[過去ログ] Intelの次世代技術について語ろう 124 (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
876(3): 警備員[Lv.1][新芽] 06/01(土)01:26 ID:4+/iv37z(2/2) AAS
Zen4の実測値
github.com/InstLatx64/InstLatx64/blob/c87a1535bfe88c91d176c144753d35bb101bbe32/AuthenticAMD/AuthenticAMD0A60F12_K19_Raphael_04_InstLatX64.txt#L3085
仮にZen5: 2x512だとすると最短throuputが0.5clkになってSSE/AVX/AVX2が遅くなるから、
現時点では Zen5: 4x512と考えるのが妥当かと
877: 警備員[Lv.8] 06/01(土)01:28 ID:dcNKjUsD(4/8) AAS
>>876
なるへそ!
878: 警備員[Lv.17] 06/01(土)01:41 ID:0DvrQhTW(1/2) AAS
<`∀´> アヒャヒャヒャ
ラプターの焼けを報告できなきゃ次のアローも欠陥品認定というIntelの泥沼地獄www
→AMD、2024年6月3日に行われるComputex 2024にて発表する予定。
【Zen 5】
●次世代 Ryzen 9000 "Granite Ridge" デスクトッププロセッサ
●次世代 Ryzen 9000 "Strix Point" モバイルプロセッサ
●第5世代 EPYC "Turin" サーバープロセッサ
●次世代 Radeon RX RDNA 4 グラフィックカード
↑
これらの製品はすべて、新しい "Zen 5" CPUマイクロアーキテクチャをベースとしている。
省15
879(1): 警備員[Lv.18] 06/01(土)02:40 ID:cQtUwHKm(1/3) AAS
>>844
PTLでは4P+8E+4LPEとなるから
通常用途は4LPE、それ以上の大抵の作業は8Eで済ますようすんだろうな
実際N100で殆ど用途は事足りる
Eコアを強化し、Pコア数はできるだけ抑える
StrixpointもZen5×4+Zen5c×8と似たような構成を取ってる
逆にX EliteをはじめとしたARM SoCはx86/x64エミュらんといかんから
Pコアはそこそこ多めに積む必要がある
880: 警備員[Lv.18] 06/01(土)02:45 ID:cQtUwHKm(2/3) AAS
IntelやAMDもモバイルSoCはハイエンドスマホ向けSoCと構成が似てる
881: 警備員[Lv.7] 06/01(土)03:00 ID:2sJxG9HA(1) AAS
N100後継は出るぞ
N250って言ってクロック100MHzあがったやつ
882: 警備員[Lv.5][新芽] 06/01(土)04:11 ID:HDPptHi8(1) AAS
>>879
EコアとZen5cコアって似ているか?
883: 警備員[Lv.8][新芽] 06/01(土)04:24 ID:6HVaYF2c(1/4) AAS
FMA512ってクライアントでは完全に使えない?
それとも256ビットに制限されるが機能する?
884: 警備員[Lv.8][新芽] 06/01(土)04:39 ID:6HVaYF2c(2/4) AAS
外部リンク:news.mynavi.jp
この記事のGolden Coveのブロック図のPort 05 FPUはクライアントでは丸ごと無効化なのか256ビット化しているだけなのかということ
885(2): 警備員[Lv.17] 06/01(土)05:59 ID:UrrHpAQV(1) AAS
Port 05のFMAはクライアントでは無効化で合ってるはず
Port 00と01が持ってる演算器は256ビット幅で、512ビット命令を処理するときはPort 00がPort 01の演算器を借りて512ビット幅で実行
サーバでは512ビットFMAはPort 00(01の演算器フュージョン)と05で2命令同時処理なのが、クライアントではPort 00(01フュージョン)だけの1命令実行
FMA以外のPort 05の命令は、AMXとFADDは無効化でALUとShuffleは普通に512ビットで動く、確かこんな感じ
886: 警備員[Lv.5][新芽] 06/01(土)06:17 ID:OiTCQXig(1) AAS
>>865
NEONが主な用途だからなのかSEVで詰め放題だからなのかわからないけど、128bit × 6ユニット使い切れるスケジューラなのか
887(1): 警備員[Lv.9][新芽] 06/01(土)06:24 ID:6HVaYF2c(3/4) AAS
>>885
外部リンク:chipsandcheese.com
こっちの記事だと256ビットFADDのみのFPUがあるからこれがPort 05かな
サイクルあたりの演算回数は256ビットx6
888: 警備員[Lv.18] 06/01(土)07:32 ID:0DvrQhTW(2/2) AAS
<`∀´> アヒャヒャヒャ
【悲報 Raptor Lake系 劣化】
Intel 推奨設定でも 検証結果 7割 不具合 www
【自作PC】
youtu.be/ax_m3nHY6Xc?t=66
■1.ラプターが焼け焦げたらどうなるの?
↓
youtu.be/FGBhNlYlRFI
もう、どうにもなりまへん www
■2,どうして焼けるの?
省30
889: 警備員[Lv.15] 06/01(土)07:41 ID:+pE1eXZj(1) AAS
Zen5の話が凄すぎてバックミラーどころか完全に周回遅れだな
890(3): 警備員[Lv.4][新芽] 06/01(土)07:45 ID:zyATG63m(1/3) AAS
>>865,887
>サイクルあたりの演算回数は256ビットx6
それは違うよ(正しくは、256ビットx3)
ADL(i9-12900K)実測値
github.com/InstLatx64/InstLatx64/blob/c87a1535bfe88c91d176c144753d35bb101bbe32/GenuineIntel/GenuineIntel0090672_AlderLake_BC_AVX512_InstLatX64.txt
1237 AVX :VPADDQ xmm, xmm, xmm L: 0.31ns= 1.0c T: 0.10ns= 0.33c
2060 AVX2 :VPADDQ ymm, ymm, ymm L: 0.31ns= 1.0c T: 0.10ns= 0.33c
3279 AVX512VL :{EVEX} VPADDQ xmm, xmm, xmm L: 0.31ns= 1.0c T: 0.10ns= 0.33c
3280 AVX512VL :{EVEX} VPADDQ ymm, ymm, ymm L: 0.31ns= 1.0c T: 0.10ns= 0.33c
3281 AVX512F :VPADDQ zmm, zmm, zmm L: 0.31ns= 1.0c T: 0.16ns= 0.50c
省7
891: 警備員[Lv.5][新芽] 06/01(土)07:48 ID:zyATG63m(2/3) AAS
>>885
特にFMAに興味があるなら>>890の実測値データを見てみると良い
892: 警備員[Lv.5][新芽] 06/01(土)07:55 ID:zyATG63m(3/3) AAS
ARLも実測値データが出てきたら、
>>865
Lion Cove: 4x256
とは違うかも知れないのは要注意(MTLの実測値もまだみたい)
893(2): 警備員[Lv.10][新芽] 06/01(土)08:05 ID:6HVaYF2c(4/4) AAS
>>890
すまん知識が無くて理解できない
FMAは積和算だから1サイクルで2回とカウントするんじゃないの
894: 警備員[Lv.10][新芽] 06/01(土)08:16 ID:nyILq7cD(1) AAS
【AI機械学習】
エンドツーエンドのAI機械学習プラットフォーム
www.tensorflow.org/?hl=ja
AI処理も爆速のAVX-512
imgur.com/Ng2f1wL
きょうびAVX512がない時点でCPUとして問題外
895: 警備員[Lv.5][新芽] 06/01(土)08:17 ID:K6bzVHE8(1/2) AAS
>>893
3.2GHz FMA 256bit throughput 0.50clk
github.com/InstLatx64/InstLatx64/blob/c87a1535bfe88c91d176c144753d35bb101bbe32/GenuineIntel/GenuineIntel0090672_AlderLake_BC_AVX512_InstLatX64.txt#L2042
FLOPSの計算の事なら1P-coreあたり (1/0.5)*3.2*(256bit/32bit)*2=102.4GFLOPS (単精度) かな
上下前次1-新書関写板覧索設栞歴
あと 107 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.076s*