Intelの次世代技術について語ろう 124

[過去ﾛｸﾞ] Intelの次世代技術について語ろう 124 (1002ﾚｽ)
上下前次 1-新

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

876(3): 警備員[Lv.1][新芽] 06/01(土)01:26 ID:4+/iv37z(2/2) AAS
Zen4の実測値
github.com/InstLatx64/InstLatx64/blob/c87a1535bfe88c91d176c144753d35bb101bbe32/AuthenticAMD/AuthenticAMD0A60F12_K19_Raphael_04_InstLatX64.txt#L3085

仮にZen5: 2x512だとすると最短throuputが0.5clkになってSSE/AVX/AVX2が遅くなるから、
現時点では Zen5: 4x512と考えるのが妥当かと

877: 警備員[Lv.8] 06/01(土)01:28 ID:dcNKjUsD(4/8) AAS
>>876
なるへそ！

878: 警備員[Lv.17] 06/01(土)01:41 ID:0DvrQhTW(1/2) AAS
<｀∀´> ｱﾋｬﾋｬﾋｬ

ラプターの焼けを報告できなきゃ次のアローも欠陥品認定というIntelの泥沼地獄www

→AMD、2024年6月3日に行われるComputex 2024にて発表する予定。
【Zen 5】
●次世代 Ryzen 9000 "Granite Ridge" デスクトッププロセッサ
●次世代 Ryzen 9000 "Strix Point" モバイルプロセッサ
●第5世代 EPYC "Turin" サーバープロセッサ
●次世代 Radeon RX RDNA 4 グラフィックカード
↑
これらの製品はすべて、新しい "Zen 5" CPUマイクロアーキテクチャをベースとしている。
省15

879(1): 警備員[Lv.18] 06/01(土)02:40 ID:cQtUwHKm(1/3) AAS
>>844
PTLでは4P+8E+4LPEとなるから
通常用途は4LPE、それ以上の大抵の作業は8Eで済ますようすんだろうな
実際N100で殆ど用途は事足りる
Eコアを強化し、Pコア数はできるだけ抑える
StrixpointもZen5×4+Zen5c×8と似たような構成を取ってる
逆にX EliteをはじめとしたARM SoCはx86/x64エミュらんといかんから
Pコアはそこそこ多めに積む必要がある

880: 警備員[Lv.18] 06/01(土)02:45 ID:cQtUwHKm(2/3) AAS
IntelやAMDもモバイルSoCはハイエンドスマホ向けSoCと構成が似てる

881: 警備員[Lv.7] 06/01(土)03:00 ID:2sJxG9HA(1) AAS
N100後継は出るぞ
N250って言ってクロック100MHzあがったやつ

882: 警備員[Lv.5][新芽] 06/01(土)04:11 ID:HDPptHi8(1) AAS
>>879
EコアとZen5cコアって似ているか？

883: 警備員[Lv.8][新芽] 06/01(土)04:24 ID:6HVaYF2c(1/4) AAS
FMA512ってクライアントでは完全に使えない？
それとも256ビットに制限されるが機能する？

884: 警備員[Lv.8][新芽] 06/01(土)04:39 ID:6HVaYF2c(2/4) AAS
外部ﾘﾝｸ:news.mynavi.jp
この記事のGolden Coveのブロック図のPort 05 FPUはクライアントでは丸ごと無効化なのか256ビット化しているだけなのかということ

885(2): 警備員[Lv.17] 06/01(土)05:59 ID:UrrHpAQV(1) AAS
Port 05のFMAはクライアントでは無効化で合ってるはず
Port 00と01が持ってる演算器は256ビット幅で、512ビット命令を処理するときはPort 00がPort 01の演算器を借りて512ビット幅で実行
サーバでは512ビットFMAはPort 00（01の演算器フュージョン）と05で2命令同時処理なのが、クライアントではPort 00（01フュージョン）だけの1命令実行
FMA以外のPort 05の命令は、AMXとFADDは無効化でALUとShuffleは普通に512ビットで動く、確かこんな感じ

886: 警備員[Lv.5][新芽] 06/01(土)06:17 ID:OiTCQXig(1) AAS
>>865
NEONが主な用途だからなのかSEVで詰め放題だからなのかわからないけど、128bit × 6ユニット使い切れるスケジューラなのか

887(1): 警備員[Lv.9][新芽] 06/01(土)06:24 ID:6HVaYF2c(3/4) AAS
>>885
外部ﾘﾝｸ:chipsandcheese.com
こっちの記事だと256ビットFADDのみのFPUがあるからこれがPort 05かな
サイクルあたりの演算回数は256ビットx6

888: 警備員[Lv.18] 06/01(土)07:32 ID:0DvrQhTW(2/2) AAS
<｀∀´> ｱﾋｬﾋｬﾋｬ

【悲報 Raptor Lake系劣化】
Intel 推奨設定でも検証結果 7割不具合ｗｗｗ
【自作PC】
youtu.be/ax_m3nHY6Xc?t=66

■１.ラプターが焼け焦げたらどうなるの？
↓
youtu.be/FGBhNlYlRFI
もう、どうにもなりまへんｗｗｗ

■２，どうして焼けるの？
省30

889: 警備員[Lv.15] 06/01(土)07:41 ID:+pE1eXZj(1) AAS
Zen5の話が凄すぎてバックミラーどころか完全に周回遅れだな

890(3): 警備員[Lv.4][新芽] 06/01(土)07:45 ID:zyATG63m(1/3) AAS
>>865,887

>サイクルあたりの演算回数は256ビットx6
それは違うよ(正しくは、256ビットx3)

ADL(i9-12900K)実測値
github.com/InstLatx64/InstLatx64/blob/c87a1535bfe88c91d176c144753d35bb101bbe32/GenuineIntel/GenuineIntel0090672_AlderLake_BC_AVX512_InstLatX64.txt
1237 AVX :VPADDQ xmm, xmm, xmm L: 0.31ns= 1.0c T: 0.10ns= 0.33c
2060 AVX2 :VPADDQ ymm, ymm, ymm L: 0.31ns= 1.0c T: 0.10ns= 0.33c
3279 AVX512VL :{EVEX} VPADDQ xmm, xmm, xmm L: 0.31ns= 1.0c T: 0.10ns= 0.33c
3280 AVX512VL :{EVEX} VPADDQ ymm, ymm, ymm L: 0.31ns= 1.0c T: 0.10ns= 0.33c
3281 AVX512F :VPADDQ zmm, zmm, zmm L: 0.31ns= 1.0c T: 0.16ns= 0.50c
省7

891: 警備員[Lv.5][新芽] 06/01(土)07:48 ID:zyATG63m(2/3) AAS
>>885
特にFMAに興味があるなら>>890の実測値データを見てみると良い

892: 警備員[Lv.5][新芽] 06/01(土)07:55 ID:zyATG63m(3/3) AAS
ARLも実測値データが出てきたら、

>>865
Lion Cove: 4x256
とは違うかも知れないのは要注意(MTLの実測値もまだみたい)

893(2): 警備員[Lv.10][新芽] 06/01(土)08:05 ID:6HVaYF2c(4/4) AAS
>>890
すまん知識が無くて理解できない
FMAは積和算だから1サイクルで2回とカウントするんじゃないの

894: 警備員[Lv.10][新芽] 06/01(土)08:16 ID:nyILq7cD(1) AAS
【AI機械学習】
エンドツーエンドのAI機械学習プラットフォーム
www.tensorflow.org/?hl=ja
AI処理も爆速のAVX-512
imgur.com/Ng2f1wL

きょうびAVX512がない時点でCPUとして問題外

895: 警備員[Lv.5][新芽] 06/01(土)08:17 ID:K6bzVHE8(1/2) AAS
>>893
3.2GHz FMA 256bit throughput 0.50clk
github.com/InstLatx64/InstLatx64/blob/c87a1535bfe88c91d176c144753d35bb101bbe32/GenuineIntel/GenuineIntel0090672_AlderLake_BC_AVX512_InstLatX64.txt#L2042

FLOPSの計算の事なら1P-coreあたり (1/0.5)*3.2*(256bit/32bit)*2=102.4GFLOPS (単精度) かな

上下前次 1-新書関写板覧索設栞歴

あと 107 ﾚｽあります
ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 0.076s*