【パイ焼き】y-cruncherベンチスレ【１億桁】 [転載禁止]©2ch.net

[過去ﾛｸﾞ] 【パイ焼き】y-cruncherベンチスレ【１億桁】 [転載禁止]©2ch.net (1002ﾚｽ)
上下前次 1-新

このｽﾚｯﾄﾞは過去ﾛｸﾞ倉庫に格納されています｡
次ｽﾚ検索歴削→次ｽﾚ栞削→次ｽﾚ過去ﾛｸﾞﾒﾆｭｰ

310(1): 2017/11/26(日)10:54 ID:dqa8BlAg(4/11) AAS
>>308
たぶんLinpackはHTTをDISABLEしないと速度半減するけどy-cruncherは20コア辺りから伸び悩むので18コアだと微妙

311(1): 2017/11/26(日)11:12 ID:7vknczsk(3/11) AAS
>>310 IntelのLinpackは、HTT Enableでも1T/Cしか使わないようになってる。
OCCT 4.5.1が使ってる古いのも、負荷が高いところは1T/Cで、負荷が低い
ところだけ2T/C。最新のAVX512対応版は負荷が低いところも1T/C。
※OCCTの全論理コア使用のチェック入れたときは、Linpackを2ジョブ並行
　実行して、負荷が高いところも全論理CPU使うようにしてるだけ。

312: 2017/11/26(日)11:55 ID:dqa8BlAg(5/11) AAS
ブラウザからなのでうっかりアゲてしまったスマン
メモリ帯域はそうだろなと思うよSkylake−SPはメモリ６チャネルになってるから

というか 4.2GHz でのAiriの結果を知りたい
18コア品はAVX512の上限が2.7GHzくらいでAVX2の上限が3.5GHzくらい、SSE4が4GHzくらいだと予想してるのだけど

313(9): 2017/11/26(日)11:59 ID:7vknczsk(4/11) AAS
AA省

314(2): 2017/11/26(日)12:30 ID:dqa8BlAg(6/11) AAS
>>313
AVXとAVX2のクロックは連動するはずなので、時々９秒台は変だね
Ushioもやってみると傾向が掴めるかと

315: 2017/11/26(日)12:40 ID:7vknczsk(5/11) AAS
>>314 AVX無印のクロックは、AVX(2) Offsetに制限されるものとされないものがあるようだ。
Hinaは制限されない方で、OCCT 4.5.1に入ってるLinpac(性能的に多分AVX無印)は制限される方。
Skylake-Xの人は、Hinaみたいのやつをどう考慮するか（または無視するか）で、クロック
設定がかなり変わって来そう。

316(1): 2017/11/26(日)13:10 ID:7vknczsk(6/11) AAS
>>314 通常クロックの範疇でかなり重いHinaと、AVX2クロックの範疇でそれほど重くない
AiriやAVX512の範疇でそれほど重くないKotoriとで、全力で行けるかどうかの判断基準が
違うとかのせいかね。
>>305はVcore 1.1Vだったと思うけどちょっと多すぎかと思っていた。>>313はちょと回す
ので電力的に厳しいということで1.05Vでやった（4.0GHz Kotoriでワットモニター読み500W
台が見えた気がするが、短すぎて本当のピークは分からない）。Airi以降も4.0GHzで垂れて
るので、もっとくれということかも。

※Skylake-SPに関するIntelの資料に下記があったけど、AVX無印の扱いが明確でない。

Code Type　　　　　　　　　　　　　　　　　　　All Core Frequency Limit
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
省8

317(2): 2017/11/26(日)13:39 ID:dqa8BlAg(7/11) AAS
>>316
AVX2はAVX+int系256bitSIMD命令なのでAVX2のFPはAVXのFPと一緒
FP=浮動小数点系の命令
int-mul＝整数系の掛算

y-cruncherは整数系の命令群を使って多倍長精度演算をエミュレートするのでint-mulが関係していると思われ
int-addとint-mulでクロックが右往左往して結果にブレが生じる不具合が有る可能性があるんじゃね

Hinaが９秒台をノイズとして除去すると順当にクロック連動して高速化するのに、Airi〜Kotoriは表のクロックとスコアが全く連動してない

318: 2017/11/26(日)14:01 ID:7vknczsk(7/11) AAS
>>317 AVX2以降はこんだけコア数あったらメモリでサチっちゃうってことだね。
(作者も書いてる通り)
メモリ2chでも4Cの6700K/7700KのOCがかなりメモリの限界に近いようだし。

319(1): 2017/11/26(日)14:26 ID:dqa8BlAg(8/11) AAS
だとSkylakeSPのフルスペック６ch仕様はi9比で1.5倍速？

320: 2017/11/26(日)15:13 ID:7vknczsk(8/11) AAS
>>319 メモリアクセスと、メモリアクセス待ちでないコアの処理が完全に並行でない
だろうから（7980XEでCPU使用率が80%程度な点からも、メモリアクセス以外の無駄も
かなりありそう）、
正確にはそうならないかも。
y-cruncherでメモリ帯域とコア性能（GHz・Core・IPC）のバランスで一番おいしいところが
あったりするかも。
※7980XEのOC試すのにXTUは基礎的な情報をグラフで見られて結構便利。（AVX系
　やるとコアクロックとVcoreが近い高さで表示されるので、その関係とか把握し易い）
　y-cruncherで桁数多いのやるのを見てると周期的なパターンがあって、大半半のところは
　ほぼCPU使用率100%。
省3

321(1): 2017/11/26(日)17:21 ID:dqa8BlAg(9/11) AAS
CPU使用率は特権リングがマイナスで実行されてる部分は表層のOSから見えないからじゃね？

あと、一般命令とAVXとAVX512で３種のクロック倍率が同時に存在するから、それをOSが正確に％に置換出来ないというか、、、そもそも％では表せないとも言えるのかも

start /affinity オプションで何コアで飽和するか試してみると何か判ってくるかも

322(1): 2017/11/26(日)18:00 ID:7vknczsk(9/11) AAS
>>321 自分はWin7→Win10(FCU)なんだけど(2015年にWin10プレビューはちょっと触ったけど)、
Win10でLinpack(1T/C)実行してみたり、CINEBENCHで中途半端なスレッド数で実行すると分かる。
コアの片側の論理CPUだけフルに使ってるとコア全体の70%ちょいを使用してると表示される。
一般的なHTT効率のソフト（CINEBENCHとか）だと1T/Cでフルに使ったら、2T/Cの70%くらいの
性能ってことでそう換算してるのではないかと推測してる。
あと、動作クロックも加味しているようだ。CINEBENCHシングルで、省電力設定でTB発動しない
場合と高パフォーマンスでTBフルに効く場合を見てみるといい。
※普通のCPU使用率を表示するソフト（CoreTempとかXTU）は従来通りのようだ。従来のCPU
　使用率を取得するAPIの仕様は変えてなくて、タスクマネージャーが自分で換算してるか新しい
　API使ってるかかね。

323: 2017/11/26(日)18:13 ID:7vknczsk(10/11) AAS
>>322 「70%ちょい」は環境によって違うようだ。3960XのSync all 4.7GHzではそうだった。
今7980XEをかなりOCした状態でCINEBENCH R15で18スレッドで実行したら92%と表示された。
もしかするとOCしてるとクロックのレンジを正しく把握できないせいか？
※FCUの前はCPUの上限クロック設定するところがあったけど、FCUはなくなったよね。
　何か関係あるのか？

324(1): 2017/11/26(日)19:03 ID:dqa8BlAg(10/11) AAS
OCしてると、そもそもタイマー関係が正常に機能してない事があるし、なんとも言えない
タイマー自体もPC互換機には歴史的に10種類くらいのハード実装とその互換実装が多種あって、APIによって異なるタイマーハードウエアと分解能と精度になる
新しいマザーだしUEFIの完成度（OCでも全てのタイマーが正常に時を刻むか）がどうかってこともあり、文章だけでは判断出来かねる
あとクロック上限もUEFI設定関連で動作が違うのかもしれないし

325: 2017/11/26(日)19:26 ID:7vknczsk(11/11) AAS
>>324 他のソフトの表示は以前通りCPU使用時間ベースでWin7と同じだから、そんな
難しい話じゃないと思う。
計算してみると、HTT効率考慮してるのではなく、動作クロックを考慮していて、基準が
ベース周波数と考えると辻褄合いそう。半分のスレッドをフルに使った場合。
3960X@4.7GHz .： Base Freq. 3.3GHz → 4.7GHz の場合、50% * 4.7GHz / 3.3GHz = 71.2%
7980XE@4.7GHz： Base Freq. 2.6GHz → 4.7GHz の場合、50% * 4.7GHz / 2.6GHz = 90.4%
※これに裏でちょろちょろ動いてる分が加算される。

326(6): 2017/11/26(日)23:07 ID:B4htzYpG(1) AAS
AA省

327(2): 2017/11/26(日)23:47 ID:dqa8BlAg(11/11) AAS
ブレが無く綺麗に安定したスコアだ

Hinaはクロックに連動して高速化
Hina以外がクロック上げても極僅かしか伸びない理由はAVX2-3GHz/AVX512-2.5GHzくらいでリミッター掛ってAVX命令以外の部分がクロックに連動して高速化したぶん少し伸びたからなんだろうなと予想してみる

参考；表面的なクロックに関係なく18コアではAVXは3GHz/2.5GHzが上限になってる
外部ﾘﾝｸ:en.wikichip.org

328: 2017/11/27(月)00:25 ID:KseSaMoG(1) AAS
>>327
Haswell-Eの頃からメモリ帯域限界近いって言ってるからね
BBP Digit Extractor for Piなら18C/36Tでもクロック分タイム縮まるでしょ
冷やせるなら1.5GHzと3GHzでやってみれば分かるよ
外部ﾘﾝｸ[html]:www.numberworld.org
>Memory bandwidth is a significant bottleneck:
>y-cruncher was already slightly memory-bound on Haswell-E. Now on Skylake X, it is much worse.

329: 2017/11/27(月)01:34 ID:96oEEOBG(1) AAS
>>326 >>305 >>308 >>313 もメッシュは固定じゃないけどMax 3.0GHz（電圧は+0.175）。
メモリって2DIMM/chの方が効率いいときってあるんだっけ？
うちのはG.Skill F4-3733C17Q2-64GTZKK（8GBx8）で書いた通りDDR4-3733 17-17-17-37-1T。
クロックとレイテンシの差はトントンくらいかね？

一応結果の部分コピーは取ってあって、全部下記が出てるからチートではなさそう。
Spot Check: Good through 100,000,000

上下前次 1-新書関写板覧索設栞歴

あと 673 ﾚｽあります
ｽﾚ情報赤ﾚｽ抽出画像ﾚｽ抽出歴の未読ｽﾚ AAｻﾑﾈｲﾙ

ぬこの手ぬこTOP 0.017s