[過去ログ] 【パイ焼き】y-cruncherベンチスレ【1億桁】 [転載禁止]©2ch.net (1002レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
304: 301 2017/11/13(月)23:44 ID:zf7vvPie(1) AAS
>>301 はメモリ帯域の限界ってこともあるかも。6700Kや7700Kの限界OCも
で4秒台も2chの限界に近いようだし。
まだ全然調整できてないから落ち着いたら色々試してみる。
i9でもっとメモリつめてる人はやってみるといいかも。10Cでも、もっとOCできる
人は更に上を狙えるかも。
※「17-SKX ~ Kotori」 だけだと思うけど、作者からの注意事項が最初に表示される。
メモリ帯域、サーマル・スロットリング、ファントム・スリットリングについて。
305(9): 2017/11/26(日)08:55 ID:7vknczsk(1/11) AAS
AA省
306: 2017/11/26(日)09:52 ID:dqa8BlAg(1/11) AAS
>>305
ありがとう、凄く判り易い
i9 の FMA Unit 数が公式だと掲載されてないのだが、XEON だと Bronz が1個でGold以上が2個らしい
FMA Unit数が2個でこの結果なのか、それとも1個だからこの結果なのか
307(1): 2017/11/26(日)10:22 ID:dqa8BlAg(2/11) AAS
x86を基準にすると
x64-SSE4 3.3倍速 / 3.1倍速
x64-AVX 3.8倍速 / 3.5倍速
x64-AVX2 7.0倍速 / 6.3倍速
x64-ADX 7.0倍速 / 6.3倍速
x64-AVX512 8.3倍速 / 7.3倍速(但しファントムスロットリング発生に要注意)
HyperThreadはDISABLEですよね?
308(4): 2017/11/26(日)10:30 ID:7vknczsk(2/11) AAS
AA省
309: 2017/11/26(日)10:47 ID:dqa8BlAg(3/11) AAS
連投すまんが>>301と同様に4.2GHzで>>305と同じ事をするとAVX2というかAiriに逆転されるんじゃ?
310(1): 2017/11/26(日)10:54 ID:dqa8BlAg(4/11) AAS
>>308
たぶんLinpackはHTTをDISABLEしないと速度半減するけどy-cruncherは20コア辺りから伸び悩むので18コアだと微妙
311(1): 2017/11/26(日)11:12 ID:7vknczsk(3/11) AAS
>>310 IntelのLinpackは、HTT Enableでも1T/Cしか使わないようになってる。
OCCT 4.5.1が使ってる古いのも、負荷が高いところは1T/Cで、負荷が低い
ところだけ2T/C。最新のAVX512対応版は負荷が低いところも1T/C。
※OCCTの全論理コア使用のチェック入れたときは、Linpackを2ジョブ並行
実行して、負荷が高いところも全論理CPU使うようにしてるだけ。
312: 2017/11/26(日)11:55 ID:dqa8BlAg(5/11) AAS
ブラウザからなのでうっかりアゲてしまったスマン
メモリ帯域はそうだろなと思うよSkylake−SPはメモリ6チャネルになってるから
というか 4.2GHz でのAiriの結果を知りたい
18コア品はAVX512の上限が2.7GHzくらいでAVX2の上限が3.5GHzくらい、SSE4が4GHzくらいだと予想してるのだけど
313(9): 2017/11/26(日)11:59 ID:7vknczsk(4/11) AAS
AA省
314(2): 2017/11/26(日)12:30 ID:dqa8BlAg(6/11) AAS
>>313
AVXとAVX2のクロックは連動するはずなので、時々9秒台は変だね
Ushioもやってみると傾向が掴めるかと
315: 2017/11/26(日)12:40 ID:7vknczsk(5/11) AAS
>>314 AVX無印のクロックは、AVX(2) Offsetに制限されるものとされないものがあるようだ。
Hinaは制限されない方で、OCCT 4.5.1に入ってるLinpac(性能的に多分AVX無印)は制限される方。
Skylake-Xの人は、Hinaみたいのやつをどう考慮するか(または無視するか)で、クロック
設定がかなり変わって来そう。
316(1): 2017/11/26(日)13:10 ID:7vknczsk(6/11) AAS
>>314 通常クロックの範疇でかなり重いHinaと、AVX2クロックの範疇でそれほど重くない
AiriやAVX512の範疇でそれほど重くないKotoriとで、全力で行けるかどうかの判断基準が
違うとかのせいかね。
>>305はVcore 1.1Vだったと思うけどちょっと多すぎかと思っていた。>>313はちょと回す
ので電力的に厳しいということで1.05Vでやった(4.0GHz Kotoriでワットモニター読み500W
台が見えた気がするが、短すぎて本当のピークは分からない)。Airi以降も4.0GHzで垂れて
るので、もっとくれということかも。
※Skylake-SPに関するIntelの資料に下記があったけど、AVX無印の扱いが明確でない。
Code Type All Core Frequency Limit
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
省8
317(2): 2017/11/26(日)13:39 ID:dqa8BlAg(7/11) AAS
>>316
AVX2はAVX+int系256bitSIMD命令なのでAVX2のFPはAVXのFPと一緒
FP=浮動小数点系の命令
int-mul=整数系の掛算
y-cruncherは整数系の命令群を使って多倍長精度演算をエミュレートするのでint-mulが関係していると思われ
int-addとint-mulでクロックが右往左往して結果にブレが生じる不具合が有る可能性があるんじゃね
Hinaが9秒台をノイズとして除去すると順当にクロック連動して高速化するのに、Airi〜Kotoriは表のクロックとスコアが全く連動してない
318: 2017/11/26(日)14:01 ID:7vknczsk(7/11) AAS
>>317 AVX2以降はこんだけコア数あったらメモリでサチっちゃうってことだね。
(作者も書いてる通り)
メモリ2chでも4Cの6700K/7700KのOCがかなりメモリの限界に近いようだし。
319(1): 2017/11/26(日)14:26 ID:dqa8BlAg(8/11) AAS
だとSkylakeSPのフルスペック6ch仕様はi9比で1.5倍速?
320: 2017/11/26(日)15:13 ID:7vknczsk(8/11) AAS
>>319 メモリアクセスと、メモリアクセス待ちでないコアの処理が完全に並行でない
だろうから(7980XEでCPU使用率が80%程度な点からも、メモリアクセス以外の無駄も
かなりありそう)、
正確にはそうならないかも。
y-cruncherでメモリ帯域とコア性能(GHz・Core・IPC)のバランスで一番おいしいところが
あったりするかも。
※7980XEのOC試すのにXTUは基礎的な情報をグラフで見られて結構便利。(AVX系
やるとコアクロックとVcoreが近い高さで表示されるので、その関係とか把握し易い)
y-cruncherで桁数多いのやるのを見てると周期的なパターンがあって、大半半のところは
ほぼCPU使用率100%。
省3
321(1): 2017/11/26(日)17:21 ID:dqa8BlAg(9/11) AAS
CPU使用率は特権リングがマイナスで実行されてる部分は表層のOSから見えないからじゃね?
あと、一般命令とAVXとAVX512で3種のクロック倍率が同時に存在するから、それをOSが正確に%に置換出来ないというか、、、そもそも%では表せないとも言えるのかも
start /affinity オプションで何コアで飽和するか試してみると何か判ってくるかも
322(1): 2017/11/26(日)18:00 ID:7vknczsk(9/11) AAS
>>321 自分はWin7→Win10(FCU)なんだけど(2015年にWin10プレビューはちょっと触ったけど)、
Win10でLinpack(1T/C)実行してみたり、CINEBENCHで中途半端なスレッド数で実行すると分かる。
コアの片側の論理CPUだけフルに使ってるとコア全体の70%ちょいを使用してると表示される。
一般的なHTT効率のソフト(CINEBENCHとか)だと1T/Cでフルに使ったら、2T/Cの70%くらいの
性能ってことでそう換算してるのではないかと推測してる。
あと、動作クロックも加味しているようだ。CINEBENCHシングルで、省電力設定でTB発動しない
場合と高パフォーマンスでTBフルに効く場合を見てみるといい。
※普通のCPU使用率を表示するソフト(CoreTempとかXTU)は従来通りのようだ。従来のCPU
使用率を取得するAPIの仕様は変えてなくて、タスクマネージャーが自分で換算してるか新しい
API使ってるかかね。
323: 2017/11/26(日)18:13 ID:7vknczsk(10/11) AAS
>>322 「70%ちょい」は環境によって違うようだ。3960XのSync all 4.7GHzではそうだった。
今7980XEをかなりOCした状態でCINEBENCH R15で18スレッドで実行したら92%と表示された。
もしかするとOCしてるとクロックのレンジを正しく把握できないせいか?
※FCUの前はCPUの上限クロック設定するところがあったけど、FCUはなくなったよね。
何か関係あるのか?
上下前次1-新書関写板覧索設栞歴
あと 679 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.029s