[過去ログ]
Intel派 vs AMD派 Part.70 (1001レス)
Intel派 vs AMD派 Part.70 http://pc7.5ch.net/test/read.cgi/jisaku/1110571266/
上
下
前次
1-
新
通常表示
512バイト分割
レス栞
抽出解除
必死チェッカー(本家)
(べ)
レス栞
あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
806: M厨 [sage] 05/03/18 01:29:46 ID:nRvurxog L2キャッシュは1MBでレイテンシは多分PenMのほうが短い。 そのベンチマークがどこなのか示して貰わないと。 メモリレイテンシにかなり依存したベンチばっかりなんじゃねーの? 同クロックでAthlon64以上ってことは多分無いだろ。 同クロックでAthlon64>Pentium MなコードをIntelコンパイラでコンパイルしなおしたら 完全に性能が逆転したケースを知っている。 扱うデータがL1キャッシュに9割5以上ヒットするようなコードなら 1〜2割程度のパフォーマンスの差は命令スケジューリング次第でどうにでもなる。 実行レイテンシが短く小回りがきくPenMか、ユニット数が多く並列度で速度を稼ぐK8か 実際どうなのよ Exclusiveなキャッシュのお陰でcryptc(Trip-Mona)ベンチ動かしたら PenIII 1GHz以下ってのは大体想像がつくのだが http://pc7.5ch.net/test/read.cgi/jisaku/1110571266/806
808: M厨 [sage] 05/03/18 01:36:36 ID:nRvurxog >>807 そうか? ちなみにそのコードはVC++(=もっとも使われる商用コンパイラ)でコンパイルしたらやっぱりPenM有利だったんだがな。 http://pc7.5ch.net/test/read.cgi/jisaku/1110571266/808
811: M厨 [sage] 05/03/18 01:55:30 ID:nRvurxog ちなみに言うとそのAthlonで速かったコードってのもMMX駆使してハンドオプティマイズがガンガンにかかってたんだが。 Athlon向けのスケジューリングだったんだろうな。 ベースになったCソースをMMX Intrinsic使うように改造してそのままIntelCでコンパイル (=まだ手動最適化の余地はある?)しただけでその元のコードのAthlonでのIPCを 軽く超えてしまったのだ。 ま、演算ユニットの小回りって大事だよ。 http://pc7.5ch.net/test/read.cgi/jisaku/1110571266/811
813: M厨 [sage] 05/03/18 02:11:12 ID:nRvurxog >>812 PenMのL1は32KB(インストラクション)+32K(データ)のセットアソシエイティブ方式だな 大抵のコードはもっとも負荷のかかる部分ではキャッシュに収まる範囲のでテーブルを 展開してループ回すような構造の最適化をやってる。 きちんと最適化がなされたアプリでL1キャッシュミスしてメインメモリに探しに逝く機会 のほうが稀だけどな。 http://pc7.5ch.net/test/read.cgi/jisaku/1110571266/813
815: M厨 [sage] 05/03/18 02:47:02 ID:nRvurxog >>814直リンでいい? http://www.darkside.com.au/bitslice/nonstd.c http://pc7.5ch.net/test/read.cgi/jisaku/1110571266/815
818: M厨 [sage] 05/03/18 02:56:36 ID:nRvurxog FUDキター!!! Linux用なら無償で使えるから使ってみれば オートディスパッチはコンパイルオプションだし *mmintrin.h使えば問答無用でMMX/SSEで最適化されたコードを生成するけど http://pc7.5ch.net/test/read.cgi/jisaku/1110571266/818
821: M厨 [sage] 05/03/18 03:17:08 ID:nRvurxog Intelコンパイラの最適化性能を見てNetBurstはどんな最適化コードを噛ませても無駄 だということは知っているわけだが。 特に命令スケジューリングにかかわる部分なんて、トレースキャッシュに入ってしまえば 極力キャッシュに収める努力だけで終わってしまう。 むしろピークの性能を出すのに専用の最適化が必要なのはAthlonのほうだと思ったが。 あれほど命令スケジューリングに左右されるCPUはないぞ http://pc7.5ch.net/test/read.cgi/jisaku/1110571266/821
823: M厨 [sage] 05/03/18 03:47:56 ID:nRvurxog MMX/SSE*も使わないまともに最適化のなされてないコードのパフォーマンス比較の 意味に意味は無い。 スーパースケーラすら導入されてない時代のπに只管こだわる雑音はただのアホと。 ハイパースレッディングはまともに並列化による最適化が行われてないコードを2つ 並列に実行することでマルチパイプラインの隙間を埋めトータル性能を稼ぐ代物。 最適化厨にとってみれば、はなからこいつに頼ること自体敗北を意味する。 それくらい解れよ。 実際、HT非使用でも十分効率のいいコードを2個動かしてもほとんど性能上がらない。 http://pc7.5ch.net/test/read.cgi/jisaku/1110571266/823
826: M厨 [sage] 05/03/18 04:19:32 ID:nRvurxog そそ、途中で切って見た目性能差が何倍もあるようにでも見せかける グラフの描き方ってどっかで見たことがあるな そういうところ真似しなくていいのにさ http://pc7.5ch.net/test/read.cgi/jisaku/1110571266/826
上
下
前次
1-
新
書
関
写
板
覧
索
設
栞
歴
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
Google検索
Wikipedia
ぬこの手
ぬこTOP
0.100s*