[過去ログ] Intel派 vs AMD派 Part.70 (1001レス)
前次1-
抽出解除 必死チェッカー(本家) (べ) レス栞 あぼーん

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
806
(1): M厨 05/03/18 01:29 ID:nRvurxog(1/9) AAS
L2キャッシュは1MBでレイテンシは多分PenMのほうが短い。
そのベンチマークがどこなのか示して貰わないと。
メモリレイテンシにかなり依存したベンチばっかりなんじゃねーの?
同クロックでAthlon64以上ってことは多分無いだろ。

同クロックでAthlon64>Pentium MなコードをIntelコンパイラでコンパイルしなおしたら
完全に性能が逆転したケースを知っている。
扱うデータがL1キャッシュに9割5以上ヒットするようなコードなら
1〜2割程度のパフォーマンスの差は命令スケジューリング次第でどうにでもなる。
実行レイテンシが短く小回りがきくPenMか、ユニット数が多く並列度で速度を稼ぐK8か

実際どうなのよ
省2
808: M厨 05/03/18 01:36 ID:nRvurxog(2/9) AAS
>>807
そうか?
ちなみにそのコードはVC++(=もっとも使われる商用コンパイラ)でコンパイルしたらやっぱりPenM有利だったんだがな。
811: M厨 05/03/18 01:55 ID:nRvurxog(3/9) AAS
ちなみに言うとそのAthlonで速かったコードってのもMMX駆使してハンドオプティマイズがガンガンにかかってたんだが。
Athlon向けのスケジューリングだったんだろうな。
ベースになったCソースをMMX Intrinsic使うように改造してそのままIntelCでコンパイル
(=まだ手動最適化の余地はある?)しただけでその元のコードのAthlonでのIPCを
軽く超えてしまったのだ。
ま、演算ユニットの小回りって大事だよ。
813
(2): M厨 05/03/18 02:11 ID:nRvurxog(4/9) AAS
>>812
PenMのL1は32KB(インストラクション)+32K(データ)のセットアソシエイティブ方式だな

大抵のコードはもっとも負荷のかかる部分ではキャッシュに収まる範囲のでテーブルを
展開してループ回すような構造の最適化をやってる。
きちんと最適化がなされたアプリでL1キャッシュミスしてメインメモリに探しに逝く機会
のほうが稀だけどな。
815: M厨 05/03/18 02:47 ID:nRvurxog(5/9) AAS
>>814直リンでいい?
外部リンク[c]:www.darkside.com.au
818: M厨 05/03/18 02:56 ID:nRvurxog(6/9) AAS
FUDキター!!!
Linux用なら無償で使えるから使ってみれば
オートディスパッチはコンパイルオプションだし
*mmintrin.h使えば問答無用でMMX/SSEで最適化されたコードを生成するけど
821: M厨 05/03/18 03:17 ID:nRvurxog(7/9) AAS
Intelコンパイラの最適化性能を見てNetBurstはどんな最適化コードを噛ませても無駄
だということは知っているわけだが。

特に命令スケジューリングにかかわる部分なんて、トレースキャッシュに入ってしまえば
極力キャッシュに収める努力だけで終わってしまう。

むしろピークの性能を出すのに専用の最適化が必要なのはAthlonのほうだと思ったが。
あれほど命令スケジューリングに左右されるCPUはないぞ
823: M厨 05/03/18 03:47 ID:nRvurxog(8/9) AAS
MMX/SSE*も使わないまともに最適化のなされてないコードのパフォーマンス比較の
意味に意味は無い。
スーパースケーラすら導入されてない時代のπに只管こだわる雑音はただのアホと。

ハイパースレッディングはまともに並列化による最適化が行われてないコードを2つ
並列に実行することでマルチパイプラインの隙間を埋めトータル性能を稼ぐ代物。
最適化厨にとってみれば、はなからこいつに頼ること自体敗北を意味する。
それくらい解れよ。
実際、HT非使用でも十分効率のいいコードを2個動かしてもほとんど性能上がらない。
826
(1): M厨 05/03/18 04:19 ID:nRvurxog(9/9) AAS
そそ、途中で切って見た目性能差が何倍もあるようにでも見せかける
グラフの描き方ってどっかで見たことがあるな

そういうところ真似しなくていいのにさ
前次1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.174s*