[過去ログ] 【トリップ検索】MERIKEN's Tripcode Finder その5 (995レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
776: ,,・´∀`・,,)っ-○○○<のたんぺおるんぺ? 2013/11/10(日)11:57 ID:0eajDBSB0(4/7) AAS
あと今更だけどVecTripperのこれが気になりました。
> いまさらAVXに対応してみた (12桁のみ)
> 3オペランド化で余計なmovdqaを消して、VEXエンコーディングで命令長が
> 削れるものを削った程度なのですが、何故かSSE版と比べて25%ぐらい
> 高速です。16bytes/clkのフェッチ帯域がクリティカルだったのだろうか。
SSEのコードだとぱっと見2000命令軽く超えてるのでそれだけで
μOPs cache流しちゃってますね(AVX*でギリギリ?)
SHAコアのコードを分割して何十個か単位でまとめてループ処理させると
μOPs cacheの利用効率あがるんじゃないかと思ったり。
ああ、おいらはこっちには復帰しませんけどね
777: ◆Meriken//XXX 2013/11/10(日)12:23 ID:QQ2EaO1lP(7/14) AAS
あ、2chに書き込めるようになったんですね。いらっしゃいませ〜
>>773
なるほどなるほど。しかしSHA-1専用命令ってそんなに効率がいいんですか。
f1, f2, f3やROTLを処理してくれるのかな? AVX-512より速いわけ無いと
思ってましたけど、興味が出てきました。
778(2): ,,・´∀`・,,)っ-○○○<のたんぺおるんぺ? 2013/11/10(日)12:43 ID:0eajDBSB0(5/7) AAS
こんにちは。
SHA-1拡張は複数
16並列
> f1, f2, f3やROTLを処理してくれるのかな? AVX-512より速いわけ無いと
> 思ってましたけど、興味が出てきました。
SHA-1はAVX-512の命令セットマニュアルのChapter8に載ってますが
専用回路が載るっぽいですね。
SHA1RNDS*とSHA1NEXTEの組み合わせで各ラウンドを処理できるようになってます
理屈上160命令+α程度でSHA-1の80ラウンドを処理出来てしまいます。
省4
779: ,,・´∀`・,,)っ-○○○<のたんぺおるんぺ? 2013/11/10(日)12:44 ID:0eajDBSB0(6/7) AAS
上にノイズが載りましたが気にしないでください
780: ののたん ◆KiwamonoL. 2013/11/10(日)14:02 ID:me5+veG40(1/3) AAS
>>778
SHA-1専用回路なんだからきちんと全部計算するんだよな。
それだったらトリップ用に削りまくった自作処理のほうが高速かもよ。
インテルコンパイラのSHA-1関数とかそんなに速くなかったし。
781(1): ,,・´∀`・,,)っ-○○○<のたんぺおるんぺ? 2013/11/10(日)14:39 ID:0eajDBSB0(7/7) AAS
俺の嫁ktkr
>SHA-1専用回路なんだからきちんと全部計算するんだよな。
いや、AESと同様に、各ラウンドを2命令でこなせる命令を追加するだけよ。
VIAのPadLockみたいなレジスタにセットして1命令発行したらハイ完了
みたいなインターフェースではない。
どのみちAESほどには並列化できるところがないからそれほど速くなんない
と思われ。
差分解読法はSSEだろうがAVXだろうがOpenCLだろうが使えるテクだけど。
前半を事前計算してキー変更の差分だけ計算するにしても、70ラウンド程度はかかるでしょ。
数学的にエレガントなショートカット方法があるなら俺も知りたい。
省4
782(1): ◆Meriken//XXX 2013/11/10(日)15:36 ID:QQ2EaO1lP(8/14) AAS
>>774
XbyakのJITアセンブラのアプローチはなかなか面白そうですねえ。
これってMTFで使って効果あるものなのかしらん。
783: ◆Meriken//XXX 2013/11/10(日)15:59 ID:QQ2EaO1lP(9/14) AAS
>>775
> 1〜5ラウンド目は初期値が定数なのでほんの少しショートカットできますよ。
ははあ、なるほどなるほど。ちょっとあとで計算してみます。
キーの生成方法はもうちょっと工夫できそうですねえ。
precomputed W[]もJens Steube氏のを借りるんじゃなくて
自分で計算したほうがいいみたいですね。
784: ◆Meriken//XXX 2013/11/10(日)16:10 ID:QQ2EaO1lP(10/14) AAS
>>778
> 命令発行ポートの制約さえなければ両方を同時に動かすことだって
> おそらく可能なわけで、割と気になる命令です。
これが本当だとしたらおいしすぎです。
しかしなかなか面白い話が沢山ありますねえ。
まだ当分楽しめそうですねw
785(1): ののたん ◆KiwamonoL. 2013/11/10(日)17:11 ID:me5+veG40(2/3) AAS
>>781
>ソフト処理じゃんあれ。
速くなかった、ってのはそういう観点の問題じゃなくて。
インテルがてめぇで作った『高速ライブラリ』でさえ、トリップ用に削ったおれおれ関数よりも遅かったぜという自慢だ。w
むか〜し、ハード実装の某CPUがって話をしたことあるけど、あれとはかなり違うんだな。
786: ◆Meriken//XXX 2013/11/10(日)17:40 ID:QQ2EaO1lP(11/14) AAS
>>785
Intelの開発者がSHA-1のルーチンのソースコードを公開してましたけど、
あれはあんまり速くなかったですね。まあ汎用のルーチンだから
しかたがないんですけど…
787(3): ◆Meriken//XXX 2013/11/10(日)17:57 ID:QQ2EaO1lP(12/14) AAS
バターン一覧にないゴミトリップが大量にヒットするバグが発生。
一応ドライバのバージョンを落としてみたけど、
MTFのバグの可能性が高いので頭が痛いところです。
多分正規表現の展開の処理に問題があるんだろうけど…
同じ問題がでた方が見えたら是非報告をお願いします。
788: 2013/11/10(日)18:21 ID:mpp3ebus0(1) AAS
まさかこの時期に正規表現のバグが出るとは……
789: ◆Meriken//XXX 2013/11/10(日)18:59 ID:QQ2EaO1lP(13/14) AAS
まあ今まで見つからなかったごくまれにしかでないバグみたいだから、
再現できないようなら取りあえずそのままにしておいて、
次のバージョンで正規表現の処理を1から書きなおしてもいいぐらい
なんですけどね。でも実際ほうっておくのは気持ち悪いので
詳しく調べてみます。
790: ◆Meriken//XXX 2013/11/10(日)20:24 ID:QQ2EaO1lP(14/14) AAS
取りあえず検索君のMTFを内部情報を保存する設定にしておきました。
これでバグについてもうちょっと分かるようになるでしょう。
791(2): ののたん ◆KiwamonoL. 2013/11/10(日)23:30 ID:me5+veG40(3/3) AAS
>>787
Radeon かな ?
待て屋の時にもごく希におかしなことになってたな。
多分ハードウェアの問題だろう。
792: ◆Meriken//XXX 2013/11/11(月)03:51 ID:LzpKaJNtP(1/5) AAS
>>791
MTFはCPUでトリップの検算するようになっているのでRadeonのハードウェアの
問題だったらこうはならないはずなんですよね。いずれにせよ再現待ちですけどね。
793: ◆Meriken//XXX 2013/11/11(月)05:08 ID:LzpKaJNtP(2/5) AAS
検索君がブルスクで落ちたのでGPUの電圧を1160mVまで引き上げました。
まあ1200mVでは過電流以外の問題は発生していなかったので、
少しづつ電圧を引き上げればいずれ安定するでしょう。
やっぱりこの速度で常時稼働させるのは楽ではないですねえ。
794: ◆Meriken//XXX 2013/11/11(月)07:41 ID:LzpKaJNtP(3/5) AAS
>>791
まあでもビデオカードへの負荷が原因でその他のハードウェアが
不安定になってるということもありえるんですかねえ。
不思議なこともあるもんです。
795: ◆Meriken//XXX 2013/11/11(月)19:46 ID:LzpKaJNtP(4/5) AAS
あれから検索君は安定して動作しています。
やっぱり>>787はハードウェアの問題だったのかなあ。
あと1週間ほど様子を見て問題ないようだったら
次の安定版を公開することにします。
上下前次1-新書関写板覧索設栞歴
あと 200 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.015s