[過去ログ] 【トリップ検索】MERIKEN's Tripcode Finder その5 (995レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
141(1): 2013/09/24(火)19:22 ID:HJd6RTmw0(1) AAS
>>139
何となくですが、
外部リンク:2chnull.info
これの347辺りからの話が、ヒントになりそうな?
これ以上は、各アーキ毎の最適化マニュアルの比較と、
マイクロアーキテクチャ自体の変更情報を全部追わないと、どこがネックになってるのかは
分からない気がするw
ちなみに>>107の環境で>>126を回した結果
【10分間のCPU検索の平均速度】 146.58M tripcode/s
あれ・・・あまり変わってない・・・なんでだろ。
142: ◆Meriken//XXX 2013/09/25(水)15:05 ID:Q0OWgfvvP(1/9) AAS
>>141
> これ以上は、各アーキ毎の最適化マニュアルの比較と、
> マイクロアーキテクチャ自体の変更情報を全部追わないと、
> どこがネックになってるのかは分からない気がするw
リンク先の話は非常に興味深いですねえ。なかなか奥が深いです。
> あれ・・・あまり変わってない・・・なんでだろ。
同じNehalem系でもGulftown(Westmere-EP)は違うのかな?
難しすぎですねw
143(1): ◆Meriken//XXX 2013/09/25(水)16:18 ID:Q0OWgfvvP(2/9) AAS
新しい開発版をうpしました。
MERIKEN's Tripcode Finder 1.1 Free Edition Alpha 7
外部リンク:www.meriken2ch.com
Alpha 6からの主な変更点は以下の通りです。
・Nehalem系のCPUでの12桁トリップのCPU検索の高速化。
・10桁トリップのCPU検索の高速化。
>>126の成果を取り込んだついでに、10桁トリップ検索でもmovapsを使うように
しました。AVXに対応していない、Nehalem系以外のCPUでは、10桁トリップの
CPU検索は少し速くなっているはずです。
前のバージョンとの速度の比較を報告していただけると助かりますです。
144(1): ◆YSRKEN.ceVZZ 2013/09/25(水)16:21 ID:HNdGVGJA0(1) AAS
>>143は私(x64+SSE2/AVX、Ivy Bridge)でも10桁が高速化するのでしょうか?
145: ◆Meriken//XXX 2013/09/25(水)16:23 ID:Q0OWgfvvP(3/9) AAS
この週末に彼女が日本から遊びに来るので、開発はしばらくお休みです。
次の更新はHaswell購入後のAVX2対応になる予定です。
146: ◆Meriken//XXX 2013/09/25(水)16:26 ID:Q0OWgfvvP(4/9) AAS
>>144
Ivy BridgeはAVXに対応しているので今回は速くなりません。
AVX版はまた今度書きなおす予定です。
147: ◆e7m8FSZy3U 2013/09/25(水)19:34 ID:CggXwBge0(1/2) AAS
/.Jから飛んできました。
ちょっと面白そうなのでしばらく回してるかもです・・・
148: ◆e7m8FSZy3U 2013/09/25(水)19:58 ID:CggXwBge0(2/2) AAS
あぁこれって何か。分散のみに参加するって出来ないのね
それはつまらんなぁ。
149: ◆Meriken//XXX 2013/09/25(水)20:04 ID:Q0OWgfvvP(5/9) AAS
9文字ぐらいの適当な長いパターンをローカルで1つだけ指定してやれば、
分散のみに参加しているのと変わりないですよ。
150: ◆Meriken//XXX 2013/09/25(水)20:42 ID:Q0OWgfvvP(6/9) AAS
Linux版を作っていた◆znjnB.IJwZLUさん、最近見かけないなあ。
忙しいのかしらん。AVXに最適化されたS-Boxをぜひ見せてもらいたかったんだけど、
自分でやったほうが早いのかな。
まあやることといったら全部レジスタで回すようにして、なるべく2バイトのVEX Prefixを
使うようにするだけだからなあ。でも言うのは簡単だけど、実際にやるのは大変そうだorz
151(2): ◆Meriken//XXX 2013/09/25(水)20:56 ID:Q0OWgfvvP(7/9) AAS
定格のi7-3770Kだと10桁トリップのCPU検索の速度はこんなんです。
mty_win_x64_20071012: 21.72M TPS
MTF (AVX): 25.56M TPS
大分速くなったけど、もうちょっといけそうなんだよなあ…
152: ◆Meriken//XXX 2013/09/25(水)20:59 ID:Q0OWgfvvP(8/9) AAS
6番目のS-Boxにvmovdqaが6個も残ってるぞ…
まずこいつらからやっつけないと。
153: ◆Meriken//XXX 2013/09/25(水)22:23 ID:Q0OWgfvvP(9/9) AAS
vmovdqaを2つに減らすことが出来ましたが、一時変数が1つ増えて
速度は横這いです。難しすぎる…
154(3): ◆LoveNico9g 2013/09/26(木)02:43 ID:sJOvmiPd0(1) AAS
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5 -> 1.1 Free Edition Alpha 7
【OS】Windows 7 Professional SP1
【ディスプレイドライバ】320.57
【検索デバイス】GPUとCPU
【使用するGPU】すべて使用
【GPU】GeForve GTX 650
【CPU】Ibtel Core i3-3220 CPU @ 3.30Ghz
【1SMあたりのブロック数(CUDA)】8
【CPUの命令セット】x64 + SSE2/AVX
省9
155: ◆Meriken//XXX 2013/09/26(木)04:07 ID:6FvOHAWcP(1/9) AAS
>>154
報告有り難うございます。やっぱりちょこっとだけ速くなっていますね。
動的書き換えを行っているコードをいじるのに結構神経を使ったんですが、
6.5%の速度向上だから上出来なのかな?
156: ◆HwAeH9HsBC.d 2013/09/26(木)04:34 ID:b6mTXvYaP(1/3) AAS
中間ステートを利用したら受け渡し所がなくても2ch上だけで安全にキーの交換ができるのか
80文字くらいのキーのテスト
157: ◆Meriken//XXX 2013/09/26(木)06:00 ID:6FvOHAWcP(2/9) AAS
なかなか面白い発想ですけど、キーの一部が依頼ごとに違ってくると
複数の依頼を同時に検索することが出来ないので、ちと現実的ではないですねえ。
158(1): 2013/09/26(木)06:35 ID:b6mTXvYaP(2/3) AAS
たしかに個人に依頼する場合はやっぱり一度に一人からの依頼しか処理できなくなりますが、Yggdrasilを使うなら大丈夫ですよね?
Yggdrasilに参加しながら自分の設定した文字列も検索する場合それの結果のキーまで64文字以上になっちゃいますが
あと自分のPCで発見した場合でもサーバから64文字を受け取らないといけなくなります
このときサーバが全クライアントに同じ64文字を使ってたら困るのは
サーバはクライアントごとにキーの最初の64文字を別のにして探索してもらえばよさそうです
あと依頼を1個解決した場合最初の64文字を切り替えないと次に他の依頼を解決したときに2人の別の人に同じ64文字が流出するので
依頼を解決するごとにサーバから新しい最初の64文字を受け取る必要があります
で、OpenCLの1回のワークのまとまりに全部同じ中間状態を最初に渡すことになりそうですが、
1回のワークで複数の依頼を解決しちゃった場合どれか1個しか使えなくなります(同じ最初の64文字が2人以上に使われることになるので)
これの解決法は思いつきませんでした
159: 2013/09/26(木)06:36 ID:b6mTXvYaP(3/3) AAS
最初の64文字を依頼人が指定するんじゃなくてYggdrasilがランダムに生成するって方式です
160: ◆Meriken//XXX 2013/09/26(木)09:06 ID:6FvOHAWcP(3/9) AAS
>>158
2ちゃんねる受け渡しを行うのはちょっと無理がありますが、ゆぐちゃんでは
ありでしょう。あ、あと私は最初に間違えてしまっていたのですが、
SHA-1のブロックの長さは64バイトですがメッセージの長さを格納するのに
8バイト必要なので、キーの長さは56文字が最適になります。
実装する際にはW[12]までの途中経過(A, B, C, D, E)を検索開始時に
クライアントに渡してやればいいだけです。最初の依頼を解決した時点で
検索をやり直すようにしてやればセキュリティ上の問題もないでしょう。
上下前次1-新書関写板覧索設栞歴
あと 835 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.013s