[過去ログ] 【トリップ検索】MERIKEN's Tripcode Finder その5 (995レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
151
(2): ◆Meriken//XXX 2013/09/25(水)20:56 ID:Q0OWgfvvP(7/9) AAS
定格のi7-3770Kだと10桁トリップのCPU検索の速度はこんなんです。

mty_win_x64_20071012: 21.72M TPS
MTF (AVX): 25.56M TPS

大分速くなったけど、もうちょっといけそうなんだよなあ…
152: ◆Meriken//XXX 2013/09/25(水)20:59 ID:Q0OWgfvvP(8/9) AAS
6番目のS-Boxにvmovdqaが6個も残ってるぞ…
まずこいつらからやっつけないと。
153: ◆Meriken//XXX 2013/09/25(水)22:23 ID:Q0OWgfvvP(9/9) AAS
vmovdqaを2つに減らすことが出来ましたが、一時変数が1つ増えて
速度は横這いです。難しすぎる…
154
(3): ◆LoveNico9g 2013/09/26(木)02:43 ID:sJOvmiPd0(1) AAS
【診断の種類】検索速度(1パターン)
【Meriken's Tripcode Finderのバージョン】1.1 Free Edition Alpha 5 -> 1.1 Free Edition Alpha 7
【OS】Windows 7 Professional SP1
【ディスプレイドライバ】320.57

【検索デバイス】GPUとCPU
【使用するGPU】すべて使用
【GPU】GeForve GTX 650
【CPU】Ibtel Core i3-3220 CPU @ 3.30Ghz

【1SMあたりのブロック数(CUDA)】8
【CPUの命令セット】x64 + SSE2/AVX
省9
155: ◆Meriken//XXX 2013/09/26(木)04:07 ID:6FvOHAWcP(1/9) AAS
>>154
報告有り難うございます。やっぱりちょこっとだけ速くなっていますね。
動的書き換えを行っているコードをいじるのに結構神経を使ったんですが、
6.5%の速度向上だから上出来なのかな?
156: ◆HwAeH9HsBC.d 2013/09/26(木)04:34 ID:b6mTXvYaP(1/3) AAS
中間ステートを利用したら受け渡し所がなくても2ch上だけで安全にキーの交換ができるのか

80文字くらいのキーのテスト
157: ◆Meriken//XXX 2013/09/26(木)06:00 ID:6FvOHAWcP(2/9) AAS
なかなか面白い発想ですけど、キーの一部が依頼ごとに違ってくると
複数の依頼を同時に検索することが出来ないので、ちと現実的ではないですねえ。
158
(1): 2013/09/26(木)06:35 ID:b6mTXvYaP(2/3) AAS
たしかに個人に依頼する場合はやっぱり一度に一人からの依頼しか処理できなくなりますが、Yggdrasilを使うなら大丈夫ですよね?
Yggdrasilに参加しながら自分の設定した文字列も検索する場合それの結果のキーまで64文字以上になっちゃいますが
あと自分のPCで発見した場合でもサーバから64文字を受け取らないといけなくなります

このときサーバが全クライアントに同じ64文字を使ってたら困るのは
サーバはクライアントごとにキーの最初の64文字を別のにして探索してもらえばよさそうです

あと依頼を1個解決した場合最初の64文字を切り替えないと次に他の依頼を解決したときに2人の別の人に同じ64文字が流出するので
依頼を解決するごとにサーバから新しい最初の64文字を受け取る必要があります

で、OpenCLの1回のワークのまとまりに全部同じ中間状態を最初に渡すことになりそうですが、
1回のワークで複数の依頼を解決しちゃった場合どれか1個しか使えなくなります(同じ最初の64文字が2人以上に使われることになるので)
これの解決法は思いつきませんでした
159: 2013/09/26(木)06:36 ID:b6mTXvYaP(3/3) AAS
最初の64文字を依頼人が指定するんじゃなくてYggdrasilがランダムに生成するって方式です
160: ◆Meriken//XXX 2013/09/26(木)09:06 ID:6FvOHAWcP(3/9) AAS
>>158
2ちゃんねる受け渡しを行うのはちょっと無理がありますが、ゆぐちゃんでは
ありでしょう。あ、あと私は最初に間違えてしまっていたのですが、
SHA-1のブロックの長さは64バイトですがメッセージの長さを格納するのに
8バイト必要なので、キーの長さは56文字が最適になります。

実装する際にはW[12]までの途中経過(A, B, C, D, E)を検索開始時に
クライアントに渡してやればいいだけです。最初の依頼を解決した時点で
検索をやり直すようにしてやればセキュリティ上の問題もないでしょう。
161
(1): 累計 ◆wop.8OO8.qow 2013/09/26(木)09:10 ID:BeI6EFic0(1) AA×
>>99

162: ◆Meriken//XXX 2013/09/26(木)09:28 ID:6FvOHAWcP(4/9) AAS
>>161
Nehalem系でも新しいルーチンの効果に結構差がでますね。
1.0.1に比べて微減なのでまあここらへんが落とし所ですね。
報告していただいて本当に助かりました。
163: ◆Meriken//XXX 2013/09/26(木)09:34 ID:6FvOHAWcP(5/9) AAS
VEX Prefixの謎はstackoverflowで怒られながらヒントを貰って
ある程度解決することが出来ました。

Which AVX registers should I use to avoid 3-byte VEX prefixes?
外部リンク:stackoverflow.com

なるべくソースオペランドにxmm0〜xmm7を使ってやればいいようですが、
それだけではないみたいですね…

----

176 %line 611+1 Source Files\CPU10_x64_AVX.asm
177 000000F0 C5F96FFC vmovdqa xmm7, xmm4
178 %line 611+0 Source Files\CPU10_x64_AVX.asm
省17
164
(1): やんやん ◆yanyan/Pails 2013/09/26(木)09:42 ID:rTRwfDJk0(1) AAS
コードの動的書き換えまでやってるんだ。頑張るなぁ
165: ◆Meriken//XXX 2013/09/26(木)10:03 ID:6FvOHAWcP(6/9) AAS
>>164
速くするためにできることは全部やるつもりですw
10桁トリップのCPU検索だと2〜3M TPS違ってくるので、かなり大きいです。
166: ◆Meriken//XXX 2013/09/26(木)10:21 ID:6FvOHAWcP(7/9) AAS
3オペランドの命令を2-byte VEX Prefixになるように
書き換えたら遅くなったぞ。なぜだ…
167: ◆Meriken//XXX 2013/09/26(木)11:03 ID:6FvOHAWcP(8/9) AAS
うーん、やっぱりわからん…
まあいいや、また今度にしよっと。
168
(1): ◆Meriken//XXX 2013/09/26(木)12:42 ID:6FvOHAWcP(9/9) AAS
290Xが噂通りの性能なら、検索君1号の6990をリプレースしたいところですが、
どうなんでしょうねえ〜

AMD,新世代GPUシリーズ「Radeon R9」「Radeon R7」を発表
外部リンク:www.4gamer.net
169: ◆YSRKEN.ceVZZ 2013/09/26(木)21:45 ID:dy4WW+LZ0(1) AAS
>>168
絶対に値段がヤバそう、かと思いましたがそれほどでもないのかな>R9 280X(のメーカー想定売価)は299ドル
170
(1): 2013/09/26(木)22:52 ID:K0nbDP0R0(1) AAS
AMDがMantleとかいう新しいLow Level APIも発表したが
使えるのグラフィック用途だけなのかな
1-
あと 825 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.023s