[過去ログ] 【トリップ検索】MERIKEN's Tripcode Finder その5 (995レス)
上下前次1-新
抽出解除 必死チェッカー(本家) (べ) レス栞 あぼーん
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
405(1): ◆Meriken//XXX 2013/10/14(月)04:18 ID:cHLdpSNUP(1/13) AAS
MTFではパターンの一部(5文字)からハッシュ値を作成していて、
ハッシュ値の生成に必要な分は最初に全て展開しています。
この方法だと非常に強力な正規表現が使える代わりに
メモリの消費量は大きいです。
正規表現の部分は2年前に作ってからほとんどいじっていないので
改善の余地がかなりあります。待て屋のマッチングのアルゴリズムは
かなり特殊なのですが、これについては鳥屋氏にいろいろ教えて
いただいたので、ぜひMTFに取り込みたいところです。
406: ◆Meriken//XXX 2013/10/14(月)04:22 ID:cHLdpSNUP(2/13) AAS
>>369
どもども。10桁トリップ検索のAVX2対応の作業がおわったら新しい開発版を
うpするのでお楽しみに。
407: ◆Meriken//XXX 2013/10/14(月)04:34 ID:cHLdpSNUP(3/13) AAS
>>389
> まあもともと256bit化したときにキャッシュに乗り切るようにあんな構造にしたので。
なるほど、そういうことだったんですね。流石です。
> 107MTPSあたりで頭打ちになります。
これはおかしいですねえ。ちょっとMTFがどうなってるか調べてみます。
408: ◆Meriken//XXX 2013/10/14(月)05:17 ID:cHLdpSNUP(4/13) AAS
10桁トリップのAVX2対応のルーチンがようやく動きました。
AVX(8スレッド): 23.65M TPS
AVX2(8スレッド): 43.44M TPS
AVX2(4スレッド): 39.04M TPS
>>383よりだいぶましになりました。
CPUを定格に戻せば48.40M TPS出る計算です。
HTの効きは今ひとつなので、まだキャッシュの使い方に
改善の余地がありそうです。
あとは最終転置やキー生成の処理の見直しですね。
409: ◆Meriken//XXX 2013/10/14(月)05:39 ID:cHLdpSNUP(5/13) AAS
>>389
12桁トリップ検索はこんな感じです。速度が出ないのはなかなか謎ですねえ。
AVX(8スレッド): 117.31M TPS
AVX2(8スレッド): 215.71M TPS
AVX2(4スレッド): 184.12M TPS
410: ◆Meriken//XXX 2013/10/14(月)08:45 ID:cHLdpSNUP(6/13) AAS
キー生成のルーチンを見なおして、10桁トリップ検索の速度が
少し上がりました。
AVX2(8スレッド): 43.44M TPS -> 46.02M TPS
定格で51.28M TPS相当なので、まずまずといったところでしょう。
もうちょっと搾り取れそうな気もしますが、かなり疲れたので
取りあえず休憩することにします。
411(1): ◆Meriken//XXX 2013/10/14(月)12:17 ID:cHLdpSNUP(7/13) AAS
しかしこうなるときちんと定格で動かしてみたくなりますねえ。
これ買ってHaswellと7990を一緒に冷やそうかしらん。
外部リンク:koolance.com
414(1): ◆Meriken//XXX 2013/10/14(月)13:20 ID:cHLdpSNUP(8/13) AAS
なるほどなるほど。もうちょっとまじめに考えた方がよさそうですねえ。
こういうのが出来合いであればいいんですけど…
画像リンク[jpg]:i11.photobucket.com
外部リンク[php]:www.techpowerup.com
416: ◆Meriken//XXX 2013/10/14(月)13:24 ID:cHLdpSNUP(9/13) AAS
AVX2対応が終わったつもりでいたんですが、10桁トリップ検索の32bit版がまだでしたw
一応作っておきますが、Haswellで32bit版を使う人なんているのかしらん。
417: ◆Meriken//XXX 2013/10/14(月)13:28 ID:cHLdpSNUP(10/13) AAS
>>415
お金があったら間違いなくそれを買っていますw
419: ◆Meriken//XXX 2013/10/14(月)14:37 ID:cHLdpSNUP(11/13) AAS
ハッシュが5文字なのは、トリップの一文字が6bitで表せるので、
5文字だと30bitになって32bitワードに収まるからです。
ソースはある程度予備知識がないとちょっと追うのは厳しいかもしれません。
昔Knuth先生のLiterary Programmingを読んで非常に面白いなと思ったんですけど、
いつかあんな形でソースコードの解説を書きたいですね。
420: ◆Meriken//XXX 2013/10/14(月)14:40 ID:cHLdpSNUP(12/13) AAS
Knuth先生のはLiterate Programmingでした。
421: ◆Meriken//XXX 2013/10/14(月)14:57 ID:cHLdpSNUP(13/13) AAS
10桁トリップ検索の32bit AVX2版もえいやっと作ってしまいました。
AVX版の8割増の速度で動いているので、まあいいことにしておきます。
今日はここまでにして、明日以降にひと通りテストして新しい開発版を用意する予定です。
上下前次1-新書関写板覧索設栞歴
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.031s