[過去ログ] 2ちゃんねるスレタイ検索 dig.2ch.net(ver 0.01)★2 (1001レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
67: dig ★ 2014/08/05(火)01:26 ID:??? BE AAS
BEアイコン:nida.gif
数字の時はこうやったんだけど、
Perl Shift-Jis の文字列
$subject =~ s/([0-9])/"\x82".chr(79+$1)/eg; # ここで変換

こんな感じで一発で半角=>全角の変換をやりたいだ
68
(1): Mango Mangue ★ 2014/08/05(火)01:33 ID:??? BE AAS
BEアイコン:mac.gif
この辺り参照かな。
外部リンク:www.serendip.ws
use Unicode::Normalize;
は既に入っていると思います。
69
(2): 動け動けウゴウゴ2ちゃんねる 2014/08/05(火)02:05 ID:WFTVKK65(3/3) AAS
これ、スレが立ってから検索に反映されるまでのタイムラグはどのくらいありますか?
重複チェックで重要になってくるので
70: 動け動けウゴウゴ2ちゃんねる 2014/08/05(火)02:10 ID:PZun78jG(2/7) AAS
>>69
重複確認はsubject.txt更新したほうがわかりやすいと思うけどねぇ
たいがいの専ブラなら次スレ候補も瞬時に検索できるわけだしさ
でも目標は>>1にある通りこんな感じ
> 3. 高速検索
>   0.1秒以下で検索したい
71: dig ★ 2014/08/05(火)03:02 ID:??? AAS
うーむ、難しそうだ
72: 動け動けウゴウゴ2ちゃんねる 2014/08/05(火)03:05 ID:PZun78jG(3/7) AAS
専ブラの外部コマンド書くときはUTF-8ってのはちょっとだけハードル高い
73: dig ★ 2014/08/05(火)03:54 ID:??? AAS
>>69
現在10分に一回データ集めてまーす
74
(1): 動け動けウゴウゴ2ちゃんねる 2014/08/05(火)03:56 ID:PZun78jG(4/7) AAS
10分に1回ってお猿さんの人気スレ更新と被ってて重くならない?
75: dig ★ 2014/08/05(火)04:05 ID:??? AAS
1000というのを作った
76
(1): dig ★ 2014/08/05(火)04:07 ID:??? AAS
>>74
どうなんだろ
digは一回のデータ集めに15秒ほどかかっています
ピーク時は10以上かかる時も見受けられるが
77
(1): dig ★ 2014/08/05(火)04:08 ID:??? AAS
>>22
1000というのを作った
78
(1): dig ★ 2014/08/05(火)04:23 ID:??? AAS
板の絞込みの練習をしてみよう
79: 動け動けウゴウゴ2ちゃんねる 2014/08/05(火)04:35 ID:PZun78jG(5/7) AAS
>>76
困ったら考えようそうしよう
80: 動け動けウゴウゴ2ちゃんねる 2014/08/05(火)04:41 ID:PZun78jG(6/7) AAS
>>77
専ブラにコマンド使って検索結果を疑似板にするのもその程度が無難だと思うます

>>78
板ソートじゃダメかしら?
81: 動け動けウゴウゴ2ちゃんねる 2014/08/05(火)04:42 ID:PZun78jG(7/7) AAS
あ、検索用コマンドで「板」が使える前提で!
82: dig ★ 2014/08/05(火)06:33 ID:??? AAS
板で絞込み(開発中) の練習がうまくいった。
83: dig ★ 2014/08/05(火)06:55 ID:??? AAS
今で413159 スレッドあるらなぁ
DAT持ってくきて貯めておくのは躊躇するなぁ
何かいい方法はないものか、
84: 動け動けウゴウゴ2ちゃんねる 2014/08/05(火)07:13 ID:2YBkKBu9(1) AAS
スレタイならヘッドラインからもらえば?
レスもbbs.cgiから送ってもらうとか。

DATも1スレ500KBとして、約200GB。
SSDの容量は分かんないけど、ライブなのは、
/mdとかtmpfsに放り込んでおけば。

DATの収容位置情報(ディレクトリ?)は、
小さなDB(オンメモリで十分?)で事足りるんじゃない?
85
(3): dig ★ 2014/08/05(火)07:19 ID:??? AAS
最終更新日時でソートするとなると
現在の10分で更新でも10分間に413159 回DATにアクセスしなきゃならないと思うんだ
ましてや目標の1分更新となると・・

なんか計算間違ってるのかな?
86
(1): 動け動けウゴウゴ2ちゃんねる 2014/08/05(火)08:16 ID:Bif7GE7k(1) AAS
>>85
そういう用途に便利なファイルを各板側で吐いておいてもらうほうが効率的だと思うけど(専ブラにも有難いし)、
subject.txtは拾ってるのだからレス数が変化したdatに対してのみHEADすれば良いのでは?
1-
あと 915 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.011s