[過去ログ] 読めないdat落ちスレのhtmlミラー避難所 (989レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
963
(1): 2006/12/02(土)18:21 ID:StO5H7q50(1/4) AAS
>>961
>htmlファイルをDLして
>htmltodatでdat化するというのはどうでしょう
htmltodatだと完全に元のdatと同じにするのは無理
964
(1): 2006/12/02(土)18:27 ID:qw0Ba7Pe0(1/3) BE AAS
>>963
>完全に
とはどういうことですか?
できれば詳しくお願いします
965
(2): 2006/12/02(土)18:42 ID:StO5H7q50(2/4) AAS
>>964
例えばここのテンプレの>>4の場合

>前スレ 読めないdat落ちスレのhtmlミラー作ります [87]
> 2chスレ:gline

が正しい形
それがにくちゃんねるのクソ仕様のhtmlの場合

>前スレ 読めないdat落ちスレのhtmlミラー作ります [87]
> ../../that3_gline/1115/1115213835.html

こんな形式になってやがる
これを現行のhtmltodatで戻すのは無理
省3
966: 2006/12/02(土)18:44 ID:IfRyt2KO0(1) AAS
にくちゃんねる内で完結している分には優れた形なんですけどね。
その代わりに汎用では無いと。
967: 2006/12/02(土)18:48 ID:qw0Ba7Pe0(2/3) BE AAS
>>965
素早く的確なレスをありがとうございます
なるほど、それですか…
確かに29chユーザーが随分悩まされてきた部分ですよね
968
(2): 2006/12/02(土)18:52 ID:2lf4ENLR0(3/6) BE AAS
>>965
下のを試してみて下さい。
スレッドURLやbeも変換出来たと思うのですが。

正規表現(改行を取り除いて)
m#<dt>([0-9]+) 名前:<span .*?>(?:<span tit
le="(.*?)" class=sage>|<a href="mail
to:(.*?)" class=mailto>)? ?(.*) (?:</a>|</sp
an>)?</span> ?(.*?) <br><dd> *?(.*?) <br> *?<b
r> *?(<a name.*?>|</tl>|</dl>)#mi

前処理(「変換オプション」から行けます)
省12
969: 2006/12/02(土)18:58 ID:2lf4ENLR0(4/6) BE AAS
で htmltodatサポ板の書き込みで聞いたのは
前処理中の

s#(>)\.\./\.\./(.+?)_(.+?)/\d+?/(\d+?)\.html(</a>)#$1http://$2\.2ch\.net/test/read\.cgi/$3/$4/$5#ig

の箇所です。
ここの「ex13」「gline」だけは欠落しているので補うしかない訳ですが
そこを半自動化出来たらいいな、と。

ただ
同じ板同じスレのhtmlを一括dat化するなら
それほど面倒でもないかもと思うですが
やはり半自動化出来ればいいな と。
1-
あと 20 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.275s*