[過去ログ] 秀丸エディタスレ Part5 (983レス)
上下前次1-新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
133(1): 04/02/02 04:58 ID:9HIVTzWU(1) AAS
>>132
それだけだと仕様が曖昧だと思う。
外部リンク:www.example.com
外部リンク:www.example.com
外部リンク:www.example.com
ってなってたらどうするの?とか
外部リンク:www.foo.example.com
外部リンク:www.example.com
外部リンク:ftp.example.com
の場合はどうするべきなんだろう?とか。
省5
134(1): 04/02/02 05:16 ID:B9ALz/DG(4/4) AAS
>133
外部リンク:www.example.com
***がなんでも
外部リンク:www.example.com
で抽出してもらいたいです。
外部リンク:www.***.example.com/
も同じで***の部分が何であれ、
外部リンク:www.example.comで抽出してもらいたいです。
>あと、一行おきって・・・
外部リンク:www.example001.com
省6
135(2): 04/02/02 07:18 ID:PIdfa7Ns(1) AAS
サブドメインのそのまたサブドメインを機械的に判別するのは無理でしょ。
全てのURLからトップドメインを抜き出すだけならできるよ。
外部リンク:www.foo.example.com → example.com
136(1): 04/02/02 07:29 ID:qoo9LRb/(1) AAS
>>134
タグつき正規表現
137: 135 04/02/02 08:46 ID:tTEyi7Ye(1) AAS
俺は嘘をついているな。
外部リンク[html]:www.nic.ad.jp
138(2): 04/02/02 15:03 ID:p6E++4OC(1/5) AAS
>135
>全てのURLからトップドメインを抜き出すだけならできるよ。
それの方法を教えてもらえませんか?
>>136
正規表現かけないんですよ。。。
書ける人が羨ましい
139: 04/02/02 17:59 ID:rqr6KZ7z(1) AAS
30分くらいで多少のことは出来るようになるぞ
140(2): 04/02/02 18:58 ID:z3xZQdf8(1/3) AAS
これ案外難しいな。
外部リンク:www.sub-001.example.com
→ 外部リンク:www.example.com
外部リンク:www.sub2.example.co.jp
→ 外部リンク:www.example.co.jp
外部リンク:www.sub03.example.jp
→ 外部リンク:www.example.jp
の置換を一発でしようと思うと……むむむ……。
141: 04/02/02 19:06 ID:jQ4ii+kW(1/5) AAS
こんなんでどうだ?
disabledraw;
gofiletop;
while (1) {
searchdown "http://[a-z0-9]+\\.([a-z0-9]+\\.)*[a-z0-9]+\\.[a-z0-9]+", regular;
if (!result) break;
$url[#i] = gettext(foundtopx, foundtopy, foundendx, foundendy);
#i = #i + 1;
}
if (#i == 0) {
省11
142: 04/02/02 19:10 ID:jQ4ii+kW(2/5) AAS
ちょい訂正
if(#i == 0) {
message "URLがありません\n";
endmacro; // ←追加
}
143: 04/02/02 19:11 ID:5VCKvYL4(1) AAS
共通部分を抜き出したんだよね?
144: 04/02/02 19:22 ID:jQ4ii+kW(3/5) AAS
重複を削除したければケツに↓を追加して。
// 重複を削除
selectall;
run "sort < con > con";
gofiletop;
while (lineno != linecount) {
$url2 = gettext(x, y, 1000, y);
if ($url1 == $url2) {
deleteline;
}
省6
145: 04/02/02 19:28 ID:jQ4ii+kW(4/5) AAS
すまん、もうひとつ訂正。
searchdown を searchdown2 に置き換えてくれ。
でないとファイルの先頭にURLがあった場合ひろいそこねる。
146(1): 140 04/02/02 19:34 ID:z3xZQdf8(2/3) AAS
http://\f[^/]+\.\f[^/\.][^/\.][^/\.]+(\.[^/\.][^/\.]\.jp|\.jp|\.[^/\.][^/\.][^/\.]+)\f(/.*)?$
正規表現を弄ってみた。
TLDがjpか汎用かで分岐して処理して、
example.co.jp
example.jp
example.com
全部処理できるようになってる。
147(1): 04/02/02 20:02 ID:jQ4ii+kW(5/5) AAS
>>146
あ、 co.jp とかがあったか。
だけど、140さんの正規表現ってあってる?
俺のは ([a-z0-9]+\\.)* の部分で
外部リンク:www.aaa.bbb.example.com
の aaa.bbb の部分を引っ掛けてるんだけど、140さんのは違うっぽく見える。
単純に、
http://[a-z0-9]+\\.([a-z0-9]+\\.)*[a-z0-9]+\\.([a-z0-9]+|[a-z0-9]+\\.[a-z0-9]+)
じゃだめなのかな。
あと、ドメイン名って英小文字と数字以外も使えるんだっけ?
148(1): 04/02/02 20:23 ID:yx9gtYk7(1/2) AAS
TABで区切られた文章を整形して枠線を付けてくれるマクロが以前あったのですが、
名前わかりますか?DOWNできるるところがありましたら教えてください
149(5): 04/02/02 21:00 ID:YSVCn3b6(1) AAS
>>138
$cls = "(com|net|org|edu|gov|co|ne|or|gr|ac|ed|go|lg|ad)";
localgrep "http://", regular;
replaceallfast "^.*?http://\\f[^ /:]+\\f.*", "\\1", regular;
replaceallfast "[^.]+\\.(" + $cls + "|" + $cls + "\\.[^.]+|[^.]+)$", "\\n\\t\\0", regular;
selectall; run "sort < con > con";
selectall; run "uniq < con > con";
俺的にはこんな感じ。uniqは、
外部リンク[html]:www.vector.co.jp
とかを拾ってきて、パスの通ったフォルダに入れておいてください。
省4
150: 04/02/02 21:02 ID:SAlx06zr(1) AAS
禿丸ってみんな何に使ってるの?
151(1): 04/02/02 21:08 ID:7ojmfaOs(1) AAS
>>138
書き換えに必要な正規表現なんかすぐに覚えられるよ。
外部リンク[html]:plamid.apgeo.com
152(1): 04/02/02 21:35 ID:p6E++4OC(2/5) AAS
>151
徐々に勉強してきます。ありがとう。
>>149
結構いい感じなのですが、
改行だけのもの、同一ドメインが複数残る、
www. というものがとても多く残る
という3つが問題。
特に同一ドメインが複数出てくるのは
何とかなるとかなり助かります。
外部リンク[html]:www.vector.co.jp
省2
上下前次1-新書関写板覧索設栞歴
あと 831 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル
ぬこの手 ぬこTOP 0.154s*