[過去ログ] スパムのブラックリストを作りましょうかねぇ (573レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
195
(1): 2013/06/07(金)22:43 ID:VAIIW/Ia(2/4) AAS
>>192
外部リンク:nik.ne
を弾くことが出来てかつ似たドメインが誤爆しないようにする方が健全化と(今システム作ってるんですし)
そして完全に誤爆を防ぐことは出来なくてもドメインの区別くらいならできる筈なんです
196: 2013/06/07(金)22:49 ID:VAIIW/Ia(3/4) AAS
>>194
私も正規表現はあまり詳しくないですが
それだと違うような
197: Jack ★ 2013/06/07(金)22:52 ID:??? AAS
>>195
同意です。
出来るだけ基本的な部分で解決できるように力を尽くして、
それでも乗り越えられない部分については、
運用方法の工夫でやるのがよろしいと思いますです。
198
(1): 2013/06/07(金)22:55 ID:tU4D+F5N(5/5) AAS
>>194
これじゃ間違いか
登録ワード \bhoo\.co/

外部リンク:hoo.coOK
外部リンク:hoo.co NG
外部リンク:yahoo.co.jp OK
外部リンク:hoo.com OK

んー、外部リンク:hoo.coと回避してきたら\bhoo\.coでいいかな
どうしても外部リンク:hoo.comは有用だというのなら、
登録自体消去していいし、\bhoo.(?!com)coこんな感じで強引に
199: 2013/06/07(金)23:00 ID:G2XQuPsC(1) AAS
>>192
じつはRock54にはクッソ短いエントリが結構ある。
それは置いといて誤爆防止で頭に\bつけたりしてるのも結構ある。
200: 2013/06/07(金)23:17 ID:7n65HNzq(2/2) AAS
そもそもこのシステム正規表現使えるの?
ありだったらいくらでも書き様はあるけど
Jimさんのレスからして使う気なさそうに見えた

Jimさんに言うにしても、そういう広告が来てからがいいと思うんだけどな
それだったら説明簡単だし
考えられる範囲で完璧にしたいってのもわかるけど
その調子でいくといつまで経っても稼働しない=広告減らない予感が
今来てる広告に対して完璧、ぐらいでいいんじゃないのかな
201: 2013/06/07(金)23:25 ID:VAIIW/Ia(4/4) AAS
システム作りって後で直すほうが面倒だと思うんですよね
やれることは最初にやったほうがいいと思います
拡張で済むならまだしも場合によっては殆ど作り直しっていうこともありますし
わりと最悪なのが拡張していった後で根本から見直しになって
拡張にかけた手間が全部無駄というパターンですよね
202: ◆BL0xGYgxHE 2013/06/07(金)23:43 ID:roBuh4Pp(5/5) AAS
>>191
了解です
ページタイトルは固定ということもあるので慎重に行きたいですが
その時はよろしくお願いしますー
203
(1): 2013/06/07(金)23:46 ID:IlnNaWhH(1) AAS
>>198
\bhoo\.co\b
の方がマシじゃないかな?

\b が\W と\w の境目みたいな意味だったはずだし
hoo.co の直後に半角スペースとか記号ならヒットして
hoo.cool.com みたいのはヒットしないでくれると思うし

> hoo.coを見に来てね
みたいにマルチバイトが直後に来た場合にどうなるかは忘れたけど
(マルチバイトの扱いは正規表現マッチのオプションしだいだっけ?)
204: 2013/06/08(土)00:06 ID:Q6WCrlMY(1/2) AAS
>>203
> hoo.coを見に来てね

\bはあってもなくても「hoo.co」にヒットするね
まあ今のとこここまで考える必要も無いと言えば無いけど
205: 2013/06/08(土)00:50 ID:Q6WCrlMY(2/2) AAS
誤爆の問題は絶対に出てくるので、誤爆をしたらさくっと解除で問題なす
登録入れたら数日は様子見。欲を言えばklistに該当する機能があればねえ
206
(1): ◆Rock54hC3G0C 2013/06/08(土)01:46 ID:kXemJbot(1/2) AAS
>>153
→必要は
 切り離しておかないと、新型のテスト結果がわからなくなりますー♪

→丁稚どんを呼ぶ
cobra2245からの呼びかけだけに反応しますので、空のRock54リストを作っておいて、それを読みに来いと指示が出来ます。

→現状のだと思う
こちらは、旧tiger509のlatestのままと思います。

RegExpの件。
もしNGワードの探索にRegExp(正規表現)を使われるのでしたら色々と注意点があります。
ist.in も、 list.infoseek.co.jpにマッチしたりします。
省6
207: Apparently admin ★ 2013/06/08(土)05:56 ID:??? AAS
>>206
どもありがとうございます。。。:)
208
(2): ◆Rock54hC3G0C 2013/06/08(土)08:24 ID:kXemJbot(2/2) AAS
Jimさんからお手紙が来ました。
一生懸命翻訳(といっても自動翻訳機w)しながら返信します。
ただ、リアル忙なのでなかなかお手伝いまでは出来ないけれども。。。
209: Apparently admin ★ 2013/06/08(土)08:28 ID:??? AAS
>>208
時間が本質である、時間は季節、時間が理由です。私は忙しくて理解しています。
あなたは時間があるときに入力していただきありがとうございます。
Google translator
Time is the essence, time is the season, time is the reason.
I understand being busy. Thank you for your input when you have time.
210: Jack ★ 2013/06/08(土)09:31 ID:??? AAS
>>208
おつです。
日本語でも書いていただければ、
Jimさんがわからなかった場合にはわたしが翻訳できると思います。
211: ◆ERO/DUMPAE 2013/06/08(土)12:50 ID:gxL5vyIE(1/4) AAS
正規表現を活用して排除することも大切だと思います。
けれども現段階では排除に相当する語句(URL)のSPAMとしての堅実な排除が必要だと思う。

時として短縮URLを複数取得してレスを投稿するSPAMを懸念するかもしれない。
けれども、それは一つの想定であり、その想定を議論することが、現段階で必要だろうか?

 想定についての議論

これを優先する以前に、まずはBLとしての機能を第1段階として確定してはどうだろうか?
212: ◆ERO/DUMPAE 2013/06/08(土)13:00 ID:gxL5vyIE(2/4) AAS
第一段階として自動削除の機能が確定したならば、後にブラックリストの登録方法を含めて検討を重ねれば良い。
なによりも、現段階でJIM管理人が嫌うものを、排除する機能を実装することが先決のような気がする。

ちなみに、ブラックリストへの登録方法と、自動削除機能がの判定能力は密接に関連する。
さらに加えて述べれば、ブラックリストへの登録を行うスキルも、運用として密接に関連する。

特定のスキルを有する者のみが、ブラックリストへの登録を可能にするならば、幾多の仕様を関係者だけで閉鎖的に検討すれば良い。
けれども、特定のスキルを有する必要も無く、ブラックリストへの登録を含めた運用を可能にするならば、よりシンプルな仕様が望ましいだろう。
213: 2013/06/08(土)13:03 ID:sCXXTasq(1/3) AAS
現在の仕様だと短いURLをブラックリストに登録した場合に誤爆の危険性が常にあり
取り扱いが難しいのでドメインをきっちり識別できるようにしようというのが主題です
別に正規表現を駆使することで一群をまとめて処理するための話をしてるわけじゃねーです
まあついでにそれもできるようならうまーですが
214: ◆ERO/DUMPAE 2013/06/08(土)13:18 ID:gxL5vyIE(3/4) AAS
> 現在の仕様だと短いURLをブラックリストに登録した場合に誤爆の危険性が常にあり

それは運用として短いURLをブラックリストに登録することの過ちを懸念していますか?
それとも今回準備される機能に誤爆の危険性があることを懸念していますか?
1-
あと 359 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.008s