[過去ログ] スパムのブラックリストを作りましょうかねぇ (573レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
215: 2013/06/08(土)13:25 ID:sCXXTasq(2/3) AAS
あなたが言っているのと同様誰でも簡単に登録できるようにということを言ってますですよ
216: ◆ERO/DUMPAE 2013/06/08(土)13:43 ID:gxL5vyIE(4/4) AAS
'`ィ (゚д゚)/ 迷走が始まりました♪
217: 2013/06/08(土)14:28 ID:W8Z5h2rx(1/2) AAS
正規表現は素人が扱うと誤削除したり、肝心な広告には効いてなかったりする
件数が増えたり複雑なパターンを書くと動作も重たくなる
簡単な方法とは言い難い

より簡単にとなると、URLっぽい部分(英数字記号のみ)を抜き出して
末尾に$付けると後方一致とか、正規表現より簡易なシステムも考えられる
(他言語を含むURLは当面無視で)
正規表現よりは安全だけど、それでも.comで登録する人が居たら同じ

そういう風にURL部分の仕組みを突き詰めると、日本語を含む広告とは別になりそう
とすると、折角の作ったシステムを、使う前に作りなおせって話になる
それはとてももったいない
218: 2013/06/08(土)14:41 ID:sCXXTasq(3/3) AAS
urlを登録したときにその前後の区切りを判別するだけで誤爆はほぼなくなる筈なので
システムの方にその判別を組み込むというのが主題だと思いますよ
(.comを登録したらとかは流石に運用上の話ですね)

hoo.co

を登録したら

hoo.co や xx.hoo.co や yy.hoo.co は削除対象
yahooo.co.jp は非削除対象という判定ですね

正規表現あんまり詳しくないんですが例えば
hoo.co → [^\w\-]hoo.co[^\w\-\.]
こんな感じに自動登録する仕組みをという話をしてるんだと思います
219
(2): Apparently admin ★ 2013/06/08(土)14:59 ID:??? AAS
どみありがとうございますGoogle.
システムはperlスクリプトではありません。それは、Haskellのプログラムです。我々は見ている
Rock54hC3G0Cサンによって提供された入力、およびいくつかの匿名の賢明な助言に
とエロ/ Dumpae-サン。現在、我々は、削除の巡航ミサイルを持っている。
これは、対象と削除を大量に行うことができます。残念なことにそこだろう
いくつかの巻き添え被害である。それは我々が構築していることが重要で貴重なツールです。
皆さんからの入力は、それが良いでしょう。今の時点で私は見ることができない
どのように我々は完全に巻き添え被害を避けることができますが、我々は最小限に、それを維持することができます。

The system is not a perl script. It is a Haskell program. We are looking
at the input provided by Rock54hC3G0C-San, and the wise advice of some anonymous
省5
220: 2013/06/08(土)15:11 ID:W8Z5h2rx(2/2) AAS
おーHaskell製か
相当レベル高いプログラマが居そうだな
221: ◆Rock54hC3G0C 2013/06/09(日)01:43 ID:/JfBpAle(1/2) AAS
>>219
Haskellって初めて聴きました。
wikipediaでHaskellを眺めてみました。
とても難解な構文だと感じました。
そしてメリットをあまり感じませんでした。
使えると「レベルの高いプログラマと認められる」のかなと、虚しく感じました。
222: ◆Rock54hC3G0C 2013/06/09(日)01:49 ID:/JfBpAle(2/2) AAS
そして、私が気に掛けているのは、実際に書き込まれたときの処理に関することです。
処理するのはbbs.cgiですので内容はperlで描かれているはずです。
(ただし、すでにHaskellで描き直されているのであればこの行以降、意味をなしません)
そのperlに実装されているRegExp(PCRE)を利用するのであれば、
諸々の注意しなければならないことがあることを助言したのであります。
223
(1): 2013/06/09(日)01:49 ID:+/y9rh3u(1/2) AAS
Haskellにも正規表現実装されてるぽいんだけど
アスキーコードに対してしか使用できない?のかな?
Jimさんも正規表現の話をperlのものとして切り捨ててるみたいだけど
逆にperlならできることを態々できない言語でやるってのは得意分野いかしてない感じだが
Haskellでやることのメリットはどの辺にあるのかな?
224: 2013/06/09(日)01:55 ID:+/y9rh3u(2/2) AAS
書き込まれた後でdatから削除するシステムみたいだから
bbs.cgiとは連動していないんじゃないかな?
225: 2013/06/09(日)02:35 ID:iw1ar9ys(1) AAS
perlだと重いんじゃない?
226: 2013/06/09(日)02:42 ID:9YqVA6Hu(1) AAS
>>223
ざっと本家を読んだ限りではプログラムの長さが短くすみ、メンテしやすい。
型(数字やテキスト)やメモリアロケーション(無限長の配列を
扱えるが、実行時にプログラム側が必要に応じて勝手にやってくれる)
の心配をせず、割とアバウトにプログラムができるためプログラミング
エラーを起こしにくい。デメリットは、実行速度の最適化が難しいのと
最初の学習ハードルが高いぐらいかな。

現在のPINKHeadlineが書き込みが行われたスレをリアルタイムでピック
アップしていることから、bbs.cgiで書かれた後のdatをスクリーニングする
仕組みがすでにあるんだろうと思う。
227: 2013/06/09(日)02:43 ID:N3FxWQCx(1) AAS
bbs.cgiには手を加えないんだと思う
だから書き込む前でなく、書き込んだ直後に削除という話になるんで

Haskellは構文解析向けだから、広告対応ならうってつけ
副作用が無いからマルチスレッド化の恩恵も受けやすい

…というのがわかってても、難しいからおれには書けない
無理に書いてもperlで書いたのと変わらない
Haskellでしっかりシステム書ける人は大したもんだなあと思うだけだよ
228: Apparently admin ★ 2013/06/09(日)07:23 ID:??? AAS
>>220-227
Perlは重要です。インターネットはPerlの上に建てられた。
良い面とすべてのプログラミング言語の悪い側面があります。
巡航ミサイルはbbs.cgiに触れていないので、rock54干渉すべきではない。
実際にはrock54は追加のチェックとして、このシステムを助けるでしょう。
Google
Perl is important. The internet was built on Perl.
There are good aspects and bad aspects of all programming languages.
The cruise missile is not touching the bbs.cgi, so it should not interfere with rock54.
In fact rock54 will help this system as an additional check.
229
(3): 2013/06/09(日)10:39 ID:64oGe8v4(1) AAS
この新システムってRock54と違って登録されたurlは一切存在を許さないってシステムだよね?
特定のurlを排除する目的で(このシステムに登録させることを目的として)マルポしてくる荒らしがでると思うけど
それはどう対処するの?
230
(1): 2013/06/09(日)12:32 ID:AttMG6Zl(1) AAS
>>229
その時は掘るんじゃないですかね
231
(1): 2013/06/09(日)12:35 ID:TZDfIxpm(1) AAS
GL7(≒広告宣伝≒スパム)に該当しないurlなら、当面これまで通り手動で削除するんでないかな
>>5
232: ◆ERO/DUMPAE 2013/06/10(月)08:10 ID:UBpIuFXz(1/4) AAS
>>229
|特定のurlを排除する目的でマルポしてくる荒らしがでると思う

( ^ω^) なかなか面白い発想であります!

結果として、排除された状態を考えてみたけれども、
ピンクちゃんねるの投稿として該当サイトへのURLが排除されるのだから
該当サイトへのURLが記載されたレスが残らない状態ですよね?

それって何かの弊害が出るのでしょうか?

現段階で想定できる弊害としては、該当サイトを話題とするスレなどでは、
該当サイトのコンテンツを示すURLが記載できない状態でしょうか?
省1
233: ◆ERO/DUMPAE 2013/06/10(月)08:12 ID:UBpIuFXz(2/4) AAS
>>219
|システムはperlスクリプトではありません。それは、Haskellのプログラムです。

Haskellか…

( ´ー`)y-~~ なんか懐かしいですね♪
234
(1): ◆ERO/DUMPAE 2013/06/10(月)08:34 ID:UBpIuFXz(3/4) AAS
(*゚ー゚) レスを全て読むのって、めんどくさい!

なのでここまでを読んで感じたことだけを書くね♪

正規表現で云々とか出ているけれども、今の段階で実装しようとしている機能性について、正規表現を掘り下げて検討する必要があるのかな?

正規表現を活用して、可変的なURLが書かれた投稿を排除すること、これは重要なことかもしれない。
けれども現段階では、完全一致で排除して行く機能を、まずは実装してみることが優先される気もする。
まずは完全一致で排除する機能をピンクちゃんねるが実装すること、これによりJIM管理人さんの意向としてスパム投稿を排除したい考えを公表できるんだと思う。

後に、いたちごっこになると思われるんだが、再びURLを変更してスパム投稿を繰り返す輩が現れた場合にどうするか?
こうしたスパムな投稿を繰り返す方々については、ピンクちゃんねるの利用をご遠慮願う事態(規制)に至るのか?
そうした場合には、該当の個人そのものの利用をご遠慮願う(個人特定での規制)のが妥当なのか?
それとも、そうした問題となるサイトへの誘導を目的とした投稿(スパム投稿)を排除するのが妥当になるのか?
省3
1-
あと 339 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.010s