[過去ログ] Bluesky ブルースカイ 8 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
665: 2024/11/28(木)15:24 ID:xY8ysxgb0(4/6) AAS
そんな中、エンジニアのDaniel van Strien氏は2024年11月26日に「Blueskyでの100万件の投稿を用いたデータセットをHugging Face上に公開しました」と発表しました。Van Strien氏はこのデータセットについて「ソーシャルメディアコンテンツに関する言語モデルのトレーニングとテスト、ソーシャルメディアでの投稿パターンの分析、会話構造と返信ネットワークの研究、ソーシャルメディアコンテンツのモデレーションに関する研究、およびソーシャルメディアデータを使用した自然言語処理タスクに使用できます」と述べています。

投稿の中でVan Strien氏は「データセットの作成にはBlueskyのAPIであるFirehoseを利用しました」と説明しています。Firehoseは、すべての投稿をリアルタイムでストリーミングできるAPIで、第三者が投稿データを自由に使用することを可能にするというものです。

しかし、一部のユーザーからはこのデータセットに対して批判が殺到しました。あるユーザーは、「Xによるくだらないスクレイピングから離れるためにBlueskyに移行したのに、BlueskyのデータをAIのトレーニングに利用しようとするあなたは最低だ」と厳しくVan Strien氏を追求しています。

こうした批判を受けてVan Strien氏は2024年11月27日に、該当のデータセットをHugging Faceのリポジトリから削除。Van Strien氏は「私はプラットフォームのツール開発をサポートしたかったのですが、今回のアプローチはデータ収集における透明性と同意の原則に反していると認識しました。今回の過ちをおわびいたします」と述べています。

データセットが公開された後にBlueskyは公式アカウントを更新し、「AI学習への利用に同意するか否かを明示する仕組み」を開発中であることを明らかにしました。
省2
1-
あと 337 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.007s