[過去ログ] Internet Archive総合 (web.archive.org) #5 (1002レス)
1-

このスレッドは過去ログ倉庫に格納されています。
次スレ検索 歴削→次スレ 栞削→次スレ 過去ログメニュー
134
(1): 2023/11/11(土)13:29 AAS
Wayback Machineに保存されてるそこそこ古めのページを表示すると、一部の画像が表示されない事ってよくあるよね。
あれって何でああなってるの?たとえば以下のページなど。
外部リンク[html]:web.archive.org

このページは2002年保存だけど、比較的新しい2010年とかに保存されたページでも同現象になってたりする。
当時保存した人も、ちゃんと保存できてるか確認して、当時は問題なく表示されてたんだと思う。
今俺たちが保存してるサイトも、10年後には画像がところどころ抜け落ちて不完全な状態になるのかと不安。
135: 2023/11/11(土)13:32 AAS
確認されてないから画像が抜け落ちてる
136: 2023/11/11(土)15:59 AAS
>>134
そもそも Internet Archive でヘッドレスブラウザを実装したのがほんの数年前のことで、
それまでは指示された単一のファイルをアーカイブするだけだったから。

アーカイブされた HTML をクライアント側のブラウザで表示したときに
個々の画像等の保存リクエストが Internet Archive へ発行されるような実装が
なされたこともあったが、それ自体も 2010 年代中盤だったはず。
137
(2): 2023/11/11(土)19:27 AAS
そうかなぁ?
俺はInternet Archive側にある画像ファイルが何らかの理由で勝手に消滅したと思ってる。
以下のサイトとかもそう。画像が1つも保存されてないのはおかしいだろ。
外部リンク[html]:web.archive.org
138: 2023/11/11(土)19:39 AAS
>>137
それ Alexa のクローラが保存したアーカイブだしw
BEアイコン:2245t.png
139: 2023/11/11(土)20:41 AAS
>>137
外部リンク:ja.wikipedia.org
IA自身がクローラーを回して収集活動を始めるまでの歴史について知っておくと良い。
140: 2023/11/11(土)21:56 AAS
昔のエッチサイトで自分が見たいところだけ抜け落ちてる悲しみ(´・ω・`)
141
(1): 2023/11/13(月)01:18 AAS
IAのアーカイブって色んな団体のアーカイブがまとまったものだからな、SPNなんてごく一部だよ
画像も収集してる団体もあれば、HTMLだけを取得してる団体もあるのでアーカイブ次第
例えばウェイバックマシンを使ってるとよく目にするCommon Crawlはほぼ画像が取得されてない
142: 2023/11/13(月)11:01 AAS
確実に保存したい時は
InternetArchiveとArchive.todayどっちもアーカイブしてるわ
それで大体残ると思うけどどうだろ
143: 2023/11/13(月)21:58 AAS
>>141
それで精度だったり保存量にばらつきがあるんすね
1-
あと 859 レスあります
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.008s