[過去ログ]
★★★ビルメンテナンス(設備)Part.400★★★ (1002レス)
上
下
前
次
1-
新
このスレッドは過去ログ倉庫に格納されています。
次スレ検索
歴削→次スレ
栞削→次スレ
過去ログメニュー
885
: 2021/05/01(土)16:43
ID:h8DFFGZ+0(144/215)
AA×
[240|
320
|
480
|
600
|
100%
|
JPG
|
べ
|
レス栞
|
レス消
]
885: [sage] 2021/05/01(土) 16:43:23.13 ID:h8DFFGZ+0 PythonによるWebスクレイピングでは、requests と Beautiful Soup の2つのライブラリが定番です。requestsでHTMLをダウンロードし、Beautiful Soup で解析して情報を取り出します。 Beautiful Soup でHTMLの中からHTML要素を取得するには「find系」(find_all()、find())と「select系」(select()、select_one())という2タイプのメソッドを用います。 機能は2つとも同じであり、検索条件に合うHTML要素を返します。 異なるのは「検索条件の指定方法」です。例えば、href属性が”sample.pdf”のa要素を検索するには、それぞれ以下のような書き方になります。どちらも同じ要素を返します。 soup.find_all("a", href="sample.pdf") soup.select("a[href='sample.pdf']") このように、find_all()メソッドは「要素名」に続いて「属性」をキーワード引数で指定できます。一方、select()メソッドは、「CSSセレクタ」が使えます。 find_all()とselect()は要素をリストで返しますが、以下の表のようにマッチする要素をひとつだけ返すメソッドも用意されています。 http://medaka.5ch.net/test/read.cgi/job/1619823523/885
によるスクレイピングでは と の2つのライブラリが定番ですでをダウンロードし で解析して情報を取り出します での中から要素を取得するには系と系という2タイプのメソッドを用います 機能は2つとも同じであり検索条件に合う要素を返します 異なるのは検索条件の指定方法です例えば属性がの要素を検索するにはそれぞれ以下のような書き方になりますどちらも同じ要素を返します このようにメソッドは要素名に続いて属性をキーワード引数で指定できます一方メソッドはセレクタが使えます とは要素をリストで返しますが以下の表のようにマッチする要素をひとつだけ返すメソッドも用意されています
上
下
前
次
1-
新
書
関
写
板
覧
索
設
栞
歴
あと 117 レスあります
スレ情報
赤レス抽出
画像レス抽出
歴の未読スレ
AAサムネイル
ぬこの手
ぬこTOP
0.040s