「Webサイトの情報を自動で集めたい!」 そう思ってスクレイピングを始めたものの、requests で取得した HTMLの壁(大量のタグの羅列) を前に絶望したことはありませんか? 正規表現で <p>.*?</p> のようなパターンを書いて抽出するのは、もうやめましょう。
今回はもBeautiful Soupを使ってスクレイピングでもしてみようかなと思ってnoteを書き始めています。 ☟前回のnoteをまずはお読みください(' ')ゞ 前回はAmazonサイトからキーワードに対してタイトルを抽出したのですが、今回は書籍の価格を抽出してみます。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する