「Webサイトの情報を自動で集めたい!」 そう思ってスクレイピングを始めたものの、requests で取得した HTMLの壁(大量のタグの羅列) を前に絶望したことはありませんか? 正規表現で <p>.*?</p> のようなパターンを書いて抽出するのは、もうやめましょう。
今回はもBeautiful Soupを使ってスクレイピングでもしてみようかなと思ってnoteを書き始めています。 ☟前回のnoteをまずはお読みください(' ')ゞ 前回はAmazonサイトからキーワードに対してタイトルを抽出したのですが、今回は書籍の価格を抽出してみます。