新人エンジニアの方向けに、XPathとCSSセレクタを使ったスクレイピングのコツを、架空のHTML構造で丁寧に解説します。 📋 架空のECサイト構造例 まず、よくあるECサイトのHTML構造を見てみましょう。
今回はSeleniumをつかって、「HTML内の要素(element)」をみつける操作までを実施する。 人間がブラウザを操作する時は、まず自分の目で「入力エリア」や「ボタン」の位置を確認して、次にフォーカスを当てて、「キー入力操作」や「クリック操作」をしている。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する