selectメソッド
requests.get関数で目的のWebページに接続し、bs4.BeautifulSoup関数でHTMLの要素を切り出せる形に変換して、BeautifulSoupオブジェクトが得られます。
BeautifulSoupオブジェクトから目的のデータを取り出す方法です。
selectメソッドは複数の要素を取得します。
BeautifulSoupオブジェクトから目的のデータを取り出す方法です。
selectメソッドは複数の要素を取得します。
書式
BeautifulSoupオブジェクト.select (CSSセレクタ)
引数には取得したい要素の「CSSセレクタ」を文字列として指定する。
CSSセレクタは要素を特定するための仕組みです。
selectメソッドで基本となるCSSセレクターは、タグ名またはclass名で複数の要素を特定します。
書式例
目的のWebページのHTMLのBeautifulSoupオブジェクトが「sp」に代入されて、class名が「val」の要素を取得する場合 下記となる。
sp.select('.val')
valが複数ある場合、各要素がリストになります
それぞれの要素を取り出す場合には、valの後ろに下記の様に[インディックス番号]付ける事により取り出せます。
sp.select('.val')[0]
sp.select('.val')[1]
sp.select('.val')[2]
更に、要素にstringプロパティーを付ければ、要素の内容だけを取り出すことができます。
sp.select('.val')[0].string
sp.select('.val')[1].string
sp.select('.val')[2].string