のぶLab.

流しのソフトウェアエンジニアの雑記帳. Android, Scala, Clojure, Ruby on Railsなど

Scrapyでtdタグ内の要素が取得できない

div > table > tbody > tr > tdとなっているtdタグ内のテキストを取得する場合、
XPathを下のように書くとダメ

//div[@id='hoge']/table/tbody/tr[i]/td[j]/text()

tbodyタグがあってもtbodyは書かず、
このようにしないといけないらしい

//div[@id='hoge']/table/tr[i]/td[j]/text()


参考
http://stackoverflow.com/questions/19380185/not-able-to-extract-text-from-the-td-tag-element-using-python-scrapy