Entries from 2007-08-30 to 1 day
ほんとにデイリーでくるようになった。
Web::Scraper プレゼン@YAPC::EU: blog.bulknews.net 28枚めからの Fragile Hard to maintain improper HTML & encoding handling に感動。そこにもうひとつ only one people can maintain scraping rule というのもいれたい。 つまらない作業はひまな誰か…
download_tumblr_image.py Web::Scraper プレゼン@YAPC::EU: blog.bulknews.net77枚目DOM+Element -> XPath にある Template::Extract はじめてしった。 でもこのアプローチだとHTMLが微妙に変わったら取り出せなくなるのは変わんなかったりしないんだろう…