Entries from 2007-08-30 to 1 day

ブログペット デイリーメール [2007年08月30日]

ほんとにデイリーでくるようになった。

Regex approach has three problems (at least)

Web::Scraper プレゼン@YAPC::EU: blog.bulknews.net 28枚めからの Fragile Hard to maintain improper HTML & encoding handling に感動。そこにもうひとつ only one people can maintain scraping rule というのもいれたい。 つまらない作業はひまな誰か…

download_tumblr_image.py Web::Scraper プレゼン@YAPC::EU: blog.bulknews.net77枚目DOM+Element -> XPath にある Template::Extract はじめてしった。 でもこのアプローチだとHTMLが微妙に変わったら取り出せなくなるのは変わんなかったりしないんだろう…