UserIcons
Webサービスのユーザのアイコン画像を抽出するサービス http://usericons.relucks.org/ で利用しています。
http://wedata.net/databases/usericons/items
- service_name
- Webサービスの名前
- url
- 適用できるurlの正規表現。ユーザ名の部分は()でくくる
- iconPageUrl
- ユーザアイコンが表示されるページのURL。ユーザ名の部分は{user_id}にする。
- iconImageElement
- iconPageUrlでユーザアイコンの画像要素を指定するXPath式
- exampleUrl
- iconPageUrlの一例
- exampleImageUrl
- exampleUrlのユーザアイコン画像のURL
url: ^http://[^/]+\.tumblr\.com iconPageUrl: http:{user_id}.tumblr.com iconPageUrl: //link[@rel="icon"]
こんなんかなーとわ思うけど、でも、これだと
http://1.media.tumblr.com/avatar_7af799e7e291_16.png
ってなっちゃう。ほんとうにほしいのは、こっち
http://1.media.tumblr.com/avatar_7af799e7e291_64.png
で、 XPath だけで書き換えられたっけか。