(未完成)netkeibaのニュースを引っ張ってくるためのplagger設定ファイル

引っこ抜くメインの設定

公式配布の既存ファイルがあるんだけど
http://plagger.org/trac/browser/trunk/plagger/assets/plugins/Filter-EntryFullText/netkeiba.yaml
リニューアルされていてアドレスが違う。
アドレスだけ変えてみたんだけど、なんだかよくわからなかったので、元のを弄る形でそこら辺からコピペしつつ。
assets/plugin/Filter-EntryFullText辺りに
netkeiba2.yamlを作成

author: senchou
custom_feed_handle: http://www.netkeiba.com/
custom_feed_follow_link: /news/\?pid=news_view\&no=.*\&category=?
handle: http://www\.netkeiba\.com/news/
extract: <h2 class="title".*?>\s*(.*?)\s*</h2>.*?</table>\s*<img .*?><br />\s*(.*?)<br /><br />\s*<div align="right">(\d{4}年\d{2}月\d{2}日)</div>
extract_capture: title body date
extract_date_format: %Y年%m月%d日
extract_after_hook: |
  $data->{body} =~ s!<br /><br />\s*<div align="right">.*?ad_flash.*?</div>!!;

config.yaml

global:
  timezone: Asia/Tokyo
  
plugins:
  - module: Subscription::Config
    config:
      feed:
        - url: http://www.netkeiba.com/news/
  - module: Filter::EntryFullText

  - module: Publish::Feed
    config:
      dir: /Users/senchou/horse/rss
      format: RSS
      filename: netkeiba.rss

補足(というか言い訳)

  • 動いているようだけど、Filter-EntryFullTextが正しいのかよくわからん。
  • author。弄っておいて名前を残す方がアレと思って変えてるけど、正直コピペだけ。。。