All Rights Reserved, Copyright (C) 2001-2003, m@fjts.org
Last modified: Sun Sep 21 21:14:02 JST 2003
get_html_table.rb
Getting texts from table of HTML.
|
get_html_table.rb は、HTML ファイルから、table TAG の中の
テキスト部分を取り出す機能を持っています。
このスクリプトを動かすためには、プログラミング言語 Ruby が
必要です。
簡単な Interface
簡単な Interface として、test.rb を作りました。
これは、ある HTML に対して、何番目の table の何行何列目に
どんな文字が入っているのか、というのを表示させるプログラムです。
使い方ですが、例えば、Yahoo! の東京の今日明日の天気予報の形式を
知りたい場合には、次のように行います。
% ruby -s test.rb -url=http://weather.yahoo.co.jp/weather/jp/13/4400.html
ファイルの形式を表示させたい場合には、
% ruby -s test.rb < htmlfile.html
を実行してください。
実際に使用している方法
私は、html2text.rb というスクリプトを作って、
earth.rb というスクリプトと
crontab を使って、定期的に Yahoo! の天気予報とトップニュースを携帯電話に
転送しています。実際には、weather.sh と topnews.sh という
Wrapper を使って、それを実行しています。
ただし、Yahoo! トップニュースの形式が変わってしまったため、
topnews.sh に関しては、現在のところ、うまく動きません。
Download
License
このページの Software の License は、基本的に
GPL とします。
Comment
何か、意見、要望、バグ、その他の修正等がありましたら、
Masaharu FUJITA <m@fjts.org>
まで、連絡を頂ければ幸いです。
Back to software top page.
Back to top page.