All Rights Reserved, Copyright (C) 2001-2003, m@fjts.org
Last modified: Sun Sep 21 21:14:02 JST 2003

get_html_table.rb

Getting texts from table of HTML.

get_html_table.rb は、HTML ファイルから、table TAG の中の テキスト部分を取り出す機能を持っています。 このスクリプトを動かすためには、プログラミング言語 Ruby が 必要です。

簡単な Interface

簡単な Interface として、test.rb を作りました。 これは、ある HTML に対して、何番目の table の何行何列目に どんな文字が入っているのか、というのを表示させるプログラムです。
使い方ですが、例えば、Yahoo! の東京の今日明日の天気予報の形式を 知りたい場合には、次のように行います。
    % ruby -s test.rb -url=http://weather.yahoo.co.jp/weather/jp/13/4400.html 
ファイルの形式を表示させたい場合には、
    % ruby -s test.rb < htmlfile.html 
を実行してください。

実際に使用している方法

私は、html2text.rb というスクリプトを作って、 earth.rb というスクリプトと crontab を使って、定期的に Yahoo! の天気予報とトップニュースを携帯電話に 転送しています。実際には、weather.sh と topnews.sh という Wrapper を使って、それを実行しています。
ただし、Yahoo! トップニュースの形式が変わってしまったため、 topnews.sh に関しては、現在のところ、うまく動きません。

Download

License

このページの Software の License は、基本的に GPL とします。

Comment

何か、意見、要望、バグ、その他の修正等がありましたら、 Masaharu FUJITA <m@fjts.org> まで、連絡を頂ければ幸いです。


Back to software top page.
Back to top page.