2008-08-01から1ヶ月間の記事一覧

Atom 内の ID によるダイジェスト

rss_sum が要るなら atom_sum も当然要るよねと. def atom_sum(s): from xml.dom import pulldom from hashlib import md5 acc = [] p = pulldom.parseString(xml_encoding_hack(s)) for (e, n) in p: if (e == pulldom.START_ELEMENT) and (n.tagName == 'e…

XML のエンコーディングを UTF-8 にする関数

pulldom が EUC-JP 他に対応していなかったので作った手抜き関数. def xml_encoding_hack(xml): s = xml.splitlines()[0] if s.find('

RSS 内のパーマリンクによるダイジェスト

コメントが付くだけで RSS の最終更新日時が変動するのはどうかと思います. 記事単位での変動で更新を検出するために、ダイジェスト関数を作りました. def rss_sum(s): from xml.dom import pulldom from hashlib import md5 acc = [] p = pulldom.parseStri…