2015年1月3日土曜日

深さ優先探索、幅優先探索

pythonでの『深さ優先検索』、『幅優先検索』の実装に関して、これがすぐ見つかるんですよねぇ、楽だなぁ。

 ・集合 (set), グラフ (graph), 経路の探索

著者の方に感謝しまして、メモっときます。


【MIYADAI.com】からテクストをパクる(3)

では、PyQueryで、MIYADAI.comでテクストをパクってみます。

ここまで、BeatifulSoup、boilerpipe、PyQueryとやってみましたが、正直、テクストをぶっこ抜くだけなら、好きなのを使いなって感じです。

 import urllib2
 from pyquery import PyQuery as pq
 o   = urllib2.build_opener()
 r   = urllib2.Request('http://www.miyadai.com/index.php?itemid=1061')
 h   = o.open(r).read()
 div = pq(h).find('div')
 for n in range(0,10000) :
     t = div.eq(n).find('div.itembody').text()
     if t:
        print t
     else:
        break