در این مقاله قرار است یک روبات بنویسیم که مطالب یک سایت را بخواند و در دیتابیس ذخیره کند ولی چگونه؟
من برای اینکار از چند تا کتابخانه استفاده خواهم کرد.
import urllib
site = urllib.urlopen('http://www.google.com')
site_data = site.read()
site.close()
در urllib به سادگی می توانید یک آدرس را دانلود کنید. ما برای scrap باید آدرس را بسازیم و هر دفعه دوباره دانلود کنیم.
