python爬虫教程之爬取百度贴吧并下载的示例

这篇文章主要介绍了python爬取百度贴吧整个html文件下载到本地的示例,需要的朋友可以参考下

测试url：http://tieba.baidu.com/p/27141123322?pn=
begin 1
end 4

代码如下:

import string ,urllib2

def baidu_tieba(url,begin_page,end_page):
    for i in range(begin_page, end_p来源gaodai$ma#com搞$代*码网age+1):
        sName = string.zfill(i,5)+ ‘.html’
        print ‘正在下载第’ + str(i) + ‘个网页，并将其存储为’ + sName + ‘……….’
        f = open (sName,’w+’)
        m = urllib2.urlopen(url + str(i)).read()
        f.write(m)
        f.close()

bdurl = str(raw_input(‘url： \n’))
begin_page = int(raw_input(‘begin :\n’))
end_page = int(raw_input(‘end : \n’))

baidu_tieba(bdurl,begin_page,end_page)

以上就是python爬虫教程之爬取百度贴吧并下载的示例的详细内容，更多请关注gaodaima搞代码网其它相关文章！

搞代码网（gaodaima.com）提供的所有资源部分来自互联网，如果有侵犯您的版权或其他权益，请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected]‍，我们会在看到邮件的第一时间内为您处理，或直接联系QQ：872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接：python爬虫教程之爬取百度贴吧并下载的示例

Hi，您需要填写昵称和邮箱！