• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

使用python BeautifulSoup库抓取58手机维修信息

python 搞代码 4年前 (2022-01-09) 24次浏览 已收录 0个评论

直接上代码:

#!/usr/bin/python<BR># -*- coding: utf-8 -*-</P><P>import urllib</P><P>import os,datetime,string</P><P>import sys</P><P>from bs4 import BeautifulSoup</P><P>reload(sys)</P><P>sys.setdefaultencoding('utf-8')</P><P>__BASEURL__ = 'http://bj.58.com/'</P><P>__INITURL__ = "http://bj.58.com/shoujiweixiu/"</P><P>soup = BeautifulSoup(urllib.urlopen(__INITURL__))</P><P>lvlELements = soup.html.body.find('div','selectbarTable').find('tr').find_next_sibling('tr')('a',href=True)</P><P>f = open('data1.txt','a')</P><P>for element in lvlELements[1:]:</P><P>    f.write((element.get_text()+'\n\r' ))</P><P>    url = __BASEURL__ + element.get('href')</P><P>    print url</P><P>    soup = Beau<strong style="color:transparent">来源gaodai#ma#com搞@代~码$网</strong>tifulSoup(urllib.urlopen(url))</P><P>    lv2ELements = soup.html.body.find('table','tblist').find_all('tr')</P><P>    for item in lv2ELements:<BR>        addr = item.find('td','t').find('a').get_text()<BR>        phone = item.find('td','tdl').find('b','tele').get_text()<BR>        f.write('地址:'+addr +' 电话:'+ phone + '\r\n\r')</P><P>f.close()<BR>

直接执行后,存在 data1.txt中就会有商家的地址和电话等信息。
BeautifulSoup api 的地址为: http://www.crummy.com/software/BeautifulSoup/bs4/doc/


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:使用python BeautifulSoup库抓取58手机维修信息
喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址