• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

Python3 使用selenium插件爬取苏宁商家联系电话

python 搞代码 4年前 (2022-01-07) 19次浏览 已收录 0个评论

这篇文章主要介绍了Python3 selenium爬取苏宁商家联系电话,此处使用了selenium插件 使用的是火狐浏览器 信息存储到csv表格里面,需要的朋友可以参考下

Selenium简介

Selenium是一个用于测试网站的自动化测试工具,支持各种浏览器包括Chrome、Firefox、Safari等主流界面浏览器,同时也支持phantomJS无界面浏览器。

此处使用了selenium插件 使用的是火狐浏览器 信息存储到csv表格里面

前面详细不多讲如果条件不满足自行百度安装

 # -*- coding: utf-8 -*- """ Created on Wed Dec 11 20:21:04 2019 @author: Administrator """ from selenium import webdriver import time import random import csv import codecs #此处为要爬取的页数默认为 50页 yema = 50 #要爬取的网址 此处网址为搜索详细产品出现的产品搜索结果页 #注意苏宁搜索行业词出现的产品页面是不一样的 wangzhi = "https://search.suning.com/%E4%BC%91%E9%97%B2%E9%A3%9F%E5%93%81/" #code<b style="color:transparent">来源gao@!dai!ma.com搞$$代^@码网</b>vs 防止中文写入时乱码 f = codecs.open('suning.csv','a',encoding='utf-8') csv_writer = csv.writer(f) #谷歌 #browser = webdriver.chrom.webdirver.WebDriver(executable_path="chromedriver") #火狐 browser1 = webdriver.Firefox(executable_path="geckodriver") def browser_1(url,browser=browser1): #打开网页 browser.get(url) return(browser) browser = browser_1(wangzhi) #通过class找到元素 #input_guanggao = browser.find_element_by_class_name("close-btn") #点一下 #input_guanggao.click() #输入 #input_txt.send_keys("111") #翻页键 #next_page = browser.find_element_by_class_name("next") #数据提取 urls = [] nub = 1 for i in range(yema-1): print(i) #将滚动条拖到底部 js="var q=document.documentElement.scrollTop=100000" browser.execute_script(js) time.sleep(random.randint(5,10)) shops = browser.find_elements_by_class_name("sellPoint") for shop in shops: #print(shop) #print("*"*10) url = shop.get_attribute('href') vip = "/0000000000/" if vip not in url: urls.append(url) print(i,"--",nub,"--",url) nub += 1 print(i,"页") i += 1 js="var q=document.documentElement.scrollTop=500" browser.execute_script(js) time.sleep(random.randint(3,5)) next_page = browser.find_element_by_class_name("next") time.sleep(random.randint(3,5)) next_page.click() time.sleep(random.randint(5,8)) print("---"*10) for ul in urls: browser_shop = browser_1(ul) #公司名称 chead_companyName = browser_shop.find_element_by_id("chead_companyName") #电话 chead_telPhone = browser_shop.find_element_by_id("chead_telPhone") #地址 chead_companyAddress = browser_shop.find_element_by_id("chead_companyAddress") browser_shop.find_element_by_class_name("storname").click() #chead_telPhone.find_element_by_xpath("//*[contains(text(),'13816391436')]").click() companyName = chead_companyName.text if companyName == "": companyName = "null" telPhone = chead_telPhone.text if telPhone == "": telPhone = "null" companyAddress = chead_companyAddress.text if companyAddress == "": companyAddress = "null" print(companyName,"==",telPhone,"==",companyAddress) csv_writer.writerow([companyName,telPhone,companyAddress]) #browser_shop.close() f.close() print("结束")  

总结

以上所述是小编给大家介绍的Python3 使用selenium插件爬取苏宁商家联系电话,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对gaodaima搞代码网网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

以上就是Python3 使用selenium插件爬取苏宁商家联系电话的详细内容,更多请关注gaodaima搞代码网其它相关文章!


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:Python3 使用selenium插件爬取苏宁商家联系电话

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址