• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

python 爬虫 批量获取代理ip的实例代码

python 搞代码 4年前 (2022-01-07) 52次浏览 已收录 0个评论

今天小编就为大家分享一篇python 爬虫 批量获取代理ip的实例代码,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

实例如下所示:

 import urllib.request import os, re,sys,time try: from StringIO import StringIO except ImportError: from io import StringIO loca = re.compile(r"""ion":"\D+", "ti""") #伪装成浏览器 header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36'} class Getip(): def __init__(self,diqu): self.ur ={"xicidaili国内普通代理 --1线":"http://www.xicidaili.com/nt/", "ip84国内普通代理 --2线":'http://www.ip84.com/dlpn-http/', 'xicidaili国内高匿名代理 --1线':'http://www.xicidaili.com/nn/', 'ip84国内高匿名代理 --2线':'http://www.ip84.com/dlgn-http/', 'xicidaili国外高匿名代理 --1线':'http://www.xicidaili.com/wn/', 'ip84国外高匿名代理 --2线':'http://www.ip84.com/gwgn-http/', 'xicidaili国外普通代理 --1线':'http://www.xicidaili.com/wt/', 'haodailiip国内混合代理 --3线':'http://www.haodailiip.com/guonei/', 'haodailiip国外混合代理 --3线':'http://www.haodailiip.com/guoji/', } self.diqu = diqu def urlopen(self,url): global header try: req = urllib.request.Request(url, None, header) res=urllib.request.urlopen(req) return res except: pass def getip(self,ren): '''url = "http://proxy.ipcn.org/proxylist.html"#代理IP页面 ip_proxy_re = re.compile(r"""\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}:\d{1,}""")# 直接匹配 xxx.xxx.xxx.xxx:xxxx''' url = self.ur[self.diqu]+str(ren) ip_proxy_re = re.compile(r'(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})\s*</td>\s*<td>\s*(\d{1,})\s*</td>\s*([\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*)\s*<') #################################通用正则匹配的  格式 是  (IP,端口,地区) 地区有可能包含换<em style="color:transparent">来源[email protected]搞@^&代*@码网</em>行和空格 try: data = self.urlopen(url).read().decode('utf-8') except: return None self.rel = [] ip = ip_proxy_re.findall(data) ##########返回的IP 就是 正则匹配的结果(IP,端口,地区) 地区有可能包含换行和空格 return ip if __name__ == '__main__': g=Getip("xicidaili国内普通代理 --1线") import pprint for x in range(4): ips = g.getip(1) print('获取到ip地址一共:',len(ips)) pprint.pprint(ips) 

以上这篇python 爬虫 批量获取代理ip的实例代码就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持gaodaima搞代码网

以上就是python 爬虫 批量获取代理ip的实例代码的详细内容,更多请关注gaodaima搞代码网其它相关文章!


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:python 爬虫 批量获取代理ip的实例代码
喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址