python 爬虫 批量获取代理ip的实例代码


Posted in Python onMay 22, 2018

实例如下所示:

import urllib.request
import os, re,sys,time
try:
 from StringIO import StringIO
except ImportError:
 from io import StringIO
loca = re.compile(r"""ion":"\D+", "ti""")
#伪装成浏览器
header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36'}
class Getip():
 def __init__(self,diqu):
  self.ur ={"xicidaili国内普通代理 --1线":"http://www.xicidaili.com/nt/",
        
    "ip84国内普通代理 --2线":'http://www.ip84.com/dlpn-http/',
        
    'xicidaili国内高匿名代理 --1线':'http://www.xicidaili.com/nn/',
       
    'ip84国内高匿名代理 --2线':'http://www.ip84.com/dlgn-http/',
    
    'xicidaili国外高匿名代理 --1线':'http://www.xicidaili.com/wn/',
    
    'ip84国外高匿名代理 --2线':'http://www.ip84.com/gwgn-http/',
    'xicidaili国外普通代理 --1线':'http://www.xicidaili.com/wt/',
    'haodailiip国内混合代理 --3线':'http://www.haodailiip.com/guonei/',
    'haodailiip国外混合代理 --3线':'http://www.haodailiip.com/guoji/',
        }
  self.diqu = diqu
 
 def urlopen(self,url):
  global header
  try:
   req = urllib.request.Request(url, None, header)
   res=urllib.request.urlopen(req)
  
   return res
  except:
   pass
 def getip(self,ren):
  '''url = "http://proxy.ipcn.org/proxylist.html"#代理IP页面
  ip_proxy_re = re.compile(r"""\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}:\d{1,}""")# 直接匹配 xxx.xxx.xxx.xxx:xxxx'''
  
  url = self.ur[self.diqu]+str(ren)
  
  ip_proxy_re = re.compile(r'(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})\s*</td>\s*<td>\s*(\d{1,})\s*</td>\s*<[^\u4E00-\u9FA5]+>([\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*)\s*<')
  #################################通用正则匹配的  格式 是  (IP,端口,地区) 地区有可能包含换行和空格
  try:
   data = self.urlopen(url).read().decode('utf-8')
  except:
   return None
  
  self.rel = []
  
  ip = ip_proxy_re.findall(data)
  ##########返回的IP 就是 正则匹配的结果(IP,端口,地区) 地区有可能包含换行和空格
  
  return ip
  
if __name__ == '__main__':
 g=Getip("xicidaili国内普通代理 --1线")
 import pprint
 for x in range(4):
  ips = g.getip(1)
  print('获取到ip地址一共:',len(ips))
  pprint.pprint(ips)

以上这篇python 爬虫 批量获取代理ip的实例代码就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
新手该如何学python怎么学好python?
Oct 07 Python
python人人网登录应用实例
Sep 26 Python
跟老齐学Python之for循环语句
Oct 02 Python
Python3实现从指定路径查找文件的方法
May 22 Python
python模仿网页版微信发送消息功能
Feb 24 Python
对numpy和pandas中数组的合并和拆分详解
Apr 11 Python
详解python的sorted函数对字典按key排序和按value排序
Aug 10 Python
python 提取tuple类型值中json格式的key值方法
Dec 31 Python
Python拼接字符串的7种方式详解
Mar 19 Python
Python Dict找出value大于某值或key大于某值的所有项方式
Jun 05 Python
python小白学习包管理器pip安装
Jun 09 Python
python 动态渲染 mysql 配置文件的示例
Nov 20 Python
python 获取当天每个准点时间戳的实例
May 22 #Python
selenium+python 去除启动的黑色cmd窗口方法
May 22 #Python
python3实现163邮箱SMTP发送邮件
May 22 #Python
django请求返回不同的类型图片json,xml,html的实例
May 22 #Python
Django使用HttpResponse返回图片并显示的方法
May 22 #Python
python实现最长公共子序列
May 22 #Python
使用python存储网页上的图片实例
May 22 #Python
You might like
PHP 高手之路(三)
2006/10/09 PHP
php 处理上百万条的数据库如何提高处理查询速度
2010/02/08 PHP
PHP数组的交集array_intersect(),array_intersect_assoc(),array_inter_key()函数的小问题
2011/05/29 PHP
PHP伪静态Rewrite设置之APACHE篇
2014/07/30 PHP
PHP利用func_get_args和func_num_args函数实现函数重载实例
2014/11/12 PHP
php获取当前页面完整URL地址
2015/12/30 PHP
网页加载时页面显示进度条加载完成之后显示网页内容
2012/12/23 Javascript
jQuery常见开发技巧详细整理
2013/01/02 Javascript
js加强的经典分页实例
2013/03/15 Javascript
从零学JSON之JSON数据结构
2014/05/19 Javascript
简介JavaScript中substring()方法的使用
2015/06/06 Javascript
浅谈JavaScript异步编程
2017/01/20 Javascript
JS中input表单隐藏域及其使用方法
2017/02/13 Javascript
详解Vue文档中几个易忽视部分的剖析
2018/03/24 Javascript
手把手教你写一个微信小程序(推荐)
2018/10/17 Javascript
[01:10:48]完美世界DOTA2联赛PWL S2 GXR vs PXG 第一场 11.18
2020/11/18 DOTA
python编写简单爬虫资料汇总
2016/03/22 Python
python中int与str互转方法
2018/07/02 Python
python根据list重命名文件夹里的所有文件实例
2018/10/25 Python
python数据处理 根据颜色对图片进行分类的方法
2018/12/08 Python
Python实现查找字符串数组最长公共前缀示例
2019/03/27 Python
python celery分布式任务队列的使用详解
2019/07/08 Python
Python实现AI自动抠图实例解析
2020/03/05 Python
CSS3中文字镂空、透明值、阴影效果设置示例小结
2016/03/07 HTML / CSS
CSS3实现可爱的小黄人动画
2016/07/11 HTML / CSS
世界上最大的乐器零售商:Guitar Center
2017/11/07 全球购物
巴西男士胡须和头发护理产品商店:Beard
2017/11/13 全球购物
乌克兰网上服装店:Bolf.ua
2018/10/30 全球购物
亚洲颇具影响力的男性在线购物零售商:His
2019/11/24 全球购物
大学生学习2014全国两会心得体会
2014/03/13 职场文书
写求职信要注意什么问题
2014/04/12 职场文书
行政助理岗位职责
2015/02/10 职场文书
2015年小学美术工作总结
2015/05/25 职场文书
2016年过年放假安排通知
2015/08/18 职场文书
python爬虫之爬取笔趣阁小说
2021/04/22 Python
golang实现一个简单的websocket聊天室功能
2021/10/05 Golang