python 爬虫 批量获取代理ip的实例代码


Posted in Python onMay 22, 2018

实例如下所示:

import urllib.request
import os, re,sys,time
try:
 from StringIO import StringIO
except ImportError:
 from io import StringIO
loca = re.compile(r"""ion":"\D+", "ti""")
#伪装成浏览器
header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36'}
class Getip():
 def __init__(self,diqu):
  self.ur ={"xicidaili国内普通代理 --1线":"http://www.xicidaili.com/nt/",
        
    "ip84国内普通代理 --2线":'http://www.ip84.com/dlpn-http/',
        
    'xicidaili国内高匿名代理 --1线':'http://www.xicidaili.com/nn/',
       
    'ip84国内高匿名代理 --2线':'http://www.ip84.com/dlgn-http/',
    
    'xicidaili国外高匿名代理 --1线':'http://www.xicidaili.com/wn/',
    
    'ip84国外高匿名代理 --2线':'http://www.ip84.com/gwgn-http/',
    'xicidaili国外普通代理 --1线':'http://www.xicidaili.com/wt/',
    'haodailiip国内混合代理 --3线':'http://www.haodailiip.com/guonei/',
    'haodailiip国外混合代理 --3线':'http://www.haodailiip.com/guoji/',
        }
  self.diqu = diqu
 
 def urlopen(self,url):
  global header
  try:
   req = urllib.request.Request(url, None, header)
   res=urllib.request.urlopen(req)
  
   return res
  except:
   pass
 def getip(self,ren):
  '''url = "http://proxy.ipcn.org/proxylist.html"#代理IP页面
  ip_proxy_re = re.compile(r"""\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}:\d{1,}""")# 直接匹配 xxx.xxx.xxx.xxx:xxxx'''
  
  url = self.ur[self.diqu]+str(ren)
  
  ip_proxy_re = re.compile(r'(\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3})\s*</td>\s*<td>\s*(\d{1,})\s*</td>\s*<[^\u4E00-\u9FA5]+>([\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*\s*[\u4E00-\u9FA5]*)\s*<')
  #################################通用正则匹配的  格式 是  (IP,端口,地区) 地区有可能包含换行和空格
  try:
   data = self.urlopen(url).read().decode('utf-8')
  except:
   return None
  
  self.rel = []
  
  ip = ip_proxy_re.findall(data)
  ##########返回的IP 就是 正则匹配的结果(IP,端口,地区) 地区有可能包含换行和空格
  
  return ip
  
if __name__ == '__main__':
 g=Getip("xicidaili国内普通代理 --1线")
 import pprint
 for x in range(4):
  ips = g.getip(1)
  print('获取到ip地址一共:',len(ips))
  pprint.pprint(ips)

以上这篇python 爬虫 批量获取代理ip的实例代码就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python连接池实现示例程序
Nov 26 Python
Python判断变量是否已经定义的方法
Aug 18 Python
Python中在脚本中引用其他文件函数的实现方法
Jun 23 Python
centos6.7安装python2.7.11的具体方法
Jan 16 Python
python使用requests模块实现爬取电影天堂最新电影信息
Apr 03 Python
Tkinter中复选菜单是否被选中的判断与设置方式
Mar 04 Python
python selenium操作cookie的实现
Mar 18 Python
OpenCV 表盘指针自动读数的示例代码
Apr 10 Python
TensorFlow打印输出tensor的值
Apr 19 Python
Python实现密钥密码(加解密)实例详解
Apr 26 Python
Python如何获取文件指定行的内容
May 27 Python
Python Merge函数原理及用法解析
Sep 16 Python
python 获取当天每个准点时间戳的实例
May 22 #Python
selenium+python 去除启动的黑色cmd窗口方法
May 22 #Python
python3实现163邮箱SMTP发送邮件
May 22 #Python
django请求返回不同的类型图片json,xml,html的实例
May 22 #Python
Django使用HttpResponse返回图片并显示的方法
May 22 #Python
python实现最长公共子序列
May 22 #Python
使用python存储网页上的图片实例
May 22 #Python
You might like
深入了解php4(1)--回到未来
2006/10/09 PHP
PHP伪静态写法附代码
2008/06/20 PHP
php下清空字符串中的HTML标签的代码
2010/09/06 PHP
php批量添加数据与批量更新数据的实现方法
2014/12/16 PHP
浅谈PHP发送HTTP请求的几种方式
2017/07/25 PHP
TP(thinkPHP)框架多层控制器和多级控制器的使用示例
2018/06/13 PHP
SlideView 图片滑动(扩展/收缩)展示效果
2010/08/01 Javascript
js中页面的重新加载(当前页面/上级页面)及frame或iframe元素引用介绍
2013/01/24 Javascript
jQuery实现表单提交时判断的方法
2014/12/13 Javascript
Jquery实现$.fn.extend和$.extend函数
2016/04/14 Javascript
简单实现nodejs上传功能
2017/01/14 NodeJs
JS实现旋转木马式图片轮播效果
2017/01/18 Javascript
bootstrap 通过加减按钮实现输入框组功能
2017/11/15 Javascript
js的函数的按值传递参数(实例讲解)
2017/11/16 Javascript
AjaxUpLoad.js实现文件上传
2018/03/05 Javascript
Vue+Django项目部署详解
2019/05/30 Javascript
Python文件操作基本流程代码实例
2017/12/11 Python
Python 中的range(),以及列表切片方法
2018/07/02 Python
pytorch 数据处理:定义自己的数据集合实例
2019/12/31 Python
python用WxPython库实现无边框窗体和透明窗体实现方法详解
2020/02/21 Python
Python实现自动打开电脑应用的示例代码
2020/04/17 Python
宝塔面板成功部署Django项目流程(图文)
2020/06/22 Python
美国男士西装打折店:Jos. A. Bank
2017/11/13 全球购物
泰国综合购物网站:Lazada泰国
2018/04/09 全球购物
Sneaker Studio波兰:购买运动鞋
2018/04/28 全球购物
万宝龙英国官网:Montblanc手表、书写工具、皮革和珠宝
2018/10/16 全球购物
小学生倡议书范文
2014/05/13 职场文书
小学校长先进事迹材料
2014/05/13 职场文书
计算机网络专业自荐书
2014/06/09 职场文书
会计人员演讲稿
2014/09/11 职场文书
房屋租赁委托书范本
2014/10/04 职场文书
2014年数学教师工作总结
2014/12/03 职场文书
2015年全国助残日活动方案
2015/05/04 职场文书
盗窃案辩护词
2015/05/21 职场文书
就业推荐表院系意见
2015/06/05 职场文书
八年级作文之友谊
2019/12/02 职场文书