python网络爬虫采集联想词示例


Posted in Python onFebruary 11, 2014

python爬虫_采集联想词代码

#coding:utf-8
import urllib2
import urllib
import re
import time
from random import choice
#特别提示,下面这个list中的代理ip可能失效,请换上有效的代理ip
iplist  = ['27.24.158.153:81','46.209.70.74:8080','60.29.255.88:8888']
list1 = ["集团","科技"]
for item in list1:
    ip= choice(iplist)
    gjc = urllib.quote(item)
    url = "http://sug.so.360.cn/suggest/word?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word="+gjc
    headers = {
                "GET":url,
                "Host":"sug.so.360.cn",
                "Referer":"http://www.so.com/",
                "User-Agent":"sMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17",
                }
    proxy_support = urllib2.ProxyHandler({'http':'http://'+ip})
    opener = urllib2.build_opener(proxy_support)
    urllib2.install_opener( opener )
    req = urllib2.Request(url)
    for key in headers:
        req.add_header(key,headers[key])
    html = urllib2.urlopen(req).read()
    ss = re.findall("\"(.*?)\"",html)
    for item in ss:
        print item
    time.sleep(2)
Python 相关文章推荐
Python深入学习之上下文管理器
Aug 31 Python
Django中使用locals()函数的技巧
Jul 16 Python
python实现教务管理系统
Mar 12 Python
Python代码块批量添加Tab缩进的方法
Jun 25 Python
django2+uwsgi+nginx上线部署到服务器Ubuntu16.04
Jun 26 Python
opencv与numpy的图像基本操作
Mar 08 Python
ubuntu 安装pyqt5和卸载pyQt5的方法
Mar 24 Python
Python 字典中的所有方法及用法
Jun 10 Python
python 生成器需注意的小问题
Sep 29 Python
Python数据模型与Python对象模型的相关总结
Jan 26 Python
从np.random.normal()到正态分布的拟合操作
Jun 02 Python
浅析Python中的套接字编程
Jun 22 Python
python基础教程之实现石头剪刀布游戏示例
Feb 11 #Python
python使用递归解决全排列数字示例
Feb 11 #Python
python基础教程之popen函数操作其它程序的输入和输出示例
Feb 10 #Python
python基础教程之python消息摘要算法使用示例
Feb 10 #Python
go和python调用其它程序并得到程序输出
Feb 10 #Python
python实现socket端口重定向示例
Feb 10 #Python
python访问sqlserver示例
Feb 10 #Python
You might like
解析file_get_contents模仿浏览器头(user_agent)获取数据
2013/06/27 PHP
php mailer类调用远程SMTP服务器发送邮件实现方法
2016/03/04 PHP
javascript中的undefined 与 null 的区别  补充篇
2010/03/17 Javascript
网站页面自动跳转实现方法PHP、JSP(上)
2010/08/01 Javascript
jquery下异步提交表单 异步跨域提交表单
2010/11/17 Javascript
JavaScript中获取未知对象属性的代码
2011/04/27 Javascript
原生js实现改变随意改变div属性style的名称和值的结果
2013/09/26 Javascript
加随机数引入脚本不让浏览器读取缓存
2014/09/04 Javascript
JavaScript中对DOM节点的访问、创建、修改、删除
2015/11/16 Javascript
JavaScript ES6的新特性使用新方法定义Class
2016/06/28 Javascript
Three.js学习之网格
2016/08/10 Javascript
js实现tab选项卡切换功能
2017/01/13 Javascript
vue2.0 + element UI 中 el-table 数据导出Excel的方法
2018/03/02 Javascript
vue解决使用webpack打包后keep-alive不生效的方法
2018/09/01 Javascript
vue-cli3 从搭建到优化的详细步骤
2019/01/20 Javascript
[jQuery] 事件和动画详解
2019/03/05 jQuery
p5.js实现故宫橘猫赏秋图动画
2019/10/23 Javascript
Layui数据表格判断编辑输入的值,是否为我需要的类型详解
2019/10/26 Javascript
vue路由拦截器和请求拦截器知识点总结
2019/11/08 Javascript
js中位数不足自动补位扩展padLeft、padRight实现代码
2020/04/06 Javascript
Flask解决跨域的问题示例代码
2018/02/12 Python
Pandas之drop_duplicates:去除重复项方法
2018/04/18 Python
Python socket实现多对多全双工通信的方法
2019/02/13 Python
Python之NumPy(axis=0 与axis=1)区分详解
2019/05/27 Python
python中封包建立过程实例
2021/02/18 Python
解决python的空格和tab混淆而报错的问题
2021/02/26 Python
水果超市创业计划书
2014/01/27 职场文书
物流创业计划书
2014/02/01 职场文书
中药学自荐信
2014/06/15 职场文书
股东授权委托书
2014/10/15 职场文书
2015年幼儿园卫生保健工作总结
2015/05/12 职场文书
如何判断微信付款码和支付宝付款码
2021/04/01 PHP
MySQL8.0.24版本Release Note的一些改进点
2021/04/22 MySQL
宝塔更新Python及Flask项目的部署
2022/04/11 Python
Python Django / Flask如何使用Elasticsearch
2022/04/19 Python
Hive常用日期格式转换语法
2022/06/25 数据库