python网络爬虫采集联想词示例


Posted in Python onFebruary 11, 2014

python爬虫_采集联想词代码

#coding:utf-8
import urllib2
import urllib
import re
import time
from random import choice
#特别提示,下面这个list中的代理ip可能失效,请换上有效的代理ip
iplist  = ['27.24.158.153:81','46.209.70.74:8080','60.29.255.88:8888']
list1 = ["集团","科技"]
for item in list1:
    ip= choice(iplist)
    gjc = urllib.quote(item)
    url = "http://sug.so.360.cn/suggest/word?callback=suggest_so&encodein=utf-8&encodeout=utf-8&word="+gjc
    headers = {
                "GET":url,
                "Host":"sug.so.360.cn",
                "Referer":"http://www.so.com/",
                "User-Agent":"sMozilla/5.0 (Macintosh; Intel Mac OS X 10_8_4) AppleWebKit/537.17 (KHTML, like Gecko) Chrome/24.0.1312.56 Safari/537.17",
                }
    proxy_support = urllib2.ProxyHandler({'http':'http://'+ip})
    opener = urllib2.build_opener(proxy_support)
    urllib2.install_opener( opener )
    req = urllib2.Request(url)
    for key in headers:
        req.add_header(key,headers[key])
    html = urllib2.urlopen(req).read()
    ss = re.findall("\"(.*?)\"",html)
    for item in ss:
        print item
    time.sleep(2)
Python 相关文章推荐
Python线程的两种编程方式
Apr 14 Python
Python使用chardet判断字符编码
May 09 Python
python中json格式数据输出的简单实现方法
Oct 31 Python
用tensorflow构建线性回归模型的示例代码
Mar 05 Python
django小技巧之html模板中调用对象属性或对象的方法
Nov 30 Python
简单了解python的break、continue、pass
Jul 08 Python
使用pickle存储数据dump 和 load实例讲解
Dec 30 Python
利用setuptools打包python程序的方法步骤
Jan 18 Python
Django 解决阿里云部署同步数据库报错的问题
May 14 Python
keras实现VGG16 CIFAR10数据集方式
Jul 07 Python
Opencv 图片的OCR识别的实战示例
Mar 02 Python
python实现一个简单的贪吃蛇游戏附代码
Jun 28 Python
python基础教程之实现石头剪刀布游戏示例
Feb 11 #Python
python使用递归解决全排列数字示例
Feb 11 #Python
python基础教程之popen函数操作其它程序的输入和输出示例
Feb 10 #Python
python基础教程之python消息摘要算法使用示例
Feb 10 #Python
go和python调用其它程序并得到程序输出
Feb 10 #Python
python实现socket端口重定向示例
Feb 10 #Python
python访问sqlserver示例
Feb 10 #Python
You might like
合并ThinkPHP配置文件以消除代码冗余的实现方法
2014/07/22 PHP
JQuery 选择和过滤方法代码总结
2010/11/19 Javascript
js自定义事件及事件交互原理概述(二)
2013/02/01 Javascript
window.showModalDialog()返回值的学习心得总结
2014/01/07 Javascript
jquery仿QQ登录账号选择下拉框效果
2016/03/22 Javascript
Angularjs中$http以post请求通过消息体传递参数的实现方法
2016/08/05 Javascript
javascript实现简单的on事件绑定
2016/08/23 Javascript
jquery实现input框获取焦点的简单实例
2017/01/26 Javascript
利用Angular2 + Ionic3开发IOS应用实例教程
2018/01/15 Javascript
p5.js 毕达哥拉斯树的实现代码
2018/03/23 Javascript
webpack4+react多页面架构的实现
2018/10/25 Javascript
jQuery实现模拟搜索引擎的智能提示功能简单示例
2019/01/27 jQuery
laydate只显示时分 不显示秒的功能实现方法
2019/09/28 Javascript
vuex actions异步修改状态的实例详解
2019/11/06 Javascript
[01:36:17]DOTA2-DPC中国联赛 正赛 Ehome vs iG BO3 第一场 1月31日
2021/03/11 DOTA
python实现文本去重且不打乱原本顺序
2016/01/26 Python
Collatz 序列、逗号代码、字符图网格实例
2017/06/22 Python
Python自定义简单图轴简单实例
2018/01/08 Python
Python之csv文件从MySQL数据库导入导出的方法
2018/06/21 Python
python顺序的读取文件夹下名称有序的文件方法
2018/07/11 Python
对python的输出和输出格式详解
2018/12/08 Python
Python 运行 shell 获取输出结果的实例
2019/01/07 Python
python基于paramiko将文件上传到服务器代码实现
2019/07/08 Python
在Python中等距取出一个数组其中n个数的实现方式
2019/11/27 Python
Tensorflow之梯度裁剪的实现示例
2020/03/08 Python
Python项目打包成二进制的方法
2020/12/30 Python
CSS3教程(2):网页边框半径和网页圆角
2009/04/02 HTML / CSS
CSS3 网页下拉菜单代码解释 中文翻译
2010/02/27 HTML / CSS
简单总结CSS3中视窗单位Viewport的常见用法
2016/02/04 HTML / CSS
KIKO MILANO荷兰网上商店:意大利专业化妆品品牌
2017/05/12 全球购物
摄影实习自我鉴定
2013/09/20 职场文书
教师对学生的寄语
2014/04/03 职场文书
二年级班级文化建设方案
2014/05/10 职场文书
2016优秀班主任个人先进事迹材料
2016/02/26 职场文书
mysql 带多个条件的查询方式
2021/06/05 MySQL
Lakehouse数据湖并发控制陷阱分析
2022/03/31 Oracle