Python抓取百度查询结果的方法


Posted in Python onJuly 08, 2015

本文实例讲述了Python抓取百度查询结果的方法。分享给大家供大家参考。具体实现方法如下:

#win python 2.7.x
import re,sys,urllib,codecs
xh = urllib.urlopen("http://www.baidu.com/s?q1=123&rn=100").read().decode('utf-8') 
rc = re.compile(r'<td class=f><h3 class="t"><a.*?>(?P<first>.*?)</h3>',re.I)
match = rc.finditer(xh)
rcr = re.compile(r'<[^>]+>',re.I)
f = codecs.open("xiaohei.txt", "w", "utf-8")
for i in rc.finditer(xh):
  ss = i.group(0)
  s1 = rcr.sub('',ss)
  print (s1)
  f.write(s1)
f.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python入门篇之文件
Oct 20 Python
Python使用Srapy框架爬虫模拟登陆并抓取知乎内容
Jul 02 Python
Python在线运行代码助手
Jul 15 Python
centos6.7安装python2.7.11的具体方法
Jan 16 Python
python安装cx_Oracle模块常见问题与解决方法
Feb 21 Python
Python基础学习之常见的内建函数整理
Sep 06 Python
Python切片索引用法示例
May 15 Python
使用Py2Exe for Python3创建自己的exe程序示例
Oct 31 Python
Python List cmp()知识点总结
Feb 18 Python
Flask框架学习笔记之表单基础介绍与表单提交方式
Aug 12 Python
基于Python解密仿射密码
Oct 21 Python
Python3 Click模块的使用方法详解
Feb 12 Python
Python抓取淘宝下拉框关键词的方法
Jul 08 #Python
Python根据区号生成手机号码的方法
Jul 08 #Python
Python写入CSV文件的方法
Jul 08 #Python
Python打印斐波拉契数列实例
Jul 07 #Python
Python可变参数函数用法实例
Jul 07 #Python
python类和继承用法实例
Jul 07 #Python
Python实现合并字典的方法
Jul 07 #Python
You might like
PHP和XSS跨站攻击的防范
2007/04/17 PHP
[原创]效率较高的php下读取文本文件的代码
2008/07/02 PHP
PHP删除特定数组内容并且重建数组索引的方法.
2011/03/25 PHP
phpcms手机内容页面添加上一篇和下一篇
2015/06/05 PHP
Yii2超好用的日期和时间组件(值得收藏)
2016/05/05 PHP
php格式化时间戳
2016/12/17 PHP
传递参数的标准方法(jQuery.ajax)
2008/11/19 Javascript
JavaScript入门教程(11) js事件处理
2009/01/31 Javascript
JavaScript对象链式操作代码(jquery)
2010/07/04 Javascript
js自定义事件及事件交互原理概述(二)
2013/02/01 Javascript
Javascript Memoizer浅析
2014/10/16 Javascript
基于JavaScript实现百叶窗动画效果不只单纯flas可以实现
2016/02/29 Javascript
JavaScript的ExtJS框架中数面板TreePanel的使用实例解析
2016/05/21 Javascript
jQuery解决$符号命名冲突
2016/06/18 Javascript
详解微信小程序开发—你期待的分享功能来了,微信小程序序新增5大功能
2016/12/23 Javascript
layer插件select选中默认值的方法
2018/08/14 Javascript
解决VUE中document.body.scrollTop为0的问题
2018/09/15 Javascript
在vue中阻止浏览器后退的实例
2019/11/06 Javascript
Python检测网站链接是否已存在
2016/04/07 Python
Python使用lxml模块和Requests模块抓取HTML页面的教程
2016/05/16 Python
python利用dir函数查看类中所有成员函数示例代码
2017/09/08 Python
Python之web模板应用
2017/12/26 Python
pandas DataFrame 根据多列的值做判断,生成新的列值实例
2018/05/18 Python
python实现音乐下载的统计
2018/06/20 Python
Python不使用int()函数把字符串转换为数字的方法
2018/07/09 Python
tensorflow: variable的值与variable.read_value()的值区别详解
2018/07/30 Python
Python基本语法之运算符功能与用法详解
2019/10/22 Python
Python网络编程之使用TCP方式传输文件操作示例
2019/11/01 Python
Python APScheduler执行使用方法详解
2020/12/10 Python
英国时尚服饰电商:Boohoo
2017/10/12 全球购物
英国家用电器折扣网站:Electrical Discount UK
2018/09/17 全球购物
春节联欢会主持词
2014/03/24 职场文书
经济贸易专业自荐信
2014/06/11 职场文书
启动仪式策划方案
2014/06/14 职场文书
学历证明范文
2015/06/16 职场文书
分析Java中Map的遍历性能问题
2021/06/26 Java/Android