Python实现抓取网页生成Excel文件的方法示例


Posted in Python onAugust 05, 2017

本文实例讲述了Python实现抓取网页生成Excel文件的方法。分享给大家供大家参考,具体如下:

Python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力

示例代码如下:

#-*- encoding:utf-8 -*-
import sys
import locale
import string
import traceback
import datetime
import urllib2
from pyquery import PyQuery as pq
# 确定运行环境的encoding
reload(sys);
sys.setdefaultencoding('utf8');
f = open('gongsi.csv', 'w');
for i in range(1,24):
  d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
  itemsa=d('dl dt a') #取title元素
  itemsb=d('dl dd') #取title元素
  for j in range(0,len(itemsa)):
    f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
  #end for
#end for
f.close();

接下来就是用Notepad++打开gongsi.csv,然后转成ANSI编码格式,保存。再用Excel软件打开这个csv文件,另存为Excel文件

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
在Python中使用matplotlib模块绘制数据图的示例
May 04 Python
Python实现类似jQuery使用中的链式调用的示例
Jun 16 Python
Python 正则表达式入门(初级篇)
Dec 07 Python
python针对excel的操作技巧
Mar 13 Python
python实现基于朴素贝叶斯的垃圾分类算法
Jul 09 Python
Python之——生成动态路由轨迹图的实例
Nov 22 Python
基于Python快速处理PDF表格数据
Jun 03 Python
python如何求圆的面积
Jul 01 Python
Python unittest装饰器实现原理及代码
Sep 08 Python
Django跨域请求原理及实现代码
Nov 14 Python
总结三种用 Python 作为小程序后端的方式
May 02 Python
python playwright之元素定位示例详解
Jul 23 Python
Python基于Socket实现的简单聊天程序示例
Aug 05 #Python
Python Socket实现简单TCP Server/client功能示例
Aug 05 #Python
对pandas的dataframe绘图并保存的实现方法
Aug 05 #Python
解决PyCharm中光标变粗的问题
Aug 05 #Python
Python实现的中国剩余定理算法示例
Aug 05 #Python
python爬虫_自动获取seebug的poc实例
Aug 05 #Python
python中的break、continue、exit()、pass全面解析
Aug 05 #Python
You might like
PHP文件生成的图片无法使用CDN缓存的解决方法
2015/06/20 PHP
PHP实现链式操作的核心思想
2015/06/23 PHP
完美解决phpexcel导出到xls文件出现乱码的问题
2016/10/29 PHP
PHP实现生成数据字典功能示例
2018/05/24 PHP
PHP registerXPathNamespace()函数讲解
2019/02/03 PHP
JQuery优缺点分析说明
2011/04/10 Javascript
js取整数、取余数的方法
2014/05/11 Javascript
jQuery遍历之next()、nextAll()方法使用实例
2014/11/08 Javascript
jquery实现将获取的颜色值转换为十六进制形式的方法
2014/12/20 Javascript
jquery仿百度百科底部浮动导航特效
2015/08/08 Javascript
JS实现单击输入框弹出选择框效果完整实例
2015/12/14 Javascript
基于jquery实现瀑布流布局
2020/06/28 Javascript
微信小程序侧边栏滑动特效(左右滑动)
2017/01/23 Javascript
js基于myFocus实现轮播图效果
2017/02/14 Javascript
AngularJS实现select的ng-options功能示例
2017/07/12 Javascript
分析JS中this引发的bug
2017/12/12 Javascript
vue项目上传Github预览的实现示例
2018/11/06 Javascript
layer 关闭指定弹出层的例子
2019/09/25 Javascript
JS数据类型STRING使用实例解析
2019/12/18 Javascript
关于AngularJS中几种Providers的区别总结
2020/05/17 Javascript
[02:14]2016国际邀请赛中国区预选赛Ehome晋级之路
2016/07/01 DOTA
[01:13:51]TNC vs Serenity 2018国际邀请赛小组赛BO2 第二场 8.18
2018/08/19 DOTA
python实现列表中最大最小值输出的示例
2019/07/09 Python
wxpython绘制圆角窗体
2019/11/18 Python
关于numpy.where()函数 返回值的解释
2019/12/06 Python
举例详解HTML5中使用JSON格式提交表单
2015/06/16 HTML / CSS
html5教你做炫酷的碎片式图片切换 (canvas)
2017/07/28 HTML / CSS
百货商场楼层班组长竞聘书
2014/03/31 职场文书
建设单位项目负责人任命书
2014/06/06 职场文书
大学感恩节活动策划方案
2014/10/11 职场文书
2014年护士工作总结范文
2014/11/11 职场文书
师德标兵事迹材料
2014/12/19 职场文书
2015婚礼主持词开场白
2015/05/28 职场文书
幼儿园体操比赛口号
2015/12/25 职场文书
十个Python自动化常用操作,即拿即用
2021/05/10 Python
python异常中else的实例用法
2021/06/15 Python