Python实现抓取网页生成Excel文件的方法示例


Posted in Python onAugust 05, 2017

本文实例讲述了Python实现抓取网页生成Excel文件的方法。分享给大家供大家参考,具体如下:

Python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力

示例代码如下:

#-*- encoding:utf-8 -*-
import sys
import locale
import string
import traceback
import datetime
import urllib2
from pyquery import PyQuery as pq
# 确定运行环境的encoding
reload(sys);
sys.setdefaultencoding('utf8');
f = open('gongsi.csv', 'w');
for i in range(1,24):
  d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
  itemsa=d('dl dt a') #取title元素
  itemsb=d('dl dd') #取title元素
  for j in range(0,len(itemsa)):
    f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
  #end for
#end for
f.close();

接下来就是用Notepad++打开gongsi.csv,然后转成ANSI编码格式,保存。再用Excel软件打开这个csv文件,另存为Excel文件

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
如何使用python爬取csdn博客访问量
Feb 14 Python
初探TensorFLow从文件读取图片的四种方式
Feb 06 Python
django启动uwsgi报错的解决方法
Apr 08 Python
PyQt5每天必学之弹出消息框
Apr 19 Python
python查看模块安装位置的方法
Oct 16 Python
Python 3.8中实现functools.cached_property功能
May 29 Python
Python求离散序列导数的示例
Jul 10 Python
使用pickle存储数据dump 和 load实例讲解
Dec 30 Python
Python 基于jwt实现认证机制流程解析
Jun 22 Python
Python实现手绘图效果实例分享
Jul 22 Python
Python reques接口测试框架实现代码
Jul 28 Python
selenium3.0+python之环境搭建的方法步骤
Feb 01 Python
Python基于Socket实现的简单聊天程序示例
Aug 05 #Python
Python Socket实现简单TCP Server/client功能示例
Aug 05 #Python
对pandas的dataframe绘图并保存的实现方法
Aug 05 #Python
解决PyCharm中光标变粗的问题
Aug 05 #Python
Python实现的中国剩余定理算法示例
Aug 05 #Python
python爬虫_自动获取seebug的poc实例
Aug 05 #Python
python中的break、continue、exit()、pass全面解析
Aug 05 #Python
You might like
PHP脚本数据库功能详解(下)
2006/10/09 PHP
PHP实现定时生成HTML网站首页实例代码
2008/11/20 PHP
php实现文件下载代码分享
2014/08/19 PHP
PHP通过引用传递参数用法分析
2016/12/01 PHP
Laravel路由研究之domain解决多域名问题的方法示例
2019/04/04 PHP
Laravel5.1 框架响应基本用法实例分析
2020/01/04 PHP
eval的两组性能测试数据
2012/08/17 Javascript
JQuery实现简单时尚快捷的气泡提示插件
2012/12/20 Javascript
JQuery获取各种宽度、高度(format函数)实例
2013/03/04 Javascript
基于jquery插件实现常见的幻灯片效果
2013/11/01 Javascript
javascript实现全角半角检测的方法
2015/07/23 Javascript
Vue自定义弹窗指令的实现代码
2018/08/13 Javascript
vue实现分环境打包步骤(给不同的环境配置相对应的打包命令)
2019/06/04 Javascript
微信小程序自定义头部导航栏(组件化)
2019/11/15 Javascript
[04:02]DOTA2上海特锦赛小组赛第二日recap精彩回顾
2016/02/28 DOTA
[01:52]深扒TI7聊天轮盘语音出处7
2017/05/11 DOTA
python获得图片base64编码示例
2014/01/16 Python
Python常见字典内建函数用法示例
2018/05/14 Python
Tensorflow加载预训练模型和保存模型的实例
2018/07/27 Python
python 3调用百度OCR API实现剪贴板文字识别
2018/09/04 Python
对python pandas 画移动平均线的方法详解
2018/11/28 Python
Python动态赋值的陷阱知识点总结
2019/03/17 Python
Python利用sqlacodegen自动生成ORM实体类示例
2019/06/04 Python
Python 词典(Dict) 加载与保存示例
2019/12/06 Python
MNIST数据集转化为二维图片的实现示例
2020/01/10 Python
HTML5新控件之日期和时间选择输入的实现代码
2018/09/13 HTML / CSS
HTML5的结构和语义(1):前言
2008/10/17 HTML / CSS
HTML5页面音视频在微信和app下自动播放的实现方法
2016/10/20 HTML / CSS
详解canvas绘制多张图的排列顺序问题
2019/01/21 HTML / CSS
德国亚马逊官方网站:Amazon.de
2020/11/15 全球购物
旷课检讨书1000字
2014/02/14 职场文书
元宵晚会主持词
2014/03/25 职场文书
社会治安综合治理责任书
2015/01/29 职场文书
青年联谊会致辞
2015/07/31 职场文书
MySQL系列之十三 MySQL的复制
2021/07/02 MySQL
浅谈Redis的事件驱动模型
2022/05/30 Redis