Python实现抓取网页生成Excel文件的方法示例


Posted in Python onAugust 05, 2017

本文实例讲述了Python实现抓取网页生成Excel文件的方法。分享给大家供大家参考,具体如下:

Python抓网页,主要用到了PyQuery,这个跟jQuery用法一样,超级给力

示例代码如下:

#-*- encoding:utf-8 -*-
import sys
import locale
import string
import traceback
import datetime
import urllib2
from pyquery import PyQuery as pq
# 确定运行环境的encoding
reload(sys);
sys.setdefaultencoding('utf8');
f = open('gongsi.csv', 'w');
for i in range(1,24):
  d = pq(url="http://www.yourwebname.com/?Code=HANGYELINGYU&myFlag=allShow&SiteID=122&PageIndex=%d"%(i));
  itemsa=d('dl dt a') #取title元素
  itemsb=d('dl dd') #取title元素
  for j in range(0,len(itemsa)):
    f.write("%s,\"%s\"\n"%(itemsa[j].get('title'),itemsb[j*2].text));
  #end for
#end for
f.close();

接下来就是用Notepad++打开gongsi.csv,然后转成ANSI编码格式,保存。再用Excel软件打开这个csv文件,另存为Excel文件

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
用Python写脚本,实现完全备份和增量备份的示例
Apr 29 Python
用python生成(动态彩色)二维码的方法(使用myqr库实现)
Jun 24 Python
python按键按住不放持续响应的实例代码
Jul 17 Python
django中media媒体路径设置的步骤
Nov 15 Python
python使用ctypes调用扩展模块的实例方法
Jan 28 Python
Python argparse模块使用方法解析
Feb 20 Python
从python读取sql的实例方法
Jul 21 Python
Python如何输出警告信息
Jul 30 Python
Python函数__new__及__init__作用及区别解析
Aug 31 Python
pycharm 2020 1.1的安装流程
Sep 29 Python
关于Python错误重试方法总结
Jan 03 Python
python字符串的多行输出的实例详解
Jun 08 Python
Python基于Socket实现的简单聊天程序示例
Aug 05 #Python
Python Socket实现简单TCP Server/client功能示例
Aug 05 #Python
对pandas的dataframe绘图并保存的实现方法
Aug 05 #Python
解决PyCharm中光标变粗的问题
Aug 05 #Python
Python实现的中国剩余定理算法示例
Aug 05 #Python
python爬虫_自动获取seebug的poc实例
Aug 05 #Python
python中的break、continue、exit()、pass全面解析
Aug 05 #Python
You might like
使用php清除bom示例
2014/03/03 PHP
Adnroid 微信内置浏览器清除缓存
2016/07/11 PHP
PHP简单检测网址是否能够正常打开的方法
2016/09/04 PHP
Javascript和Ajax中文乱码吐血版解决方案
2009/12/21 Javascript
js 多种变量定义(对象直接量,数组直接量和函数直接量)
2010/05/24 Javascript
js 处理URL实用技巧
2010/11/23 Javascript
Jquery index()方法 获取相应元素索引值
2012/10/12 Javascript
原生javascript和jquery判断浏览器版本等信息
2013/07/04 Javascript
jQuery中prop()方法用法实例
2015/01/05 Javascript
检测一个函数是否是JavaScript原生函数的小技巧
2015/03/13 Javascript
JavaScript动态修改弹出窗口大小的方法
2015/04/06 Javascript
浅谈jquery中delegate()与live()
2015/06/22 Javascript
BootStrap点击下拉菜单项后显示一个新的输入框实现代码
2016/05/16 Javascript
jQuery搜索框效果实现代码(百度关键词联想)
2021/02/25 Javascript
微信+angularJS的SPA应用中用router进行页面跳转,jssdk校验失败问题解决
2016/09/09 Javascript
KnockoutJS 3.X API 第四章之数据控制流if绑定和ifnot绑定
2016/10/10 Javascript
js简易版购物车功能
2017/06/17 Javascript
Vue.extend构造器的详解
2017/07/17 Javascript
js判断输入框不能为空格或null值的实现方法
2018/03/02 Javascript
vue在手机中通过本机IP地址访问webApp的方法
2018/08/15 Javascript
详解vue为什么要求组件模板只能有一个根元素
2019/07/22 Javascript
[01:06:39]DOTA2上海特级锦标赛主赛事日 - 1 胜者组第一轮#1Liquid VS Alliance第三局
2016/03/02 DOTA
Python操作列表之List.insert()方法的使用
2015/05/20 Python
详解Python判定IP地址合法性的三种方法
2018/03/06 Python
opencv实现静态手势识别 opencv实现剪刀石头布游戏
2019/01/22 Python
解决pytorch-yolov3 train 报错的问题
2020/02/18 Python
Django CSRF认证的几种解决方案
2020/03/03 Python
Python常用数字处理基本操作汇总
2020/09/10 Python
pip install命令安装扩展库整理
2021/03/02 Python
五款漂亮的纯CSS3动画按钮的实例教程
2014/11/21 HTML / CSS
HTML5实现桌面通知 提示功能
2017/10/11 HTML / CSS
HTML5超炫酷粒子效果的进度条的实现示例
2019/08/23 HTML / CSS
怎么写好自荐信
2013/10/30 职场文书
解决MySQL存储时间出现不一致的问题
2021/04/28 MySQL
MySQL深度分页(千万级数据量如何快速分页)
2021/07/25 MySQL
Python实现批量将文件复制到新的目录中再修改名称
2022/04/12 Python