Python CSV文件模块的使用案例分析


Posted in Python onDecember 21, 2019

本文实例讲述了Python CSV文件模块的使用。分享给大家供大家参考,具体如下:

1、CSV模块使用流程

1、导入模块

impport CSV

2、打开文件(xxx.csv)

with open('xxx.csv','a',encoding='utf-8') as f:
  • 1、a和 a+   ‘追加'功能

a  追加写

a+ 追加写读(先写后读)

  • 2、r 和 r+  

r 只读

r+读写,先读后写

  • 3、w,w+

w 只写

w+写读 先写后读

3、初始化写入对象

writer = csv.wirter()

4、写入数据

writer.writerow(['孙悟空', '兰陵王'])

案例:

猫眼电影top10榜单的爬取

1、网址:url

2、目标:爬取自己想要的文件

3、保存本地:csv文件

4、步骤

  • 1、找url规律

第一页:https://maoyan.com/board/4?offset=0

第4页:https://maoyan.com/board/4?offset=30

第n页:offset=(n-1)*10

  • 2、写正则表达式

'<div class="movie-item-info".*?title="(.*?)".*?class="star">(.* ?)</p>.*?class="releasetime">(.*?)</p>',re.S

练习:爬取猫王top10信息

from urllib import request
import re
import time
import csv
class MaoyanSpider(object):
   def __init__(self):
    self.headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"}
    self.page = 1
    # 用来计数
   def get_page(self, url):
    req = request.Request(url, headers=self.headers)
    res = request.urlopen(req)
    html = res.read().decode('utf-8')
    # 直接调用解析函数
    self.parse_page(html)
   def parse_page(self,html):
     p=re.compile('<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.*?)</p>.*?class="releasetime">(.*?)</p>',re.S)
     #p=re.compile('<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.* ?)</p>.*?class="releasetime">(.*?)</p>',re.S)
     r_list = p.findall(html)
     # 直接调用保存函数
     # r_list:[('霸王别姬','张国荣','1993'),(),()]
     self.write_csv(r_list)
  # 保存数据函数
   def  write_csv(self,r_list):
     with open('猫眼电影top10.csv','a') as f:
      writer = csv.writer(f)
      # 依次写入每个电影信息
      for r_t in r_list:
        film = [
          r_t[0].strip(),
          r_t[1].strip(),
          r_t[2].strip()
          ]
        writer.writerow(film)
  #主函数
   def work_om(self):
     for pn in range(0,41,10):
      url = 'https://maoyan.com/board/4?offset=%s'%str(pn)
      self.get_page(url)
      print('第%d页爬取成功'%self.page)
      self.page += 1
      time.sleep(4)
if __name__ =='__main__':
  begin = time.time()
  spider = MaoyanSpider()
  spider.work_om()
  end = time.time()
  print("执行时间%.2f"%(end - begin))

运行截图:

Python CSV文件模块的使用案例分析

更多Python相关内容感兴趣的读者可查看本站专题:《Python操作Excel表格技巧总结》、《Python编码操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python格式化压缩后的JS文件的方法
Mar 05 Python
Python2.x利用commands模块执行Linux shell命令
Mar 11 Python
详解python的数字类型变量与其方法
Nov 20 Python
Python二叉搜索树与双向链表转换算法示例
Mar 02 Python
python 执行终端/控制台命令的例子
Jul 12 Python
Python3+Requests+Excel完整接口自动化测试框架的实现
Oct 11 Python
Pytorch之卷积层的使用详解
Dec 31 Python
python烟花效果的代码实例
Feb 25 Python
使用python求解二次规划的问题
Feb 29 Python
python mysql自增字段AUTO_INCREMENT值的修改方式
May 18 Python
python 实现&quot;神经衰弱&quot;翻牌游戏
Nov 09 Python
Python趣味挑战之用pygame实现简单的金币旋转效果
May 31 Python
python实现的分析并统计nginx日志数据功能示例
Dec 21 #Python
Python数据持久化存储实现方法分析
Dec 21 #Python
python cv2截取不规则区域图片实例
Dec 21 #Python
Python lxml模块的基本使用方法分析
Dec 21 #Python
python Manager 之dict KeyError问题的解决
Dec 21 #Python
tornado+celery的简单使用详解
Dec 21 #Python
Python selenium的基本使用方法分析
Dec 21 #Python
You might like
分享下页面关键字抓取www.icbase.com站点代码(带asp.net参数的)
2014/01/30 PHP
php可生成缩略图的文件上传类实例
2014/12/17 PHP
php header函数的常用http头设置
2015/06/25 PHP
Yii框架使用PHPExcel导出Excel文件的方法分析【改进版】
2019/07/24 PHP
php的对象传值与引用传值代码实例讲解
2021/02/26 PHP
Js切换功能的简单方法
2010/11/23 Javascript
使用jquery局部刷新(jquery.load)从数据库取出数据
2014/01/22 Javascript
JavaScript中对DOM节点的访问、创建、修改、删除
2015/11/16 Javascript
基于Node.js实现nodemailer邮件发送
2016/01/26 Javascript
Bootstrap实现input控件失去焦点时验证
2016/08/04 Javascript
AnjularJS中$scope和$rootScope的区别小结
2016/09/18 Javascript
AngularJS入门教程二:在路由中传递参数的方法分析
2017/05/27 Javascript
JavaScript强制类型转换和隐式类型转换操作示例
2019/05/01 Javascript
教你完全理解ReentrantLock重入锁
2019/06/03 Javascript
java和js实现的洗牌小程序
2019/09/30 Javascript
支付宝小程序实现省市区三级联动
2020/06/21 Javascript
Jquery使用each函数实现遍历及数组处理
2020/07/14 jQuery
vue 组件之间事件触发($emit)与event Bus($on)的用法说明
2020/07/28 Javascript
vuex页面刷新导致数据丢失的解决方案
2020/12/10 Vue.js
[45:18]完美世界DOTA2联赛循环赛 PXG vs IO 第二场 11.06
2020/11/09 DOTA
Python实现简单的多任务mysql转xml的方法
2017/02/08 Python
python list排序的两种方法及实例讲解
2017/03/20 Python
使用TensorFlow实现二分类的方法示例
2019/02/05 Python
Django模型序列化返回自然主键值示例代码
2019/06/12 Python
python 抓包保存为pcap文件并解析的实例
2019/07/23 Python
django2.2 和 PyMySQL版本兼容问题
2020/02/17 Python
python删除某个目录文件夹的方法
2020/05/26 Python
英国图书音像网站:Hive.co.uk(图书、电子书、DVD、蓝光、音乐CD等)
2017/10/16 全球购物
毕业生求职简历的自我评价
2013/10/07 职场文书
安全事故检讨书
2014/01/18 职场文书
运动会演讲稿200字
2014/08/25 职场文书
三八妇女节新闻稿
2015/07/17 职场文书
如何书写先进事迹材料?
2019/07/02 职场文书
2019年圣诞节祝福语集锦
2019/12/25 职场文书
Python实现照片卡通化
2021/12/06 Python
Java设计模式之享元模式示例详解
2022/03/03 Java/Android