Python CSV文件模块的使用案例分析


Posted in Python onDecember 21, 2019

本文实例讲述了Python CSV文件模块的使用。分享给大家供大家参考,具体如下:

1、CSV模块使用流程

1、导入模块

impport CSV

2、打开文件(xxx.csv)

with open('xxx.csv','a',encoding='utf-8') as f:
  • 1、a和 a+   ‘追加'功能

a  追加写

a+ 追加写读(先写后读)

  • 2、r 和 r+  

r 只读

r+读写,先读后写

  • 3、w,w+

w 只写

w+写读 先写后读

3、初始化写入对象

writer = csv.wirter()

4、写入数据

writer.writerow(['孙悟空', '兰陵王'])

案例:

猫眼电影top10榜单的爬取

1、网址:url

2、目标:爬取自己想要的文件

3、保存本地:csv文件

4、步骤

  • 1、找url规律

第一页:https://maoyan.com/board/4?offset=0

第4页:https://maoyan.com/board/4?offset=30

第n页:offset=(n-1)*10

  • 2、写正则表达式

'<div class="movie-item-info".*?title="(.*?)".*?class="star">(.* ?)</p>.*?class="releasetime">(.*?)</p>',re.S

练习:爬取猫王top10信息

from urllib import request
import re
import time
import csv
class MaoyanSpider(object):
   def __init__(self):
    self.headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1"}
    self.page = 1
    # 用来计数
   def get_page(self, url):
    req = request.Request(url, headers=self.headers)
    res = request.urlopen(req)
    html = res.read().decode('utf-8')
    # 直接调用解析函数
    self.parse_page(html)
   def parse_page(self,html):
     p=re.compile('<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.*?)</p>.*?class="releasetime">(.*?)</p>',re.S)
     #p=re.compile('<div class="movie-item-info">.*?title="(.*?)".*?class="star">(.* ?)</p>.*?class="releasetime">(.*?)</p>',re.S)
     r_list = p.findall(html)
     # 直接调用保存函数
     # r_list:[('霸王别姬','张国荣','1993'),(),()]
     self.write_csv(r_list)
  # 保存数据函数
   def  write_csv(self,r_list):
     with open('猫眼电影top10.csv','a') as f:
      writer = csv.writer(f)
      # 依次写入每个电影信息
      for r_t in r_list:
        film = [
          r_t[0].strip(),
          r_t[1].strip(),
          r_t[2].strip()
          ]
        writer.writerow(film)
  #主函数
   def work_om(self):
     for pn in range(0,41,10):
      url = 'https://maoyan.com/board/4?offset=%s'%str(pn)
      self.get_page(url)
      print('第%d页爬取成功'%self.page)
      self.page += 1
      time.sleep(4)
if __name__ =='__main__':
  begin = time.time()
  spider = MaoyanSpider()
  spider.work_om()
  end = time.time()
  print("执行时间%.2f"%(end - begin))

运行截图:

Python CSV文件模块的使用案例分析

更多Python相关内容感兴趣的读者可查看本站专题:《Python操作Excel表格技巧总结》、《Python编码操作技巧总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python编程中time模块的一些关键用法解析
Jan 19 Python
Python探索之SocketServer详解
Oct 28 Python
Python实现的维尼吉亚密码算法示例
Apr 12 Python
PyTorch快速搭建神经网络及其保存提取方法详解
Apr 28 Python
python进阶之多线程对同一个全局变量的处理方法
Nov 09 Python
Python使用pyautocad+openpyxl处理cad文件示例
Jul 11 Python
django+tornado实现实时查看远程日志的方法
Aug 12 Python
python求平均数、方差、中位数的例子
Aug 22 Python
Python基于xlutils修改表格内容过程解析
Jul 28 Python
python switch 实现多分支选择功能
Dec 21 Python
通过python-pptx模块操作ppt文件的方法
Dec 26 Python
Python作用域和名称空间的详细介绍
Apr 13 Python
python实现的分析并统计nginx日志数据功能示例
Dec 21 #Python
Python数据持久化存储实现方法分析
Dec 21 #Python
python cv2截取不规则区域图片实例
Dec 21 #Python
Python lxml模块的基本使用方法分析
Dec 21 #Python
python Manager 之dict KeyError问题的解决
Dec 21 #Python
tornado+celery的简单使用详解
Dec 21 #Python
Python selenium的基本使用方法分析
Dec 21 #Python
You might like
网络资源
2006/10/09 PHP
php5 and xml示例
2006/11/22 PHP
PHP采集类Snoopy抓取图片实例
2014/06/19 PHP
PHP实现的英文名字全拼随机排号脚本
2014/07/04 PHP
laravel配置Redis多个库的实现方法
2019/04/10 PHP
php中数组最简单的使用方法
2020/12/27 PHP
javascript indexOf函数使用说明
2008/07/03 Javascript
javascript 数据类型转换(parseInt,parseFloat)
2010/07/20 Javascript
jquery实现的一个导航滚动效果具体代码
2013/05/27 Javascript
js禁止页面复制功能禁用页面右键菜单示例代码
2013/08/29 Javascript
js 通用订单代码
2013/12/23 Javascript
JavaScript中的对象的extensible属性介绍
2014/12/30 Javascript
jquery 插件实现瀑布流图片展示实例
2015/04/03 Javascript
初步了解javascript面向对象
2015/11/09 Javascript
bootstrap导航栏、下拉菜单、表单的简单应用实例解析
2017/01/06 Javascript
详解AngularJS通过ocLazyLoad实现动态(懒)加载模块和依赖
2017/03/01 Javascript
vue动画—通过钩子函数实现半场动画操作
2020/08/09 Javascript
js实现移动端图片滑块验证功能
2020/09/29 Javascript
vscode自定义vue模板的实现
2021/01/27 Vue.js
[01:45]2014DOTA2 TI预选赛预选赛 战前探营!
2014/05/21 DOTA
Python学习笔记(一)(基础入门之环境搭建)
2014/06/05 Python
Python实现的百度站长自动URL提交小工具
2014/06/27 Python
Python中map,reduce,filter和sorted函数的使用方法
2015/08/17 Python
Python基于递归算法求最小公倍数和最大公约数示例
2018/07/27 Python
python面试题小结附答案实例代码
2019/04/11 Python
python 从list中随机取值的方法
2020/11/16 Python
CSS3 渐变(Gradients)之CSS3 径向渐变
2016/07/08 HTML / CSS
Sandro Paris美国官网:典雅别致的法国时尚服饰品牌
2017/12/26 全球购物
澳大利亚领先的在线药房:Pharmacy Online(有中文站)
2020/02/22 全球购物
武汉某公司的C#笔试题面试题
2015/12/25 面试题
2014幼儿园班主任工作总结
2014/12/04 职场文书
市场部岗位职责
2015/02/12 职场文书
汽车4S店前台接待岗位职责
2015/04/03 职场文书
公司人力资源管理制度
2015/08/05 职场文书
Nginx配置Https安全认证的实现
2021/05/26 Servers
利用 JavaScript 构建命令行应用
2021/11/17 Javascript