使用python进行拆分大文件的方法


Posted in Python onDecember 10, 2018

python按指定行数把大文件进行拆分

如图大文件有7000多万行,大小为16G

使用python进行拆分大文件的方法

需要拆分成多个200万行的小文件

代码如下:

# -*- coding:utf-8 -*-
from datetime import datetime
 
def Main():
 source_dir = '/data/u_lx_data/zhangqm/sh/yanjie/liuxuesheng/jz_yuanshi_list0206.txt'
 target_dir = '/data/u_lx_data/zhangqm/sh/yanjie/liuxuesheng/split/'
 
 # 计数器
 flag = 0
 
 # 文件名
 name = 1
 
 # 存放数据
 dataList = []
 
 print("开始。。。。。")
 print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
 
 with open(source_dir,'r') as f_source:
  for line in f_source:
   flag+=1
   dataList.append(line)
   if flag == 2000000:
    with open(target_dir+"jz_yuanshi_list_"+str(name)+".txt",'w+') as f_target:
     for data in dataList:
      f_target.write(data)
    name+=1
    flag = 0
    dataList = []
    
 # 处理最后一批行数少于200万行的
 with open(target_dir+"jz_yuanshi_list_"+str(name)+".txt",'w+') as f_target:
  for data in dataList:
   f_target.write(data)
 
 print("完成。。。。。")
 print(datetime.now().strftime('%Y-%m-%d %H:%M:%S'))
 
if __name__ == "__main__":
 Main()

结果如下:

使用python进行拆分大文件的方法

总共产生39个文件,最后一个文件行数760821,这样就OK啦

经测试16G文件所需时间如图:不到两分钟

使用python进行拆分大文件的方法

以上这篇使用python进行拆分大文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python贪吃蛇游戏编写代码
Oct 26 Python
Python实现计算圆周率π的值到任意位的方法示例
May 08 Python
TensorFlow Session使用的两种方法小结
Jul 30 Python
numpy.meshgrid()理解(小结)
Aug 01 Python
wxpython多线程防假死与线程间传递消息实例详解
Dec 13 Python
使用tensorflow实现VGG网络,训练mnist数据集方式
May 26 Python
Python通过类的组合模拟街道红绿灯
Sep 16 Python
python递归函数用法详解
Oct 26 Python
Python爬虫过程解析之多线程获取小米应用商店数据
Nov 14 Python
Python图像处理之图像拼接
Apr 28 Python
高考要来啦!用Python爬取历年高考数据并分析
Jun 03 Python
Python操作CSV格式文件的方法大全
Jul 15 Python
python使用udp实现聊天器功能
Dec 10 #Python
Python面向对象之类和对象实例详解
Dec 10 #Python
详解Django-auth-ldap 配置方法
Dec 10 #Python
Python网页正文转换语音文件的操作方法
Dec 09 #Python
python 使用 requests 模块发送http请求 的方法
Dec 09 #Python
Python实现八皇后问题示例代码
Dec 09 #Python
python中的tcp示例详解
Dec 09 #Python
You might like
PhpMyAdmin出现export.php Missing parameter: what /export_type错误解决方法
2012/08/09 PHP
php array_reverse 以相反的顺序返回数组实例代码
2017/04/11 PHP
javascript操作html控件实例(javascript添加html)
2013/12/02 Javascript
js中精确计算加法和减法示例
2014/03/28 Javascript
JavaScript中读取和保存文件实例
2014/05/08 Javascript
网页中表单按回车就自动提交的问题的解决方案
2014/11/03 Javascript
初始Nodejs
2014/11/08 NodeJs
为什么Node.js会这么火呢?Node.js流行的原因
2014/12/01 Javascript
javascript显式类型转换实例分析
2015/04/25 Javascript
PageSwitch插件实现100种不同图片切换效果
2015/07/28 Javascript
基于jQuery和hwSlider实现内容左右滑动切换效果附源码下载(一)
2016/06/22 Javascript
JavaScript兼容性总结之获取非行间样式案例
2016/08/07 Javascript
JS仿QQ好友列表展开、收缩功能(第一篇)
2017/07/07 Javascript
Java设计中的Builder模式的介绍
2018/03/22 Javascript
在vue中使用vue-echarts-v3的实例代码
2018/09/13 Javascript
解决vue移动端适配问题
2018/12/12 Javascript
Vue CLI 3.x 自动部署项目至服务器的方法
2019/04/02 Javascript
详解微信UnionID作用
2019/05/15 Javascript
vue服务端渲染操作简单入门实例分析
2019/08/28 Javascript
Vue中keep-alive组件作用详解
2020/02/04 Javascript
[00:36]TI7不朽珍藏III——斯温不朽展示
2017/07/15 DOTA
Python中的两个内置模块介绍
2015/04/05 Python
Python中的面向对象编程详解(下)
2015/04/13 Python
Python输出带颜色的字符串实例
2017/10/10 Python
python实现替换word中的关键文字(使用通配符)
2020/02/13 Python
Pycharm及python安装详细步骤及PyCharm配置整理(推荐)
2020/07/31 Python
Python是什么 Python的用处
2020/05/26 Python
利用python对mysql表做全局模糊搜索并分页实例
2020/07/12 Python
曼城官方网上商店:Manchester City
2019/09/10 全球购物
自荐信不宜过于夸大
2013/11/06 职场文书
浙江文明网签名寄语
2014/01/18 职场文书
小班开学寄语
2014/04/04 职场文书
小学校长竞聘演讲稿
2014/05/16 职场文书
政协调研汇报材料
2014/08/15 职场文书
敬老院义诊活动总结
2015/05/07 职场文书
MySQL Router实现MySQL的读写分离的方法
2021/05/27 MySQL