用Python读取几十万行文本数据


Posted in Python onDecember 24, 2018

我在使用python读取几十万行的文件中的数据,并构造字典,列表等数据结构时,再访问字典,列表时,一般都会出现内存不够的问题,然后只能循环读取几百行或者一定数量的行数来循环操作。

keyword_list=[line.strip() for line in open("keywords.txt",'r')]
#f1=open("part_wiki_vec.txt",'r')
f1=open("wiki_vectors.txt")
f2=open("result.txt",'w')
i=0
content=f1.readlines()
while i<1150:
 for line in content[300*i:300*(i+1)]:
  line=line.strip().split(' ')
  if line[0] in keyword_list:
   wordvec=' '.join(line)
   print wordvec
   f2.write(wordvec)
  #print line
 i+=1

我是这样读取的

应该还有很多好的方法,比如多线程等等。

做此记录只为了学习

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
跟老齐学Python之有容乃大的list(4)
Sep 28 Python
Python升级导致yum、pip报错的解决方法
Sep 06 Python
python编程培训 python培训靠谱吗
Jan 17 Python
Python基于Flask框架配置依赖包信息的项目迁移部署
Mar 02 Python
对Pytorch中nn.ModuleList 和 nn.Sequential详解
Aug 18 Python
python如何使用socketserver模块实现并发聊天
Dec 14 Python
Docker部署Python爬虫项目的方法步骤
Jan 19 Python
Django使用Profile扩展User模块方式
May 14 Python
python中plt.imshow与cv2.imshow显示颜色问题
Jul 16 Python
python源码剖析之PyObject详解
May 18 Python
python机器学习创建基于规则聊天机器人过程示例详解
Nov 02 Python
Python Pandas数据分析之iloc和loc的用法详解
Nov 11 Python
python实现flappy bird小游戏
Dec 24 #Python
python实现Flappy Bird源码
Dec 24 #Python
python3安装speech语音模块的方法
Dec 24 #Python
对Python 语音识别框架详解
Dec 24 #Python
python抓取网页内容并进行语音播报的方法
Dec 24 #Python
解决pyttsx3无法封装的问题
Dec 24 #Python
pyttsx3实现中文文字转语音的方法
Dec 24 #Python
You might like
php pthreads多线程的安装与使用
2016/01/19 PHP
通过判断JavaScript的版本实现执行不同的代码
2010/05/11 Javascript
了不起的node.js读书笔记之例程分析
2014/12/22 Javascript
JS简单获取及显示当前时间的方法
2016/08/03 Javascript
nodeJs内存泄漏问题详解
2016/09/05 NodeJs
JS实现表单多文件上传样式美化支持选中文件后删除相关项
2016/09/30 Javascript
基于JS实现横线提示输入验证码随验证码输入消失(js验证码的实现)
2016/10/27 Javascript
js中通过getElementsByName访问name集合对象的方法
2016/10/31 Javascript
JavaScript中全选、全不选、反选、无刷新删除、批量删除、即点即改入库(在yii框架中操作)的代码分享
2016/11/01 Javascript
Angular 4环境准备与Angular cli创建项目详解
2017/05/27 Javascript
javaScript封装的各种写法
2017/08/14 Javascript
jQuery选择器之基本过滤选择器用法实例分析
2019/02/19 jQuery
Node.js 的 GC 机制详解
2019/06/03 Javascript
JavaScript遍历数组和对象的元素简单操作示例
2019/07/09 Javascript
jQuery实现移动端下拉展现新的内容回弹动画
2020/06/24 jQuery
谈谈node.js中的模块系统
2020/09/01 Javascript
线程和进程的区别及Python代码实例
2015/02/04 Python
Python实现翻转数组功能示例
2018/01/12 Python
python创建文件备份的脚本
2018/09/11 Python
python-itchat 统计微信群、好友数量,及原始消息数据的实例
2019/02/21 Python
python添加菜单图文讲解
2019/06/04 Python
利用selenium爬虫抓取数据的基础教程
2019/06/10 Python
Python3 实现减少可调用对象的参数个数
2019/12/20 Python
Pytorch自己加载单通道图片用作数据集训练的实例
2020/01/18 Python
python安装dlib库报错问题及解决方法
2020/03/16 Python
Python嵌入C/C++进行开发详解
2020/06/09 Python
pandas实现导出数据的四种方式
2020/12/13 Python
BCBG官网:BCBGMAXAZRIA
2017/12/29 全球购物
美国最大的在线寄售和旧货店:Swap.com
2018/08/27 全球购物
Java的类可以定义为Protected或者Private得吗
2015/09/25 面试题
电大学习个人自我评价范文
2013/10/04 职场文书
生物制药毕业生自荐信
2013/10/16 职场文书
帝企鹅日记观后感
2015/06/10 职场文书
心理健康教育主题班会
2015/08/13 职场文书
初中化学教学反思
2016/02/22 职场文书
SQL Server——索引+基于单表的数据插入与简单查询【1】
2021/04/05 SQL Server