用Python读取几十万行文本数据


Posted in Python onDecember 24, 2018

我在使用python读取几十万行的文件中的数据,并构造字典,列表等数据结构时,再访问字典,列表时,一般都会出现内存不够的问题,然后只能循环读取几百行或者一定数量的行数来循环操作。

keyword_list=[line.strip() for line in open("keywords.txt",'r')]
#f1=open("part_wiki_vec.txt",'r')
f1=open("wiki_vectors.txt")
f2=open("result.txt",'w')
i=0
content=f1.readlines()
while i<1150:
 for line in content[300*i:300*(i+1)]:
  line=line.strip().split(' ')
  if line[0] in keyword_list:
   wordvec=' '.join(line)
   print wordvec
   f2.write(wordvec)
  #print line
 i+=1

我是这样读取的

应该还有很多好的方法,比如多线程等等。

做此记录只为了学习

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
Python列表计数及插入实例
Dec 17 Python
Python实现将json文件中向量写入Excel的方法
Mar 26 Python
python 列表,数组,矩阵两两转换tolist()的实例
Apr 04 Python
Django框架使用mysql视图操作示例
May 15 Python
Django model select的多种用法详解
Jul 16 Python
appium+python adb常用命令分享
Mar 06 Python
使用Django xadmin 实现修改时间选择器为不可输入状态
Mar 30 Python
使用Python中tkinter库简单gui界面制作及打包成exe的操作方法(二)
Oct 12 Python
Python QT组件库qtwidgets的使用
Nov 02 Python
Django启动时找不到mysqlclient问题解决方案
Nov 11 Python
Python OpenCV 图像平移的实现示例
Jun 04 Python
Python实现学生管理系统并生成exe可执行文件详解流程
Jan 22 Python
python实现flappy bird小游戏
Dec 24 #Python
python实现Flappy Bird源码
Dec 24 #Python
python3安装speech语音模块的方法
Dec 24 #Python
对Python 语音识别框架详解
Dec 24 #Python
python抓取网页内容并进行语音播报的方法
Dec 24 #Python
解决pyttsx3无法封装的问题
Dec 24 #Python
pyttsx3实现中文文字转语音的方法
Dec 24 #Python
You might like
水质对咖图啡风味的影响具体有哪些
2021/03/03 冲泡冲煮
十天学会php之第三天
2006/10/09 PHP
php使用Jpgraph绘制复杂X-Y坐标图的方法
2015/06/10 PHP
php简单防盗链实现方法
2015/07/29 PHP
Smarty使用自定义资源的方法
2015/08/08 PHP
聊聊 PHP 8 新特性 Attributes
2020/08/19 PHP
jQuery UI 实现email输入提示实例
2013/08/15 Javascript
js锁屏解屏通过对$.ajax进行封装实现
2014/07/31 Javascript
director.js实现前端路由使用实例
2015/02/03 Javascript
js实现带圆角的两级导航菜单效果代码
2015/08/24 Javascript
JS实现按比例缩放图片的方法(附C#版代码)
2015/12/08 Javascript
jQuery点击输入框显示验证码图片
2016/05/19 Javascript
前端框架Vue.js构建大型应用浅析
2016/09/12 Javascript
vue实现前进刷新后退不刷新效果
2018/01/26 Javascript
使用Angular CLI从蓝本生成代码详解
2018/03/24 Javascript
Vue源码探究之状态初始化
2018/11/14 Javascript
[03:49]2016完美“圣”典风云人物:AMS专访
2016/12/06 DOTA
python实现给数组按片赋值的方法
2015/07/28 Python
Python中的FTP通信模块ftplib的用法整理
2016/07/08 Python
浅谈Python的垃圾回收机制
2016/12/17 Python
Python数据处理numpy.median的实例讲解
2018/04/02 Python
对web.py设置favicon.ico的方法详解
2018/12/04 Python
Python使用matplotlib实现交换式图形显示功能示例
2019/09/06 Python
Python yield的用法实例分析
2020/03/06 Python
从0到1使用python开发一个半自动答题小程序的实现
2020/05/12 Python
python中if及if-else如何使用
2020/06/02 Python
爱尔兰家电数码商城:Currys PC World爱尔兰
2016/07/23 全球购物
教学大赛获奖感言
2014/01/15 职场文书
支教自我鉴定
2014/01/18 职场文书
《阳光》教学反思
2014/02/23 职场文书
孝敬父母的演讲稿
2014/05/14 职场文书
优秀学生干部个人事迹材料
2014/06/02 职场文书
营销学习心得体会
2014/09/12 职场文书
小学班主任经验交流材料
2014/12/16 职场文书
大学生暑假实习总结
2015/07/13 职场文书
2016企业先进集体事迹材料
2016/02/25 职场文书