利用python进行文件操作


Posted in Python onDecember 04, 2020

作者: wyh草样

出处:https://www.cnblogs.com/wyh0923/p/14084898.html

什么是文件

文件是系统存储区域的一个命名位置,用来存储一些信息,便于后续访问。能够在非易失性存储器中实现持续性存储,比如在硬盘上。当我们要读取或者写入文件时,我们需要打开文件;在操作完毕时,我们需要关闭文件,以便释放和文件操作相关的系统资源,因此,文件操作的主要包括以下:

打开文件

  • 读取或者写入
  • 关闭文件
  • 打开文件

Python使用内置的open()函数打开一个文件,并且返回一个文件对象,也叫句柄(handle)。

f = open("test.txt") # 在本文件夹下面的一个文件
f = open("C:/Python33/README.txt") # 全路径

再打开文件时,我们需要指定文件打开的模式,当我们需要读取文件时,使用f = open("test.txt", 'r'),写入文件时,使用f = open("test.txt", 'w'),追加输入时f = open("test.txt", 'a'),这里的a就是append的意思。追加模式和写入模式的区别就是,写入模式打开一个文件时,无论这个文件是否有内容,都会被清空再写入;在使用追加模式时,打开的文件,只是在原有的内容上继续进行写入。同时我们也要制定以文本模式打开还是二进制模式打开。

文本模式(text mode)和二进制(binary mode)模式的区别

文本模式中,读取时操作系统的换行符('\n' on Unix,'\r\n' on Windows)会被转换成Python的默认换行符\n,写入时会将默认的换行符转换为操作系统的换行符;在二进制模式中不会转换。这个转化在对文本文件没有影响,但是对于二进制数据会有影响,比如图像文件或者EXE文件等。因此, 再打开这类文件时,一般使用二进制模式进行读写

常用模式

r 文本模式,读取
rb 二进制模式,读取
w 文本模式,写入
wb 二进制模式,写入
a 文本模式,追加
ab 二进制模式,追加
+ 可读可写
f = open("test.txt", 'r') # 读模式
f = open("test.txt", 'w') # 写模式
f = open("img.bmp",'r+') # 可读可写
f = open("img.bmp",'w+') # 可读可写
f = open("img.bmp",'rb') # 二进制读取

如何关闭文件

当文件操作结束时,我们最好主动关闭文件。尽管Python有垃圾回收(garbage collector)机制,去清理不用的对象,但是最好还是自己关闭文件。
最简单的方法就是:

f = open("app.log", 'r')
do_something()
f.close()

但是这个办法不安全,因为在进行其他操作时,可能会出现异常,程序退出,那么关闭文件的语句就不会被执行。
因此,可以用语句来处理:

try:
 f = open('app.log', 'r')
 do_something()
finally:
 f.close()

无论是否发生异常,关闭文件的指令都会被执行。
但是python官方给出的最佳用法是:

with open('app.log', 'r') as f:
 do_something()

使用这种用法,我们不必调用close()方法,在with语句程序内部就会执行,无论内部是否出现异常。with语句被称为上下文管理器,我们可以暂且不管这个的原理,只需要知道使用with语句,关闭文件的操作会被自动执行,这也是官方推荐的最佳用法,比用语句写起来简单。

文件操作

写入文件
主要介绍两个方法:

1.write()方法
这个方法的参数是一个单独的字符串,比如:

lines = ['line1', 'line2']
with open('filename.txt', 'w') as f:
 s = ''
 for data in lines:
  s += data
  s += '\n'
 f.write(s)

其实更好的写法是使用join函数:

lines = ['line1', 'line2']
with open('filename.txt', 'w') as f:
 f.write('\n'.join(lines))

其实更加优雅的写法,可以使用生成器:

lines = ['line1', 'line2']
with open('filename.txt', 'w') as f:
 f.writelines("%s\n" % l for l in lines)

读取文件

这里介绍四种用法,后面都默认文件已经被打开了:
1.read()方法

result = f.read()

这里返回的是文件内容,是str类型的结果,这个方法还带一个数值类型的参数,指定读取多少内容,如果省略了或者是负数,那么就返回文件的全部内容。
2.readline()方法

result = f.readline()

返回的也是字符串,不过是一行内容,继续调用,就会返回下一行内容
3.readlines()方法

result = f.readlines()

这里返回的是一个列表,但是当数据较大时,这样的用法会很占用内存,不推荐在数据量大时使用
4.直接循环文件对象

for line in f:
 print line
 do_something()

这样的用法节省内存,快速,并且代码还简单

result = f.readlines()
------------------------
result = list(f)

这两种写法返回的结果是一样的
显然我们推荐第四种用法。

如何处理大文件
大文件主要问题在于占用内存较大,我们不能一下子将文件全部内容读入内存,最好的做法如下:

with open("log.txt") as f:
 for line in f:
  do_something_with(line)

一行一行读取,内存不会爆,同时速度也更快,使用with语句,无论内部是否出现异常,在结束时,文件对象都会被关闭,因此在处理大文件时,最好这样来做。

以上就是利用python进行文件操作的详细内容,更多关于python 文件操作的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python使用mailbox打印电子邮件的方法
Apr 30 Python
Python正则表达式知识汇总
Sep 22 Python
python自动发邮件库yagmail的示例代码
Feb 23 Python
Python可变参数*args和**kwargs用法实例小结
Apr 27 Python
Python实例方法、类方法、静态方法的区别与作用详解
Mar 25 Python
对Python中一维向量和一维向量转置相乘的方法详解
Aug 26 Python
python tkinter组件摆放方式详解
Sep 16 Python
Python turtle库绘制菱形的3种方式小结
Nov 23 Python
django model的update时auto_now不被更新的原因及解决方式
Apr 01 Python
python 代码运行时间获取方式详解
Sep 18 Python
python中time、datetime模块的使用
Dec 14 Python
详解python字符串驻留技术
May 21 Python
Python爬虫之Selenium下拉框处理的实现
Dec 04 #Python
Python爬虫之Selenium警告框(弹窗)处理
Dec 04 #Python
Python爬虫之Selenium中frame/iframe表单嵌套页面
Dec 04 #Python
Python爬虫之Selenium多窗口切换的实现
Dec 04 #Python
Python爬虫之Selenium实现键盘事件
Dec 04 #Python
python 爬虫请求模块requests详解
Dec 04 #Python
Python爬虫之Selenium鼠标事件的实现
Dec 04 #Python
You might like
php网页后退不再出现过期
2007/03/08 PHP
php桌面中心(二) 数据库写入
2007/03/11 PHP
php DOS攻击实现代码(附如何防范)
2012/05/29 PHP
PHP YII框架开发小技巧之模型(models)中rules自定义验证规则
2015/11/16 PHP
thinkPHP中验证码的简单使用方法
2015/12/26 PHP
CI框架(CodeIgniter)实现的导入、导出数据操作示例
2018/05/24 PHP
js innerHTML 的一些问题的解决方法
2008/06/22 Javascript
Prototype 学习 工具函数学习($A方法)
2009/07/12 Javascript
Jquery加载时从后台读取数据绑定到dropdownList实例
2013/06/09 Javascript
网页中可关闭的漂浮窗口实现可自行调节
2013/08/20 Javascript
JavaScript操作Cookie方法实例分析
2015/05/27 Javascript
JavaScript中ES6 Babel正确安装过程
2016/07/18 Javascript
Javascript从数组中随机取出不同元素的两种方法
2016/09/22 Javascript
jQuery焦点图左右转换效果
2016/12/12 Javascript
JavaScript实现计数器基础方法
2017/10/10 Javascript
详解webpack-dev-server使用http-proxy解决跨域问题
2018/01/13 Javascript
JS删除数组里的某个元素方法
2018/02/03 Javascript
nodejs中密码加密处理操作详解
2018/03/20 NodeJs
微信小程序url传参写变量的方法
2018/08/09 Javascript
vue的全局变量和全局拦截请求器的示例代码
2018/09/13 Javascript
vue引入axios同源跨域问题
2018/09/27 Javascript
JavaScript实现指定数量的并发限制的示例代码
2020/03/10 Javascript
vue v-on:click传递动态参数的步骤
2020/09/11 Javascript
详解Python编程中time模块的使用
2015/11/20 Python
wxpython布局的实现方法
2019/11/01 Python
Python实现对adb命令封装
2020/03/06 Python
PyCharm+PyQt5+QtDesigner配置详解
2020/08/12 Python
在Ubuntu中安装并配置Pycharm教程的实现方法
2021/01/06 Python
巴西手表购物网站:eclock
2019/03/19 全球购物
护理专业本科生自荐信
2013/10/01 职场文书
《黄河颂》教学反思
2014/02/07 职场文书
干部现实表现材料
2014/02/13 职场文书
高中学校对照检查材料
2014/08/31 职场文书
瘦西湖导游词
2015/02/03 职场文书
焦裕禄观后感
2015/06/03 职场文书
PHP解决高并发问题
2021/04/01 PHP