一篇文章带你搞懂Python的文件读写

开发 后端
本文基于Python基础,使用Python语言,介绍了有关Python文件操作的知识点。从文件的基本概念入手 ,通过一个个小项目的演示,对常用的读写模式,文件对象操作方法,以及在实际应用中需要注意的问题,都做了详细的讲解。希望帮助你更好的学习Python。

[[401879]]

一、什么是文件?

文件就是把一些存储存放起来,可以让程序下一次执行的时候直接使用,而不必重新制作一份,省时省力。

二、文件如何的打开?

Python内置了一个open()方法,可以对文件进行读写操作。

使用open()方法操作文件就像把大象塞进冰箱一样,可以分三步走,一是打开文件,二是操作文件,三是关闭文件。

open语法

open()方法的返回值是一个file对象,可以将它赋值给一个变量(文件句柄)。

其基本语法格式为:

  1. f = open(filename, mode) 

注:

Python中,所有具有read和write方法的对象,都可以归类为file类型。而所有的file类型对象都可以使用open方法打开,close方法结束。

filename:一个包含了你要访问的文件名称的字符串值,通常是一个文件路径。

mode:打开文件的模式,有很多种,默认是只读方式r。

例:

  1. # 打开一个文件 
  2. f = open("1.txt""w"
  3. f.write("Python 是一种非常好的语言。\nPython!!\n"
  4. # 关闭打开的文件 
  5. f.close() 

运行结果:

在1.txt文件中写入Python 是一种非常好的语言。Python。

三、访问模式

通过一个表格,了解Python常用的读写模式

如果要读取非UTF-8编码的文件,需要给open()函数传入encoding参数。

例如,读取GBK编码的文件:

  1. >>> f = open('gbk.txt''r', encoding='gbk'
  2. >>> f.read() 
  3. 'GBK' #编码 

遇到有些编码不规范的文件,可能会抛出UnicodeDecodeError异常,这表示在文件中可能夹杂了一些非法编码的字符。遇到这种情况,可以提供errors参数,表示如果遇到编码错误后如何处理。

  1. f = open('gbk.txt''r', encoding='gbk', errors='ignore'

四、 文件对象操作

用open方法打开一个文件,将返回一个文件对象。这个对象内置了很多操作方法。

下面打开了一个f文件对象(1.txt)。对文件对象进行相关的操作。

1. f.read(size)

读取一定大小的数据, 然后作为字符串或字节对象返回。size是一个可选的数字类型的参数,用于指定读取的数据量。当size被忽略了或者为负值,那么该文件的所有内容都将被读取并且返回。

  1. f = open("1.txt""r"
  2.  
  3. str = f.read() 
  4. print(str) 
  5.  
  6. f.close() 

如果文件体积较大,请不要使用read()方法一次性读入内存,而是read(312)这种一点一点的读。

2. f.readline()

从文件中读取一行n内容。换行符为'\n'。如果返回一个空字符串,说明已经已经读取到最后一行。这种方法,通常是读一行,处理一行的情况下使用。

  1. f = open("1.txt""r"
  2. str = f.readline() 
  3. print(str) 
  4. f.close() 

3. f.readlines()

将文件中所有的行,一行一行全部读入一个列表内,按顺序一个一个作为列表的元素,并返回这个列表。readlines方法会一次性将文件全部读入内存,所以也存在一定的弊端。但是它有个好处,每行都保存在列表里,可随意存取。

  1. f = open("1.txt""r"
  2. a = f.readlines() 
  3. print(a) 
  4. f.close() 

4. 遍历文件

实际情况中,我们会将文件对象作为一个迭代器来使用。

  1. # 打开一个文件 
  2. f = open("1.txt""r"
  3.  
  4. for line in f: 
  5.     print(line, end=''
  6.  
  7. # 关闭打开的文件 
  8. f.close() 

这个方法很简单, 不需要将文件一次性读出,但是同样没有提供一个很好的控制,与readline方法一样只能前进,不能回退。

几种不同的读取和遍历文件的方法比较:

如果文件很小,read()一次性读取最方便;

如果不能确定文件大小,反复调用read(size)比较保险;

如果是配置文件,调用readlines()最方便。普通情况,使用for循环更好,速度更快。

5. f.write()

使用write()可以完成向文件写入数据。

  1. # 打开一个文件 
  2. f = open("/tmp/foo.txt""w"
  3.  
  4. f.write("Python 是一种非常好的语言。\n我喜欢Python!!\n"
  5.  
  6. # 关闭打开的文件 
  7. f.close() 

6. f.tell()

返回文件读写指针当前所处的位置,它是从文件开头开始算起的字节数。一定要注意了,是字节数,不是字符数。

7. f.seek()

如果要改变位置指针的位置, 可以使用f.seek(offset, from_what)方法。seek()经常和tell()方法配合使用。

from_what的值,如果是0表示从文件开头计算,如果是1表示从文件读写指针的当前位置开始计算,2表示从文件的结尾开始计算,默认为0,例如:

offset:表示偏移量。

  • seek(x,0) :从起始位置即文件首行首字符开始移动 x 个字符。
  • seek(x,1) :表示从当前位置往后移动x个字符。
  • seek(-x,2):表示从文件的结尾往前移动x个字符。

例:

  1. f = open("1.txt""rb+"
  2. f.write(b"1232312adsfalafds"
  3.  
  4. print(f.tell()) 
  5.  
  6.  
  7. print(f.seek(5)) 
  8.  
  9. print(f.read(1)) 
  10.  
  11. print(f.seek(-3, 2)) 
  12.  
  13. print(f.read(1)) 

运行结果:

8. f.close()

关闭文件对象。当处理完一个文件后,调用f.close()来关闭文件并释放系统的资源。文件关闭后,如果尝试再次调用该文件对象,则会抛出异常。忘记调用close()的后果是数据可能只写了一部分到磁盘,剩下的丢失了,或者更糟糕的结果。

五、 with关键字

with关键字用于Python的上下文管理器机制。为了防止open这一类文件打开方法,在操作过程出现异常或错误,或者最后忘了执行close方法,文件非正常关闭等可能导致文件泄露、破坏的问题。

Python提供了with这个上下文管理器机制,保证文件会被正常关闭。不需要再写close语句。注意缩进。

  1. with open('test.txt''w'as f: 
  2.     f.write('Hello, world!'

with支持同时打开多个文件(文件都是随机创建的):

  1. with open('1'as obj1, open('2','w'as obj2: 
  2.     s=obj1.read() 
  3.     obj2.write(s) 

六、总结

本文基于Python基础,使用Python语言,介绍了有关Python文件操作的知识点。从文件的基本概念入手 ,通过一个个小项目的演示,对常用的读写模式,文件对象操作方法,以及在实际应用中需要注意的问题,都做了详细的讲解。希望帮助你更好的学习Python。

 

责任编辑:姜华 来源: Python爬虫与数据挖掘
相关推荐

2021-05-18 09:00:28

Pythonclass

2021-08-02 10:01:09

Iterator接口Java项目开发

2021-05-21 09:01:56

Python继承多态

2021-08-17 09:55:05

JavaScript MicrotaskPromise

2021-08-30 10:01:01

Map接口HashMap

2021-05-15 09:18:04

Python进程

2023-05-12 08:19:12

Netty程序框架

2021-06-30 00:20:12

Hangfire.NET平台

2022-02-21 09:44:45

Git开源分布式

2021-05-15 10:16:14

Python匿名函数

2021-03-24 10:00:32

Python递归函数Python基础

2021-04-24 10:19:41

Python函数指向

2021-03-21 07:36:43

Python迭代知识语言

2020-06-03 11:06:26

DNS域名缓存

2023-09-06 14:57:46

JavaScript编程语言

2021-05-18 08:30:42

JavaScript 前端JavaScript时

2023-07-30 15:18:54

JavaScript属性

2021-01-26 23:46:32

JavaScript数据结构前端

2021-03-05 18:04:15

JavaScript循环代码

2021-03-09 14:04:01

JavaScriptCookie数据
点赞
收藏

51CTO技术栈公众号