网络爬虫系列的附加内容,对爬取到的内容进行读取操作


read()方法

read方法有一个参数:

f.read(size) # f为文件对象

可选参数size为数字,表示从已打开文件中读取的字节计数,默认情况下为读取全部
示例:
example.txt :

1 2 3
4 5 6
7 8 9
with  open('example.txt') as f:
    content = f.read(6)
    print(content)

运行结果:

1 2 3
 

这里空格和回车各算一个字符,共读取6个。

readline()方法

readline方法可以从文件中读取整行,包括换行符’\n’

f.readline(size)

size表示读取的字节数,默认情况下为读取一行中的全部字符
示例:

with  open('example.txt') as f:
    content = f.readline()
    print(content)

运行结果:

1 2 3
 

readline方法会记住上一个readline函数读取的位置,接着读取下一行

readlines方法

可以读取多行,没有参数,返回的是所有行组成的列表

示例:

with  open('example.txt') as f:
    content = f.readlines()
    print(content)

运行结果:

['1 2 3\n', '4 5 6\n', '7 8 9']

参考: 一文搞懂Python文件读写.知乎.朱卫军.

调整本文代码样式: