极客时间-轻松学习，高效学习-极客邦

Harry

2019-01-20

read 和 seek 的单位是字符还是字节呢？

作者回复: 操作的单位都是字节。
另 ASCII码中，一个英文字母占一个字节，中文汉字占两个字节；UTF-8编码中，一个英文字母占一个字节，中文占三个字节；Unicode编码应为和中文都是两个字节。

 1

 6
硕杨Sxuya

2018-07-26

不友好，文件的第一个字符是1，tell（）输出的也是位置1，很容易乱，为什么不多进行几个呢？比如到第5个字符，这样不就去分开“位置的指针数字”和“内容的数字”，没想过新手会蒙圈你说的1到底是哪个1么？。。。

作者回复: 有道理，改变文件内容或者多移动几个位置会让大家更好理解，谢谢你的反馈，后面注意提升演示代码友好度。



 5
太阳宇宙

2018-07-08

老师，您在视频中演示的把之前的内容注释掉是怎么操作的，谢谢

作者回复: 在pycharm使用ctrl+/ 可以把选中的行注释掉，再次输入可以取消注释



 4
。

2018-07-04

好难啊。。。。

作者回复: 学习编程是一条不断上升的曲线，爬过波峰会看到更美的风景，加油哦！



 4
Kirin

2018-07-26

老师我的是mac系统。版本3.7
为什么文件是中文的时候seek的第二个参数不能为1。而且为0的时候偏移之后文件不能读取。感觉有很多东西老师你都没讲啊

作者回复: seek()操作非常简单，这里主要希望大家了解文件指针这个概念，因此我没有太详细讲解每个参数。一般我们对文本经常用到的就只有移动到开头和移动到结尾操作。如果需要使用第二个参数，需要在打开文件的时候使用b参数，我想你遇到的问题应该是open(‘文件名’,‘r’) 只使用了r参数。这个是Python的规定了。

常用操作如下：

# 移动到文件开头，重新读取文件
f = open(‘b.txt’,’rb’)
# b.txt 内容
f.read()
# b’hello python1\nhello python2\n'
f.seek(0) # 移动到文件的开头
f.seek(0,0) # 移动到文件的开头

# 移动到文件结尾,以便追加新的信息
f.seek(0,2) # 28

# 注意这两种操作无需open()函数的第二个参数使用’b’参数，但是当你使用seek()函数第二个参数为1、2时，第一个参数如果是非0 就要增加’b’参数，否则会报错了。

#取得倒数第三个字符
f.seek(-3,2) # 25
f.read(1) # b’n’

# 取得第7个字符
f.seek(0) # 0
f.seek(6,0) # 6
f.read(1) # b’p’

# 另一种方法
f.seek(4,0) # 4
f.seek(2,1) # 2
f.read(1) # b’p’

了解了什么情况能够使用seek()第二个参数之后再来说一下中文的问题。因为中文涉及到两种常见编码：
utf-8和gb2312，由于你使用的是mac系统，默认在文本文件写入一个汉字，就会占用三个位置。
例如：“你好” 使用 open(‘filename’,’rb’)方式打开就是 b'\xe4\xbd\xa0\xe5\xa5\xbd’ 这样的内容，那么要注意操作汉字必须要保证是三个位置一起操作，才是操作一个汉字。而如果open()函数不带b参数，seek()函数依然只能使用移动到开头和结尾，没有看到你的具体错误信息，但我猜想这可能就是你的报错原因了，比如使用seek读取第二个汉字

f = open('b.txt','rb') # '你好，python\n极客时间\n'
f.read()
# b’\xe4\xbd\xa0\xe5\xa5\xbd\xef\xbc\x8cpython\n\xe6\x9e\x81\xe5\xae\xa2\xe6\x97\xb6\xe9\x97\xb4\n'
f.seek(1,0) # 1
f.seek(2,1) # 3
f.read(3).decode('utf-8') # ‘好’



 3
Wayne

2018-12-02

因为中文占两个bytes，如果 file6.read(3) ，读取的字符串是：“1 诸” ，指针实际是在第四个位置，所以 file6.tell() 则会返回 4。



 2
chi

2019-04-23

我遇到了一个问题想请教一下老师。在本节前面的内容都没问题，直到最后要将 file6.seek(0) 改为 file6.seek(5,0)。
代码如下：
======
file6 = open('name.txt')
print('当前文件指针位置 %s' %file6.tell())

print('当前读取到了一个字符：%s' %file6.read(1))
print('当前文件指针位置%s' %file6.tell())

# 注意seek参数，第一个代表偏移量，第二个代表偏移起始位置
file6.seek(5,0)
print('进行了seek操作')
print('当前文件指针位置%s' %file6.tell())

print('当前读取到了一个字符：%s' %file6.read(1))
print('当前文件指针位置%s' %file6.tell())

file6.close()
======

输出的结果是
======
Traceback (most recent call last):
File "D:/DongYunbo/python文件/file_op.py", line 36, in <module>
print('当前读取到了一个字符：%s' %file6.read(1))
当前文件指针位置 0
UnicodeDecodeError: 'gbk' codec can't decode byte 0xc1 in position 2: illegal multibyte sequence
当前读取到了一个字符：a
当前文件指针位置1
进行了seek操作
当前文件指针位置5
======

感觉是由于编码的问题，中文字“诸”无法输出，可是要如何解决呢？尝试了 open('name.txt',encoding='utf-8') 也会报错（不一样的错误）。
感谢老师的回答与付出。

展开

作者回复: 您好，UnicodeDecodeError: 'gbk' 是表示文件为gbk编码，可以使用open('name.txt',encoding='gbk')方式读取，另外要注意由于seek()是按照字节操作的，如果文件里面有汉字要注意两个字节一个汉字。



 1
WALKER

2018-07-06

老师，为什么我在文件中写上汉字，读取文件出来的都是乱码。

作者回复: 要保证读写编码一致才会不出现乱码，例如windows是gb2312，linux是utf8，python要根据需要调整写入和读取的编码，保证读写的参数文件的编码操作系统的编码一致才会不出现乱码



 1
偷故事的人

2019-12-27

如果能教一下对文件内容的搜索与替换就好了。

作者回复: 搜索需要引入re模块，一般使用re.findall( )可以进行查找，我提供一下官方文档，后面视频在标准库部分会有介绍。https://docs.python.org/zh-cn/3.6/library/re.html




王小纯

2019-11-29

在视频中没有看到您讲解as使用方法，看您作业当中就有使用，老师能够给讲解as是什么意思吗

作者回复: 您好，作业里面我使用了 with 这个上下文管理器打开文件， as 后面跟的是文件描述符，意思是打开文件成功之后，后续对文件操作可以使用此文件描述符即可，在课程后面有关于with 的讲解。




Cheryl

2019-11-22

file6=open('name.txt')
print(file6.tell())
file6.read(1)
print(file6.tell())
file6.read(1)
file6.seek(0)
print(file6.tell())
file6.read(1)
print(file6.tell())

结果：
0
2
0
2
为什么同样的代码，我的指针每次移位输出为2，您的是1？

展开

作者回复: 偏移量和文件内容以及字符编码是有关的，比如我的第一个是字母，偏移就是1；如果是gb2312字符集，第一个是汉字，偏移量就是2，utf8字符集就是3




Cheryl

2019-11-22

print(file.write('hello'))为什么输出的内容不是hello而是2呢？想问下这个输出的这个2是什么

作者回复: file.write('hello') 是把内容写入到文件，得到的是写入字符的数量，这里如果打印返回值，应该为5。
注意：官方文档中描述write( )无返回值,所以不应该有print 输出




润枝

2019-10-29

老师你好，我刚试验的时候，seek第一个参数为0的时候一切正常，当第二个参数为2时，没有使用‘b函数时报错，看了老师您解答其他同学疑问后，加了‘b’，但指针的实际位置与屏幕输出的不同，麻烦老师帮我看下是哪里有问题，谢谢。
name.txt内容如下
a lucy
b tom
c lily

代码如下
file6=open('name.txt','rb')
file6.seek(3,2)
print('当前指针位置是 %s' %file6.tell())
print('当前指针位置的内容是 %s' %file6.read(1))
print('当前指针位置是 %s' %file6.tell())
file6.close()

屏幕输出如下：
当前指针位置是 24
当前指针位置的内容是 b''
当前指针位置是 24

展开

作者回复: 试试 seek(-3,2)




　

2019-09-20

open的file，mode这些属性都得用字符串？

作者回复: open()是python的内置函数，用法参考这里：https://docs.python.org/zh-cn/3.6/library/functions.html#open

 1


人の初

2019-06-14

请教老师，这个报错是什么原因？谢谢
C:\Users\Administrator\PycharmProjects\dierci\venv\Scripts\python.exe C:/Users/Administrator/PycharmProjects/dierci/name.py
0
a 诸葛亮
Traceback (most recent call last):
File "C:/Users/Administrator/PycharmProjects/dierci/name.py", line 17, in <module>
file6.seek(2,2)
io.UnsupportedOperation: can't do nonzero end-relative seeks

Process finished with exit code 1
代码：
file6=open('name.txt')
print(file6.tell())
print(file6.read(5))
#第一个参数代表偏移位置，第二个参数0表示从文件开头偏移，1表示从当前位置偏移，2从文件结尾
file6.seek(2,2)
print(file6.tell())
文件name.txt为：
a 诸葛亮
b 曹操
c 刘备
d 关羽
e 张飞

展开

作者回复: 在python3中，没有使用b模式选项打开的文件，只允许从文件头开始计算位置，从文件尾计算时就会引发异常
需要使用 file6 = open('name.txt','rb')




.

2019-06-03

file6 = open('name.txt')
# print('当前文件指针的位置 s%' %file6.tell())
print( '当前读取到了一个字符，字符的内容是 s%' %file6.read(1))
print(file6.tell())
print(file6.seek(0))
print( '进行了seek操作')
print(file6.tell())
file6.read(1)
print(file6.tell())
报错如下：
/Users/paulakisscat/PycharmProjects/venv/bin/python /Users/paulakisscat/PycharmProjects/file_op.py
Traceback (most recent call last):
File "/Users/paulakisscat/PycharmProjects/file_op.py", line 25, in <module>
print( '当前读取到了一个字符，字符的内容是 s%' %file6.read(1))
ValueError: incomplete format
老师您好，代码报错了，但不知道错在哪里，上次提出的问题也是，还没有得到回复，辛苦老师解答

展开

作者回复: 您好，在第一句 print('当前读取到了一个字符，字符的内容是 s%' % file6.read(1)) 就产生了报错，
可以根据错误提示的 File "/Users/paulakisscat/PycharmProjects/file_op.py", line 25 定位到哪个文件的第几行产生的错误，而ValueError: incomplete format 是类型错误，字符串替换应该是%s，而不是s%




纯然

2019-05-29

UnicodeDecodeError: 'gbk' codec can't decode byte 0xc1 in position 2: illegal multibyte sequence
老师，这种报错要怎么解决

作者回复: 文本不是gbk编码，假设文本时utf-8 编码，在open()的时候增加encoding=utf-8 参数来解决

 1


孙祥烈L

2019-05-14

老师你好：
文档内容：
a诸葛亮
2.刘备
3.关羽
代码：
file6=open('name.txt')
print('当前文件指针的位置 %s' % file6.tell())
print('当前读取到了一个字符，字符的内容是 %s' % file6.read(3))
print('当前文件指针的位置 %s' % file6.tell())
print('当前读取到了一个字符，字符的内容是 %s' % file6.read(2))
print('当前文件指针的位置 %s' % file6.tell())
结果：
当前文件指针的位置 0
当前读取到了一个字符，字符的内容是 a诸葛
当前文件指针的位置 5
当前读取到了一个字符，字符的内容是亮

一个汉字不是两个字节吗？read(3)结果不应该是a诸吗？而且指针不是应该在3吗？

展开

作者回复: 我使用gbk编码重现了你的结果，把你的问题再简单化就是：英文字母占1字节，gbk编码汉字占2字节，utf-8编码汉字占三字节，按照官方文档写法read(3)应该读取三个字节，应该是“a诸”，而不是“a诸葛”
官方文档描述如下：
“read(size=-1)
Read up to size bytes from the object and return them”
文档链接 https://docs.python.org/zh-cn/3.6/library/io.html

产生这样结果的原因在open( )函数，如果open( )函数的参数带“b” 则read会按照字节读取，如果不带就会按照字符读取，即：utf-8汉字会读取一个完整汉字（一个字符，三个字节），gb2312也会读取一个完整汉字（一个字符，两个字节）




SuQiu

2019-04-19

首先，你的新文件名来源于文本内容本身，就需要一个暂存的空间--变量。如果存储多个，还是顺序的要考虑使用一个顺序的数据结构，列表是一个很好的选择。最后文本处理一定是按顺序读取的，而你的需求应该是逐行读取，那要考虑在每行读入进来之后，判断这行作为文件名还是文件内容对待，如果文件名要做创建文件处理，如果内容，要做添加到文件中处理。希望能帮到你
………………………………………………………

我尝试了这样去处理这个文本，但是当我写入了第一份文件后，如何判断写入下一个文件成了我的一个问题。当我判断这个为文件名后，这里有一个if条件，做文件名处理，但是下一行内容不满足这个条件，就进入不到写入的这个条件下面去执行写入。

展开

作者回复: 把当前文件名暂存成变量，从原始文件读取到下一个文件名之后可以做对比




SuQiu

2019-04-18

老师你好，我有一个文本文件，格式类似下面这样，
示例系统1
192.168.1.0
192.168.3.0
示例系统2
192.168.31.0
192.168.31.123
示例系统3
192.168.21.1
192.168.21.3
……
然后我想处理这个文本，另存为以示例系统的名称为文件名，新文件的内容为他对应的IP，但是我想的办法逻辑上有点问题，导致不能正常处理，想请问老师，这样的文本处理有什么好的经验方法没有？
谢谢。

展开

作者回复: 首先，你的新文件名来源于文本内容本身，就需要一个暂存的空间--变量。如果存储多个，还是顺序的要考虑使用一个顺序的数据结构，列表是一个很好的选择。最后文本处理一定是按顺序读取的，而你的需求应该是逐行读取，那要考虑在每行读入进来之后，判断这行作为文件名还是文件内容对待，如果文件名要做创建文件处理，如果内容，要做添加到文件中处理。希望能帮到你



