- 主题:Python代码文本文件readline读取一行为啥包括了BOM字节顺序标记
Python代码文本文件readline读取一行为啥包括了BOM字节顺序标记?
>>> f=open('d:/bar.txt','r',encoding='utf-8')
>>> f.readline()
'\ufeff新年都未有芳华,二月初惊见草芽。\n'
>>> f.readline()
'白雪却嫌春色晚,故穿庭树作飞花。'
>>>
--
修改:ooolinux FROM 112.50.55.*
FROM 112.50.55.*
用utf-8-sig
【 在 ooolinux 的大作中提到: 】
: Python代码文本文件readline读取一行为啥包括了BOM字节顺序标记?
: >>> f=open('d:/bar.txt','r',encoding='utf-8')
: >>> f.readline()
: ...................
--
FROM 183.157.71.*
我要吐槽一下Python的文档,从open函数
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
第几段介绍encoding跳转到codecs,很长的一篇翻到最后才介绍:
encodings.utf_8_sig — UTF-8 codec with BOM signature
This module implements a variant of the UTF-8 codec. On encoding, a UTF-8 encoded BOM will be prepended to the UTF-8 encoded bytes. For the stateful encoder this is only done once (on the first write to the byte stream). On decoding, an optional UTF-8 encoded BOM at the start of the data will be skipped.
感觉文档太难用了,甚至比Qt的都不如。
还是说这个问题有更好的查询路径?
【 在 adoal 的大作中提到: 】
: 用utf-8-sig
:
--
FROM 183.251.227.*
我已经记不得为什么我知道这回事了 -_-;;;;
【 在 ooolinux 的大作中提到: 】
: 我要吐槽一下Python的文档,从open函数
: open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
: 第几段介绍encoding跳转到codecs,很长的一篇翻到最后才介绍:
: ...................
--
FROM 183.157.163.*
肯定遇到过
【 在 adoal 的大作中提到: 】
: 我已经记不得为什么我知道这回事了 -_-;;;;
:
--
FROM 120.35.168.*
bom这个事本来就是很少见
只有win下才会有一些吧
还有就是如果知道关键字是bom
直接搜索不就好了
在什么位置没那么重要吧
【 在 ooolinux 的大作中提到: 】
: 我要吐槽一下Python的文档,从open函数
: open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
: 第几段介绍encoding跳转到codecs,很长的一篇翻到最后才介绍:
: ...................
--
FROM 123.123.193.*
一个函数的参数各个选项应该直接明了列出来,而不是绕一大圈,感觉微软的文档就比较好
【 在 xuanqing 的大作中提到: 】
: bom这个事本来就是很少见
: 只有win下才会有一些吧
: 还有就是如果知道关键字是bom
: ...................
--
FROM 120.35.168.*