Python代码文本文件readline读取一行为啥包括了BOM字节顺序标记

水木社区手机版

主题:Python代码文本文件readline读取一行为啥包括了BOM字节顺序标记
楼主|ooolinux|2024-12-19 20:08:27|只看此ID
Python代码文本文件readline读取一行为啥包括了BOM字节顺序标记？
>>> f=open('d:/bar.txt','r',encoding='utf-8')
>>> f.readline()
'\ufeff新年都未有芳华，二月初惊见草芽。\n'
>>> f.readline()
'白雪却嫌春色晚，故穿庭树作飞花。'
>>>
--
修改:ooolinux FROM 112.50.55.*
FROM 112.50.55.*
1楼|adoal|2024-12-20 01:35:52|只看此ID
用utf-8-sig

【在 ooolinux 的大作中提到: 】
: Python代码文本文件readline读取一行为啥包括了BOM字节顺序标记？
: >>> f=open('d:/bar.txt','r',encoding='utf-8')
: >>> f.readline()
: ...................
--
FROM 183.157.71.*
2楼|ooolinux|2024-12-20 08:40:32|只看此ID
我要吐槽一下Python的文档，从open函数
open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
第几段介绍encoding跳转到codecs，很长的一篇翻到最后才介绍：

encodings.utf_8_sig — UTF-8 codec with BOM signature

This module implements a variant of the UTF-8 codec. On encoding, a UTF-8 encoded BOM will be prepended to the UTF-8 encoded bytes. For the stateful encoder this is only done once (on the first write to the byte stream). On decoding, an optional UTF-8 encoded BOM at the start of the data will be skipped.

感觉文档太难用了，甚至比Qt的都不如。
还是说这个问题有更好的查询路径？
【在 adoal 的大作中提到: 】
: 用utf-8-sig
:
--
FROM 183.251.227.*
3楼|adoal|2024-12-20 13:23:54|只看此ID
我已经记不得为什么我知道这回事了 -_-;;;;

【在 ooolinux 的大作中提到: 】
: 我要吐槽一下Python的文档，从open函数
: open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
: 第几段介绍encoding跳转到codecs，很长的一篇翻到最后才介绍：
: ...................
--
FROM 183.157.163.*
4楼|ooolinux|2024-12-20 16:07:31|只看此ID
肯定遇到过
【在 adoal 的大作中提到: 】
: 我已经记不得为什么我知道这回事了 -_-;;;;
:
--
FROM 120.35.168.*
5楼|xuanqing|2024-12-20 16:08:00|只看此ID
bom这个事本来就是很少见
只有win下才会有一些吧
还有就是如果知道关键字是bom
直接搜索不就好了
在什么位置没那么重要吧

【在 ooolinux 的大作中提到: 】
: 我要吐槽一下Python的文档，从open函数
: open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
: 第几段介绍encoding跳转到codecs，很长的一篇翻到最后才介绍：
: ...................
--
FROM 123.123.193.*
6楼|ooolinux|2024-12-20 16:24:01|只看此ID
一个函数的参数各个选项应该直接明了列出来，而不是绕一大圈，感觉微软的文档就比较好
【在 xuanqing 的大作中提到: 】
: bom这个事本来就是很少见
: 只有win下才会有一些吧
: 还有就是如果知道关键字是bom
: ...................
--
FROM 120.35.168.*