java 默认策略是换成 \ufffd,需要特殊处理下,会有异常。
Charset.forName(xxx).newDecoder()
.onMalformedInput(CodingErrorAction.REPORT)
.onUnmappableCharacter(CodingErrorAction.REPORT)
.decode(ByteBuffer.wrap(xxx));
这样应该会异常~默认 new String 是使用 replacement
mozilla 有 chardet 项目,但是吧,对于自研项目,应该主要就是 gbk 与 utf8 了吧
【 在 guestking (无) 的大作中提到: 】
: 解不出来的意思,是指二进制数据超过了某个编码的上下限?
--
FROM 114.222.153.*