- 主题:C++标准委员会成立33年憋不出来一个std::string::to_upper()
是否可以考虑在 std::u8string 上实现各种语言文字的大小写功能
不过 std::u8string 出现没多少年,不知道什么个情况
【 在 zli07 的大作中提到: 】
: rust的string是强制要求utf8,cpp有std::string,std::u16string,可以是任意字符集,甚至可以不遵循utf8/utf16编码规范
--
FROM 120.253.228.*
u8string 目前只是 basic_string<char8_t>的别名,并没有强制 utf-8 的限制,比如你可以给一个 u8string 从一个 unicode codepoint 的 utf8 字符序列中间截断,而不会有任何问题;rust 如果在 codepoint 中间截断会直接 panic
【 在 easior 的大作中提到: 】
: 是否可以考虑在 std::u8string 上实现各种语言文字的大小写功能
: 不过 std::u8string 出现没多少年,不知道什么个情况
--
FROM 114.251.196.*
你这么说也对
虽然 u8 串字面值本身是 UTF-8 编码
但内存中的 u8string 对象可被逐字节读取,也就可被截断
但 UTF-8 本身有校验功能
估计只需要为 u8string 实现一个完整编码的校验功能就差不多了
【 在 zli07 的大作中提到: 】
: u8string 目前只是 basic_string<char8_t>的别名,并没有强制 utf-8 的限制,比如你可以给一个 u8string 从一个 unicode codepoint 的 utf8 字符序列中间截断,而不会有任何问题;rust 如果在 codepoint 中间截断会直接 panic
--
FROM 120.253.228.*
顶,整天净整些华而不实的东西,还不如c,虽然c比较古老
【 在 poocp 的大作中提到: 】
: 算不上尸位素餐?
: Rust有to_uppercase()
: Python有upper()
: ...................
--
修改:god4 FROM 114.246.92.*
FROM 114.246.92.*
c++委员会:我们只做non-trival的feature,to_upper?进我的hello world教程都不合格
--
FROM 219.142.253.*
C++:You don't pay for what you don't use
需要校验的地方才校验(一般是对外入口,防止脏数据的入侵),不用到处校验
【 在 zli07 的大作中提到: 】
: u8string 目前只是 basic_string<char8_t>的别名,并没有强制 utf-8 的限制,比如你可以给一个 u8string 从一个 unicode codepoint 的 utf8 字符序列中间截断,而不会有任何问题;rust 如果在 codepoint 中间截断会直接 panic
:
--
FROM 221.218.167.*