- 主题:[转载]为什么从 PDF 里面解出文本很难
简繁转换应该按照简化版的翻译对待……
而不仅仅是代换
【 在 callmebbser (BBSer) 的大作中提到: 】
: 不会。只会“一級方程式”转为“一级方程式”
--
修改:oldwatch FROM 116.233.186.*
FROM 116.233.186.*
一级方程式刚好是对的
程式
程式语言
方程式
一级方程式
一元方程式
都能做对才算赢
【 在 oldwatch (一条叫java的鱼◎城内风光独好) 的大作中提到: 】
: 简繁转换应该按照简化版的翻译对待……
: 而不仅仅是代换
--
FROM 121.207.202.*
我的意思就是简繁转换要做好
必须附带一定程度语义/句法分析才行
以前那种直接内码映射的糙快猛到头了
【 在 cybereagle (2/3的沉默@XMUCSD) 的大作中提到: 】
: 一级方程式刚好是对的
: 程式
: 程式语言
: ...................
--
FROM 116.233.186.*
我看过一些简体版的三国
里面好多华佗字符化,某某人字“符什么”……
看见几次才反应过来大概是Word转的
有个简体版的《三国志集解》,里面忽然来了一句“琼森议论”,查了原文才知道是“强生议论”
【 在 oldwatch (一条叫java的鱼◎城内风光独好) 的大作中提到: 】
: 简繁转换应该按照简化版的翻译对待……
: 而不仅仅是代换
--
修改:qblyy FROM 89.247.127.*
FROM 89.247.127.*
“海内存知己”真的会转成“海記憶體知己”
【 在 iMx (围城) 的大作中提到: 】
: “一级方程式”会转成 “一级方程序 ”吗?
--
FROM 183.157.160.*
哈哈哈哈哈哈哈
【 在 adoal (阿豆) 的大作中提到: 】
: “海内存知己”真的会转成“海記憶體知己”
--
FROM 114.85.149.*
字元 -_-;;;;
【 在 qblyy (新的昵称) 的大作中提到: 】
: 我看过一些简体版的三国
: 里面好多华佗字符化,某某人字“符什么”……
: 看见几次才反应过来大概是Word转的
: ...................
--
FROM 183.157.160.*
实际上呢?
【 在 FuZu 的大作中提到: 】
: 书读百遍,其义自见,多看!多查字典
--
FROM 117.136.103.*
你可以试试啊
这个东西,扯到最后又扯到NLP上就没劲了。能解决手上的问题就行,完美是不存在的。
【 在 iMx 的大作中提到: 】
: “一级方程式”会转成 “一级方程序 ”吗?
:
--
FROM 123.118.187.*
有个繁简中文转换的开源项目:
https://github.com/BYVoid/OpenCC
应该是目前做得最好的,也支持各种编程语言使用。
【 在 oldwatch (一条叫java的鱼◎城内风光独好) 的大作中提到: 】
: 我的意思就是简繁转换要做好
: 必须附带一定程度语义/句法分析才行
: 以前那种直接内码映射的糙快猛到头了
: ...................
--
FROM 59.77.36.*