- 主题:现在感觉,后四十回,亦是曹雪芹原作,
很多人做过这个分析
语言风格前80后40相比变化很大
【 在 sthgot2give 的大作中提到: 】
: 其实现在有工具做这这个事,就是分析作者的语言风格。我见过有人用这种方法做YU情分析。
: 估计应该有人已经做过了,把整部红楼做语言的统计和分类。应该很容易能判断出是谁写的。
: 这个不需要大语言模型,传统机器学习就应该能胜任。
: ...................
--
FROM 111.42.148.*
统计很容易做到公平,只要你想证明的事不复杂
比如,类似以下这种统计就可以证明语言风格有差异
前80回带语气助词“呢”“吗”的对话是不带语气助词对话的16.7倍
后40回带语气助词是不带语气助词的1.9倍
前80回多用“吃茶”“吃酒”,“吃”是“喝”的5倍
后40回多用“喝茶”“喝酒”,“喝”比“吃”多
“大凡”一词,后40回出现的次数是前80回的8.5倍
“东道”一词,后40回出现的次数是前80回的12倍
【 在 icetea 的大作中提到: 】
: 二十多年前,似乎就有人做过这种分析。
: 但统计这个事,很容易靠不同立场的不同解释得出不同结论。
--
修改:wwwsmthnet FROM 111.42.148.*
FROM 111.42.148.*
简单的统计就可以证明前80后40语言风格有很大差异
这种差异,可以类比一个东北大妞忽然变成林黛玉,或者一个直男突然变成gay
【 在 luoxiaoyi 的大作中提到: 】
: 其实也不用证据,倒是双作者说应该提出证据,
: ,
--
修改:wwwsmthnet FROM 111.42.148.*
FROM 111.42.148.*
语言风格的变化的情况,除了上面的例子,还有很多,例如
前80回用词:“越性”“偏生”“越发”
后40回用词:“索性”“偏偏”“更加”
前80回:人物交谈多有粗口,各种人物加起来超过百次(例如娼妇,放屁,cao等)
后40回:娼妇出现一次(赵姨娘)、放屁出现一次(贾政)
这些例子,已经包含了你想要的东西,就算再吹毛求疵,也是毋庸置疑的
【 在 icetea 的大作中提到: 】
: 这个统计太粗糙了,根本谈不上公平。
: 随着小说情节的发展,时间变了,环境变了,
: 出场人物变了,接触的周边人物变了,语言习
: ...................
--
修改:wwwsmthnet FROM 111.42.148.*
FROM 111.42.148.*