- 主题:中国的正史,能否改成数据库的形式
以前的正史,不是编年体,就是纪传体,而且掺杂了很多作者的私货。
如果把史书写成数据库的方式,把大量的资料,一小段一小段存为数据库中的数据。数据来源包括各种可信的资料,甚至一些相关的野史。并建立大量的索引。
读者在查看史书的时候,可以根据用户想要看的内容,动态的生成对应的内容。比如想看张居正的生平,系统就会自动通过AI分析,查找存在库中的相关资料,以纪传体的方式生成一个张居正的传。但是如果只想看张居正的一条鞭法,以及这个法的前因后果,那么就只搜集分析对应的资料,并加以横向对比,生成这个事件的分析,以及明末经济情况,得出张居正改革效果的一个相对客观的判断。
中国的24史,读者想看,要花费大量时间,导致深入了解一段时间历史必须是专家。好多人拿出史书上找到的片言只语,自己进行演绎,歪曲历史,得出一些十分荒唐,但又好像是十分正确的结论。
--
FROM 120.244.202.*
写史书的人掺私货比较麻烦。
读史书的人如果利用史书资料掺私货,这就有意义了。很多人提出荒唐的结论,是通过根据自己想要得出的结论筛选找出一些历史资料,再一演绎,就得出想要的结论。他的结论一眼就能看出荒唐,但是想批,也要查对应的历史资料。很多人没那个时间,因此也就算了。
但是随着技术的发展,搜寻资料,对历史事件进行相对客观的分析,已经完全可以通过AI加数据库技术解决。
历史是妓女,但是由于资料太多,因此成了只为少部分人服务的官妓。如果通过信息技术,让历史分析能走入大众,降低了门槛,也可以避免被一些人利用历史忽悠民众。
【 在 carbon 的大作中提到: 】
: 做成数据库这有社么不可以的,子要你给钱
: 但是想去掉掺私货就笑话了,没有人比现在人更会掺私货了
--
FROM 120.244.202.*
我想到这个问题,是看到编写清史有感。
据说清史编出来,有3000万字。这么多字,看也要看三年。不是历史专家,谁会去看这个东西。也就是说,这样写出来的历史,没有意义,也只能以资料的形式存在。
但是清朝虽然没有历史,但是现存的好多实录、起居注、奏折,还有各种案卷,以及民间的各种经济活动的文书、图书,还有野史,都非常多。把这些汇总,史学家进行考证,对资料的可信度进行分级,存入数据库中。
读者这时候要看的,就不是一部3000万字的大书了,而是想点哪里点哪里,还可以立刻生成各种分析,当然如果愿意,也可以自己采用自己的分析方法对查到的数据进行分析。这样研究历史,要比先看3000万字的大书,再开始搞研究,要有效的多。
【 在 whx83 的大作中提到: 】
: 技术上肯定没问题。
: 但,历史不是简单的史料的堆砌。就像大数据大数据,数据本身只是载体,数据背后的人的活动才有意义(商业的、社会的等等)。
: 你又如何保证所谓的AI后边的人不会对历史加作料?
: ...................
--
FROM 120.244.202.*
维基是个人写好的,不能动态生成。个人不能根据自己的需求SQL历史资料。
历史资料是已有的,数据库史书不改动内容,只存入库中。
【 在 Madlee 的大作中提到: 】
: 不就是维基吗?里面的私货不要太多哦。
--
FROM 120.244.202.*
资治通鉴可以算是数据库,因此为了阅读方便,还有了本末体,这就相当于对这个数据库进行了一次查询。
不足的是,资治通鉴选的历史资料有限,已被司马光进行了大量的筛选,丢失了很多东西。对帝王将相尤其是帝王记录的多,但是想分析某个时代的经济情况,社会阶级对立的问题,就会感觉资料很少。
相对而言,可能更像是四库全书,只不过不增删,但会对可信度进行一个标定。也就是对当时所存的所有资料,都以数据形式进行入库,然后读者根据需要,进行查询,快速动态生成资料汇总,并生成文档。
【 在 whx83 的大作中提到: 】
: “对历史事件进行相对客观的分析”,这目的本身就无法达成。历史是人的历史,背后是人性。在人文科学汇总追求自然科学那一套确定性,南辕北辙了。
: 你所说的这个数据库,其实可以参考一下《资治通鉴》。司马光编纂的资治通鉴,在当时应该就是个历史数据库了,是在当时的历史条件下做的。结果呢?其中尚且有那么多问题,有技术上的,也有作者自身局限性的。你现在提倡的这个数据库,其实和当年司马光编纂《资治通鉴》没有本质区别,只不过数据更丰富一些。那么,今天的这个数据库,肯定也会有编纂者自身的各种主客观局限性带来的各种问题。甚至,因为披上了所谓的官方背景、高科技手段的外衣,更容易迷惑人、操控人,还不易反驳。
: 其实,你顶帖里说的那些困难,现在的网络手段足够你解决了。你想了解张居正,只要花点时间搜索,就能找到很多归纳、总结的东西。但是,这些纷繁负责的网络来源,里边掺水、掺沙子的可不少。你所说的数据库,只不过是把这些零散的东西归堆了,但永远无法解决人对史料的影响的问题。
: ...................
--
FROM 120.244.202.*
资治通鉴一是只给出了搜索结果,没提供数据库。
我希望的是只提供数据库,并放开让用户自己查询。当然,数据库也提供一些基本查询。
也就是说,这个数据库不提供什么观点,只提供历史资料。查出来的结果,想黑想捧都可以,只不过对这个结果不满意的人,也可以很方便的批驳这个结论。
用户可以根据查询结果,再进行文学加工,就生成一个《千古冤忠袁崇焕》,也可以用同样的手段生成一个《大奸似忠袁都师》。只是用户如果较真,可以很方便的找出相关历史资料。这样,万年的袁都师的坑也就能更有学术味,而不是互相谩骂抬杠。这也间接提高了中华历史的普及。
【 在 whx83 的大作中提到: 】
: 你说的数据库跟司马光编纂《资治通鉴》本质上没区别:都是要经过筛选、再加工的。只不过资治通鉴是司马光那波人做的,你所说的是人和AI做的(其实本质都是人)。
: 我觉得,用技术手段把那些史料放在一起,在搜索、查询上做得好一些就可以了,方便用户查找,节省时间。像你说的:输入个“张居正”,给你一篇张居正的方方面面的东西,本身就是经过“处理”的,真没必要。而且这么做,《资治通鉴》有的问题,你的数据库同样会有。说到底,历史是人文学科,一些高科技可以用作辅助手段,但不要把自然科学那一套整个搬过来,那样是喧宾夺主甚至南辕北辙。
:
--
FROM 120.244.202.*
我想的是:核心是一个大的数据库。但是提供一些查询服务。对于复杂的查询,比如对一条鞭法实际效果及影响,这种明显不是简单的查询能解决的,就可以提供AI帮助查询并编辑。
当然,如果用户不愿意用提供的AI,想自己建立查询,自己分析查询结果,也没问题。
就如同卖菠萝提供削皮服务,但是有人觉得卖家削的太浪费,愿意买回去自己削,那也没问题。核心是卖菠萝,不是削皮。
【 在 whx83 的大作中提到: 】
: 你是只提供查询的意思吗?只是查询功能的话,根本用不到AI,简单的机械逻辑就足以搞定。上AI是几个意思?那就是说:在原始数据和呈现给用户的内容之间导了一遍手,经过了处理,且留下了做更多处理的可能。
: 好一个“不提供任何观点”。知道什么叫“用事实说谎”吗?对事实的选择本身就是有观点的,且可以达到影响读者思想的目的的。比如老光编《资治通鉴》,就体现了他作为一代醇儒的个人偏好。同样,只要你保留了对内容再加工的接口(AI,但不限于AI),就是有观点的,体现了AI以及后边控制它的人的观点。
:
--
FROM 120.244.202.*
要的就是千人千言,千人千言才好。要是万人一言,那岂不是更糟糕?
只要基础的资料是真实的,不是伪造的,就存进去。
任何人想了解历史,都可以自己方便的找到资料,相当于一个历史专家为你服务。这被让别人洗脑要好多了。
另外,有一些资料是过去伪造的,也可以辅助现代的学者专家进行考证,修正数据库的资料。
【 在 fixdudu 的大作中提到: 】
: 事实可以是客观的,这种AI大数据可以搞
: 要说对事实的分析对应资料因为夹杂分析的人主观,肯定就没法客观了,千人千言
:
--
FROM 120.244.202.*
别人说什么,如果自己也可以方便的得到一手材料,那就不妨让人随便说,只要不是捏造。
比如历史上说雍正的传位诏书是把十改成于,编的神乎其神,但是如果有了方便的历史查询系统,把传位诏书往出一调,甚至搜索一下“雍正真的篡改遗诏了吗?”,就能给出详实的历史分析,还怕什么一人万言?
人被骗往往是由于无知,有了知,还怕被骗?只是骗人的人怕自己骗不了人了。
【 在 whx83 的大作中提到: 】
: 官方可以搞查询,但不要搞什么AI编辑。
: 那就完全可以交给民间去搞。官方搞AI编辑,结果可能不是“千人千言”,也不是“万人一言”,而是“一人万言”。
:
--
FROM 120.244.202.*
我的意思是,官方提供AI,但是放开查询,任何人也可以做自己的AI。
或者你觉得官方AI不好,那么官方就只提供查询接口,想找什么资料自己去找。正是因为相信官方不会做这么下作的事,才觉得有个官方AI好。但这并不等于只许用官方的搜索结果。
举个例子,你去饭店吃饭,服务员拿出一本菜谱,你可以自己随便点。你也可以直接说,我不选了,你给我们来一个全家桶吧。不是因为饭店提供了全家桶套餐,就不能自己点。
【 在 whx83 的大作中提到: 】
: 别人说什么,如果自己也可以方便的得到一手材料,那就不妨让人随便说,只要不是捏造。
: ~~~~~~~~~~
: 这个在现在的条件下的搜索技术完全可以做到,而且因为其非官方的特性,反而会让人脑子里天然有一道防火墙:这东西可能对也可能不对,还需要对照鉴别。想想你自己看某个历史网贴的过程,是不是这样的?
: ...................
--
FROM 120.244.202.*