20M+的数据，用什么方法同步呢

水木社区手机版

主题:20M+的数据，用什么方法同步呢
10楼|sixue1999|2023-05-15 21:12:30|只看此ID
这个问题我去问了一下ChatGPT，结果ChatGPT直接给了我一个极其有道理的解决方案

换成csv！

感觉太有道理了！比整个版都靠谱
【在 sixue1999 的大作中提到: 】
: 详细说下需求
: 1.自己写的小工具，下载网文的
: 其中索引文件现在是25m，存成json格式
: ...................
--
FROM 120.244.20.*
11楼|GoGoRoger|2023-05-16 09:27:09|只看此ID
索引单独一个文件，每个网文一个文件
【在 sixue1999 的大作中提到: 】
: 详细说下需求
: 1.自己写的小工具，下载网文的
: 其中索引文件现在是25m，存成json格式
: 2.工具使用python+c#写的，暂时解析保存json的速度还可以
: 3.索引文件（其实还有下载的网文），现在被我放到dropbox里了
: 这样可以在几台机器+手机上自动同
: ..................

发自「今日水木 on M2007J17C」

※ 来源:·水木社区 http://www.mysmth.net·[FROM: 219.142.237.*]

FROM 219.142.237.*
12楼|ToSimplicity|2023-05-16 16:50:42|只看此ID
难道查找索引的时候是把整个索引文件读到内存里么? 那也太大了吧
本地索引存储用sqlite, 增量用json
sqlite记一下当前已经已经同步的进度, 如果有新的就自动导入一下
都很简单, 没啥活儿
--
修改:ToSimplicity FROM 211.161.233.*
FROM 211.161.233.*
13楼|ZhangShao|2023-05-16 23:28:27|只看此ID
哈哈哈

【在 sixue1999 的大作中提到: 】
: 标题: ChatGPT一语惊醒梦中人
: 发信站: 水木社区 (Mon May 15 21:13:24 2023), 站内
:
: 这个问题我去问了一下ChatGPT，结果ChatGPT直接给了我一个极其有道理的解决方案
:
: 换成csv！
:
: 感觉太有道理了！比整个版都靠谱
: 【在 sixue1999 的大作中提到: 】
: : 详细说下需求
: : 1.自己写的小工具，下载网文的
: : 其中索引文件现在是25m，存成json格式
: : ...................
:
: --
:
: ※ 来源:·水木社区 mysmth.net·[FROM: 120.244.20.*]
--
FROM 120.229.89.*
14楼|sixue1999|2023-05-17 23:33:31|只看此ID
我本来就是分开存的
现在的问题是索引太大，25m，现在应该更大了

其实我已经拆成一系列json了，按照字典顺序拆分的
但这玩意仍然不是很稳定，还是会有即使没有变更，也要更新好多文件的尴尬情况
而且逻辑也有点复杂

但是ChatGPT的方案用csv就非常完美
拆分容易，数据稳定，不像json不保顺序

【在 GoGoRoger 的大作中提到: 】
: 索引单独一个文件，每个网文一个文件
: 发自「今日水木 on M2007J17C」
: ※ 来源:·水木社区 http://www.mysmth.net·[FROM: 219.142.237.*]
: ...................
--
FROM 120.244.20.*
15楼|allegro|2023-05-18 00:04:44|只看此ID
能存在git上吗？pygithub有接口的。

【在 sixue1999 的大作中提到: 】
: 详细说下需求
: 1.自己写的小工具，下载网文的
: 其中索引文件现在是25m，存成json格式
: ...................
--
FROM 158.140.1.*
16楼|pigtracer|2023-05-19 16:03:43|只看此ID
配置一个git不就好了，一个写入，其它几个pull。。。

【在 sixue1999 的大作中提到: 】
: 详细说下需求
: 1.自己写的小工具，下载网文的
: 其中索引文件现在是25m，存成json格式
: ...................
--
FROM 103.37.140.*
17楼|Bernstein|2023-05-20 17:19:14|只看此ID
找一个备份工具不就行了，特性比较多支持增量备份的那种

【在 sixue1999 的大作中提到: 】
: 详细说下需求
: 1.自己写的小工具，下载网文的
: 其中索引文件现在是25m，存成json格式
: ...................
--
FROM 221.218.208.*
18楼|sixue1999|2023-05-21 14:14:20|只看此ID
不管是git还是备份工具都不如dropbox好用啊
【在 Bernstein 的大作中提到: 】
: 找一个备份工具不就行了，特性比较多支持增量备份的那种
--
FROM 120.244.20.*
19楼|hongyan2022|2023-05-27 00:31:12|只看此ID
这... 解决了什么问题吗？

【在 sixue1999 的大作中提到: 】
: 这个问题我去问了一下ChatGPT，结果ChatGPT直接给了我一个极其有道理的解决方案
: 换成csv！
: 感觉太有道理了！比整个版都靠谱
--
FROM 47.144.177.*