版上推荐了官媛,结果找不到下载资源。虽然有网站提供在线阅读,但我喜欢下载到kindle上看。再结合以前也有一些小说无法下载到kindle上看,我决定找找下载txt的程序。
经过一番查找最后找到了一款开源软件:
https://github.com/Henryyy-Hung/Web-Crawler-of-Chinese-Fiction软件的exe版本只能支持有限的几个网站,于是我自己在源码上改了改,添加了需要下载的网站地址以及相关信息。
例如原版本支持“www.31xs.com”网站,如果要在网站“www.20xs.org”上下载文件,只需要在相应的地方添加一段与31xs网站类似的信息即可。主要修改在auto_setting(self, url)函数中。
还有些网站每一章的格式不一定完全一样,这时候需要在crawl_chapter_page(self, chapter_content)函数中针对特定网站进行修改。例如“
https://www.ddyueshu.com/28593_28593334/”我在废土世界扫垃圾。
ps:下载完 官媛 之后才发现就是 宦海浮沉,书只是改了个名字。
--
FROM 106.39.148.*