欢迎大家试用我的新项目，纯开源

水木社区手机版

主题:欢迎大家试用我的新项目，纯开源
20楼|Aladdin|2026-04-08 19:58:33|只看此ID
对多模态的输入支持如何？能支持图片或者视频这种吗？

【在 Xjt 的大作中提到: 】
: Readme里有支持的文件列表
: First-Class Office & PDF: pdf, pptx, ppt, docx, doc, xlsx, xls
: First-Class Deep Text: md, markdown, txt, eml (email)
: ...................
--
FROM 58.19.0.*
21楼|Xjt|2026-04-09 18:33:00|只看此ID
视频不支持，但是如下文件里的多模态图像都能读取和理解：
First-Class Office & PDF: pdf, pptx, ppt, docx, doc, xlsx, xls
First-Class Deep Text: md, markdown, txt, eml (email)
Lightweight Text: mdx, yaml, yml, tex, csv, tsv

【在 Aladdin 的大作中提到: 】
: 对多模态的输入支持如何？能支持图片或者视频这种吗？
:
--
FROM 103.149.83.*
22楼|liismn|2026-04-13 09:11:31|只看此ID
如果将大模型替换为国产的大模型，你觉得效果会有变化吗，还是保持稳定？

【在 Xjt 的大作中提到: 】
: Github搜DocMason
: DocMason is a repo-native agent app for analyst-grade answers over complex private files. The repo is the app. Codex is the runtime.
: 可以你本地各种格式的私人文件ppt excel pdf doc等等，变成你的私人知识库，并且可以询问非常复杂的问题，都可以得到深度分析所有本地资料后咨询级的答案或者报告。
: ...................
--
FROM 114.242.100.*
23楼|Xjt|2026-04-13 10:01:07|只看此ID
我没试过哦，你可以试试。有issue欢迎去github上提，我来改进哈。

我认为如果是国内的顶级大模型，那么区别不会很大，最关键的是你用的runtime的AI Agent harnessing能力（比如Codex或者Claude code）
【在 liismn 的大作中提到: 】
: 如果将大模型替换为国产的大模型，你觉得效果会有变化吗，还是保持稳定？
:
--
FROM 27.115.98.*
24楼|biglei|2026-04-13 15:53:06|只看此ID
?！已经star！
--
FROM 123.116.48.*
25楼|Xjt|2026-04-13 17:15:58|只看此ID
感谢！
【在 biglei 的大作中提到: 】
: ?！已经star！
--
FROM 27.115.98.*