- 主题:欢迎大家试用我的新项目,纯开源
对多模态的输入支持如何?能支持图片或者视频这种吗?
【 在 Xjt 的大作中提到: 】
: Readme里有支持的文件列表
: First-Class Office & PDF: pdf, pptx, ppt, docx, doc, xlsx, xls
: First-Class Deep Text: md, markdown, txt, eml (email)
: ...................
--
FROM 58.19.0.*
视频不支持,但是如下文件里的多模态图像都能读取和理解:
First-Class Office & PDF: pdf, pptx, ppt, docx, doc, xlsx, xls
First-Class Deep Text: md, markdown, txt, eml (email)
Lightweight Text: mdx, yaml, yml, tex, csv, tsv
【 在 Aladdin 的大作中提到: 】
: 对多模态的输入支持如何?能支持图片或者视频这种吗?
:
--
FROM 103.149.83.*
如果将大模型替换为国产的大模型,你觉得效果会有变化吗,还是保持稳定?
【 在 Xjt 的大作中提到: 】
: Github搜DocMason
: DocMason is a repo-native agent app for analyst-grade answers over complex private files. The repo is the app. Codex is the runtime.
: 可以你本地各种格式的私人文件ppt excel pdf doc等等,变成你的私人知识库,并且可以询问非常复杂的问题,都可以得到深度分析所有本地资料后咨询级的答案或者报告。
: ...................
--
FROM 114.242.100.*
我没试过哦,你可以试试。有issue欢迎去github上提,我来改进哈。
我认为如果是国内的顶级大模型,那么区别不会很大,最关键的是你用的runtime的AI Agent harnessing能力(比如Codex或者Claude code)
【 在 liismn 的大作中提到: 】
: 如果将大模型替换为国产的大模型,你觉得效果会有变化吗,还是保持稳定?
:
--
FROM 27.115.98.*
?!已经star!
--
FROM 123.116.48.*
感谢!
【 在 biglei 的大作中提到: 】
: ?!已经star!
--
FROM 27.115.98.*