本地知识库问答系统已经完整实现,主要包含以下功能:
1. 文档处理
- 支持加载TXT、PDF、Word等多种格式文档
- 使用RecursiveCharacterTextSplitter进行智能文本分块
- 可配置的chunk_size和chunk_overlap参数优化语义完整性
2. 向量化与检索
- 使用nomic-embed-text或bge-m3进行文本向量化
- 采用FAISS向量数据库进行高效存储和检索
- 支持保存和加载向量索引,避免重复构建
3. 问答功能
- 集成DeepSeek大语言模型进行回答生成
- 优化的prompt模板提升回答质量
- 支持相关度评分和来源追踪
- 提供交互式问答界面
4. 实用特性
- 完整的错误处理机制
- 支持用户反馈收集
- 自动保存对话历史
- 命令行参数支持批处理和交互模式
使用方法:
1. 构建索引:python TrainP.py --build <文档目录>
2. 单次查询:python TrainP.py --query <问题>
3. 交互模式:python TrainP.py --interactive
--
FROM 183.241.167.*