- 6 回复
- 463 浏览
给模型加RAG,试了LangChain+Qdrant
最近在搞本地知识库,用LangChain搭了个RAG流水线,向量库选了Qdrant,docker跑起来挺快。GitHub上有个叫 langchain-chatchat 的项目,部署脚本直接拉镜像就行,少踩点坑。传送门
踩坑点:Qdrant默认端口6333容易和别的服务冲突,改成6334就稳了。另外文档分块chunk_size设512效果比1024好,样本量200+测试结果,F1高了0.03。想搞多轮对话还得自己接memory,有点烦。


6s 条评论