有没有会弄RAG的佬？

目前需求是有很多文档（~100k字），打算用OpenAI的text-embedding-3-large模型和claude的sonnet 3.5配合，问问这是可以实现的吗

没搞过，工程量好大。混着用效果好么。

理论上可行。

前面的操作只是将数据向量化（也可以本地做向量化），后面的LLM模型用来优化回答

向量化之后大概率是放到要给向量数据库，不确定OpenAI是否需要放到指定的向量数据库

关于向量可以看B站的这两个视频
【上集】向量数据库技术鉴赏】
【下集】向量数据库技术鉴赏】

本地的向量数据库可以用这个 qdrant/qdrant docker一键部署，有图形化界面可以查看向量数据
少量数据的向量数据库，可以用 chroma-core/chroma 基于内存部署，也可以做持久化存储

后面的LLM模型用来优化回答。前后端流程大概如下