zhonghua PDF数据存储在AWS S3,要导出向量化后的数据。因为想用自己搭建的Open WebUI,直接用Open WebUI创建知识库时间很长,有时候还会出现莫名其妙的问题,用AWS省心,效果感觉也还行。但不知道怎么导出来,只能通过AWS使用嘛?
Drift https://docs.aws.amazon.com/zh_cn/cur/latest/userguide/dataexports-s3-bucket.html https://docs.aws.amazon.com/zh_cn/prescriptive-guidance/latest/automated-pdf-analysis-solution/storage-phase.html
Drift 存储在 AWS S3 的 PDF 数据导出到本地,可以通过工具如 LangChain、Haystack 或 OpenAI 的嵌入模型进行向量化处理,然后将生成的向量数据转换为 Open WebUI 支持的格式并导入其知识库中。这一流程既可以通过 AWS 自动化完成,也可以在本地或其他云服务上实现,并不局限于只能使用 AWS。