Wren AI 服务
此图展示了 Wren AI 提供的 AI 服务流程,该流程似乎涉及大型语言模型(LLM),例如 OpenAI 的 GPT,与知识库交互以处理和回答查询。以下是根据图表进行的流程概述
索引处理:
流程始于将模型定义语言 (MDL) 重写为数据定义语言 (DDL),以帮助 LLM 更好地理解数据上下文。
向量数据库:
向量数据库专门用于高效存储和搜索向量数据。向量数据以 AI 可搜索的方式存储语义上下文。
RAG 流水线:
- 检索: Wren AI 服务在此阶段在向量数据库中搜索与用户查询相关的上下文。
- 提示: Wren AI 服务构建一个包含用户查询和从向量数据库检索到的上下文的提示。该提示旨在促进 LLM 生成相关且准确的响应。
- LLM: 大型语言模型接收提示并生成 SQL 和描述,以创建与用户初始查询对应的结果。
信息
当前版本中使用的 LLM
- 嵌入器: OpenAI text-embedding-3-large,维度 3072
- 生成器: 您可以选择以下模型之一
- OpenAI gpt-4o-mini
- OpenAI o3-mini
- OpenAI gpt-4o
请期待未来版本提供更多 LLM 选项。
输出处理:
- 验证: 对 LLM 生成的 SQL 进行验证,确保其可执行。Wren AI 服务与 Wren Engine 协作执行 SQL 并验证结果。
- 纠正: 如果在验证过程中检测到错误,或者 SQL 被认为不够“好”,系统会标记此问题,并提示 LLM 重新生成输出。
总体而言,Wren AI 服务结合了大型语言模型的自然语言处理能力与数据库查询和验证的精确性,提供了强大的 AI 驱动查询应答服务。