使用您自己的数据快速入门
本指南将帮助您学习如何
- 将您自己的数据集添加到 Wren AI
- 定义表之间的关系
添加您自己的数据
Wren AI 可以通过链接到数据库或读取文件的方式与您的数据集建立连接。有关连接到数据源的更多信息,请参阅连接数据源概览。
在本教程中,我们将使用 DuckDB 来演示如何通过以下步骤从 CSV 文件添加数据集。
1. 准备您的数据集
准备您的数据集文件。这里我们以电子商务数据集文件为例。
有关我们支持的文件格式的更多信息,请参阅 DuckDB 文档。
信息
下载我们的示例数据进行尝试:e-commerce.tar
2. 在容器中创建文件夹
docker exec wrenai-wren-engine-1 bash -c "mkdir -p /usr/src/app/etc/data"
3. 将归档文件复制到容器中
docker cp ./e-commerce.tar wrenai-wren-engine-1:/usr/src/app/etc/data/
4. 解压归档文件
docker exec wrenai-wren-engine-1 bash -c "tar xvf /usr/src/app/etc/data/e-commerce.tar -C /usr/src/app/etc/data"
5. 通过 DuckDB 连接读取文件
点击 DuckDB 选项
1. 填写连接属性
- 显示名称:命名此连接,此处我们填写“e-commerce”。
- 初始 SQL 语句:使用 SQL 语句读取您的数据集。
CREATE TABLE reviews AS SELECT * FROM read_csv('./etc/data/e-commerce/reviews.csv', header = true);
CREATE TABLE customers AS SELECT * FROM read_csv('./etc/data/e-commerce/customers.csv', header = true);
CREATE TABLE orders AS SELECT * FROM read_csv('./etc/data/e-commerce/orders.csv', header = true);
点击 下一步 按钮开始连接。
选择表
每个 CSV 文件将创建一个表,选择所有表并点击 下一步。
定义关系
点击 +添加 按钮定义表之间的关系,以便使数据模型可视化。 1. 在 customer 表中添加以下关系:
从 | 到 | 类型 |
---|---|---|
customers.Id | orders.CustomerId | 一对多 |
2. 在 orders 表中添加以下关系
从 | 到 | 类型 |
---|---|---|
orders.OrderId | reviews.OrderId | 一对多 |
点击 完成 提交您的设置。
在建模页面理解您的数据
在首页提问
随时向 Wren AI 提出任何问题。