跳到主要内容

使用您自己的数据快速入门

本指南将帮助您学习如何

  • 将您自己的数据集添加到 Wren AI
  • 定义表之间的关系

添加您自己的数据

Wren AI 可以通过链接到数据库或读取文件的方式与您的数据集建立连接。有关连接到数据源的更多信息,请参阅连接数据源概览

在本教程中,我们将使用 DuckDB 来演示如何通过以下步骤从 CSV 文件添加数据集。

1. 准备您的数据集
准备您的数据集文件。这里我们以电子商务数据集文件为例。
有关我们支持的文件格式的更多信息,请参阅 DuckDB 文档

信息

下载我们的示例数据进行尝试:e-commerce.tar

2. 在容器中创建文件夹

docker exec wrenai-wren-engine-1 bash -c "mkdir -p /usr/src/app/etc/data"

3. 将归档文件复制到容器中

docker cp ./e-commerce.tar wrenai-wren-engine-1:/usr/src/app/etc/data/

4. 解压归档文件

docker exec wrenai-wren-engine-1 bash -c "tar xvf /usr/src/app/etc/data/e-commerce.tar -C /usr/src/app/etc/data"

5. 通过 DuckDB 连接读取文件
点击 DuckDB 选项 connect

1. 填写连接属性

  • 显示名称:命名此连接,此处我们填写“e-commerce”。
  • 初始 SQL 语句:使用 SQL 语句读取您的数据集。
CREATE TABLE reviews AS SELECT * FROM read_csv('./etc/data/e-commerce/reviews.csv', header = true);
CREATE TABLE customers AS SELECT * FROM read_csv('./etc/data/e-commerce/customers.csv', header = true);
CREATE TABLE orders AS SELECT * FROM read_csv('./etc/data/e-commerce/orders.csv', header = true);

点击 下一步 按钮开始连接。 duckdb2

选择表

每个 CSV 文件将创建一个表,选择所有表并点击 下一步select_table

定义关系

点击 +添加 按钮定义表之间的关系,以便使数据模型可视化。 relationship 1. 在 customer 表中添加以下关系:

类型
customers.Idorders.CustomerId一对多

2. 在 orders 表中添加以下关系

类型
orders.OrderIdreviews.OrderId一对多

点击 完成 提交您的设置。

在建模页面理解您的数据

model

在首页提问

随时向 Wren AI 提出任何问题。 ask