TigerGraph图数据库的数据加载_GraphStudio方式

2022-04-15 00:00:00 数据文件点击映射选中

Graph Schema创建成功后需要把数据映射到schema中。下面是使用可视化界面GraphStudio将数据映射到Graph Schema中。

点击左边的“Map Data To Graph”的“Add data file”：

注意事项：

上传单个文件大小限制500M，还可以通过下面方法绕过该限制：若您的TigerGraph在本地部署的话,直接将文件或该文件的快捷方式放置到TigerGraph的数据文件目录中，地址为：<tigergraph_rood_dir>/loadingData。
文件必须时.csv格式。系统只接受.csv文件的上传。若收到将文件复制到<TigerGraph_root_dir>/loadingData目录中，不要创建任何子目录，因为系统不会读取子目录中的内容。
配置文件内容解析器

点击所上传的文件“computers.csv”和“connections.csv”，以“connectons.csv“为例，弹出文件内容解析器：

将数据映射到点或边

点击左侧的“Map Data To Graph“按钮后点击“Map data file to vertex or edge“按钮，在完成所有编辑后再次点击该按钮就可退出数据映射的编辑模式。

选中某个源文件，选中后该文件上有提示“Select the target verter/edge to create the maping“信息：

接下来，选取需要映射到的点类或边类，随后在该源文件与对应的点类或边类之间出现一条虚线箭头，若目标点类/边类此时还未创建对应的Primary ID的映射，则上方会出现一条红色提示。

在这一步中，你需要将数据源中的某个列与对应点类或边类中的特定ID或属性连接起来。首先，选中一个介于数据源和点类/边类之间的数据映射（即图中的绿色的虚线箭头）。选中后，该箭头会变为橙色（即处于待编辑状态），右侧的面板中也会随之出现两张表格。左侧的表格显示源数据中的每一列，并列出该列中的行令牌作为示例；右侧的表格则显示出选中点类或边类的特定字段。如果是点类，则这里显示的是primary id或属性；如果是边类，则这里显示的是该边类的起始点类，目标点类以及属性。

映射方法如下：首先选中左侧数据列表格中的一行，然后选择右侧表格中的需要映射到的字段。此时，两者间会出现一条绿色的箭头。重复以上操作可以完成所有字段的映射。由于系统支持多对一的映射，所以并不需要在每一个点类/边类的字段都建立映射关系。

把vertex、edge数据都映射到graph后，点击左上角“publish data mapping”按钮，把数据都映射到graph中：

数据加载：

选中一个或多个数据文件(按shift键可多选)，然后点击工具栏中左上角的开始加载按钮，运行结果如下：

至此，数据的映射和加载完成。然后就可进行“Explore Graph”和“Write Qeries”操作。

注意：可能无法显示在gsql中创建的加载作业：

GraphStudio只能识别通过图形界面创建的数据映射过程。若加载作业是在GSQL中创建的，则它将不会显示在GraphStudio中。同时，一旦发布了这些数据映射过程，则所有的加载作业都会被清除，所以，请保存在发布之前对它们就行备份。

相关文章