时序数据库DolphinDB客户端软件教程

2022-05-20 00:00:00 执行 代码 启动 脚本 终端

DolphinDB提供了从基于Java的GUI, VS Code Extension, Web界面,到命令行等各种灵活友好的交互界面,具体包括以下6种客户端交互方式。

1. DolphinDB GUI

DolphinDB GUI是基于Java的功能齐全的图形化编程以及数据浏览界面。 DolphinDB GUI可以在任何支持Java的操作系统上使用,例如: Windows, Linux, 以及Mac。DolphinDB GUI的特点是速度快,功能齐全,用户友好的图形化界面。 GUI适合用于管理和开发DolphinDB脚本、模块,以及数据库交互,查看运行结果等。 GUI提供非常友好的编程界面:查找替换文本、保留字高亮显示、系统函数提示、行号显示,选择部分代码执行、执行结果浏览、log信息、临时变量浏览、数据库浏览。 通过Project浏览器,可以浏览所有项目。通过Database浏览器,可以浏览所有DFS数据库以及其分区表的schema。适用于DolphinDB脚本项目管理和程序开发。

1.1 核心概念

Server

GUI菜单中的server是指DolphinDB数据库服务器。完成添加后,会自动出现在server下拉菜单中。默认添加的server为localhost:8848。 这里值得注意的是,连接远端服务器,我们一般建议连接数据节点,因为DolphinDB关于数据库的操作都是在数据节点上执行的。

Login

登录数据库服务器主要有三种方法:

  • 在添加server的时候指定用户名和密码
  • 通过工具条中的login按钮
  • 通过脚本中使用 login函数

Workspace

启动GUI的时候,首先会要求用户指定workspace路径。 Workspace用于项目管理。 Workspace下面可以有多个项目。 GUI同时只能有一个workspace,可以在不同的workspace直接切换.

Project

指定workspace后,可以通过 New Project来创建新的项目,也可以通过Import Folder来导入已有的项目。

File

创建完project后,用户可以在project下面通过New Folder以及New File来生成脚本目录以及脚本文件。脚本文件创建之后,即可通过编辑器来编写、修改、以及执行脚本。

Synchronize to server

在远端服务器上执行一个脚本文件或者调用了一个module都会在该服务器上查找对应的脚本文件。当GUI和DolphinDB server不在一个机器上时,有可能需要把本地新编辑的脚本文件同步到远程服务器上。 为此,DolphinDB提供了Synchronize to server, 即文件同步功能。在项目浏览器中右键点击需要同步的目录或者文件,并选择 Synchronize to server,将其传送到服务器的对应目录。 在添加远程服务器的同时可以指定服务器相应目录。如果添加的时候未指定,则可通过 Server->Edit Server菜单来指定。例如远端目录是'/home/usr1", 而本地需要同步的文件名是"C:/users/usr1/Project/scripts/test.dos, 同步的时候,系统会在远端自动创建目录和相应文件'/home/usr1/Project/scripts/test.dos'。

1.2 安装和启动

在启动GUI前,需要确保已经安装java 8 64bit以及以上版本。

DolphinDB GUI无需安装,可以直接运行。在Windows环境下,双击gui.bat即可。在Linu和Mac环境下,在Terminal中输入:

cd /your/gui/folder
./gui.sh
复制代码

常见无法正常启动原因

如果DolphinDB GUI无法正常启动,可能有以下三个原因:

  • 没有安装Java,Java下载地址:www.oracle.com/technetwork…
  • Java的不在系统路径中。在Windows上,需要查看是否在Path中;在Linux上需要查看,是否在PATH中。
  • 安装的Java版本不符合要求,DolphinDB GUI使用环境需要64 位Java 8及以上版本。32位的Java即使版本正确由于不支持Server模式,只有Client模式,将无法启动GUI。我们可以在命令行中使用java -version命令查看Java的版本信息。

符合要求的Java版本如下:

java -version

java version "1.8.0_121"

Java(TM) SE Runtime Environment (build 1.8.0_121-b13)

Java HotSpot(TM) 64-Bit Server VM (build 25.121-b13, mixed mode)
复制代码

如果版本信息的后一行如下,那么DolphinDB GUI将无法正常启动。

Java HotSpot(TM) Client VM
复制代码

1.3 程序执行及结果查看

GUI编程界面提供代码查询,修改,高亮显示,函数提示等功能。用户可以选择部分代码执行,也可以点击文件执行代码。执行完毕,可以立刻看到执行结果,以及查看所有的局部变量和共享变量的值。 关于GUI更详细具体的功能介绍请参阅GUI帮助手册。

1.4 中文出现乱码

如果中文显示出现乱码,需要在文件菜单Preferences中设置中文字体,例如微软雅黑(Microsoft Yahei)。 然后用print(变量)名,查看输出结果,乱码会消失。

1.5 精度配置

DolphinDB GUI默认精度是4位,如果需要更高或低的精度,需要在Preferences中, 将精度配置项Default number of decimal place设置成想要的精度,例如8。

1.6 java.lang.OutOfMemoryError: Java heap space

如果出现内存溢出,说明GUI的默认2048M启动内存不能满足需要,可以通过修改gui/gui.bat或者gui/gui.sh中的-Xmx启动参数来扩大内存,如下:

start javaw -classpath dolphindb.jar;dolphingui.jar;jfreechart-1.0.1.jar;jcommon-1.0.0.jar;jxl-2.6.12.jar;rsyntaxarea.jar;autocomplete.jar -Dlook=cross -Xmx4096m com.xxdb.gui.XXDBMain
复制代码

2. VS Code Extension

VS Code 是微软开发的一款轻便又有极强扩展性的代码编辑器,它提供强大的插件框架,可以让VS Code通过插件来支持不同编程语言,达到语法高亮、智能语法提示以及代码运行等效果。DolphinDB database 提供了VS Code的插件,用户可以使用VS Code编写DolphinDB脚本并运行。

DolphinDB VS Code 插件提供如下功能:

  • 自动识别dos和txt后缀的文件
  • 连接DolphinDB Server
  • 编辑和执行DolphinDB脚本
  • 观察变量

VS Code 插件与GUI功能非常相似,优点是VS Code使用者无需安装其它软件,直接下载插件即可使用,学习成本低,上手快。缺点是不支持GUI的画图功能以及DFS数据库浏览器功能。

2.1 下载安装插件

点击VS Code左侧导航栏的Extensions图标,或者通过ctrl+shift+X快捷键打开插件安装窗口,在搜索框中输入DolphinDB,即可搜索到DolphinDB插件。点击Install进行安装。安装完成后,以txt和dos为后缀的文件都可以被DolphinDB插件识别。

2.2 连接DolphinDB Server

在编辑并运行脚本之前,需要先新增并选择一个数据节点作为运行脚本的服务器。新建并打开一个txt或dos文件,通过右键菜单可以增加、选择和移除DolphinDB Server。

新增服务器

选择右键菜单的“DolphinDB:addServer”,依次输入server名称、数据节点IP地址以及端口号。

选择服务器

选择右键菜单的“DolphinDB:chooseServer”,选择要连接的server。

移除服务器

选择右键菜单的“DolphinDB:removeServer”,选择要移除的server。

2.3 编辑和运行DolphinDB脚本

VS Code打开txt或dos文件时,DolphinDB插件会自动加载右键菜单并且识别脚本,支持语法高亮、智能语法提示。通过 ctrl+E 快捷键或者下拉菜单"executeCode"来执行选中代码,若没有选中代码,则会执行当前光标所在的行。

2.4 观察变量

DolphinDB 插件在左边导航增加了变量面板,面板显示当前服务器上的所有本地和共享变量,每次执行代码时面板上变量会更新。点击变量右边的"show"链接可以在输出面板查看变量的值

3. DolphinDB Notebook

DolphinDB Notebook是DolphinDB服务器安装包自带的,基于网页的丰富的图形化交互工具。它主要用于系统监控、日志查看、以及数据浏览。同时也可用于快速编辑执行代码、查看变量、以及具体基本的画图功能。 和DolphinDB终端一样,它更适合临时任务,不适于执行定期任务,以及开发任务。为了保证DolphinDB服务器的性能,若10分钟内无命令执行,系统会自动关闭会话以释放DolphinDB系统资源。

3.1 启动

DolphinDB Notebook通过是通过HTML+Javascript编写的Web前端。无需安装,在single模式下,启动DolphinDB服务器,只要在浏览器输入网址(默:htt://localhos:8848)即可访问。 在集群模式下只要在浏览器输入controller节点的网址加端口号即可访问。 当出现无法访问Notebook的情况,需要查看以下几个方面。

  • 确保DolphinDB server的license没有过期
  • 确保该节点的端口没有被防火墙屏蔽
  • 确保web目录在server目录下面

在Linux环境下,如果端口没有开放,可以尝试如下命令:

>firewall-cmd --get-active-zones

public
interfaces: eth1

>sudo firewall-cmd --zone=public --permanent --add-port=8848/tcp

success
复制代码

3.2 登录

DolphinDB Notebook不会强制用户登录服务器。但是有些功能例如浏览/创建数据库,浏览/创建分区表需要登录才能访问。如果需要用户执行任何代码前都需要登录,可以在single模式下的dolphindb.config里面添加webLoginRequired=true;集群模式下需要在controller.cfg和cluster.cfg中添加。 当用户成功登录,会在屏幕上方显示登录用户名。另外需要注意,如果10分钟内无命令执行,会自动退出登录。

3.3 集群管理以及系统监控

DolphinDB Notebook 主要的功能是用于集群节点管理、系统监控以及数据浏览。

启动节点

集群模式下,启动节点过程中,如果按刷新键没有看到节点状态更新状态。 可以注意以下几个方面:

  • 有的时候由于Cache的原因,所以需要刷新网页 (SHIFT键+刷新)

  • 如果长时间状态没有更新,则需要查看系统log(点击ServerLog列对应节点的View超链接)得出具体未启动原因:

  • License过期

  • 节点端口被其它进程占用

  • 正在恢复元数据

  • 其它原因

3.4 程序执行以及结果查看

在single和cluster模式,DolphinDB notebook代码编辑和执行都是一致。的区别是在集群模式下,用户需要点击节点名字的链接来打开notebook界面。 另外,当需要浏览DFS数据库以及分区表的时候,single模式按钮在屏幕右上角,cluster模式则在屏幕左上角。

4. DolphinDB终端(DolphinDB Terminal)

DolphinDB终端(DolphinDB Terminal)是一个命令行交互式工具,用于连接到远程的DolphinDB服务器执行命令。使用终端的优点是可以快速连接到远端数据库上执行一些交互命令和脚本。缺点是没有图形化界面,不适用于开发和执行大量复杂代码。

DolphinDB终端和DolphinDB服务器用的是同一个程序,1.10.4及以上版本方可支持。当用户启动DolphinDB的时候,如果指定参数remoteHostremotePort,当前进程将被启动为DolphinDB终端。如果服务器不允许guest用户登录,启动时可参数uidpwd指定用户名和密码,也可以在启动后的终端中通过login命令登录。DolphinDB的工作非常简单,接受用户的输入并发送到远程服务器执行,后把执行结果在终端显示。因此DolphinDB终端不需要license,也不需要系统初始化脚本dolphindb.dos以及其它配置文件。DolphinDB的终端可以是跨操作系统的,例如Windows上的终端可以访问Linux的DolphinDB的服务器。

下面的命令是在Linux上启动DolphinDB终端的示例。由于默认shell不支持命令上下回滚,所以需要借助rlwrap命令来实现。

rlwrap -r ./dolphindb -remoteHost 127.0.0.1 -remotePort 8848 -uid admin -pwd 123456
复制代码

下面的命令实在Windows上启动DolphinDB终端的示例。

dolphindb.exe -remoteHost 127.0.0.1 -remotePort 8848 -uid admin -pwd 123456
复制代码

成功登入后,系统会显示DolphinDB Termninal,如下:

DolphinDB Terminal 1.10.4 (Build:2020.04.03). Copyright (c) 2011~2019 DolphinDB, Inc.
复制代码

如果启动终端时不指定登录信息,可以在连接后使用login命令。

>DolphinDB Terminal 1.10.4 (Build:2020.04.03). Copyright (c) 2011~2019 DolphinDB, Inc.
>login("admin","123456");
复制代码

DolphingDB终端支持单行或多行脚本。只要在代码末尾加上分号;或者go语句,系统就会将代码发送到远端执行。通过分号;单句提交示例如下:

1+2;
复制代码

多句提交示例如下:

def myFunc(x,y){
    return x+y
}
myFunc(1,2);
复制代码

由于分号;会触发解析它们之前的代码,如果将其放在自定义函数中间,会造成函数定义无法完整传送到远端,从而造成解析错误,例如:

def myFunc(x,y){
    return x+y;
}
myFunc(1,2);

//抛出语法接异常
Syntax Error: [line #2] } expected to end function definition
复制代码

退出终端使用quit指令。

quit + Enter
复制代码

为方便在任何工作目录下启动终端,可以将DolphinDB可执行文件目录(即包含dolphindb或者dolphindb.exe的目录),添加到系统的搜索路径中。Linux上可以export到PATH

 export PATH=/your/dolphindb/excutable/path:$PATH
复制代码

在Windows上可以将可执行文件路径添加到系统环境变量Path中。格式为分号加全路径(注意分号必须是英文分号)。路径设置完成后,可以通过打开dos或者PowerShell窗口,在任意目录下,通过dolphindb命令启动终端。

5. 命令行远程脚本执行

DolphinDB终端可以让用户方便的连接到远端的DolphinDB服务器,并以交互的方式执行命令。但是如果所有需要执行的脚本已经写在一个脚本文件中,那么我们有更简单的办法在远端服务器上批处理执行这些脚本。只要在启动DolphinDB终端的命令中额外指定一个参数run,即可以将run参数指定的本地脚本文件发送到远端服务器上执行。执行完成后终端马上退出。我们称这种模式为命令行远程脚本执行。使用示例如下。需要特别说明的是,/home/usr1/test.dos是本地而非远程服务器上的脚本文件。

./dolphindb -remoteHost 127.0.0.1 -remotePort 8848 -uid admin -pwd 123456 -run /home/usr1/test.dos
复制代码

命令行远程脚本执行是DolphinDB终端的一个特殊应用。相对于终端模式,优点是无需在终端中输入代码,可以执行更复杂的代码,以及用于重复执行特定任务。例如,定期连接到远端服务器数据库执行脚本中的代码,执行完即退出。缺点是,没有交互模式。

6. 命令行本地脚本执行

通过终端交互式或批量执行脚本覆盖了大部分的应用场景。但是某些场景下,需要同时能够在本地和远端执行脚本。譬如,本地读取一个csv文件,然后追加到运行在远端DolphinDB数据库中。这种模式我们称之为命令行本地脚本执行。下面是在Linux上启动命令行本地脚本执行的示范:

./dolphindb  -run /home/usr1/test.dos
复制代码

Windows上启动命令行本地脚本执行非常类似:

dolphindb.exe -run c:/users/usr1/test.dos
复制代码

启动命令行本地脚本执行,只要通过启动参数run指定一个本地的脚本文件,同时不指定参数remoteHost即可。本质上是启动了一个DolphinDB的工作站(workstation)来执行脚本,完成后退出。因此,命令行本地执行脚本文件的配置跟工作站的配置一样,需要dolphindb.lic和dolphidnb.dos。在Windows下,还需要tzdb目录。

那么在本地脚本执行过程中,如何连接到远端数据库进行操作呢?我们需要通过xdb函数创建一个到远程数据库的连接,然后使用remoteRun函数执行一个脚本或进行rpc调用。DolphinDB对rpc调用进行了扩展,不仅可以调用远端服务器上定义的函数,也可以将本地的函数序列化到远端服务器执行。如果需要执行的脚本比较复杂,一般我们建议定义成一个本地的函数,然后通过rpc调用来完成。

下面的脚本文件test.dos,演示了如何将本地的一个csv文件,写入到远程的一个分布式数据库表中。

def appendData(dbPath, partitionTable, t1){
    pt = loadTable(dbPath, partitionTable)
    return tableInsert(pt, t1)
}

conn=xdb("127.0.0.1",8848,"admin","123456")
remoteRun(conn, appendData, "dfs://db1", "pt", loadText("c:/users/usr1/data.csv"))
复制代码

我们首先定义一个函数appendData,将一个内存表写入到指定的数据库表中。然后创建一个远程连接conn。再后通过loadText函数加载本地的csv文件,rpc调用appendData函数。

相关文章