DolphinDB应用场景概述

2022-04-28 00:00:00 数据 分析 数据处理 实时 适用于

DolphinDB Database 是由浙江智臾科技有限公司自主研发,于2018年发布的高性能磁盘与内存混合型和列式分布式数据库产品。DolphinDB集成了功能强大的编程语言和高容量高速度的流数据分析系统,为海量数据(特别是时间序列数据)的快速存储、检索、计算及分析提供一站式解决方案。

DolphinDB具有运行快、部署快、开发快、学习快这四大优势,使其适用于大数据分析管理的诸多应用场景,主要可以归纳为以下四类:数据仓库、研发工具、实时数据处理及批处理作业。

  1. 数据仓库

海量数据的存储和分析是DolphinDB擅长的场景,系统点对点架构设计、高效的C++语言全自研实现、列式存储、内存计算、实现分布式文件系统、语言的JIT优化、支持多种精细化分区方式、以及各种算法的精心调优,使DolphinDB在大数据的存储和分析领域性能优势明显,单表百亿条数据简单查询毫秒级响应,复杂查询秒级响应,高出同类产品1-2个数量级。

  • 适用于海量数据的存储管理。DolphinDB能支持单表百万级分区,集群亿级分区,能轻松管理PB级历史数据和实时数据。随着互联网时代的到来,无论金融、电子商务还是物联网各领域的数据量都呈几何级增加,使用DolphinDB可以轻松实现海量股票和期货的点线交易数据(tick data)、商品历史交易数据和物-流-数据等的管理。
  • 可实现实时数据秒级入库。DolphinDB与其他数据仓库相比的一个重要优势是可以将实时数据每隔1秒或几秒钟批量进入数据库,使后台做研发和数据分析人员仅有短暂延迟即可使用实时数据。
  • 实现大数据毫秒级查询。DolphinDB对于大数据查询及分析请求达到毫秒级响应,远远优于主流产品的秒级和分钟级响应。
  • 适用于大量并发用户的同时访问。在拥有大量数据的电商业务场景中,促销、秒杀等情况下,瞬间的访问量能达到平时的几十甚至数百倍,以及在政府或大型机构往往都存在大量的并发用户,DolphinDB在此类情况下仍然能够保持优越的性能。

2. 研发工具

DolphinDB提供完善的IDE开发环境,提供与SQL和Python语法相近的功能强大而使用灵活的脚本语言,内置300+功能函数,友好的支持时序数据处理,提供领先、滞后、累积窗口、滑动窗口等多种指标函数,支持C++、C#、Java、Python、Json等多种语言开发接口,可以方便的使用DolphinDB脚本语言对业务的建模,分析。

  • 适用于企业数据工程师研发新产品。现代企业要想在竞争中赢得胜利,必须要能够快速推出新的产品,快速满足市场需求,实现业务的敏捷推进。新产品研发都会基于海量数据做仿真,其中一种模式的操作模式是后台用数据仓库,前台用Python或Java,需要把数据加载后再做分析。庞大的数据量使程序的开发和运行都是十分耗时。DolphinDB把编程语言和数据库融合,数据科学家可以直接在DolphinDB中编写脚本,进行库内分析,避免了数据迁移。并且,用户可以直接使用集群的资源进行并行计算,从而使开发效率和计算能力大大提高。例如在金融行业,一个四年期每周交易的S&P500个股期权交易策略的研发,使用普通内存数据库及Java,仅测试一次就需要24小时。而使用DolphinDB,完成同样的操作仅需要10分钟。因此在金融行业交易策略研发方面,DolphinDB将大有作为。
  • 适用于数据建模及大数据分析运用。利用DolphinDB对实际业务问题建立分析模型,反映业务生产实际情况并可进行预测仿真。例于面对证券客户,利用DolphinDB对客户、产品、市场的分析,构造有竞争力的数据模型和指标体系,支撑营销和客户服务。
  • DolphinDB的一站式服务不仅适合科研人员和数据分析员完成复杂的交互式任务。20多M大小的轻便体量,也使其适用于中小企业和高校的一部分学者和科研人员进行数据处理。

3. 实时数据处理

DolphinDB内置流数据处理引擎,架构设计优良,在对流数据处理保证高吞吐量的情况下,达到较低的时延。在万兆以太网环境下,两台不同物理服务每次发送10000条数据(每条数据size 80 bytes),时延控制在1ms左右。

  • DolphinDB低延迟高并发以及历史数据和实时数据一体化处理的能力,适用于速度要求极高的实时性任务,如实时的报告生成、性能监控、市场风险管理、信用卡反欺诈、智能交通调度、安全管理和金融机构内部交易及市场监管。
  • 在工业4.0时代,制造行业的数据量与日继增,智能装备和终端的普及以及各种各样传感器的使用,将会带来无所不在的感知和连接,所有的生产装备、感知设备、联网终端,包括生产者本身都在源源不断地产生数据,这些数据将会渗透到企业运营、价值链乃至产品的整个生命周期。企业的生产线往往时刻处于高速运转中,对数据实时性的处理要求极高,DolphinDB对实时数据的快速处理能力可应用于整体设备效率分析、设备状态监控、预测性维修保养等,提高企业管理效能。
  • 在金融领域更是如此。在金融市场,执行速度1毫秒的差别或许就决定了策略的盈亏。DolphinDB毫秒级响应速度能够非常有效的支持金融市场的高频交易。

4. 批处理作业

DolphinDB支持对批处理作业进行管理。可以灵活地定制批处理的执行计划,按天、按周、按月等,以及每天有多个执行时间。

  • DolphinDB的批处理作业适用于数据清洗、归档、日志分析和机器学习,例如各个金融机构的往来业务和跨主机系统业务的定时对账。

综上,DolphinDB的高性能和强大的计算能力将会使它拥有更加广泛的应用场景。

相关文章