图数据库OrientDB-基础篇

2022-04-08 00:00:00 数据库 模型 支持 定义 数据结构

  本文假设用户已有RDBMS及标准SQL的基础知识。

    本文不对OrientDB的下载、安装、使用作说明。具体可参考:http://orientdb.com/getting-started/


主要内容

1、什么是图数据库

2、图数据库的适用场景

3、为什么要使用图数据库

4、OrientDB的特性

5、OrientDB的数据模型

6、OrientDB的一些基本概念

7、OrientDB的查询

1、什么是图数据库

图:一些节点和关联这些节点的联系的集合。

NoSql(Not Only Sql)数据库分为四大类: 

key/value                 例如: Redis 

column-oriented      例如: Hbase 

document                例如: MongoDB

graph                       例如: Neo4j,OrientDB

图数据库是NoSql数据库的一种。


2、图数据库的适用场景

世界上的大部分领域实际上都可以建模成图。

Gartner定义了商业世界的5个图:

社交 、

意向 、

消费 、

兴趣 、

移动。


3、为什么要使用图数据库?

性能

灵活性

       图天生是可扩展的。

        新增加节点与边对现有的模型,SQL,应用程序等没有任何影响。

敏捷性

        可以与敏捷开发或者测试驱动开发模式保持一致。

        我们知道现在的大型软件开发,业务模型不可能在开发初期就完美地确定下来。随着需求的变化,业务模型在后期可能会与当初设计大相径庭,而图数据库则拥抱变化。


4、OrientDB的特性

OrientDB是用JAVA语言实现的,运行在JVM之上。

Multi-Model:OrientDB支持多种模型:Key/Value, Object, Document, and Graph。

Multi-Master Replication: OrientDB集群部署时每个点都是Master,每个Master上都有完整的数据。一旦一个Master上的数据发生变更,会将发生变更的数据同步通知其它Master。

Extended SQL : OrientDB支持大部分标准的SQL,同时在标准的SQL之上扩展了部分功能以方便图的操作。

Easy Integration :使用teleporter可以很容易地将数据从RDBMS迁移到OrientDB上。

OOP:OrientDB定义数据结构的Class符合OOP(Object-oriented programming)的理念,支持继承和多态的特性。

Document-Graph:如下图API的依赖关系。

5、OrientDB的数据模型

OrientDB支持多种模型: Key/Value, Object, Document, and Graph 。

Key/Value

Object

Document

Graph


6、OrientDB的一些基本概念

Classes : 类比关系型数据库系统中的Table与传统文档数据库的collections。这个概念来自于OOP(Object-oriented programming)的理念。class用于定义数据结构的模型。

Record:record是OrientDB中小的加载和存储的单位。record有四种类型:Document、RecordBytes(BLOB)、Vertex、Edge。

Document:是OrientDB中灵活的record。Document支持schema-less,schemal-full,schema-mixed,即可以在定义数据结构的时候指定属性及约定条件,也可以不指定。它通过create class语法来定义一个数据结构。

Vertex:在OrientDB的graph模型下,每个结点叫作Vertex,每个Vertex也是一个Document。

Edge:在OrientDB的graph模型下,连接两个Vertex的边叫作Edge。Edge是有向性的而且仅能连接两个Vertex。

Clusters : 用于存储record。每个数据库多有32767个cluster。每个class都必须至少有一个对应的cluster。默认情况下OrientDB会自动为每个class创建与当前cpu核数相同的cluster,其中有一个默认的cluster。

Cluster Selection:当新增加一条reocrd时OrientDB会根据cluster section为这条记录选择一个cluster。cluster section有四条类型:

detault、round-robin、balanced、local。

Record ID :每个record都有一个record id。 record id的格式如下:

#<cluster-id>:<cluster-position>。

Relationships: OrientDB中不使用join,它通过在每个reocrd中定义一个关系类型的属性来维护关系。这个关系属性存储的实际是record id,就像定义一个指针在内存中将两个record联系起来。

Inheritance & Polymorphic: OrientDB支持面向对象的继承和多态特性。


7、OrientDB的SQL

在写图数据库的SQL时,步是要确认起始点(这个也是图数据库比较耗时的地方),一旦起始点确认后,我们便可以近乎物理连接的方式查询这个起始点相关联的数据。

基本的SQL:OrientDB支持大部分标准的SQL查询。

例如:SELECT FROM Person WHERE name LIKE 'Luk%'

Traverse:traverse语法可以遍历获取一个record联结的reocrd。它比select使用起来更简单和快速。

例如:RAVERSE out("Friend") FROM #10:1234 WHILE $depth <= 3

Match:match是一种表述力很强的查询语法结构,类比Neo4j的Cypher语法结构。它以一种说明式的方式来查询。

例如:

MATCH {class: Person, as: person, where: (name = 'John' AND surname = 'Doe')}.both('Friend').both('Friend')

{as: friendOfFriend} RETURN person, friendOfFriend

相关文章