使用Java操作TensorFlow的方法
简介
机器学习在全球范围内越来越受欢迎和使用。 它已经彻底改变了某些应用程序的构建方式,并且可能会继续成为我们日常生活中一个巨大的(并且正在增加的)部分。
没有什么包装且机器学习并不简单。 它对许多人来说似乎非常复杂并常常令人生畏。
像谷歌这样的公司将自己的机器学习概念与开发人员联系起来,在谷歌帮助下让他们逐渐迈出第一步,故TensorFlow的框架诞生了。
TensorFlow为何物?
TensorFlow是由谷歌使用Python和c++开发的开源机器学习框架。
它可以帮助开发人员轻松获取数据,准备和训练模型,预测未来状态,以及执行大规模机器学习。
有了它,我们可以训练和运行深度神经网络的内容,诸如光学字符识别,图像识别/分类,自然语言处理等。
张量与操作
TensorFlow基于计算图,你可以将其想象为具有节点和边的经典图。
每个节点被称为操作,它们将零个或多个张量输入并产生零个或多个张量输出。 操作可以非常简单,例如基本的添加,但它们也可以非常复杂。
张量被描绘为图的边缘,并且是核心数据单元。 当我们将它们提供给操作时,我们在这些张量上执行不同的功能。 它们可以具有单个或多个维度,有时也称为它们的等级(标量:等级0,向量:等级1,矩阵:等级2)。
这些数据受到操作的影响通过张量传递到计算图中,故而称为TensorFlow。
张量可以以任意数量的维度存储数据,并且有三种主要类型的张量:占位符,变量和常量。
安装TensorFlow
使用Maven,安装TensorFlow就像包含依赖项一样简单:
<dependency>
<groupId>org.tensorflow</groupId>
<artifactId>tensorflow</artifactId>
<version>1.15.0</version>
</dependency>
如果你的设备支持GPU功能,可以添加以下依赖:
<dependency>
<groupId>org.tensorflow</groupId>
<artifactId>libtensorflow</artifactId>
<version>1.15.0</version>
</dependency>
<dependency>
<groupId>org.tensorflow</groupId>
<artifactId>libtensorflow_jni_gpu</artifactId>
<version>1.15.0</version>
</dependency>
你可以使用TensorFlow对象来检查当前操作的TensorFlow的版本。
System.out.println(TensorFlow.version());
TensorFlow的JavaAPI
Java API TensorFlow提供包含在org.tensorflow包中。 它目前是实验性的,因此不能保证其稳定性。
需要注意的是TensorFlow唯一完全支持的语言是Python,Java API几乎没有什么功能。
API向我们介绍了新的类,接口,枚举和异常。
类
通过API引入的新类是:
- Graph:表示TensorFlow计算的数据流图;
- Operation:在Tensors上执行计算的Graph节点;
- OperationBuilder:Operations的构建器类;
- Output:操作产生的张量的符号句柄;
- SavedModelBundle:表示从存储加载的模型;
- SavedModelBundle.Loader:提供加载SavedModel的选项;
- Server:进程内TensorFlow服务器,用于分布式训练;
- Session:图形执行的驱动程序;
- Session.Run:输出执行会话时获得的张量和元数据;
- Session.Runner:运行操作并评估张量;
- Shape:由操作产生的可能部分已知的张量形状;
- Tensor:静态类型的多维数组,其元素是由T描述的类型;
- TensorFlow:描述TensorFlow运行时的静态实用程序方法;
- Tensors:用于创建张量对象的类型安全工厂方法;
枚举
DataType:将张量中的元素类型表示为枚举;
接口
Operand:由TensorFlow操作的操作数实现的接口;
异常
TensorFlowException:执行TensorFlow图时抛出的未经检查的异常
如果我们将所有这些与Python中的tf模块进行比较将发现存在明显的区别。 Java API没有几乎相同的功能,至少目前如此。
图(Graphs)
如前所述,TensorFlow基于计算图 - 其中org.tensorflow.Graph是Java的实现。
注意:它的实例是线程安全的,尽管我们需要在完成它之后显式释放Graph使用的资源。
让我们从一个空图开始:
Graph graph = new Graph();
该对象是空的,所以这个图表意义不大。 要对它做任何操作,我们首先需要使用Operations加载它。
我们使用opBuilder()方法来加载它,它返回一个OperationBuilder对象,一旦我们调用.build()方法,它就会将操作添加到我们的图形中。
常量
让我们在图表中添加一个常量:
Operation x = graph.opBuilder("Const", "x")
.setAttr("dtype", DataType.FLOAT)
.setAttr("value", Tensor.create(3.0f))
.build();
占位符
占位符是变量的“类型”,声明时没有赋值,他们的值将在之后进行分配。 这允许我们使用没有任何实际数据的操作来构建图形:
Operation y = graph.opBuilder("Placeholder", "y")
.setAttr("dtype", DataType.FLOAT)
.build();
函数
最后为了解决这个问题,我们需要添加某些函数。 这些可以像乘法,除法或加法一样简单,也可以像矩阵乘法一样复杂。 和之前一样,我们使用.opBuilder()方法定义函数:
Operation xy = graph.opBuilder("Mul", "xy")
.addInput(x.output(0))
.addInput(y.output(0))
.build();
注意:我们使用input(0)作为张量可以有多个输出。
图形可视化
遗憾的是,Java API还没有包含任何允许像Python中一样可视化图形的工具。
会话(Sessions)
如前所述,Session是Graph的驱动程序。 它封装了执行Operation和Graph计算张量(tensors)的环境。
这意味着我们构建的图(graph)中的张量(tensors)实际上并没有任何值,因为我们没有在会话(session)中运行图形(graph)。
我们首先将图表添加到会话(session)中:
Session session = new Session(graph);
我们的操作知识简单地将x于y相乘,为了运行我们的图(graph)并得到计算结果,我们需要使用fetch()获取到xy的操作并为其提供x和y的值:
Tensor tensor = session.runner().fetch("xy").feed("x", Tensor.create(5.0f)).feed("y", Tensor.create(2.0f)).run().get(0);
System.out.println(tensor.floatValue());
运行这段代码将产生的结果如下:
10.0f
Java当中加载Python中Saving模块
这可能听起来有点奇怪,但由于Python是唯一受到良好支持的语言,因此Java API仍然没有保存模型的功能。
这意味着Java API仅用于服务用例,至少在TensorFlow完全支持之前。 目前至少我们可以使用SavedModelBundle类在Python中训练和保存模型,然后使用Java加载它们来为它们提供服务:
SavedModelBundle model = SavedModelBundle.load("./model", "serve");
Tensor tensor = model.session().runner().fetch("xy").feed("x", Tensor.create(5.0f)).feed("y", Tensor.create(2.0f)).run().get(0);
System.out.println(tensor.floatValue());
结论
TensorFlow是一个功能强大且广泛使用的框架。 它不断得到改进,并最近被引入新语言:包括Java和javascript。
尽管Java API还没有像TensorFlow在Python中那么多的功能,但它仍然可以作为向Java开发人员介绍TensorFlow的一个很好的开始。
到此这篇关于如何使用Java操作TensorFlow的文章就介绍到这了,更多相关Java操作TensorFlow内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!
相关文章