关于TensorFlow要注意以下几个要点:
(1)图是对于计算的一种描述
(2)图包含作为操作的节点。
(3)在一个给定的会话环境中执行计算。
(4)对于任何计算过程而言,图一定是在一个会话里启动。
(5)会话将图操作加载到像CPU或者GPU这样的设备上。
(6)会话提供执行图操作的方法
1.张量
张量是一个数学对象,它是对标量、向量或者矩阵的泛化。张量可以表示为一个多维数组。零秩(阶)张量就是标量。向量或者数组是秩为1的张量,而矩阵是秩为2的张量。简言之,张量可以被认为是一个n维数组。
2.计算图与会话
TensorFlow因其TensorFlow Core程序而受欢迎,TensorFlow Core有两个主要的作用:
(1)在构建阶段建立计算图
(2)在执行阶段运行计算图
我们来看一下TensorFlow是如何工作的:
(1)其程序通常被结构化为构建阶段和执行阶段。
(2)构建阶段搭建具有节点(操作)和边(张量)的图。
(3)执行阶段使用会话来执行图中的操作。
(4)最简单的操作是一个常数,它没有输入,只是传递输出给其它计算操作。
(5)一个操作的例子就是乘法(或者是取两个矩阵作为输入并输出另一个矩阵的加法或减法操作)
(6)TensorFlow库具有一个默认图来构建操作添加节点。
因此,TensorFlow程序具有构建阶段和执行阶段两部分。
构建阶段--(1)搭建一个图 (2)构建计算图中的节点(操作)和边(张量)
执行阶段-- (1)使用会话执行操作 (2)重复执行一组训练操作
计算图是由一系列的TensorFlow操作排成的节点组成的。
我们来对比一下TensorFlow和numpy。在numpy中,如果你打算将两个矩阵相乘,需要生成两个矩阵并将它们相乘。但是在TensorFlow中,你建立一个图(默认图,除非你另外创建了一个图)。接下来,需要创建变量、占位符以及常量值,然后创建会话并初始化变量。最终,把数据赋值给占位符以便调用其它操作。
实际上,为了计算节点,必须在一个会话里面运行计算图。
一个会话里囊括了TensorFlow运行时的控制和状态。
下面代码生成了一个会话(Session)对象:
sess=tf.Session()
这之后就可以用它的运行方法来充分运行计算图以计算节点1和节点2.
计算图定义了计算。它并不执行计算,也不保留任何值。它用来定义代码中提及的操作。同时,创建了一个默认的图。因此,你不必创建图,除非需要创建图用于多种目的。
会话允许你执行图或者只执行部分图。它为执行分配资源(在一个或多个CPU或者GPU上)。它还保留了中间结果和变量值。
在TensorFlow中创建的变量的值,只在一个会话内是有效的。如果你尝试在之后的第二个会话里访问其值,TensorFlow就会报错,因为变量不是在那里初始化的。
想运行任何操作,需要给图创建一个会话。会话会分配内存在存储当前变量值。
下面是演示代码:
import tensorflow as tf
sess=tf.Session()
myGraph=tf.Graph()
with myGraph.as_default():
variable=tf.Variable(30,name="navin")
initialize=tf.global_variables_initializer()
with tf.Session(graph=myGraph)as sess:
sess.run(initialize)
print(sess.run(variable))
控制台就会输出30.
3.常量、占位符与变量
TensorFlow程序使用张量数据结构来表示所有的数据--在计算图中,只有张量在操作之间被传递。可以把TensorFlow张量想象成一个n维数组或者列表。张量具有静态类型、秩以及形状。在这里,图产生一个不变的结果。变量在整个图的执行过程维持其状态。
通常,在深度学习中你不可避免要处理很多图片,因此需要给每一章图片赋以像素值,然后对所有图片重复此操作。
为了训练模型,需要能够修改图以调节一些对象,比如权重值、偏置量。简单来说,变量让你能够给图添加可训练的参数。他们在创建时就带有类型属性和初始值。
让我们在TensorFlow中创建一个常量并输出它。
import tensorflow as tf
x = tf.constant(12,dtype='float32')
sess=tf.Session()
print(sess.run(x))
下面对每一行代码进行解释:
(1)导入TensorFlow模块并用tf来调用它。
(2)创建常量值(x)并制定其数值为12.
(3)创建会话来计算数值。
(4)只运行变量x并输出其当前值。
前两部属于构建阶段,后两部属于执行阶段。下面讨论TensorFlow的构建阶段和执行阶段。
可以把前面的代码用另一种方式重写如下:
import tensorflow as tf
x = tf.constant(12,dtype='float32')
with tf.Session() as sess:
print(sess.run(x))
现在可以探索如何创建变量并将其初始化。以下是实现代码:
import tensorflow as tf
x = tf.constant(12,dtype='float32')
y=tf.Variable(x+11)
model=tf.global_variables_initializer()
with tf.Session() as sess:
sess.run(model)
print(sess.run(y))
代码解释:
(1)导入TensorFlow模块并用tf来调用它
(2)创建名为x的常量并赋予初始值12
(3)创建变量y并用方程y=x+11来定义它。
(4) 使用tf.global_variables_initializer()初始化变量。
(5)创建一个会话来计算值。
(6)运行在第4部建立的模型。
(7)只运行变量y并输出其当前值。
4.占位符
占位符是一个可以在之后赋给它数据的变量。它是用来接收外部输入的。占位符可以是一维或者是多维,用来存储n维数组。
import tensorflow as tf
x = tf.placeholder("float",None)
y=x*10+500
# model=tf.global_variables_initializer()
with tf.Session() as sess:
placeX=sess.run(y,feed_dict={x:[0,5,15,25]})
print(placeX)
代码解释:
(1)1.导入TensorFlow模块并用tf来调用它。
(2)创建占位符x,指定为float类型。
(3)创建张量y,它是x乘以10并加500的操作。注意x的初始值并未给定。
(4)创建一个会话用于计算值
(5)在feed_dict中给定x的值以运行y。
(6)输出y的值。
在下面的例子中,创建一个2*4的矩阵(一个二维数组)用于存放一些数。然后使用和之前相同的操作来实现逐元素地乘以10并加1的操作。占位符的第一个维度是None,这意味着任何行数都可以。
也可以考虑一个二维数组而非一维数组。代码如下:
import tensorflow as tf
x = tf.placeholder("float",[None,4])
y=x*10+1
# model=tf.global_variables_initializer()
with tf.Session() as sess:
dataX=[[12,2,0,-2],
[14,4,1,0]]
placeX=sess.run(y,feed_dict={x:dataX})
print(placeX)
这是一个2*4的矩阵。因此,如果把None替换为2,也可以得到相同的输出。
但是如果创建一个形状为[3,4]的占位符(后面输入一个2*4的矩阵),就会报错。
当调用tf.constant的时候,常量会被初始化,而且其值将不会再变化。而变量在你调用tf.Variable的时候并不会被初始化。想在TensorFlow程序里面初始化所有的变量,必须显式地调用如下的特殊操作。
sess.run(tf.global_variables_initializer())
认识到init是TensorFlow自居的一个句柄很重要,它用来初始化所有的全局变量。在你调用sess.run之前,变量是没有被初始化的。