写给 python 程序员的 OpenG

2023-01-31 05:01:44 python 程序员写给

文章目录

1 预备知识

1.1 坐标系
1.2 投影
1.3 视景体
1.4 视口
1.5 视点
1.6 OpenGL 变换

2 安装 pyopengl
3 OpenGL 库及函数简介

3.1 OpenGL 核心库 GL
3.2 OpenGL 实用库 GLU
3.3 OpenGL 工具库 GLUT
3.4 windows 专用库 WGL

4 开始 OpenGL 的奇幻之旅

4.1 OpenGL 基本图形的绘制

4.1.1 设置颜色
4.1.2 设置顶点
4.1.3 绘制基本图形

4.2 第一个 OpenGL 程序
4.3 设置初始显示模式
4.4 初始化画布
4.5 清除屏幕及深度缓存
4.5 设置投影
4.6 设置视点
4.7 设置视口
4.8 设置模型视图
4.9 捕捉鼠标事件、键盘事件和窗口事件
4.10 综合应用
4.11 小结

5 加速渲染

5.1 创建顶点缓冲区对象（VBO）
5.2 分离顶点混合数组
5.3 使用顶点缓冲区对象（VBO）

6 致谢

OpenGL 是 Open Graphics Library 的简写，意为“开放式图形库”，是用于渲染 2D、3D 矢量图形的跨语言、跨平台的应用程序编程接口（api）。OpenGL 不是一个独立的平台，因此，它需要借助于一种编程语言才能被使用。C / c++ / python / java 都可以很好支持 OpengGL，我当然习惯性选择 Python 语言。

如果读者是 python 程序员，并且了解 numpy，接下来的阅读应该不会有任何障碍；否则，我建议先花半小时学习一下 python 语言。关于 numpy，可以参考我的另一篇博文《数学建模三剑客MSN》。事实上，我觉得 python 语言近乎于自然语言，只要读者是程序员，即便不熟悉 python，读起来也不会有多大问题。

另外，读者也不必担心数学问题。使用 OpenGL 不需要具备多么高深的数学水平，只要能辅导初中学生的数学作业，就足够用了。

1.1 坐标系

在 OpenGL 的世界里，有各式各样的坐标系。随着对 OpenGL 概念的理解，我们至少会接触到六种坐标系，而初始只需要了解其中的三个就足够用了（第一次阅读这段话的时候，只需要了解世界坐标系就可以了）。

世界坐标系（World Coordinates）

世界坐标系是右手坐标系，以屏幕中心为原点(0, 0, 0)，且是始终不变的。
视点坐标系（Eye or Camera Coordinates）

视点坐标是以视点为原点，以视线的方向为Z+轴正方向的坐标系。OpenGL 管道会将世界坐标先变换到视点坐标，然后进行裁剪，只有在视线范围（视景体）之内的场景才会进入下一阶段的计算。
屏幕坐标系（Window or Screen Coordinates）

OpenGL 的重要功能之一就是将三维的世界坐标经过变换、投影等计算，最终算出它在显示设备上对应的位置，这个位置就称为设备坐标。在屏幕、打印机等设备上的坐标是二维坐标。值得一提的是，OpenGL 可以只使用设备的一部分进行绘制，这个部分称为视区或视口（viewport）。投影得到的是视区内的坐标(投影坐标)，从投影坐标到设备坐标的计算过程就是设备变换了。

1.2 投影

三维场景中的物体最终都会显示在类似屏幕这样的二维观察平面上。将三维物体变为二维图形的变换成为投影变换。最常用的投影有两种：平行投影和透视投影。如下图所示，F 是投影面，p1p2 为三维空间中的一条直线，p’1 和 p’2 分别是 p1 和 p2 在 F 上的投影，虚线表示投影线，O 为投影中心。
在这里插入图片描述

平行投影
这里所说的平行投影，特指正交平行投影——投影线垂直于投影面。将一个三维点 (x,y,z) 正交平行投影到 xoy 平面上，则投影点坐标为 (x,y,0)。由于平行投影丢弃了深度信息，所以无法产生真实感，但可以保持物体之间相对大小关系不变。
透视投影
透视投影将投影面置于观察点和投影对象之间，距离观察者越远的物体，投影尺寸越小，投影效果具有真实感，常用于游戏和仿真领域。

1.3 视景体

无论是平行投影还是透视投影，投影成像都是在投影面上——我们可以把投影面理解成显示屏幕。世界坐标系描述的三维空间是无限的，投影平面是无限的，但（我们能够看到的）屏幕面积总是有限的，因此在投影变换时，通常只处理能够显示在屏幕上的那一部分三维空间。从无限三维空间中裁切出来的可以显示在屏幕上的部分三维空间，我们称之为视景体。视景体有六个面，分别是左右上下和前后面。

对于平行投影而言，视景体是一个矩形平行六面体；对于透视投影来说，视景体是一个棱台。理解这一点并不难：因为越远处的物体在投影窗口的透视投影越小，也就意味着填满投影窗口需要更大的体量，视景体自然就变成了棱台。
在这里插入图片描述

1.4 视口

对于平行投影而言，视口就是由视景体的左右上下四个面围成的矩形，对于透视投影来说，视口就是视景体的前截面在投影窗口上的透视投影。

视口是 OpenGL 中比较重要的概念，现阶段可以简单理解成屏幕（或其他输出设备）。事实上，视口和屏幕是相关但又不相同的，屏幕有固定的宽高比，而视口大小可以由用户自行定义。通常，为了适应不同宽高比的屏幕，在设置视口时，会根据屏幕宽高比调整视景体（增加宽度或高度）。

1.5 视点

现实生活中，人们看到的三维空间物体的样子取决于观察者站在什么角度去看。这里面包含着三个概念：

观察者的位置：眼睛在哪儿？
观察者的姿势：站立还是倒立？左侧卧还是右侧卧？
观察对象：眼睛盯着哪里？

对应在 OpenGL 中，也有同样的概念，即视点的位置、瞄准方向的参考点，以及（向上的）方向。

1.6 OpenGL 变换

下图是三维图形的显示流程。世界坐标系中的三维物体经过视点变换和一系列几何变换（平移、旋转、缩放）之后，坐标系变换为视点坐标系；经过投影和裁剪之后，坐标系变换为归一化设备坐标系；最后经过视口变换显示在屏幕上，相应地，坐标系变成了窗口坐标系。
在这里插入图片描述

视点变换：相当于设置视点的位置和方向
模型变换：包括平移、旋转、缩放等三种类型
裁剪变换：根据视景体定义的六个面（和附加裁剪面）对三维空间裁剪
视口变换：将视景体内投影的物体显示在二维的视口平面上

如果想当然地使用 pip 如下所示安装，可能会有一些麻烦。

pip install pyopengl

当我这样安装之后，运行 OpenGL 代码，得到了这样的错误信息：

NullFunctionError: Attempt to call an undefined function glutInit, check for bool(glutInit) before calling

原来，pip 默认安装的是32位版本的pyopengl，而我的操作系统是64位的。建议点击这里下载适合自己的版本，直接安装.whl文件。我是这样安装的：

pip install PyOpenGL-3.1.3b2-cp37-cp37m-win_amd64.whl

我第一次接触 OpenGL 的 GL / GLU / GLUT 的时候，一下就被这些长得像孪生兄弟的库名字给整懵圈了，要不是内心强大，也许就跟 OpenGL 说再见了。时间久了才发现，OpenGL 的库及函数命名规则非常合理，便于查找、记忆。

OpenGL函数的命名格式如下：

<库前缀><根命令><可选的参数个数><可选的参数类型>

常见的库前缀有 gl、glu、glut、aux、wgl、glx、agl 等。库前缀表示该函数属于 OpenGL 哪一个开发库。从函数名后面中还可以看出需要多少个参数以及参数的类型。I 代表 int 型，f 代表 float 型，d 代表 double 型，u 代表无符号整型。例如 glColor3f() 表示了该函数属于gl库，参数是三个浮点数。

OpenGL 函数库相关的 API 有核心库(gl)、实用库(glu)、实用工具库(glut)、辅助库(aux)、窗口库(glx、agl、wgl)和扩展函数库等。gl是核心，glu是对gl的部分封装。glut是为跨平台的OpenGL程序的工具包，比aux功能强大。glx、agl、wgl 是针对不同窗口系统的函数。扩展函数库是硬件厂商为实现硬件更新利用OpenGL的扩展机制开发的函数。本文仅对常用的四个库做简单介绍。

3.1 OpenGL 核心库 GL

核心库包含有115个函数，函数名的前缀为gl。这部分函数用于常规的、核心的图形处理。此函数由gl.dll来负责解释执行。由于许多函数可以接收不同数以下几类。据类型的参数，因此派生出来的函数原形多达300多个。核心库中的函数主要可以分为以下几类函数：

绘制基本几何图元的函数：
glBegain()、glEnd()、glNORMal*()、glVertex*()
矩阵操作、几何变换和投影变换的函数：
如矩阵入栈函数glPushMatrix()，矩阵出栈函数glPopMatrix()，装载矩阵函数glLoadMatrix()，矩阵相乘函数glMultMatrix()，当前矩阵函数glMatrixMode()和矩阵标准化函数glLoadIdentity()，几何变换函数glTranslate*()、glRotate*()和glScale*()，投影变换函数glOrtho()、glFrustum()和视口变换函数glViewport()
颜色、光照和材质的函数：
如设置颜色模式函数glColor*()、glIndex*()，设置光照效果的函数glLight*() 、glLightModel*()和设置材质效果函数glMaterial()
显示列表函数：
主要有创建、结束、生成、删除和调用显示列表的函数glNewList()、glEndList()、glGenLists()、glCallList()和glDeleteLists()
纹理映射函数：
主要有一维纹理函数glTexImage1D()、二维纹理函数glTexImage2D()、设置纹理参数、纹理环境和纹理坐标的函数glTexParameter*()、glTexEnv*()和glTetCoord*()
特殊效果函数：
融合函数glBlendFunc()、反走样函数glHint()和雾化效果glFog*()
光栅化、象素操作函数：
如象素位置glRasterPos*()、线型宽度glLineWidth()、多边形绘制模式glPolyGonMode()，读取象素glReadPixel()、复制象素glCopyPixel()
选择与反馈函数：
主要有渲染模式glRenderMode()、选择缓冲区glSelectBuffer()和反馈缓冲区glFeedbackBuffer()
曲线与曲面的绘制函数：
生成曲线或曲面的函数glMap*()、glMapGrid*()，求值器的函数glEvalCoord*() glEvalMesh*()
状态设置与查询函数：
glGet*()、glEnable()、glGetError()

3.2 OpenGL 实用库 GLU

包含有43个函数，函数名的前缀为glu。OpenGL提供了强大的但是为数不多的绘图命令，所有较复杂的绘图都必须从点、线、面开始。Glu 为了减轻繁重的编程工作，封装了OpenGL函数，Glu函数通过调用核心库的函数，为开发者提供相对简单的用法，实现一些较为复杂的操作。此函数由glu.dll来负责解释执行。OpenGL中的核心库和实用库可以在所有的OpenGL平台上运行。主要包括了以下几种：

辅助纹理贴图函数：
gluScaleImage() 、gluBuild1Dmipmaps()、gluBuild2Dmipmaps()
坐标转换和投影变换函数：
定义投影方式函数gluPerspective()、gluOrtho2D() 、gluLookAt()，拾取投影视景体函数gluPickMatrix()，投影矩阵计算gluProject()和gluUnProject()
多边形镶嵌工具：
gluNewTess()、gluDeleteTess()、gluTessCallback()、gluBeginPolygon()、gluTessVertex()、gluNextContour()、gluEndPolygon()
二次曲面绘制工具：
主要有绘制球面、锥面、柱面、圆环面gluNewQuadric()、gluSphere()、gluCylinder()、gluDisk()、gluPartialDisk()、gluDeleteQuadric()
非均匀有理B样条绘制工具：
主要用来定义和绘制Nurbs曲线和曲面，包括gluNewNurbsRenderer()、gluNurbsCurve()、gluBeginSurface()、gluEndSurface()、gluBeginCurve()、gluNurbsProperty()
错误反馈工具：
获取出错信息的字符串gluErrorString()

3.3 OpenGL 工具库 GLUT

包含大约30多个函数，函数名前缀为glut。glut是不依赖于窗口平台的OpenGL工具包，由Mark KLilgrad在SGI编写（现在在Nvidia），目的是隐藏不同窗口平台API的复杂度。函数以glut开头，它们作为aux库功能更强的替代品，提供更为复杂的绘制功能，此函数由glut.dll来负责解释执行。由于glut中的窗口管理函数是不依赖于运行环境的，因此OpenGL中的工具库可以在X-Window, Windows NT, OS/2等系统下运行，特别适合于开发不需要复杂界面的OpenGL示例程序。对于有经验的程序员来说，一般先用glut理顺3D图形代码，然后再集成为完整的应用程序。这部分函数主要包括：

窗口操作函数：
窗口初始化、窗口大小、窗口位置函数等 glutInit()、glutInitDisplayMode()、glutInitWindowSize()、glutInitWindowPosition()
回调函数：
响应刷新消息、键盘消息、鼠标消息、定时器函数 GlutDisplayFunc()、glutPostRedisplay()、glutReshapeFunc()、glutTimerFunc()、gluTKEyboardFunc()、glutMouseFunc()
创建复杂的三维物体：
这些和aux库的函数功能相同
菜单函数：
创建添加菜单的函数 GlutCreateMenu()、glutSetMenu()、glutAddMenuEntry()、glutAddSubMenu() 和 glutAttachMenu()
程序运行函数：
glutMainLoop()

3.4 Windows 专用库 WGL

针对windows平台的扩展，包含有16个函数，函数名前缀为wgl。这部分函数主要用于连接OpenGL和Windows ，以弥补OpenGL在文本方面的不足。 Windows专用库只能用于Windows环境中。这类函数主要包括以下几类：

绘图上下文相关函数：
wglCreateContext()、wglDeleteContext()、wglGetCurrentContent()、wglGetCurrentDC()、wglDeleteContent()
文字和文本处理函数：
wglUseFontBitmaps()、wglUseFontOutlines()
覆盖层、地层和主平面层处理函数：
wglCopyContext()、wglCreateLayerPlane()、wglDescribeLayerPlane()、wglReakizeLayerPlatte()
其他函数：
wglShareLists()、wglGetProcAddress()

4.1 OpenGL 基本图形的绘制

4.1.1 设置颜色

设置颜色的函数有几十个，都是以 glColor 开头，后面跟着参数个数和参数类型。参数可以是 0 到 255 之间的无符号整数，也可以是 0 到 1 之间的浮点数。三个参数分别表示 RGB 分量，第四个参数表示透明度（其实叫不透明度更恰当）。以下最常用的两个设置颜色的方法：

glColor3f(1.0，0.0，0.0)  # 设置当前颜色为红色
glColor4f(0.0，1.0，1.0，1.0)  # 设置当前颜色为青色，不透明度
glColor3ub(0, 0, 255)  # 设置当前颜色为蓝色

glColor 也支持将三个或四个参数以向量方式传递，例如：

glColor3fv([0.0，1.0，0.0])  # 设置当前颜色为绿色

特别提示：OpenGL 是使用状态机模式，颜色是一个状态变量，设置颜色就是改变这个状态变量并一直生效，直到再次调用设置颜色的函数。除了颜色，OpenGL 还有很多的状态变量或模式。在任何时间，都可以查询每个状态变量的当前值，还可以用 glPushAttrib() 或 glPushClientAttrib() 把状态变量的集合保存起来，必要的时候，再用 glPopAttrib() 或 glPopClientAttrib() 恢复状态变量。

4.1.2 设置顶点

顶点（vertex）是 OpengGL 中非常重要的概念，描述线段、多边形都离不开顶点。和设置颜色类似，设置顶点的函数也有几十个，都是以 glVertex 开头，后面跟着参数个数和参数类型，同样也支持将多个以向量方式传递。两个参数的话，分别表示 xy 坐标，三个参数则分别表示 xyz 坐标。如有第四个参数，则表示该点的齐次坐标 w；否则，默认 w=1。至于什么是齐次坐标，显然超出了初中数学的范畴，在此不做探讨。

glVertex2f(1.0，0.5) # xoy平面上的点，z=0
glVertex3f(0.5，1.0，0.0) # 三维空间中的点

4.1.3 绘制基本图形

仅仅设置颜色和顶点，并不能画出来什么。我们可以在任何时候改变颜色，但所有的顶点设置，都必须包含在 glBegin() 和 glEnd() 之间，而 glBegin() 的参数则指定了将这些顶点画成什么。以下是 glBegin() 可能的参数选项：

参数	说明
GL_POINTS	绘制一个或多个顶点
GL_LINES	绘制线段
GL_LINE_STRIP	绘制连续线段
GL_LINE_LOOP	绘制闭合的线段
GL_POLYGON	绘制多边形
GL_TRIANGLES	绘制一个或多个三角形
GL_TRIANGLE_STRIP	绘制连续三角形
GL_TRIANGLE_FAN	绘制多个三角形组成的扇形
GL_QUADS	绘制一个或多个四边形
GL_QUAD_STRIP	绘制连续四边形

4.2 第一个 OpenGL 程序

通常，我们使用工具库（GLUT）创建 OpenGL 应用程序。为啥不用 GL 或者 GLU 库呢？画画之前总得先有一块画布吧，不能直接拿起画笔就开画。前文说过，工具库主要提供窗口相关的函数，有了窗口，就相当于有了画布，而核心库和实用库，就好比各式各样的画笔、颜料。使用工具库（GLUT）创建 OpenGL 应用程序只需要四步（当然，前提是你需要先准备好绘图函数，并给它取一个合适的名字）：

初始化glut库
创建glut窗口
注册绘图的回调函数
进入glut主循环

OK，铺垫了这么多之后，我们终于开始第一个 OpenGL 应用程序了：绘制三维空间的世界坐标系，在坐标原点的后方（z轴的负半区）画一个三角形。代码如下：

# -*- coding: utf-8 -*-

# -------------------------------------------
# quidam_01.py 三维空间的世界坐标系和三角形
# -------------------------------------------

from OpenGL.GL import *
from OpenGL.GLUT import *

def draw():
    # ---------------------------------------------------------------
    glBegin(GL_LINES)                    # 开始绘制线段（世界坐标系）
    
    # 以红色绘制x轴
    glColor4f(1.0, 0.0, 0.0, 1.0)        # 设置当前颜色为红色不透明
    glVertex3f(-0.8, 0.0, 0.0)           # 设置x轴顶点（x轴负方向）
    glVertex3f(0.8, 0.0, 0.0)            # 设置x轴顶点（x轴正方向）
    
    # 以绿色绘制y轴
    glColor4f(0.0, 1.0, 0.0, 1.0)        # 设置当前颜色为绿色不透明
    glVertex3f(0.0, -0.8, 0.0)           # 设置y轴顶点（y轴负方向）
    glVertex3f(0.0, 0.8, 0.0)            # 设置y轴顶点（y轴正方向）
    
    # 以蓝色绘制z轴
    glColor4f(0.0, 0.0, 1.0, 1.0)        # 设置当前颜色为蓝色不透明
    glVertex3f(0.0, 0.0, -0.8)           # 设置z轴顶点（z轴负方向）
    glVertex3f(0.0, 0.0, 0.8)            # 设置z轴顶点（z轴正方向）
    
    glEnd()                              # 结束绘制线段
    
    # ---------------------------------------------------------------
    glBegin(GL_TRIANGLES)                # 开始绘制三角形（z轴负半区）
    
    glColor4f(1.0, 0.0, 0.0, 1.0)        # 设置当前颜色为红色不透明
    glVertex3f(-0.5, -0.366, -0.5)       # 设置三角形顶点
    glColor4f(0.0, 1.0, 0.0, 1.0)        # 设置当前颜色为绿色不透明
    glVertex3f(0.5, -0.366, -0.5)        # 设置三角形顶点
    glColor4f(0.0, 0.0, 1.0, 1.0)        # 设置当前颜色为蓝色不透明
    glVertex3f(0.0, 0.5, -0.5)           # 设置三角形顶点
    
    glEnd()                              # 结束绘制三角形
    
    # ---------------------------------------------------------------
    glFlush()                            # 清空缓冲区，将指令送往硬件立即执行

if __name__ == "__main__":
    glutInit()                           # 1. 初始化glut库
    glutCreateWindow('Quidam Of OpenGL') # 2. 创建glut窗口
    glutDisplayFunc(draw)                # 3. 注册回调函数draw()
    glutMainLoop()                       # 4. 进入glut主循环

运行代码，我这里显示结果如下面左图所示。如果尝试运行这段代码出错的话，我猜应该是 pyopengl 安装出现了问题，建议返回到前面重读 pyopengl 的安装。
在这里插入图片描述
短暂的激动之后，你可能会尝试画一些其他的线段，变换颜色或者透明度，甚至绘制多边形。很快你会发现，我们的第一个程序有很多问题，比如：

窗口的标题不能使用中文，否则会显示乱码
窗口的初始大小和位置无法改变
改变窗口的宽高比，三角形宽高比也会改变（如上面右图所示）
三角形不应该遮挡坐标轴
改变颜色的透明度无效
不能缩放旋转

没关系，除了第1个问题我不知道怎么解决（貌似无解），其他问题都不是事儿。和我们的代码相比，一个真正实用的 OpenGL 程序，还有许多工作要做：

设置初始显示模式
初始化画布
绘图函数里面需要增加：
1. 清除屏幕及深度缓存
2. 投影设置
3. 模型试图设置
绑定鼠标键盘的事件函数

4.3 设置初始显示模式

初始化 glut 库的时候，我们一般都要用 glutInitDisplayMode() 来设置初始的显示模式，它的参数可以是下表中参数的组合。

参数	说明
GLUT_RGB	指定RGB颜色模式的窗口
GLUT_RGBA	指定RGBA 颜色模式的窗口
GLUT_INDEX	指定颜色索引模式的窗口
GLUT_SINGLE	指定单缓存窗口
GLUT_DOUBLE	指定双缓存窗口
GLUT_ACCUM	窗口使用累加缓存
GLUT_ALPHA	窗口的颜色分量包含 alpha 值
GLUT_DEPTH	窗口使用深度缓存
GLUT_STENCIL	窗口使用模板缓存
GLUT_MULTISAMPLE	指定支持多样本功能的窗口
GLUT_STEREO	指定立体窗口
GLUT_LUMINANCE	窗口使用亮度颜色模型

使用双缓存窗口，可以避免重绘时产生抖动的感觉。我一般选择 GLUT_DOUBLE | GLUT_ALPHA | GLUT_DEPTH 作为参数来设置初始的显示模式。

4.4 初始化画布

开始绘图之前，需要对画布做一些初始化工作，这些工作只需要做一次。比如：

glClearColor(0.0, 0.0, 0.0, 1.0) # 设置画布背景色。注意：这里必须是4个参数
glEnable(GL_DEPTH_TEST)          # 开启深度测试，实现遮挡关系
glDepthFunc(GL_LEQUAL)           # 设置深度测试函数（GL_LEQUAL只是选项之一）

如有必要，还可以开启失真校正（反走样）、开启表面剔除等。

4.5 清除屏幕及深度缓存

每次重绘之前，需要先清除屏幕及深度缓存。这项操作一般放在绘图函数的开头。

glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT)

4.5 设置投影

投影设置也是每次重绘都需要的步骤之一。glOrtho() 用来设置平行投影，glFrustum() 用来设置透视投影。这两个函数的参数相同，都是视景体的 left / right / bottom / top / near / far 六个面。

视景体的 left / right / bottom / top 四个面围成的矩形，就是视口。near 就是投影面，其值是投影面距离视点的距离，far 是视景体的后截面，其值是后截面距离视点的距离。far 和 near 的差值，就是视景体的深度。视点和视景体的相对位置关系是固定的，视点移动时，视景体也随之移动。

我个人认为，视景体是 OpengGL 最重要、最核心的概念，它和视口、视点、投影面、缩放、漫游等概念密切关联。只有正确理解了视景体，才能正确设置它的六个参数，才能呈现出我们期望的效果。

为了在窗口宽高比改变时，绘制的对象仍然保持固定的宽高比，一般在做投影变换时，需要根据窗口的宽高比适当调整视景体的 left / right 或者 bottom / top 参数。

假设 view 是视景体，width 和 height 是窗口的宽度和高度，在投影变换之前，需要先声明是对投影矩阵的操作，并将投影矩阵单位化：

glMatrixMode(GL_PROJECTION)
glLoadIdentity()
if width > height:
	k = width / height
	glFrustum(view [0]*k, view [1]*k, view [2], view [3], view [4], view [5])
else:
	k = height / width
	glFrustum(view [0], view [1], view [2]*k, view [3]*k, view [4], view [5])

4.6 设置视点

视点是和视景体关联的概念。设置视点需要考虑眼睛在哪儿、看哪儿、头顶朝哪儿，分别对应着eye, lookat 和 eye_up 三个向量。

gluLookAt(
       eye[0], eye[1], eye[2], 
       look_at[0], look_at[1], look_at[2],
       eye_up[0], eye_up[1], eye_up[2]
   )

4.7 设置视口

视口也是和视景体关联的概念，相对简单一点。

glViewport(0, 0, width, height)

4.8 设置模型视图

模型平移、旋转、缩放等几何变换，需要切换到模型矩阵：

glMatrixMode(GL_MODELVIEW)
glLoadIdentity()
glScale(1.0, 1.0, 1.0)

4.9 捕捉鼠标事件、键盘事件和窗口事件

GLUT 库提供了几个函数帮我们捕捉鼠标事件、键盘事件和窗口事件：

glutMouseFunc()
该函数捕捉鼠标点击和滚轮操作，返回4个参数给被绑定的事件函数：键（左键/右键/中键/滚轮上/滚轮下）、状态（1/0）、x坐标、y坐标
glutMotionFunc()
该函数捕捉有一个鼠标键被按下时的鼠标移动给被绑定的事件函数，返回2个参数：x坐标、y坐标
glutPassiveMotionFunc()
该函数捕捉鼠标移动，返回2个参数给被绑定的事件函数：x坐标、y坐标
glutEntryFunc()
该函数捕捉鼠标离开或进入窗口区域，返回1个参数给被绑定的事件函数：GLUT_LEFT 或者 GLUT_ENTERED
glutKeyboardFunc(keydown)
该函数捕捉键盘按键被按下，返回3个参数给被绑定的事件函数：被按下的键，x坐标、y坐标
glutReshapeFunc()
该函数捕捉窗口被改变大小，返回2个参数给被绑定的事件函数：窗口宽度、窗口高度

如果我们需要捕捉这些事件，只需要定义事件函数，注册相应的函数就行：

def reshape(width, height):
	pass

def mouseclick(button, state, x, y):
	pass

def mousemotion(x, y):
	pass

def keydown(key, x, y):
	pass

glutReshapeFunc(reshape)            # 注册响应窗口改变的函数reshape()
glutMouseFunc(mouseclick)           # 注册响应鼠标点击的函数mouseclick()
glutMotionFunc(mousemotion)         # 注册响应鼠标拖拽的函数mousemotion()
glutKeyboardFunc(keydown)           # 注册键盘输入的函数keydown()

4.10 综合应用

是时候把我们上面讲的这些东西完整的演示一下了。下面的代码还是画了世界坐标系，并在原点前后各画了一个三角形。鼠标可以拖拽视点绕参考点旋转（二者距离保持不变），滚轮可以缩放模型。敲击退格键或回车键可以让视点远离或接近参考点。敲击 x/y/z 可以减小参考点对应的坐标值，敲击 X/Y/Z 可以增大参考点对应的坐标值。敲击空格键可以切换投影模式。
在这里插入图片描述
上图左是平行投影模式的显示效果，上图右是透视投影模式的显示效果。代码如下：

# -*- coding: utf-8 -*-

# -------------------------------------------
# quidam_02.py 旋转、缩放、改变视点和参考点
# -------------------------------------------

from OpenGL.GL import *
from OpenGL.GLU import *
from OpenGL.GLUT import *
import numpy as np

IS_PERSPECTIVE = True                               # 透视投影
VIEW = np.array([-0.8, 0.8, -0.8, 0.8, 1.0, 20.0])  # 视景体的left/right/bottom/top/near/far六个面
SCALE_K = np.array([1.0, 1.0, 1.0])                 # 模型缩放比例
EYE = np.array([0.0, 0.0, 2.0])                     # 眼睛的位置（默认z轴的正方向）
LOOK_AT = np.array([0.0, 0.0, 0.0])                 # 瞄准方向的参考点（默认在坐标原点）
EYE_UP = np.array([0.0, 1.0, 0.0])                  # 定义对观察者而言的上方（默认y轴的正方向）
WIN_W, WIN_H = 640, 480                             # 保存窗口宽度和高度的变量
LEFT_IS_DOWNED = False                              # 鼠标左键被按下
MOUSE_X, MOUSE_Y = 0, 0                             # 考察鼠标位移量时保存的起始位置

def getposture():
    global EYE, LOOK_AT
    
    dist = np.sqrt(np.power((EYE-LOOK_AT), 2).sum())
    if dist > 0:
        phi = np.arcsin((EYE[1]-LOOK_AT[1])/dist)
        theta = np.arcsin((EYE[0]-LOOK_AT[0])/(dist*np.cos(phi)))
    else:
        phi = 0.0
        theta = 0.0
        
    return dist, phi, theta
    
DIST, PHI, THETA = getposture()                     # 眼睛与观察目标之间的距离、仰角、方位角

def init():
    glClearColor(0.0, 0.0, 0.0, 1.0) # 设置画布背景色。注意：这里必须是4个参数
    glEnable(GL_DEPTH_TEST)          # 开启深度测试，实现遮挡关系
    glDepthFunc(GL_LEQUAL)           # 设置深度测试函数（GL_LEQUAL只是选项之一）

def draw():
    global IS_PERSPECTIVE, VIEW
    global EYE, LOOK_AT, EYE_UP
    global SCALE_K
    global WIN_W, WIN_H
        
    # 清除屏幕及深度缓存
    glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT)
    
    # 设置投影（透视投影）
    glMatrixMode(GL_PROJECTION)
    glLoadIdentity()
    
    if WIN_W > WIN_H:
        if IS_PERSPECTIVE:
            glFrustum(VIEW[0]*WIN_W/WIN_H, VIEW[1]*WIN_W/WIN_H, VIEW[2], VIEW[3], VIEW[4], VIEW[5])
        else:
            glOrtho(VIEW[0]*WIN_W/WIN_H, VIEW[1]*WIN_W/WIN_H, VIEW[2], VIEW[3], VIEW[4], VIEW[5])
    else:
        if IS_PERSPECTIVE:
            glFrustum(VIEW[0], VIEW[1], VIEW[2]*WIN_H/WIN_W, VIEW[3]*WIN_H/WIN_W, VIEW[4], VIEW[5])
        else:
            glOrtho(VIEW[0], VIEW[1], VIEW[2]*WIN_H/WIN_W, VIEW[3]*WIN_H/WIN_W, VIEW[4], VIEW[5])
        
    # 设置模型视图
    glMatrixMode(GL_MODELVIEW)
    glLoadIdentity()
        
    # 几何变换
    glScale(SCALE_K[0], SCALE_K[1], SCALE_K[2])
        
    # 设置视点
    gluLookAt(
        EYE[0], EYE[1], EYE[2], 
        LOOK_AT[0], LOOK_AT[1], LOOK_AT[2],
        EYE_UP[0], EYE_UP[1], EYE_UP[2]
    )
    
    # 设置视口
    glViewport(0, 0, WIN_W, WIN_H)
    
    # ---------------------------------------------------------------
    glBegin(GL_LINES)                    # 开始绘制线段（世界坐标系）
    
    # 以红色绘制x轴
    glColor4f(1.0, 0.0, 0.0, 1.0)        # 设置当前颜色为红色不透明
    glVertex3f(-0.8, 0.0, 0.0)           # 设置x轴顶点（x轴负方向）
    glVertex3f(0.8, 0.0, 0.0)            # 设置x轴顶点（x轴正方向）
    
    # 以绿色绘制y轴
    glColor4f(0.0, 1.0, 0.0, 1.0)        # 设置当前颜色为绿色不透明
    glVertex3f(0.0, -0.8, 0.0)           # 设置y轴顶点（y轴负方向）
    glVertex3f(0.0, 0.8, 0.0)            # 设置y轴顶点（y轴正方向）
    
    # 以蓝色绘制z轴
    glColor4f(0.0, 0.0, 1.0, 1.0)        # 设置当前颜色为蓝色不透明
    glVertex3f(0.0, 0.0, -0.8)           # 设置z轴顶点（z轴负方向）
    glVertex3f(0.0, 0.0, 0.8)            # 设置z轴顶点（z轴正方向）
    
    glEnd()                              # 结束绘制线段
    
    # ---------------------------------------------------------------
    glBegin(GL_TRIANGLES)                # 开始绘制三角形（z轴负半区）
    
    glColor4f(1.0, 0.0, 0.0, 1.0)        # 设置当前颜色为红色不透明
    glVertex3f(-0.5, -0.366, -0.5)       # 设置三角形顶点
    glColor4f(0.0, 1.0, 0.0, 1.0)        # 设置当前颜色为绿色不透明
    glVertex3f(0.5, -0.366, -0.5)        # 设置三角形顶点
    glColor4f(0.0, 0.0, 1.0, 1.0)        # 设置当前颜色为蓝色不透明
    glVertex3f(0.0, 0.5, -0.5)           # 设置三角形顶点
    
    glEnd()                              # 结束绘制三角形
    
    # ---------------------------------------------------------------
    glBegin(GL_TRIANGLES)                # 开始绘制三角形（z轴正半区）
    
    glColor4f(1.0, 0.0, 0.0, 1.0)        # 设置当前颜色为红色不透明
    glVertex3f(-0.5, 0.5, 0.5)           # 设置三角形顶点
    glColor4f(0.0, 1.0, 0.0, 1.0)        # 设置当前颜色为绿色不透明
    glVertex3f(0.5, 0.5, 0.5)            # 设置三角形顶点
    glColor4f(0.0, 0.0, 1.0, 1.0)        # 设置当前颜色为蓝色不透明
    glVertex3f(0.0, -0.366, 0.5)         # 设置三角形顶点
    
    glEnd()                              # 结束绘制三角形
    
    # ---------------------------------------------------------------
    glutSwapBuffers()                    # 切换缓冲区，以显示绘制内容
    
def reshape(width, height):
    global WIN_W, WIN_H
    
    WIN_W, WIN_H = width, height
    glutPostRedisplay()
    
def mouseclick(button, state, x, y):
    global SCALE_K
    global LEFT_IS_DOWNED
    global MOUSE_X, MOUSE_Y
    
    MOUSE_X, MOUSE_Y = x, y
    if button == GLUT_LEFT_BUTTON:
        LEFT_IS_DOWNED = state==GLUT_DOWN
    elif button == 3:
        SCALE_K *= 1.05
        glutPostRedisplay()
    elif button == 4:
        SCALE_K *= 0.95
        glutPostRedisplay()
    
def mousemotion(x, y):
    global LEFT_IS_DOWNED
    global EYE, EYE_UP
    global MOUSE_X, MOUSE_Y
    global DIST, PHI, THETA
    global WIN_W, WIN_H
    
    if LEFT_IS_DOWNED:
        dx = MOUSE_X - x
        dy = y - MOUSE_Y
        MOUSE_X, MOUSE_Y = x, y
        
        PHI += 2*np.pi*dy/WIN_H
        PHI %= 2*np.pi
        THETA += 2*np.pi*dx/WIN_W
        THETA %= 2*np.pi
        r = DIST*np.cos(PHI)
        
        EYE[1] = DIST*np.sin(PHI)
        EYE[0] = r*np.sin(THETA)
        EYE[2] = r*np.cos(THETA)
            
        if 0.5*np.pi < PHI < 1.5*np.pi:
            EYE_UP[1] = -1.0
        else:
            EYE_UP[1] = 1.0
        
        glutPostRedisplay()
    
def keydown(key, x, y):
    global DIST, PHI, THETA
    global EYE, LOOK_AT, EYE_UP
    global IS_PERSPECTIVE, VIEW
    
    if key in [b'x', b'X', b'y', b'Y', b'z', b'Z']:
        if key == b'x': # 瞄准参考点 x 减小
            LOOK_AT[0] -= 0.01
        elif key == b'X': # 瞄准参考 x 增大
            LOOK_AT[0] += 0.01
        elif key == b'y': # 瞄准参考点 y 减小
            LOOK_AT[1] -= 0.01
        elif key == b'Y': # 瞄准参考点 y 增大
            LOOK_AT[1] += 0.01
        elif key == b'z': # 瞄准参考点 z 减小
            LOOK_AT[2] -= 0.01
        elif key == b'Z': # 瞄准参考点 z 增大
            LOOK_AT[2] += 0.01
        
        DIST, PHI, THETA = getposture()
        glutPostRedisplay()
    elif key == b'\r': # 回车键，视点前进
        EYE = LOOK_AT + (EYE - LOOK_AT) * 0.9
        DIST, PHI, THETA = getposture()
        glutPostRedisplay()
    elif key == b'\x08': # 退格键，视点后退
        EYE = LOOK_AT + (EYE - LOOK_AT) * 1.1
        DIST, PHI, THETA = getposture()
        glutPostRedisplay()
    elif key == b' ': # 空格键，切换投影模式
        IS_PERSPECTIVE = not IS_PERSPECTIVE 
        glutPostRedisplay()

if __name__ == "__main__":
    glutInit()
    displayMode = GLUT_DOUBLE | GLUT_ALPHA | GLUT_DEPTH
    glutInitDisplayMode(displayMode)

    glutInitWindowSize(WIN_W, WIN_H)
    glutInitWindowPosition(300, 200)
    glutCreateWindow('Quidam Of OpenGL')
    
    init()                              # 初始化画布
    glutDisplayFunc(draw)               # 注册回调函数draw()
    glutReshapeFunc(reshape)            # 注册响应窗口改变的函数reshape()
    glutMouseFunc(mouseclick)           # 注册响应鼠标点击的函数mouseclick()
    glutMotionFunc(mousemotion)         # 注册响应鼠标拖拽的函数mousemotion()
    glutKeyboardFunc(keydown)           # 注册键盘输入的函数keydown()
    
    glutMainLoop()                      # 进入glut主循环

4.11 小结

虽然还有很多领域需要我们继续探索，比如灯光、材质、雾化、拾取等，但那不是奇幻之旅的目标。奇幻之旅仅仅是帮助读者建立 OpenGL 的基本概念。至此，我们基本完成了任务。

实际应用 OpenGL 绘制三维图像时，往往需要处理数以万计的顶点，有时甚至是百万级、千万级。我们通常不会在绘制函数里面传送这些数据，而是在绘制之前，将这些数据提前传送到GPU。绘制函数每次绘制时，只需要从GPU的缓存中取出数据即可，极大地提高了效率。这个机制地实现，依赖于顶点缓冲区对象（Vertex Buffer Object），简称VBO。

尽管 VBO 是显卡的扩展，其实没有用到GPU运算，也就是说 VBO 不用写着色语言，直接用opengl函数就可以调用，主要目的是用于加快渲染的速。

VBO 将顶点信息放到 GPU 中，GPU 在渲染时去缓存中取数据，二者中间的桥梁是 GL-Context。GL-Context 整个程序一般只有一个，所以如果一个渲染流程里有两份不同的绘制代码，GL-context 就负责在他们之间进行切换。这也是为什么要在渲染过程中，在每份绘制代码之中会有 glBindbuffer、glEnableVertexAttribArray、glVertexAttribPointer。如果把这些都放到初始化时候完成，使用一种结构记录该次绘制所需要的所有 VBO 所需信息，把它保存到 VBO特定位置，绘制的时候直接在这个位置取信息绘制，会简化渲染流程、提升渲染速度。这就是 VAO 概念产生的初衷。

VAO 的全名是 Vertex Array Object，首先，它不是 Buffer-Object，所以不用作存储数据；其次，它针对“顶点”而言，也就是说它跟“顶点的绘制”息息相关。VAO 记录的是一次绘制中所需要的信息，这包括“数据在哪里 glBindBuffer”、“数据的格式是怎么样的 glVertexAttribPointer”、shader-attribute 的 location 的启用 glEnableVertexAttribArray。

根据我查到的资料，几乎所有的显卡都支持 VBO，但不是所有的显卡都支持 VAO，而 VAO 仅仅是优化了 VBO 的使用方法，对于加速并没有实质性的影响，因此本文只讨论 VBO 技术。

5.1 创建顶点缓冲区对象（VBO）

假定画一个六面体，顶点是这样的：

# 六面体数据
# ------------------------------------------------------
#    v4----- v5
#   /|      /|
#  v0------v1|
#  | |     | |
#  | v7----|-v6
#  |/      |/
#  v3------v2

# 顶点集
vertices = np.array([
    -0.5, 0.5, 0.5,   0.5, 0.5, 0.5,   0.5, -0.5, 0.5,   -0.5, -0.5, 0.5, # v0-v1-v2-v3
    -0.5, 0.5, -0.5,  0.5, 0.5, -0.5,  0.5, -0.5, -0.5,  -0.5, -0.5, -0.5 # v4-v5-v6-v7
], dtype=np.float32)

# 索引集
indices = np.array([
    0, 1, 2, 3, # v0-v1-v2-v3 (front)
    4, 5, 1, 0, # v4-v5-v1-v0 (top)
    3, 2, 6, 7, # v3-v2-v6-v7 (bottom)
    5, 4, 7, 6, # v5-v4-v7-v6 (back)
    1, 5, 6, 2, # v1-v5-v6-v2 (right)
    4, 0, 3, 7  # v4-v0-v3-v7 (left)
], dtype=np.int)

在GPU上创建VBO如下：

from OpenGL.arrays import vbo

vbo_vertices = vbo.VBO(vertices)
vbo_indices = vbo.VBO(indices, target=GL_ELEMENT_ARRAY_BUFFER)

创建顶点 VBO 时，默认 target=GL_ARRAY_BUFFER，而创建索引 VBO 时，target=GL_ELEMENT_ARRAY_BUFFER，因为顶点的数据类型是 np.float32，索引的数据类型是np.int。

在VBO保存的顶点数据集，除了顶点信息外，还可以包含颜色、法线、纹理等数据，这就是顶点混合数组的概念。假定我们在上面的顶点集中增加每个顶点的颜色，则可以写成这样：

vertices = np.array([
    0.3, 0.6, 0.9, -0.35, 0.35, 0.35,   # c0-v0
    0.6, 0.9, 0.3, 0.35, 0.35, 0.35,    # c1-v1
    0.9, 0.3, 0.6, 0.35, -0.35, 0.35,   # c2-v2 
    0.3, 0.9, 0.6, -0.35, -0.35, 0.35,  # c3-v3 
    0.6, 0.3, 0.9, -0.35, 0.35, -0.35,  # c4-v4 
    0.9, 0.6, 0.3, 0.35, 0.35, -0.35,   # c5-v5 
	0.3, 0.9, 0.9, 0.35, -0.35, -0.35,  # c6-v6 
	0.9, 0.9, 0.3, -0.35, -0.35, -0.35  # c7-v7
], dtype=np.float32)

5.2 分离顶点混合数组

使用 glInterleavedArrays() 函数可以从顶点混合数组中分离顶点、颜色、法线和纹理。比如，对只包含顶点信息的顶点混合数组：

vbo_indices.bind()
glInterleavedArrays(GL_V3F, 0, None)

如果顶点混合数组包含了颜色和顶点信息：

vbo_indices.bind()
glInterleavedArrays(GL_C3F_V3F, 0, None)

glInterleavedArrays() 函数第一个参数总共有14个选项，分别是：

GL_V2F
GL_V3F
GL_C4UB_V2F
GL_C4UB_V3F
GL_C3F_V3F
GL_N3F_V3F
GL_C4F_N3F_V3F
GL_T2F_V3F
GL_T4F_V4F
GL_T2F_C4UB_V3F
GL_T2F_C3F_V3F
GL_T2F_N3F_V3F
GL_T2F_C4F_N3F_V3F
GL_T4F_C4F_N3F_V4F

5.3 使用顶点缓冲区对象（VBO）

使用glDrawElements() 等函数绘制前，需要先绑定顶点数据集和索引数据集，然后使用glInterleavedArrays() 分理出顶点、颜色、法线等数据。

vbo_indices.bind()
glInterleavedArrays(GL_V3F, 0, None)
vbo_indices.bind()
glDrawElements(GL_QUADS, int(vbo_indices .size/4), GL_UNSIGNED_INT, None)
vbo_indices.unbind()
vbo_indices.unbind()

写作过程中，我参考了很多资料，包括纸质书籍和网页，列写于此，一并致谢！

《OpenGL编程精粹》杨柏林陈根浪徐静编著
Opengl开发库介绍
OpenGL的API函数使用手册
glut处理鼠标事件
Learn OpenGL

本文写作过程持续了两三周，期间可谓呕心沥血。发表之际，如释重负，填词以记之。

愁云淡淡风萧萧，
暮暮复朝朝。
别来应是，体重锐减，骨立形销。

日日思OpenGL，
情绪好无聊。
一篇博文，一台电脑，一只鼠标。

——调寄《眼儿媚》

相关文章