虚拟现实与增强现实的基础原理及应用
什么是虚拟现实?
虚拟现实(VR)是利用计算机技术创造一个模拟的生态环境。与传统的用户界面不同,VR将用户放置在场景中体验。用户不是在自己面前观看屏幕,而是沉浸在其中,能够与3D世界进行交互。通过尽可能多的模拟感官,如视觉、听觉、触觉、甚至嗅觉,看世界的眼睛。虚拟现实体验的现阶段限制是内容的可用性。
虚拟现实和增强现实有什么区别?
虚拟现实增强现实是同一枚硬币的两面。你可以把增强现实想象成现实世界中一只脚的虚拟现实:增强现实模拟真实环境中的人造物体;虚拟现实创造了一个居住的人工环境。
在增强现实中,计算机使用传感器和算法来确定摄像机的位置和方向。然后,AR技术将3D图形从摄像机的角度呈现出来,将计算机生成的图像叠加在用户对真实世界的视图上,达到增强的效果。
在虚拟现实中,用户的眼睛位置不是在物理环境中定位,而是在模拟环境中定位。如果用户的头部转动,图形就会相应地做出反应,然后通过3d引擎生成对应的效果环境。虚拟现实技术不是合成虚拟物体和真实场景(合成虚拟物体和真实场景在用户无感知的情况下被称为 混合现实MR),而是为用户创造一个令人信服的、交互式(感知手套等等)的世界。
虚拟现实技术
虚拟现实中最容易识别的组件是头挂式显示器(HMD).人类是视觉生物,而显示技术往往是沉浸式虚拟现实系统与传统用户界面之间最大的区别。例如,洞穴自动虚拟环境在房间大小的屏幕上主动显示虚拟内容.虽然对大学和大型实验室的人来说很有趣,但消费者和工业上的可穿戴设备的不方便性和价格现阶段还在优化。
带着多种新兴硬件在软件选择方面,可穿戴设备的未来正在发展,但仍是未知的。HTC、Oculus Quest和PlayStation, VR等概念正在引领潮流,但谷歌、苹果、三星(Samsung)、联想(Lenovo),华为等厂商可能会以更高层次的沉浸感和可用性令业界大吃一惊。无论谁走在前面,只要买到头盔大小的设备,就可以在起居室、办公室或工厂的地板上工作,这使得HMD在虚拟现实技术方面占据了中心地位,今年如果华为vr glass的意见开始引领虚拟世界的进程。
研究方法
如何获得图像中物体的深度?
主要问题是能否可以在立体图像中找到相对应的点。那么,什么是立体图像呢?当一个图像被称为一组或一对立体声图像,只要它是通过在不同位置安装的多个摄像机同时为同一对象或目标提取的的图像。对应的点是什么?它们是物体在3D空间中不同位置的某个点的相对投影。对图像中两个对应点的位置差称为视差。这种差异与空间中相应点的位置、相机的方位和物理特性有关。如果摄像机的参数已知,则可以根据图像计算物体的深度。首先,我们解释了空间中的点是如何投影到图像平面上的。假定任意点的坐标值在相对于ccd中心的空间中,它被想象成投影后在图像中的点。它相对于图像中心的坐标值是,而图像相对于ccd坐标值的中心点是,在哪里从CCD的中心点到传感场的距离。立体视觉图像机制空间的概念视图是立体视觉系统空间的概念视图。本研究以立体视觉系统为主轴。用两个镜头来确定图像的深度。这部分是单目视觉无法实现的特点。那么通过使用两眼聚焦函数计算相应的角度以获得目标物体的图像深度,立体视觉是增强所必需的:
1. 眼睛识别分析
眼睛识别一般包括预处理、特征提取、样本学习、识别等。实现眼球识别技术的方法有以下几种。
(1)投影法:在投影法中,根据投影图像在其中一定方向上进行的分布特征,而对眼睛位置进行检测。投影法是一种统计方法,它利用眼部的灰度信息,分别通过水平投影和垂直投影来检测瞳孔的纵横坐标。所以,可以才能对人眼进行准确的定位。
(2)强积金和方差投影函数(VPF)-Hough变换方法:Hough变换是图像的基础算法之一,是将图像从空域变换到参数域。图像中的曲线以大多数边界点所满足的某种参数形式而表示。这个瞳孔被用作标准圆。通过圆的标准方程,通过Hough变换可以精确地定位眼睛瞳孔的位置:。由于表观几何解析性,Hough变换大大提高。
(3)AdaBoost分类方法:AdaBoost算法是机器人学习领域中一种高效的迭代运算算法。它针对同一个训练集训练不同的弱分类器,然后将这些弱分类器集合起 来组成一个强分类器。该算法具有分类精度高、人眼识别速度快等优点。然而,这类算法的有效性取决于分类器的选择。在快速人眼检测方面有着非常重要的应用。
(4)样本匹配方法:根据瞳孔形状使用圆形样本,在图像窗口从左到右、从上到下动态搜索瞳孔的位置。样本匹配从较大的图像中搜索小图像。通过对样本和匹配区域的相似度计算,以最相似的位置作为匹配点来识别目标位置。样本匹配算法属于机器人学习领域的范畴,是一种有效的眼睛识别算法。
神经网络应用训练图
2.边缘检Sobel
obel算子是差分运算和低通运算相结合的结果。它除了具有降噪的优点外,还具有边缘检测的效果。由于导数可以降低噪声强度,所以Sobel算子对噪声的滤波尤为有利。Sobel算子掩码的导数用下列公式表示:
所述方法的输入是对应于1280×1024 RGB彩色图像的深度图像,即立体视觉可以提供的信息。肤色将从产生的最大肤色,色斑进一步检测。从保守估计出发,计算眼睛空间扩展的方法包括一个圆形掩模展开,其半径为。鉴于先前对估计的3D位置的跟踪,肤色的3D点在预定的深度范围内(25毫米)。估计是保留的,而其他深度设置为零: 借用下网上图片这个大概就是看到的效果。
全局优化:更新方程,重新评估每个像素的速度和位置:
对该目标函数进行了优化,并假设一帧进行眼定位。因此,这种方法和跟踪人的眼睛所必需的序列优化的获得了每个点的特征值。
空间连续性取决于期望观测运动图像的采样频率。
虚拟现实与音频的重要性
令人信服的虚拟现实应用程序需要的不仅仅是图形。听觉和视觉都是一个人的空间感的核心。事实上,人类对音频信号的反应比对视觉暗示的反应更快。为了创造真正的沉浸式虚拟现实体验,准确的环境声音和空间特征是必不可少的。这些都为虚拟世界提供了一种强大的存在感。要体验双耳音频细节,进入虚拟现实体验,戴上一些耳机和修补这个音频信很久以前。
虽然视听信息最容易在虚拟现实中复制,但积极的研究和开发工作仍在其他感官中进行。像全方位跑步机这样的触觉输入让用户感觉自己实际上是在模拟中行走,而不是坐在椅子上或沙发上。
触觉技术(VRTRIX的数据手套),也被称为动觉或触摸反馈技术,已经从简单的旋转重量“隆隆”马达发展到未来超声技术。
现在可以听到和感受到真实到生活的感觉,以及视觉虚拟现实体验.
大学教育中沉浸式虚拟现实的应用
沉浸式虚拟现实提供了一种符合多感官学习风格的现代学习渠道,有时比传统的学习方法更有效也更。然而,有些分析文献指出,没有足够的证据支持将学习方式评估纳入普通教育实践。
在中学后教育系统中采用沉浸式虚拟现实的最有说服力的论据可能是已将这种模拟纳入其课程的现有学科,例如在国外的,外科教育中的全室模拟机器人辅助(da vinci手术)血管内程序。不幸的是,这些模拟血管内程序造成的医疗伤害,由于错误的模拟训练,导致因个别产品责任案件而引起的数百起诉讼。用户手术技能从模拟(da Vinci手术)应用程序转移到现实世界环境的证据数量有时被发现是不够的。
在负担能力方面,将身临其境的虚拟现实纳入专上教育系统,最初受到所用设备成本的限制,但消费者耳机的商业化却大大降低了成本。移动电话技术已经达到了一个水平,沉浸式虚拟现实可以很容易地适应hmd格式,只需使用低成本的google cardboard或Samsung Gear VR耳机即可。。根据2015年美国教育研究中心(ECAR)发布的一项调查,92%的美国大学生拥有能够访问企业级系统和虚拟现实软件应用的手机。
课程如何将身临其境的虚拟现实融入教育课程。它的重点涉及跨学科的考虑,因为沉浸式虚拟现实的适用性广泛的各种学科。核心假设是学生通过体验学习和亲身体验来优化学习和实际技能学习,从而在适用的情况下简要总结身临其境的VR的积极效果。重点是教育及其相关目标,即技能培训,目的是进一步了解沉浸式虚拟现实在高级思维条件下培训用户的潜在能力。
VR整个系统结构的原理图
将三维立体虚拟图像技术与空间规划和场景设计相结合,可以模拟各种天气条件和四季、气候条件和水景、雾效应等的变化。或者,它可以通过模拟计划中的实际情况来改进现有的场景。并对其实用性进行了研究和评价。不仅可以方便地获得各种不同的视觉效果,而且可以有效地降低实验的误码率。并且大大提高了程序的可靠性和现实性。有了这样的技术,教学中很多危险实验、高经费实验、等也可以结合起来来模拟和评估不同的情况设计。
end
作者简介
杨海旭为好未来高级AR/VR工程师