关闭
您当前的位置:首页 > 伙乘资讯 > 34AI文本创作

有形VR书籍:探索基于标记的虚拟现实有形界面的设计空间

来源:MDPI 时间:2023-01-05 作者:豪尔赫·卡多佐/豪尔赫·里贝罗 浏览量:

应用科学2021,11(4), 1367;

收稿日期: 2021-01-5/修订日期:2021 年 1 月 28 日/录用日期: 2021-01-29/已发布: 3 二月 2021
(本文属于特刊《增强现实和虚拟现实应用的创新解决方案》)

抽象

有形用户界面(TUI)代表了虚拟现实(VR)的巨大潜力,因为有形用户界面可以自然地提供丰富的触觉线索,而这些线索在使用标准控制器的VR体验中经常缺失。我们对为基于智能手机的VR实施TUI特别感兴趣,因为它的使用门槛较低且易于部署。为了使整个系统保持简单易用,我们探索了使用智能手机摄像头通过视觉标记进行物体检测。为了帮助VR体验设计师,在这项工作中,我们为基于标记的TUI提供了一个VR设计空间。我们通过开发几个基于标记的有形交互原型,并通过与具有不同背景的专业人士进行形成性研究来绘制这个设计空间。然后,我们在一本有形的VR书中实例化了设计空间,我们通过受小插图方法启发的远程用户研究对其进行了评估。
关键词:
虚拟现实;基于智能手机的虚拟现实;有形的用户界面;有形书


1. 简介

Ishii和Ullmer[1]在20多年前引入了TUI的概念,后来将其系统化并定义为:
...有形接口为数字信息提供物理形式,使用物理工件作为计算媒体的表示和控制[2]。

对于VR来说,有形的交互代表了巨大的潜力,因为物理对象可以自然地提供丰富的触觉线索,而这些线索在VR体验中经常缺失。用户经常通过VR中的通用控制器操纵具有明确物理对应物的虚拟对象,无论虚拟对象如何,都能体验到完全相同的重量感、温度感、质感等。根据Carrozzino和Bergamasco[4],TUI可以提供更自然的交互[3],并且对应于更好的VR解决方案。TUI还可以带来更高的沉浸感[5,6],因为它们提供比标准控制器更丰富的感官反馈。它们还可以促进更高的存在感,特别是Lee定义的身体存在感[7]。至少,TUI可以更有趣和引人入胜[8]。


在虚拟环境 (VE) 中实现有形交互要求系统能够检测物理对象,理想情况下是位置和方向跟踪——六自由度 (DOF)。多年来,已经尝试了各种替代方案,从有源(带有传感器的仪器)到被动物体。

在我们的工作中,我们利用智能手机的成熟标记识别算法作为在用户沉浸在VE中时检测物理物体的一种手段。这种方法的优点是适用于基于智能手机的VR,并利用智能手机上现有的硬件:相机。此外,视觉标记易于打印并适合各种物理对象,使这种方法非常便宜且易于使用。这些特性使这种方法适用于用户收到要组装的模板或套件的自己动手 (DIY) 场景,也适用于需要大量有形物品和 VR 系统的课堂情况。由于 TUI 通常也等同于易用性,因此我们的方法也适用于用户没有太多时间学习如何使用该系统的步行和使用场景,例如博物馆和其他文化遗产探索情况。


尽管VR已经有一些应用,例如[9],但基于标记的VRTUI的设计空间尚未得到充分研究。
我们的主要贡献是定义和探索基于标记的VRTUI设计空间。我们首先采用了从研究到设计启发的过程,并制作了几个原型,以帮助我们深入了解基于标记的 TUI 的可能性。然后,与Surale等人[10]类似,我们进行了一项形成性研究,要求参与者设想基于标记的VRTUI的可能用途和期望。基于提出的想法和我们自己的探索,我们绘制了一个具有八个维度的设计空间,可以帮助设计师了解设计基于标记的TUI的替代方案。我们在有形VR书中实例化了设计空间,用于建筑探索,然后进行了评估。

2. 背景及相关工作

本节概述了如何在VR中使用有形资产,VR之外存在哪种基于标记的TUI,以及采用书籍外形的界面 - 与我们为Tangible VR Book选择的外形尺寸相同。

2.1. VR中的有形资产

通常,有形物可以通过两种非常不同的方式实现:它们可以是需要电源才能操作的主动对象,也可以是被动对象。

2.1.1. 活动

Johnson等人[11]实现了带有各种传感器的毛绒玩具,包括俯仰和滚动传感器,陀螺仪和磁力计以及弯曲和挤压传感器,这使他们能够感知与玩具的各种相互作用。虽然玩具的使用不是在沉浸式VR中,而是在屏幕前,但该项目展示了调整现有玩具的一个有趣方面:它们对用户来说很熟悉,它们很容易成为“叙事有形物”,“存在于叙事世界的空间和时间中,可以成为交互设计和叙事设计的有效策略”[12]。


Sajjadi等人[13]在VR游戏《迷宫指挥官》中使用Sifteo Cubes作为有形物体,其中两名玩家,一名使用VR耳机,另一名操纵Sifteo立方体,合作逃离迷宫。玩家使用Sifteo立方体,移动它们以形成和操纵虚拟迷宫,而VR用户可以识别敌人和障碍物。Sifteo Cubes是带有屏幕和传感器的小型计算机(约4厘米的立方体),使它们能够对运动和彼此之间的接近做出反应。《迷宫指挥官》展示了有形交互的一个重要方面:VR系统的一部分状态是可见的,并且可以由VR以外的用户进行物理操作。


另一个例子是Araujo等人的Snake Charmer[6],其中机械臂充当物理对象以提供触觉反馈。手臂跟踪用户手的动作,并能够重新定位自己,以便在用户触摸虚拟物体时提供触觉反馈。它还能够拾取不同的端点以提供不同的表面纹理、温度等。Snake Charmer强调了在沉浸式VR中交互时触觉反馈细节的重要性。
所有这些都是有源有形物的例子:具有传感功能的物体需要电源才能运行。活性有形物通常更昂贵和/或需要相当大的努力才能生产。

2.1.2. 被动

另一方面,即使是简单的被动有形资产也被证明对VR体验有显着的积极影响[5]。
例如,Aguerreche等人[14]创建了一个可重新配置的对象,其形状为具有可伸缩边缘的三角形。这种被动对象由外部传感基础设施(动作捕捉工作室)检测,并且可以与各种虚拟对象相关联,从而允许对其进行操作。
被动物体也可以通过外部深度感应摄像头检测。例如,在Annexing Reality系统[15]中,Kinect传感器用于识别物理对象并将它们映射到具有相似形状的虚拟对象。然后,用户可以拾取和检查虚拟对象,同时实际拾取和操作类似的物理对象。然而,深度摄像头尚未在主流设备中找到,带有Kinect传感器的Annexing Reality原型使用起来很麻烦。
这两个例子强调了灵活解决方案的重要性,其中相同的对象可以代表不同的虚拟对象,以及对日常对象的机会主义使用,以便创建有形物品可以便宜而快速。

2.2. 基于标记的有形用户界面

尽管视觉标记主要与增强现实(AR)体验相关联,但它们已广泛用于各种TUI。Jord et al. [16] 在他们的 Reactable 系统中使用基准标记进行音乐表演。Zheng等人[17]演示了如何使用印刷纸标记创建各种类型的TUI原型。池田和冢田[18]将视觉标记与电容感应相结合,创造出可以悬停在多点触控电容式显示器上的有形物。相反,沉浸式VR中使用的视觉标记的例子并不多。虽然不是严格意义上的VR,但以下示例演示了视觉标记在检测对象中的可能用途,并提供了如何在基于智能手机的VR中使用它们的良好示例。

Henderson和Feiner[19]为AR创造了一类交互技术,他们称之为机会主义控制:“一种有形的用户界面[Ishii and Ullmer 1997],它利用了自然发生的,触觉有趣的,以及其他未使用的提示”[19]。在他们的实现中,他们使用结构化的视觉标记来计算自然物理对象的位置和方向。然后,其他计算机视觉算法可以检测相对于视觉标记的感兴趣区域的手势。在我们的Tangible VR Book原型中,我们依靠标记跟踪功能,通过跟踪隐藏/可见的标记序列来检测标记本身的简单手势。


Paolis等人[20]使用标记检测实现了台球模拟。标记被放置在表面上,为台球桌和物理球杆的尖端提供参考。尽管模拟的可视化是在桌面显示器上进行的,但此示例进一步展示了视觉标记的多功能性以及使用它们跟踪物理对象的难易程度。同样,Cheng等人[21]在他们的图标系统中,在日常物品上粘贴基准标记,将它们转换为各种应用的输入控制器。
Lee等人[22]提供了一个有趣的例子,说明视觉标记应用于混合现实环境中基于手势的有形交互中。在这种情况下,视觉标记不是用来跟踪日常物品,而是用来跟踪用户身体的一部分:手。在Tangible VR Book的原型中,我们还尝试了用户手上的视觉标记,以提供有关手部位置的视觉反馈。

2.3. 基于书籍的界面

我们使用有形VR书实例化基于标记的TUI的设计空间。因此,分析使用书籍形式作为界面的其他项目是相关的。

Magic Book [23]是“传统立体书的增强版”,允许用户扫描页面上的AR标记以查看3D虚拟模型。用户可以快速切换到沉浸式模式并进入3D模型。这本书是通过手持AR显示器体验的,因此用户不会连续操作书籍,而是将其放在桌子上并通过AR显示器查看。在 3D 模型中,不需要物理书籍对象。这本书旨在作为一个协作界面,允许在沉浸式VR和AR模式之间快速过渡。我们的有形VR书采用相同的物体检测技术(视觉标记),但旨在用于在沉浸式VE内进行操作。我们还采用了许多魔术书中没有的互动功能。


姊妹小说[24]是一种具有类似书籍外观的交互式设备,游客可以在参观谢菲尔德将军公墓时随身携带,以自动收听与特定地点和主题相关的音频故事。该系统由靠近兴趣点的蓝牙扬声器补充,这些扬声器可以检测书籍的存在以呈现录音。书籍格式旨在提供直观的处理,因为与设备的交互是通过熟悉的常规书籍操作完成的。与系统的交互基本上是通过打开书籍并在与所选主题关联的页面上放置书签来完成的。姊妹小说的书籍格式旨在“以一种不引人注目的方式融入环境”[24]。同样,我们为主原型选择了书籍格式,因为它是一种不拘一格的外形,“属于”任何地方。与配套小说相反,我们的系统旨在用于VE内部,并利用其他交互来控制相关信息的显示。


其他展示书籍外形不拘一格的界面是PaperVideo [25],它研究了与视频的交互如何利用类似书籍的外形中类似纸张的显示器的存在,以及FoldMe [26],它探索通过类似书籍的设备与可折叠显示器的交互。与这些旨在与物理设备进行现实世界交互的项目不同,我们的有形VR书籍专门针对沉浸式VR的使用。虽然我们没有遵循这条途径,但PaperVideo和FoldMe定义的设计空间也可以应用于类似于Tangible VR Book的TUI。

2.4. TUI框架

随着时间的推移,已经根据非常不同的视角研究和构建了物理对象与数字系统交互的使用[27]。在本节中,我们将简要回顾一些已提出的有形交互框架,以及它们与我们提出的设计空间的关系。

Holmquist等人[28]根据对象作为容器、令牌和工具所扮演的信息角色,对物理对象和数字信息之间的可能关联进行了分类。容器是可以与任何类型的数字信息相关联的通用对象。对于容器,与其关联的数字信息在对象的整个生命周期内可能会有所不同。令牌是其物理属性反映与其关联的数字信息的对象。与令牌关联的信息通常不会随时间而更改,因为它与该特定物理对象密切相关。最后,工具是用于操作数字信息的对象。


Ullmer和Ishii[29]根据多个物体如何被解释以形成物理物体系统对TUI进行分类。在空间系统中,某些参考系内对象的空间配置用于定义有形物体的状态。在关系系统中,“多个有形物的系统之间的序列、邻接或其他逻辑关系被映射到计算解释”[29]。建设性系统代表具有模块化元素的有形物体,这些元素可以组装在一起(例如乐高™积木)以创建不同的解释。最后,结合有形物表示“不引用其他对象来派生意义”的有形物[29]。


Hornecker和Buur[30]提出了一个“专注于交互的用户体验的框架,旨在解开交互的材料/物理和社会方面的交织”。他们关于有形互动的物理空间和社会互动的框架由四个主题组成,为思考有形系统的设计提供了不同的视角。随后,每个主题被分解为代表描述和解释有形系统的分析工具的概念。有形操纵是指与物理对象的身体交互,这些物理对象以某种方式与计算功能耦合。这个主题关注物体的材料质量以及它们的操作如何与系统的影响相关联。有形操作的概念是:触觉直接操作(抓取,感觉和移动的能力),轻量级交互(在小步骤中与即时反馈进行交互的能力),同构效应(理解动作与其效果之间关系的能力)。空间互动是指有形互动如何嵌入物理空间并要求(身体)在空间中运动。空间互动包括以下概念:居住空间(人和物体是否相遇并形成一个有意义的地方),可配置的材料(空间是可配置和可适应的,移动事物有意义),非碎片可见性(是否每个人都可以看到正在发生的事情),全身互动(我们是否可以使用我们的整个身体),表演性动作(我们的身体动作是否可以在我们做我们所做的事情时传达一些东西)。具身促进是指空间中物体的物理配置如何指导群体行为。具体化促进中的概念是:具体约束(物理配置是否约束导致协作的行为),多个接入点(所有用户是否可以看到正在发生的事情并使用中心对象参与),定制表示(表示是否熟悉并与用户的技能相关联)。表达性表示侧重于有形的东西代表什么,它们的表现力如何,使用什么材料和数字表示,以及用户如何感知它们。


Simeone等人[31]为替代现实[32]定义了一个分层模型,其中VE通过用虚拟对象替换物理对象的过程来适应物理世界。在五个替换级别中的每一个级别,虚拟对象都离其物理对应物更远。在副本级别中,虚拟对象显示为复制物理代理的 3D 模型,包括提供完全相同的功能并允许相同的交互。在美学层面上,虚拟对象外观的物理性质可能与其物理对应物不同。例如,虚拟对象可能使用不同的材质渲染,这反过来可能会影响用户对它的感知方式。在加/减级别,虚拟元素在其物理对应对象中添加或删除。例如,一个杯子可以在没有手柄(减法)的情况下被虚拟描绘。功能级别表示替换,其中物理对象和虚拟对象的所有提示之间不再匹配 [33]。例如,“一个杯子可能被渲染成一盏油灯,因为它们有一些共同的特点(我们可以在两者中倒入液体),但用于两种不同的功能(饮用或照明)”[31]。最后,类别级别表示达到极致的替换,其中虚拟对象的外观与其物理对应项无关。
Harley等人[34]描述了一个基于七个类别的有形叙事框架。每个类别“反映了叙事的可能性或限制,塑造了叙事的创建和传达方式”。主要用户代表目标受众(儿童、青少年、成人)。媒体表示有形交互后的反馈如何呈现给用户。有形物体的叙事功能代表了有形物体在叙事中的使用(人物、导航工具、故事成分的隐喻等)。叙事有形表示有形物是否可以被视为叙事,即对象存在于叙事世界中。叙事创建考虑系统是否允许用户创建和/或讲述故事。叙事选择表示用户在讲故事过程中可以做出的可能影响叙事路径的选择类型。最后,叙事位置代表用户在叙事中的角色(外部探索性、内部探索性、外部本体论和内部本体论)。

3. 早期原型设计

早期原型设计阶段的目标是为我们提供关于基于标记的TUI的实现可能性和局限性的见解和知识。我们采用了一种通过设计进行研究的过程,类似于Versteeg等人[35]。
在本节中,我们将简要介绍我们开发的一些原型以及由此产生的反思。图 1显示了其中一些早期原型。

applsci-11-01367-g001-550.jpg


图1.为VR原型选择早期基于标记的TUI模型。


最初的原型(图1a)非常简单,主要用于基本了解如何模拟不同的物理特性。
其他原型开始探索更复杂的形式和操作。图1b显示了有形塔的三种不同原型。顶级版本探索了物理对象中的细节,以模仿塔楼的建筑细节。中间和底部版本允许用户“打开”有形并检查其内部。底部版本还包括一个自由移动的元素来代表塔的钟声:随着有形物体的移动,该元素将在物理和虚拟环境中自然摆动。还制作了一个书籍对象(图1c)的原型。当用户翻阅页面时,他们可以看到页面的视觉呈现,同时听到音频版本。
我们还探索了标记物在身体内部和与身体相关的使用。图1d显示了三个原型想法:在脚和“楼梯台阶”,手指和手腕上使用标记。身体上的标记的主要目的是允许系统提供有关用户身体的视觉反馈,但它们也可以允许简单的手势检测输入。
我们还探索了各种输入控制器,例如“按钮”、手势和有形滑块、门户和手持控制器(图 1e–i)。按钮控制器通过检测特定标记上的不存在/存在模式来工作(图 1e)。手势滑块通过检测一系列标记上的不存在/存在模式来工作(图 1f)。有形滑块的工作原理是通过在具有多个预编码标记图案的条带上滑动来动态显示不同的标记(图 1g)。门户的工作原理是从表面上分离标记,使其更接近用户眼睛的预定义阈值(图1小时)。最后,手持式控制器利用早期的物理瓶原型,通过一系列可见标记检测与其他物体的接近或控制器本身的旋转(图 1i)。

思考

即使使用廉价材料,也可以轻松传达一些物理特性,例如形状,尺寸,重量和质地。气味或声学等其他特性更难模仿。
标记很难包含在某些物体(例如塑料瓶)的表面上,因为它们需要位于平坦的表面上。在这些情况下,可能需要对物理对象进行调整,以便允许或促进跟踪,例如将其扩展到其自然极限之外(图1a)。
在我们的原型中,我们使用了没有任何特殊相机镜头的标准智能手机。这意味着视野是有限的,在由几个部分组成的有形物中尤其明显,如可打开的塔。如果视野(FOV)中没有足够的标记,虚拟表示的某些部分会突然消失。尽管存在这些问题,但拿着物理建筑模型并能够将其靠近我们的眼睛,打开它查看内部并检查微小细节的效果非常引人注目。
书籍原型产生了一种易于操作的有形产品,其中书籍的自然功能大多直接运输到VE。我们可以很容易地想象利用数字信息的丰富性,同时保持书籍的操作简单性。此外,外形尺寸会导致一个不显眼的对象,该对象“属于”大多数任何地方,而不会引起对其使用的关注。
在脚上使用记号笔的一个缺点是,记号笔需要很大才能被识别,但这会使它们的耐磨性降低。在手上使用标记,特别是在某种可穿戴设备的背景下,可能是基于智能手机的VR手部检测的廉价解决方案。
某些类型的控制器(如按钮、手势滑块或手持控制器)很难以稳定的方式实现。由于标记从相机视图中消失,很容易意外激活。有形滑块和可拆卸门户不会受到此问题的影响。有形滑块提供了一种有趣的方式来创建动态对象,其中可以通过移动底层条带来动态更改关联的标记。此外,它还建议许多其他控件变体,例如,当控件未作时,条带会自动返回到静止位置。

4. 形成性研究

形成性研究的目的是了解人们如何在VR中使用基于标记的TUIs。与[10]相反,我们没有想到特定的应用。此外,我们认为参与者很难想象与他们的经验相去甚远的东西(通过VR中的物理对象进行交互)。我们没有要求参与者执行特定的任务,而是让他们体验简单的TUI VR原型,然后采访他们。这些访谈的结果后来被用来为基于标记的TUI为VR构建一个设计空间。

4.1. 参与者

大学教职员工和学生中的14名参与者是通过电子邮件招募的,或者通过几个地点的直接联系招募的。参与者来自多个背景/专业:土木工程,行政工作者,网页设计师,神学教授,IT技术员,旅游,销售,信息工程,建筑,药学。年龄从27岁到55岁不等,但大多数(57%)的年龄在(40-49岁)之间。六名受试者为女性,八名受试者为男性。四名参与者报告以前没有VR经验,六名报告基本经验,四名报告经常使用,但没有人报告自己是VR专家。

4.2. 程序

会议在我们的实验室或参与者的工作场所进行。向参与者介绍了研究的目的,并填写了个人数据问卷。然后,他们被要求使用我们提供的基于智能手机的VR系统试用三个原型。虽然原型非常简单,但我们指导参与者的实验,以确保所有相关方面都得到体验。然后对参与者进行采访,以收集他们对有形互动范式的反馈和想法。在与原型的互动中,鼓励参与者将他们的想法外化,并提出具体问题以促进反思。访谈是半结构化的,有几个计划的问题,关于参与者在刚刚探索的原型下可以想象的上下文和应用,在各种原型中可以改进什么,原型还提出了哪些其他想法。这些问题和原型的主要目的是激发参与者的想象力,以引出可以为设计空间提供进一步的想法。采访数据被录音,后来被转录。一些参与者在会议结束后通过电子邮件与我们联系,提供了他们在会议期间没有想到的其他想法。

4.3. 结果

本节介绍形成性研究的主要结果,使用 R# 进行编码,以便于本文后面的参考。
  • R1.物体的物理特性
参与者经常提到可能与TUI中传达相关的物理对象的具体特征,“能够感受到纪念碑某些部分的纹理和形状。[P9],“感受教堂里灯的气味”[P11]。几何形状,纹理,体积,密度,气味是参与者提到的一些特征。
  • R2.系统输入的对象
一些用户建议使用对象作为直接向系统发送输入的一种方式:“使用对象敲击塔的钟并再现声音”[P7],“控制看到地板的切口”[P13]。参与者提出了各种输入,例如使用有形物“击中”另一个物体,更改位置,将其用作激活内容的键,作为更改音乐的控制器。
  • R3.与对象操作相关的输出模态
与会者还提到了几个例子,说明他们期望看到或听到的有形物纵的结果。有趣的是,音频是一种经常被提及的输出方式:“看到教堂的管风琴,并能够按下按键来再现电子管的不同声音”[P11],“......书中伴随着各个时代的环境声音“[P4],”这种体验可以伴随着其他时代的语言的音频,如古老的葡萄牙语、拉丁语等。[P4]。视频和3D模型也经常被提及,但动画,文本,图像也被建议。
  • R4.对象作为副本
有形物通常与现有的物理对象相关联,作为持有或操纵原始物理对象的体验的替代品:“将宗教艺术的对象物化......因为它们代表了非常重要但不能向公众提供的东西“[P4],”使用物理系的'走钢丝器',我们控制它的平衡位置“[P10]。
  • R5.解构对象
参与者还经常描述能够打开和解构物体有用的情况:“打开计算机以了解内部内容并了解连接组件的工作原理”[P2],“......可以打开探索旧建筑的内部...”[P3],“打开计算机并使用对象作为组件”[P5],“通过零件拆卸构造模型以查看内部”[P13]。
  • R6.神奇的互动
参与者提出的一些想法涉及的互动超越了简单的物理操作,而是代表了在我们的物理世界中不可能的神奇互动:“通过建筑模型,我可以选择一个特定的公寓,以便客户可以进入空间”[P1]。
  • 建议7.固定对象
虽然大多数想法都提到了对小物体的操纵,但也有少数想法提到了环境中存在的固定/大型物体:“爬上几级台阶,看看塔钟的面积”[P7]。

5. 设计空间

结合形成性研究和原型探索产生的想法,我们塑造了一个由八个维度组成的设计空间,这些维度提供了不同的设计选项(图 2)。并非所有结果都直接应用于设计空间。相反,设计空间的一些维度受到相关工作的启发。我们使用术语“维度”作为MacLean等人[36]在他们的设计空间分析方法中的“问题”的同义词。以下小节将介绍这八个维度。
applsci-11-01367-g002-550.jpg

图2.设计空间的尺寸和选项。


我们的设计空间不试图描述交互式元素,为此存在其他更专业的框架,例如 [37] 空间输入的设计考虑,有形接口的 [38] 标记和约束范式,或 [39] 接口的预期、感知和期望移动框架。
设计空间每个维度中的选项并不意味着相互排斥,即使我们可能希望通过考虑一个选项而不是另一个选项来突出有形的某些方面。(部分)例外是对象维度的类型,其中选项在对内相互排斥(可移动/不移动、可重新配置/不可重新配置、主动/被动、动态/静态)。

5.1. 整体保真度

整体保真度维度捕获了Simeone等人[31]的替代环境分层模型的一部分。但是,我们通过仅考虑两个选项来简化分层模型:副本和代理。
顾名思义,副本是现有物理对象的复制品。复制品的忠实程度必须由设计团队主观定义,但目的是用户将对象视为复制现有的物理对象。副本选项对于在我们的设计空间中维护非常重要,因为它代表了形成性研究[R4]中的反复引用:拾取和检查已知物理对象的可能性,否则是不可能的(例如,因为它无法访问)。
代理选项包括替代环境的其余层:美学、加/减、功能、类别。从本质上讲,代理物理对象在形状、重量、大小等方面可能与它所表示的虚拟对象相距甚远,但仍为用户提供有形元素。

5.2. 主要物理特性

主要的物理特征维度在为特定的VR体验设计有形对象时捕捉了意图的焦点。对于给定的体验来说,也许最重要的是物体的形状,无论其重量或质地如何;或者也许是设计师希望传达的刚性......[R1]。这个维度的选项(形状、刚度、尺寸、重量、纹理、温度、气味、声学)可以提醒设计师,物体具有许多可以通过有形的东西探索的非视觉特征。这也提醒我们,肯定会有许多特征无法传达,除非有形的是VR中呈现的物理对象。声学选项值得特别一提:物理对象的声学特性仅在形成性研究会议中间接提及,我们没有在文献中发现任何探索声学的TUI示例。然而,这是一个选项,它来自物体的其他非视觉属性,我们可以以某种方式触觉探索,例如,通过用手指敲击一个物体或用另一个物体敲击物体。这个维度的选项列表不一定完整,尽管我们认为纹理是一个特征,包括触觉的大多数子感官。

5.3. 主要 I/O 角色

尽管有形资产总是既用作系统的输入 [R2] 又用作系统状态的表示,但某些有形资产可能会强调一个而不是另一个。主 I/O 角色维度表示了这一点,并允许设计人员考虑整个系统最相关的方面。例如,如果有形的主要角色是输入,那么它将用于以某种方式影响 VE 的状态。在这种情况下,设计师需要考虑如何操纵有形物以及系统将如何检测输入,例如,系统是否会检测手势、有形物的相对位置或方向、与其他有形物或虚拟物体的接近程度等。设计人员还需要考虑这种操作对VE的影响。如果有形的主要作用是输出,设计师需要考虑哪种类型的信息将与有形信息相关联,以及该信息是在虚拟对象上还是在VE中的其他地方可视化。
在某些情况下,要确定有形物的主要作用是充当控制者(输入)还是作为信息的输出可能并不容易。一些有形物体可以简单地充当虚拟对象的物理表示,用户可以操纵它来检查虚拟对象,而不会影响 VE 中的其他任何内容。在许多情况下,有形对象的整体保真度是副本,其主要 I/O 角色将只是未定义,因为它充当被动、惰性对象的副本。但是,一些有形资产可能会复制工具,例如,在这种情况下,它们将主要用作输入。在其他情况下,有形物的作用可以界定为投入和产出,而没有一方凌驾于另一方之上。

5.4. 输出模式

输出模态维度是指有形在VE中的表示方式以及与之相关的媒体类型(即,当有形的主要I / O角色是输出时)[R3]。大多数情况下,有形物通过VE中的3D模型表示,但其他选项也是可能的:文本,图像,图形(例如,计算机生成的图形或动画),音频,视频。考虑输出模式很重要,因为它对交互的其他方面有影响。如果有形与基于时间的媒体(如音频或视频)相关联,设计人员还需要考虑如何控制媒体的复制(由用户手动,或由系统自动)。要考虑的另一个方面是关联的输出信息的呈现位置。这在下一个维度中涵盖。

5.5. 输出耦合

输出耦合维度是指与有形相关的信息是作为虚拟对象本身的一部分还是在环境中呈现。为此,我们考虑了三种选择:信息呈现在对象本身上,就好像是对象的一部分一样;信息与对象耦合(如果对象在 3D 空间中移动,则相关信息将相应地移动),但不直接在对象上渲染;信息独立于对象呈现在环境中的某个位置。

5.6. 对象的类型

对象维度的类型结合了物理对象可以显示的几个二进制属性 [R5, R7]:可移动/不可移动、可重新配置/不可重新配置、主动/被动、动态/静态。
不可移动的物体通常很大,是空间建筑的一部分(墙壁,门,大型家具)。可移动物体可以被移动、拾取和操纵。可移动物体通常需要更多考虑和注意细节,因为它们通常会在用户手中握住更长的时间。
可重新配置的物体具有可移动或可变形的部件,因此在使用过程中可以以某种方式改变形状。例如,可打开的塔原型将被认为是可重新配置的,因为它可以打开和关闭。不可重新配置的有形物在使用过程中不能改变物理形状。
有源有形物依靠电流来发挥作用,而无源有形物则不然。
动态有形对象是其含义会随时间变化的对象,而静态对象在整个VR体验中具有相同的虚拟表示。应该注意的是,如果系统能够以某种方式在整个时间中分配不同的含义,则所有物理对象都可以用作动态有形物。物理对象并非绝对有必要能够更改配置或状态,尽管这是一种解决方案。有形滑块的早期原型将是动态有形的一个例子。

5.7. 系统配置

系统配置维度直接取自并等同于Ullmer和Ishii[29]定义的类别:空间,关系,建设性和关联性。
前三个选项表示具有多个相互依存的有形资产的系统。在空间系统中,某些参考系内对象的空间配置用于定义有形物体的状态。在关系系统中,“多个有形物的系统之间的序列、邻接或其他逻辑关系被映射到计算解释”[29]。建设性系统代表具有模块化元素的有形物体,这些元素可以组装在一起(例如乐高™积木)以创建不同的解释。最后,最后一个选项——关联——表示“不引用其他对象来派生意义”的有形资产[29]。

5.8. 信息角色

信息角色维度等同于Holmquist等人[28]表示数字信息的物理对象类:容器,令牌和工具。
容器是可以与任何类型的数字信息相关联的通用对象。对于容器,与其关联的数字信息在对象的整个生命周期内可能会有所不同。令牌是其物理属性反映与其关联的数字信息的对象。与令牌关联的信息通常不会随时间而更改,因为它与该特定物理对象密切相关。最后,工具是用于操作数字信息的对象。

6. 有形VR书

有形VR书籍(图3)类似于实体书,每页都有厚厚的页面,每页上都包含视觉标记。这大致保持了与普通书籍相同的功能[40],因为可以拿起这本书来检查封面和封底,翻页,靠近或远离眼睛阅读。这些提示对于VR书籍的虚拟表示是相同的。有形VR书不会试图成为任何特定书籍的复制品,因此在整体保真度维度上是一个代理对象。
applsci-11-01367-g003-550.jpg

图3.有形VR书籍概述(顶部);有形VR书中基于标记的TUI设计空间的实例化(底部)。


我们选择书籍格式有几个原因。这本书是一个熟悉的物品,我们从很小的时候就开始学习使用——有些书是为一岁以下的儿童设计的。书籍也非常不拘一格。它们可以由从塑料到布料的非常不同的材料制成;可以有硬封面或软封面和页面;非常小或非常大;具有互动性;具有动态元素,例如在立体书中;甚至嵌入电子设备。这种用途范围使其用途广泛,塑造和拓宽了用户的期望。在这个原型中,我们主要对传达一本书的主要物理特征感兴趣:它的形状和大小。


在这个原型中,当使用有形VR书时,用户最初被放置在一个抽象的环境中,只有两个可识别的物体(图4a):屏幕和支架(盒子)。这两个对象都用于显示书籍页面上显示的内容之外的其他信息。因此,原型使用对象和环境上的输出耦合。我们还添加了基于标记的手部跟踪(图4b),以便于选择书籍的可拆卸部分(如下所述)并作用于“滑块”元素。该解决方案的灵感来自[22],尽管它显然不是最佳的,仅用于原型设计目的。我们预计,手部跟踪的进一步发展将使未来基于移动的跟踪成为可能,这将允许在VE中使用虚拟手。

applsci-11-01367-g004-550.jpg

图4.有形VR书#3中的抽象环境和手部检测。


有形VR书的原型是在与“1834年圣克鲁斯修道院的数字3D重建”项目合作的范围内开发的[41]。在这种情况下,VR Book的目的是允许探索由此产生的数字重建的360°图像,以及检查选定的3D模型。因此,原型使用多种输出模式,例如文本,图像,音频,视频和3D模型。视频和3D模型呈现在环境(屏幕和支架)中,允许更大的物体视图。
Tangible VR Book提供了三种浏览内容的方式(超越了自然的翻页):通过手势激活的滑块,通过有形滑块,通过有形门户。滑块允许在页面内导航内容,而门户允许在 360° 环境中导航。每页中心的视觉标记允许系统检测和跟踪书籍,页面底部的其他标记允许实施内容浏览机制。原型没有单一的主 I/O 角色,相反,输入和输出同样重要。
这些内容浏览机制很重要,因为在各种情况下,以有形VR书籍为特色可能不可行,其中包含如此多的页面数和要探索的内容项的数量。为了使其成为更灵活的解决方案,需要不需要翻页的内容浏览技术。

6.1. 手势滑块

手势滑块机制包括用手在页面底部执行“滑动”手势,类似于基于触摸的电子书阅读应用程序。Lee等人之前已经探索过这种类型的相互作用[42]。在我们的实现中,左侧内部页面显示目录,右侧页面显示相关内容(图 5)。从左到右的滑动手势将在目录上向前移动,而从右到左的滑动手势将返回。为了允许显示更多内容,可能采用非常不同的格式,浏览机制利用了书外信息的显示:当用户浏览目录时,视频和3D模型将显示在屏幕上和支架上,在环境中。
applsci-11-01367-g005-550.jpg

图5.通过手势滑块选择内容。


滑动手势检测的实现利用了视觉标记。三个标记放置在物理页面的底部,实际上由带有标签“幻灯片”的水平条表示。当用户执行滑动手势时,系统会将每个标记的跟踪顺序的丢失解释为手势。

6.2. 有形滑块

有形滑块机制包括物理拉动一条略微超出书页边缘的纸条(图 6a)。
applsci-11-01367-g006-550.jpg

图6.通过有形滑块进行内容选择。


左页显示了各种可用的内容项,与手势滑块机制类似,有形滑块允许用户通过拉动和释放滑动条来循环浏览内容。这将更改右侧页面上描述的内容(图 6b)。Zheng等人[17]探索了创建可交互视觉标记的类似方法,尽管这里我们利用了标记本身的结构。
该条带实际上表示为页面右下边缘的一个小矩形半透明条带,以及标签“Pull”和向右箭头(图 6c)。在松紧带的帮助下,移动条可以自动返回静止位置。有形滑块还提供手势滑块中不存在的触觉和音频提示:拉动条带时,用户会感受到松紧带产生的阻力;当条带被释放时,他们会听到条带撞击纸板的声音。
物理滑块机制专门用于利用结构化矩阵标记[43]。由于这些标记排列为白色和黑色方块的矩阵,因此很容易组装一个固定在页面上的标记,带有一个孔,该孔可以通过下面的移动条填充白色或黑色(图6b)。这有效地创建了一个可以具有两种状态的动态对象(可以使用跨越矩阵多个单元格的孔创建更多状态/标记)。

6.3. 有形门户

包含有形滑块内容的页面还包括一种进入 360º 环境的替代方法,即“拾起”有形门户并将其移近头部,就像窥视内部一样。
门户的有形物是一个厚块(图 7 a),可以从页面右上角移除(图 7b)。门户实际上由半透明球体表示。当用户拿起门户时,页面右上角会留下一个占位符球体,显示门户可以重新附加到页面上的位置(通过使用磁性机制)。通过门户后,VE会自动更改以显示相应的360°图像和环境声音。
applsci-11-01367-g007-550.jpg
图7.使用有形门户进行 360° 导航。

6.4. 实现

在实施VR手册时,我们的目标是创造一种可访问的体验,以促进通用使用,而不是专注于单一站点特定的体验。我们利用计算机视觉(CV)解决方案进行对象检测和跟踪,这些解决方案通常用于增强现实(AR)应用并与之相关。AR应用长期以来一直使用和改进特定的CV技术,用于基于结构化标记甚至基于自然图像特征检测平面。这些技术被认为足够成熟,以至于各种商业开发工具包和平台已经出现,甚至在浏览器平台中也被积极使用。我们不是实现一个典型的AR应用程序,即用户将智能手机放在手上,并将相机指向一个视觉标记,然后叠加3D模型,而是在VR耳机上使用智能手机。用户沉浸在VE中,检测到的标记简单地表示为VE中的附加3D对象(见图3)。
我们的实现基于基于Web的VR框架A-Frame[44]和用于检测视觉标记的AR.js[45]组件,该组件本身基于ARToolkit的JavaScript端口[46]。A-Frame是基于Web的,支持WebVR / WebXR规范。它可以在智能手机上运行,使VR体验在任何地方都可以高度访问和使用。AR.js组件使用智能手机的摄像头来检测视觉标记,并计算它们相对于智能手机摄像头的位置和方向(这与智能手机放置在VR外壳内并戴在用户头上时用户在虚拟世界中的视图相同)。当标记在相机上变得可见或隐藏时,AR.js会触发应用程序事件,例如,用于开始/恢复或暂停图书页面上的视频。可以在同一物理对象的不同部分放置多个标记,以创建更强大的跟踪或检测运动部件。
源代码可以在https://git.dei.uc.pt/jorgecardoso/Tangible-VR-Book找到。

7. 评估

由于 COVID-19 大流行,我们选择了不需要实际处理原型的评估程序。我们遵循了受小插图方法[47]启发的方法,以收集有关我们原型的反馈。我们通过在线问卷调查进行了两项研究,用户可以看到原型被用于视频/基于照片的小插图。
在第一项研究中,目标是进一步了解用户对有形VR书上呈现的可能媒体内容的期望,因为这涉及我们设计空间中的两个维度(输出模式和输出耦合),这两个维度对用户来说非常突出。我们还想了解关于原型可用性的普遍意见。在第二项研究中,目标是收集有关内容导航的交互元素的反馈,因为它们代表了最不自然的交互。
我们使用谷歌表单准备了在线问卷,并通过社交网络和部门邮件列表进行传播。

7.1. 第一次研究

问卷的第一部分介绍了研究和目标,并要求提供人口统计信息(年龄、性别和职业)。
第二部分引起了对内容和交互的期望:它显示了Tangible VR Book原型各个页面的虚拟表示的视频小插曲,并向用户询问了几个种子问题,即他们希望在书的封面/封底中看到什么,以及他们希望如何与音频/视频进行交互, 3D模型和书内的超链接。这些小插曲中的视频没有显示任何互动,也没有描绘用户处理书籍(图 8a)。这是为了减少对参与者的影响,因为目标是引起期望。
applsci-11-01367-g008-550.jpg

图8.调查表第二部分和第三部分的示例小插图。


第三部分要求提供有关有形VR书可用性的反馈:它展示了视频小插曲,并排构图描绘了用户操纵实体有形VR书和各自第一人称虚拟视图的第三人称视角。每个视频都展示了与书中不同部分的互动(与视频/音频的互动、与门户的互动以及 3D 模型检查;图8b)。我们还询问了用户对原型的一般意见(不喜欢/不有趣,喜欢/有趣,非常喜欢/非常有趣),以及其他公开反馈。

这些小插图中使用的原型是上一节中描述的原型的简化版本。为了不引起对这些特定交互的过多关注,用于这些小插图的原型没有显示手势或有形滑块。


结果和讨论
在线问卷在18天内提供。21名参与者回答了在线问卷,总共提供了200多条评论。
受访者自称的专业活动是“学生”(5)、“设计师”(4)、“教授”(2)、“VR开发人员”(2)、“市场营销”(2)、“电气工程师”(1)、“公务员”(1)、“研究员”(1)、“程序员”(1)、“相机操作员”(1)和“未来主义者”(1)。
年龄从20岁到52岁不等,平均年龄为32岁。14名受访者为男性,7名受访者为女性。我们收集了来自几个国家的回复,但没有记录受访者的原籍国。
对内容和互动的期望

十位受访者提到在书的封面中使用视频或3D模型作为展示本书内容摘要的一种方式(“......作者,在视频色度中,展示作品。总的来说,受访者的评论指出,封面中应使用动态内容作为吸引力因素(“带有动画的封面使书籍对读者更具吸引力”)。一位受访者建议,该书可以触发图书本身之外的内容,以利用用户周围的 360° 空间(“......360度的阅读体验不再集中于一本书的机会......在页面上,并成为身临其境的体验“)。一位受访者建议允许用户在封面中选择书籍的布局。这个建议可能是受到当前电子书阅读器的启发,这些阅读器允许选择书籍的布局(例如,一列或两列)。但是,我们的Tangible VR Book并非用于高密度文本显示,因此此功能目前似乎并不相关。


关于与媒体内容的交互(所有受访者都专注于视频),六名受访者建议自动视频再现。一些参与者明确提到在页面可见时自动播放,其他参与者建议仅在视频(页面)靠近用户时才播放。我们发现有趣的是,这位受访者建议进行这种交互,因为我们为门户实施了类似的交互。目前尚不清楚如何将这本书靠近或远离一个人的头脑可以推广到其他情况,例如视频播放,但将来可能会有所探索。一些受访者建议将自动再现与基于手势的手动命令相结合,以停止或向前或向后移动视频。一位受访者建议通过有趣的摇晃互动来更改视频,尽管不清楚“更改”的含义:“当页面打开时,视频开始。要停止视频,您可以触摸该页面。要更改视频,您可以摇动页面。晃动的相互作用似乎很有趣,因为它与我们用许多物理对象(包括书籍)执行的物理动作有关。然而,这种互动的意义并不是立竿见影的。虽然我们有时会摇晃实体书,同时将书的封面分开,以使我们知道书内某处的小纸片掉落,但这并不容易适用于其他情况。尽管如此,这是一个熟悉的手势,探索起来可能会很有趣。一些参与者提供了受触摸设备经验启发的建议。例如,通过触摸页面来手动控制视频以开始和停止,并按页面的特定区域以快进或向后。有趣的是,四位受访者建议使用语音命令。使用带有有形界面的语音命令起初似乎是矛盾的。但是,对于较大的虚拟图书,其中可用的物理页面不足以显示所有虚拟页面,则需要某种控件来访问其他虚拟页面。在这种情况下,语音输入可能是要考虑的替代方法。三位受访者建议使用眼动追踪,也许可以作为选择在有多个视频可用的情况下播放哪种视频的一种方式,并结合其他机制。


关于与超链接(门户)的互动,评论意见分散在几个方面。三位受访者建议使用语音命令作为激活门户的一种方式(“我们也许可以与单词互动?说输入...“)。一位受访者建议在进入门户时使用基于凝视的交互,另一位受访者建议在物理页面中使用带有凸起表面的特定区域,用于触觉提示,按下这些区域即可进入门户(“页面将具有与链接选项相对应的区域,物理页面可以有浮雕,让您感觉应该按下。一位受访者建议使用超链接作为在VR之外打开信息的一种方式(“链接可以打开你附近的一个显示内容的Web浏览器。

关于3D内容的使用,受访者提到了能够检查和操纵3D模型的重要性:“我可以从任何一侧查看3D模型,我选择如何移动模型”,“弹出模型,您可以放大,旋转或移开以显示其背后的内容”。一位受访者建议能够将3D模型从页面上删除(“可以自由探索对象。我想触摸呈现的对象并能够将它们从页面上取下“)。虽然我们还没有对这种交互进行原型设计,但它们可以在基于智能手机的VR中实现,并得到其他有形物体的支持,以充当抓取器或通过基于视觉的手部检测。


关于可用性的反馈

参与者在描绘的有形VR书原型中发现了一些问题。有些与布局或书中虚拟元素的视觉表示有关:有些页面有很多未使用的空间,视频太小,视频看起来不像视频,而更像静止图像,文本太小。受访者还指出,在检测使页面暂时消失的标记时存在技术问题。一位受访者提到背景(即360度场景)分散了注意力,但其他人提到了能够环顾四周的相关性。一位受访者认为,“必须以相同的姿势拿着一本书观看长视频可能不太舒服”。两位受访者认为,用于表示门户的球体并不直观:“我不能立即明白这个球体的用途,它不直观”。另一位受访者认为视觉元素更新速度不够快,这会导致分心。一位受访者对VR书的价值也非常挑剔:“我看不出这个解决方案比只看2D页面更有优势”。


受访者还提供了一些建议:能够 360° 观看视频,而不仅仅是在书页上;使用动画、更生动的 360° 背景;能够通过在“用户面前的较大浮动选项”中显示信息来“放大”书籍页面上的信息;不仅使用360°背景,而且让用户沉浸在可探索的建筑3D空间中;增加虚拟书籍的厚度
一些受访者还表达了他们对原型的评价(“这正是我正在寻找的,能够看到不再存在的东西”)并提出了进一步的考虑方面。例如,一位受访者强调了在360°环境中导航的挑战,并希望他能够与其他用户分享经验;另一个建议在图形冒险类型的游戏中使用VR Book;另一个建议合并语音命令。
总体印象
当被问及他们对填写问卷时看到的原型的一般看法时,20名受访者回答他们喜欢它(10名受访者)或非常喜欢(10名受访者)。只有一位受访者不喜欢Tangible VR Book原型。

7.2. 第二次用户研究

在第二个用户研究中,我们想评估页面内容导航技术。在在线问卷的第一部分中,我们询问了参与者的年龄和性别。在第二部分中,参与者可以观看演示内容导航技术的视频小插曲,并按偏
微信扫一扫分享资讯

热门话题
推荐文章