网站推广咋做的,1号店网上购物商城,phpstudy做正式网站,移动端h5页面开发流程弹出图#xff1a;扭曲时态数据可视化 摘要1 引言2 相关工作3 弹出图3.1 椭球模型3.1.1 水平轨迹3.1.2 垂直轨迹3.1.3 组合轨迹 3.2 视觉映射与交互 4 实施5 结果6 评估7 讨论8 结论和未来工作致谢参考文献 期刊: IEEE Trans. Vis. Comput. Graph.#xff08;发表日期: 2019扭曲时态数据可视化 摘要1 引言2 相关工作3 弹出图3.1 椭球模型3.1.1 水平轨迹3.1.2 垂直轨迹3.1.3 组合轨迹 3.2 视觉映射与交互 4 实施5 结果6 评估7 讨论8 结论和未来工作致谢参考文献 期刊: IEEE Trans. Vis. Comput. Graph.发表日期: 2019作者: Johanna Schmidt; Dominik Fleischmann; Bernhard Preim; Norbert Brändle; Gabriel Mistelbauer 摘要
时间数据可视化用于分析随时间变化的因变量其中时间是一个独立变量。由于需要向用户传达许多方面的信息例如时间和变量的变化可视化时间数据本质上是困难的。这是可视化中的一个重要主题已经设计了许多处理不同任务的可视化技术。在本文中我们提出了一种新颖的概念——弹出图popup-plots其中利用常见的3D旋转交互来浏览数据。这使用户能够从不同的角度查看数据而无需学习和适应新的交互概念。因此弹出图是一种新颖的可视化和与时间相关的因变量交互方法。我们通过根据时间弯曲空间来扩展2D图来加入时间信息。弯曲是基于球坐标系方法计算的其受到朝向图的视角的持续影响。因此可以从不同的角度观察图之间无缝切换提供了分析所表示数据不同方面的可能性。由于当前视角是通过数据的形状来表示的用户可以推断出当前查看的数据的哪一部分。时间信息被编码到可视化本身中类似于树的年轮。我们通过将其应用于来自两个不同领域的数据包括随时间的空间位置上的测量以及评估我们解决方案的可用性来演示我们的方法。
关键词时态数据、时间相关可视化、3D 绘图、椭球坐标系。
1 引言
时空数据集的可视化本质上是一项具有挑战性的任务[1]因为必须以视觉方式传达时间背景、随时间的变化以及因变量之间的关系。因此时间相关数据可视化 [2] 是一个新兴主题应用于许多不同领域。
在许多情况下时间数据集由在连续时间点获取的测量值组成。此类测量值可以是温度 [3]、交通量 [4]、医疗参数 [5] 或可能随时间变化的其他测量值。我们将此类测量称为属性。为了保持一致性并且为了能够比较随时间变化的值测量结果经常记录在固定的空间位置。我们将这些位置称为地标。作为此类数据集的一个示例我们可以想象一份温度值记录该记录是在一个月内每天使用固定温度计在特定空间位置测量的。地标、属性和时间的组合类似于 3D 数据集包含两个因变量属性和地标和自变量时间。不同的时间点可以定义为时间戳。
已经提出了几种可视化技术来直观地分析这种特定类型的数据。传统的二维图是一种广泛使用且众所周知的视觉表示形式可用于可视化地标位置处的属性。可以通过投影来包含时间信息例如使用颜色或线宽。另一种方法是将二维表示扩展到三维以显示时间。在这种情况下三个数据维度被映射到三个空间维度。在这种情况下最简单的表示是 3D 曲面图将属性值随时间变化连接起来。三维时间数据的另一个突出且广泛采用的视觉表示是时空立方体 [6]。最初它使用二维来显示二维空间信息例如地图数据使用第三维来可视化时间基本上沿着时间轴级联几个二维图[7]。时空立方体的概念还可用于显示随时间变化的地标处的属性其中每个数据维度由三个空间维度之一编码。
旋转、缩放和平移等交互是探索三维数据的重要概念。我们利用它们并在此提出了一种用于分析 3D 数据的 2.5D 图的新概念其中时间是交互的问题。从传统且众所周知的 2D 绘图开始通过使用 3D 旋转改变观察方向相继显示更多时间信息。这是通过使用椭球模型而不是笛卡尔坐标系来实现的。与现有技术相比椭圆体模型允许弯曲空间以查看时间。这种弯曲直接受到观看方向的影响而观看方向由用户控制。我们将这种新的可视化技术称为弹出图PP其灵感来自于著名的弹出贺卡。如果这样的卡片关闭它是平坦的不显示时间但是当打开时连续更多的结构时间变得可见。
弹出图PP使我们能够将各个方面固有地编码到可视化中并通过简单地改变观察方向来研究数据的不同方面。因此PP 允许在一个视图中检查数据而无需使用投影、多个视图或刷动和链接。由于空间弯曲可以通过查看可视化的形状来推断数据的当前查看方向。椭球模型在视觉上对时间信息进行编码类似于树的年轮其中内环类似于过去。此外解析椭球模型提供了不同观察方向之间的无缝过渡。表 1 概述了传统可视化技术与我们提出的 PP 之间的差异。
我们在第 2 节中概述了相关的最先进技术。第 3 节中描述的弹出图 (PP) 的新颖概念已作为基于 Web 的应用程序实现参见第 4 节 。为了证明弹出图PP的多功能性我们将它们应用于两个数据集一个来自医学另一个来自流量分析参见第 5 节。这项工作在第 6 节中进行评估并在第 7 节中进行讨论。我们在第 8 节中对未来的方面进行总结。
2 相关工作
为了涵盖我们工作的所有方面我们必须参考有关可视化的几个领域。最突出的是时间数据可视化和时空数据可视化其次是交互技术。由于我们的用例基于医疗数据和交通数据因此我们随后对这些学科中的数据可视化方法进行回顾。
时态数据可视化描述了允许分析时态数据集的可视化系统和技术。现有的时态数据可视化应用程序非常异构因为它们是为了解决不同领域内的各种任务而开发的。 Aigner 等人对时态数据可视化进行了全面的调查。 [2]。许多技术使用线性隐喻即时间线将时间可视化为连续变量。例如ThemeRiverHavre 等人[8]和堆叠图Byron 和 Wattenberg [9]沿水平时间轴绘制属性值。此类应用程序对于探索属性随时间的变化以及研究单个时间戳内属性的关系非常有用。这同样适用于沿线性时间轴以成对方式连接相关信息的弧线图[10]。循环图采用时间的水平表示来描绘单变量 [11] 和多变量 [12] 时间序列数据中的循环模式。托明斯基等人。 [13]使用线性表示在时间轮中显示时间但建议围绕时间轴以圆形布局排列属性。托明斯基等人。 [14]后来将该技术扩展到三个维度。
其他方法也使用第三维来编码可视化中的附加信息。 Timetunnel由 Akaishi 和 Okada [15] 提出以 3D 扇形方式围绕中央时间条定位 2D 绘图。流可视化中的隐喻可用于显示属性随时间的变化 [16]传达故事情节的演变 [17]或将属性解释为 3D 对象 [18] 以显示其时间进程。更复杂的结构例如 Noirhomme-Fraiture [19] 的变焦星可用于包含附加信息例如直方图以便对数据进行更详细的分析。
由于线性时间轴在较大数据集的情况下可能会消耗大量空间因此已经研究了径向布局以有效地传达时间信息空间。通过使用颜色[20]或分层方法[21]可以观察属性随时间的变化。韦伯等人。 [22]提出了一个图其中属性沿着显示时间进程的螺旋可视化。最近的方法采用更复杂的几何变换来显示时间信息。巴赫等人。 [23]使用基于曲线的布局来表示可视化中的时间。其他作者利用平行坐标并找到了通过合并时间信息来增强绘图的新方法。格伦德尔等人。 [24]提出了一个小部件来探索并行坐标图中的时间并比较两个连续轴之间的时间关系。约翰逊等人。 [25]使用深度线索来整合平行坐标中的时间。通过这种方式可视化可以在关注属性时揭示数据中的时间模式。
我们使用新颖的曲线布局来显示时间这取决于观察方向这意味着球形或椭球体模型。这不仅提供了以与传统和广泛采用的绘图相同的方式探索数据的可能性而且还提供了通过改变观看方向或更一般地通过交互来探索时间。此外不同数据视图之间的无缝转换可以评估一个视图内的时空关系。我们的方法类似于由Zhao等人提出的环图。 [26]将时间编码为环。通过显示与 2D 视图交织在一起的 3D 视图可以探索数据中的模式。然而环图不会根据视角而改变因此时空仍然是平坦的。
由于时间数据通常与空间位置相关因此这两个术语的组合导致时空数据的可视化[27]。我们提出的可视化技术也可以应用于一维时空数据集[28]。然后第一因变量表示空间例如沿路径的一维位置第二因变量定义在这些空间位置测量的属性。时空立方体是可视化此类数据的直观且广泛的概念[29]。作者描述了沿每个轴投影和展平的方法以及提取和转换操作。与我们提出的技术相关的操作是弯曲和展开。
与我们的概念的主要区别在于时空立方体考虑平坦时空空间和时间之间具有不连续的过渡。然而在时空数据的配置中[30]例如当将地理地图作为两个依赖属性时我们的方法将不会类似于令人满意的视觉表示。因此我们的方法不适用于完整分析这些数据。
交互技术支持对时空数据的理解。处理多维数据的典型方法是在多个视图中呈现数据的不同方面[31]。我们专门设计了我们的方法使用户可以在一个视图中直接与三维图进行交互以研究数据的不同方面。这是通过隐含时空椭球模型来实现的。空间折叠已经被其他方法所应用。埃尔姆奎斯特等人。 [32]提出了一种折叠空间以在探索过程中保留上下文和概览的技术。当空间弯曲将二维地图延伸到三维时人们会得到折叠空间范围的印象以及两点之间距离的概念。同样我们对空间进行变形以实现不同观看视角之间的无缝过渡。 van Wijk 和 Nuij [33] 描述了对地图上两点之间的行进距离进行编码的另一种方法。他们在过渡过程中使用了距离与相机速度和高度的非线性映射。
由于我们的 PP 根据观察方向延伸到三维我们还对数据点应用非线性椭圆体映射以实现平滑和无缝的过渡。与 Azuma 等人类似。 [34]我们建议根据需要更改可视化的表示但在我们的例子中取决于当前的观看方向。科尼哈等人。 [35]介绍了一种在多视图环境中研究曲线族的方法。对属性随时间的时间进展的分析也可以解释为研究一组曲线。我们提出的方法允许通过 3D 交互来研究属性值。
医疗应用程序以不同的方式利用时间和时空数据可视化。医学上的时间进展通常是指一名或多名患者的病史以研究模式[36]或事件[37]。在这种情况下事件带有时间戳但离散并且通常无法随着时间的推移在特定地标处连续监控。因此事件可视化并不直接适用于我们的时态数据类型。在其他情况下时空可视化技术用于描述测量数据的时间变化。 De ́ anBen 等人。 [38]使用多个视图来显示心血管动力学的时间进展。他们同时使用 2D 图形和 3D 渲染图像。曹等人。 [39]关注的是测量间隔并不总是在简单的线图中显示的事实。格拉瑟等人。 [40]使用平行坐标向三维的扩展来表达纵向灌注磁共振研究中的时间。在他们的可视化中可以清楚地识别描述肿瘤边界局部异质性的峰值。我们的方法可用于研究在局部感兴趣点进行的医学测量的时间进展。
交通数据包含多种不同的可能数据类型包括空间中移动的物体的采样位置以及汇总研究例如沿特定路线的物体数量。收集这些数据用于统计评估或实时监控交通状况[41]。时间是一个重要方面因为交通状况通常在一天或一年内变化很大。交通数据可视化的主要研究目标是通过提供合适的解决方案[28]如交互、聚合和内存管理方法来分析大量数据。还有其他方法专注于分析交通系统中特定路线沿线的参数。托明斯基等人。 [42]实现了时空墙用于分析随时间变化的轨迹的属性。格罗特尔等人。 [43]采用不同可视化技术即平行坐标和热图的组合来分析轨迹。我们的方法可用于可视化沿着预定义轨迹例如火车轨道或高速公路的属性的时间进程。
3 弹出图
弹出图 (PP) 描述了一种新颖的 2.5D 类型的图用于时态数据的可视化。我们使用 3D 椭球模型来代替笛卡尔坐标系来显示数据这在 3.1 节中有详细解释。 PP 通过根据当前观察方向连续添加时间信息来扩展传统的 2D 绘图。 PP 的概念允许我们在单一视图中查看数据并与之交互。
PP 可应用于由三个数据维度组成或可投影到三个数据维度的数据其中一维类似于时间。在本文中我们处理的 3D 数据集由由两个因变量属性、地标和一个自变量表示时间戳定义的数据点组成。椭球模型为每个数据点分配一个 3D 位置。因此PP 提供了一种在 3D 空间中绘制数据点的新颖概念其中 3D 旋转用作交互机制从不同角度研究数据。现有的可视化技术也适用于点图和线图可以用于增强视觉表示例如通过添加 viewcube [44]。由于 PP 的椭球模型主要描述数据点如何变换因此它不限于任何特定的可视化技术或应用领域。 3.2 节概述了数据的视觉表示和交互概念。
3.1 椭球模型
PP 采用椭圆体模型将数据点映射到 3D 位置。随后我们解释了数学背景并介绍了该模型的理论概念。我们用二次曲面来模拟时空例如椭球体和双曲面。在本节中我们使用球坐标表示法其中几何点由三元组 (r, θ, φ) 描述。我们进一步提出 PP 的内在和外在观点。内在视图显示从用户角度使用 PP 可视化的数据从而产生一个椭圆弯曲的坐标系其原点从笛卡尔 xy 平面连续向外移动。相反外部视图从固定的观察者角度展示了嵌入笛卡尔坐标系的转换后的数据。应该注意的是所有附图都是通过在矢量图形语言 Asymptote 中实现并程来实现的 [45]。
PP 中的主要交互概念是 3D 旋转。因此为用户提供了两个自由度 θ 和 φ分别类似于从左到右和从上到下的视角。不同的视角设置将导致数据以不同的方式可视化。同一数据点的所有可能的 3D 位置都被汇总为轨迹。水平观察方向由 θ 控制改变 θ 时生成的数据点的 3D 位置集合称为水平轨迹参见第 3.1.1 节。类似地φ 引导从上到下的观察方向因此我们将改变 φ 时生成的一组数据点 3D 位置称为垂直轨迹参见第 3.1.2 节。最初数据点的轨迹是针对两个视角分别确定的但随后组合成单个连续轨迹参见第 3.1.3 节。由于时间是沿着朝向观察者的正 z 轴编码的因此我们只考虑正半空间并使用 xy 平面剪切所有二次曲面。
3.1.1 水平轨迹 3.1.2 垂直轨迹 3.1.3 组合轨迹 3.2 视觉映射与交互
椭球模型根据观察方向定义 3D 数据点的位置。该模型确保不同观看视角之间的连续无缝过渡。因此PP 提供了一个在三个维度上显示数据的基本框架然后可以通过采用现有的可视化技术来丰富该框架。以最简单的形式我们建议在可视化中将数据点呈现为球体。我们进一步建议将同一时间的转换数据点连接到连接曲线例如通过使用 Catmull-Rom 样条线。随后对这些样条线进行等距采样并将获得的位置用于渲染。图 4 概述了这些提出的视觉映射策略。
PP 可视化会受到参数 λ 和 r 的影响。时间戳之间的距离由 λ 控制见图 5允许用户放大和缩小 PP。不同的 λ 设置也使得 PP 能够适应各种类型的数据集甚至是不同时间跨度的数据集。椭圆体模型的半径 r 定义了绘图的大小和可显示时间戳的数量即最大可显示过去请参见公式 17 和公式 30。
除了旋转之外我们还测试了进一步交互的可能性来分析数据。可以在可视化中显示网格线和标签参见图 4以更好地传达上下文信息。网格线的形状和位置也是根据PP模型计算的。由于当前的观看方向定义了可视化的形状因此还可以在不阅读标签或解释网格线的情况下解释 PP参见图 6。相反当使用时空立方体等传统技术时人们总是需要参考线索才能解释可视化。我们还添加了通过单击按钮快速选择预定义数据视角的可能性。这些视角之一是传统的 2D 图由 θ 0°、φ 0° 定义。另外两个视角是从顶部θ 0°φ 90°和从侧面θ 90°φ 0°查看数据。 PP 不限于这些预定义的设置其他预定义的视角可能有助于强调数据中的某些模式。我们还添加了通过单击各自的 3D 样条曲线来选择各个时间戳的可能性。然后所选时间戳的更多详细信息即日期和最小/最大属性值将显示在单独的窗口中。不同的时间戳可以通过其分配的类别颜色在视觉上区分。为了一般性我们没有包含任何进一步的类别语义。类别可以映射到数据中特定领域的语义组例如通过聚类识别。
PP 方法涵盖了时态数据可视化所需的许多方面表 1 中介绍
观看次数。 PP 只需要一个视图即可传达数据集的所有方面。数据的不同视图并不代表在单独窗口中显示的封装状态而是通过用户直接与数据交互来实现。 坐标系。数据点的位置根据PP椭球模型计算。可以识别属性值随时间显着变化的地标以及时间变化较小的地标。 维度。根据椭球模型PP 采用 2.5D 数据表示。可以通过 3D 旋转来实现对数据的进一步探索其中还包含时间。每次旋转都会揭示数据的不同方面。 时间探索。从侧面观察θ 90 且 φ 0时会显示属性的时间进程。可以看出随着时间的推移属性值是否持续增加或减少。当从顶部查看 PPθ 0 和 φ 90时会显示时间戳的数量和距离。 时间编码。时间戳根据树木的年轮进行编码过去的时间点位于内部。这种时间的循环编码可以非常快速地识别较旧和较新的时间戳。人们可以识别时间戳是否大部分是等距的或者它们之间是否存在较大的间隙。循环时间编码表现出固有的时间顺序。 过渡。 PP允许用户在3D空间中自由旋转。在旋转过程中PP 椭球模型保证了变换后的数据点位置的连续转变。与数据集交互时看不到跳跃效果。 方向。这解决了 PP 的一个非常重要的方面因为数据集的当前方向始终直接由可视化本身反映。这允许立即探索数据而无需任何额外的视觉提示例如方向立方体。 可理解性。由于 PP 会弯曲空间以显示时间因此可能需要一个初始适应阶段来理解该概念。尽管如此PP 提供了探索和解释数据的丰富可能性。
4 实施
PP 是使用 JavaScript 和 WebGL 进行渲染的基于 Web 的解决方案。 2D 数据集存储为 JSON 格式的文本文件。我们使用 ThreeJS (v. r84) [46] 来渲染并使用 JQuery (v. 3.2.0) [47] 来实现用户界面元素。我们的方法在配备 Intel Core i7 2.90GHz 处理器、16 GB RAM 和 NVIDIA GeForce GTX 670M 显卡的系统上进行了测试并在 Windows 8.1 64 位上使用网络浏览器 Firefoxv. 52.0.2。数据集的加载只需几毫秒并且交互是实时运行的。对于我们提出的两个用例该应用程序消耗了大约 300 MB参见图 7 和图 8。
5 结果
这项工作是由来自不同领域的两个用例推动的。两个用例的数据结构都适用于我们对包含两个因变量和自变量时间的 3D 数据集的定义。随后我们解释了如何使用 PP 来探索这些数据。
第一个用例属于医疗领域与称为主动脉夹层 (AD) 的血管疾病有关。通常在健康的血管中血液在单个流动通道内流动。在 AD 的情况下会形成几个其他流动通道导致容器直径和压力增加。由于这些通道并不是为了承受高血压而设计的它们最终往往会破裂这是一种致命的事件。血管直径是预测此类事件的重要指标。因此主动脉直径属性是在特定测量点标志处评估的。这些测量必须在多次患者检查时间戳中重复进行以监测患者的健康状况[48]。在我们的用例中检查了接受手术治疗以缩小主动脉直径的患者的数据集。 3D 数据集由十个时间戳组成这些时间戳是在七年的时间内采集的。主动脉直径是在主动脉沿线的 11 个标志处测量的。使用两个类别来识别手术干预之前蓝色和之后橙色的时间戳见图 7。
在中心标志处可以检查相当不同的直径值θ 0°φ 0°而在外部标志处直径随时间保持恒定。在手术干预之前可以看到最高直径值蓝色。当分析中包含时间时我们可以认识到直径的急剧增加是最近发生的θ 60°φ 60°直径随着时间的推移而增加。手术干预后立即对患者进行监测由非常靠近的蓝色和橙色时间戳表示。橙色时间戳还显示了中间区域直径的预期术后减小θ 30°φ 60°。当查看时间戳θ 0°φ 90°时可以清楚地看到患者接受了定期医疗监测但检查之间的距离不同。由于中心区域的直径值相当低两个时间戳描述的直径值不同于数据集的其余部分。可以看出这两个时间戳描述了过去发生的检查θ 30°φ 30°。图 7 中采用的矩阵视图也可能包含在医疗报告中以直观地传达时间和时间变化。
第二个用例与交通数据有关。在大城市的街道网络中有所谓的主动脉路线它们对于整体交通状况非常重要。这些路线可能是进出城市的高速公路或高速公路或者绕开城市以引导周围的交通。该用例的 3D 数据集包含沿着主动脉路线穿过大城市的高速公路行驶的车辆汽车和卡车数量。车辆数量属性在计数站地标自动记录。我们选择了 24 个记录代表 2014 年一天的 24 小时时间戳。我们的 PP 结果如图 8 所示。
数据中可以识别出两组θ 0°φ 0°其中一大组时间戳记录了相当高的流量计数而一组异常值由四个时间戳组成属性值较低。我们将车辆数量最多的时间戳标记为红色将离群值组的一个时间戳标记为青绿色。当旋转绘图查看时间时可以看到离群值组Outlier代表凌晨时段θ 60°φ 0°、θ 90°φ 0°并且θ 90°φ 30°。据报告晚高峰期间的交通量最高θ 90°φ 0°。从侧面查看数据早晚高峰时段清晰可见。还可以看出车辆数量在早上一小时内急剧增加但在傍晚和夜间时间缓慢减少。数据中的局部最大值表明特别是两个地标在高峰时段报告了高车辆数量两个峰值θ 0°φ 60°。该数据集包含一天中每小时的流量计数因此时间戳都是等距的θ 0°φ 90°。数据的中间视图θ 90°φ 90°揭示了一些地标的交通计数随时间的变化高度多样化的交通活动。车辆数量在夜间保持相当恒定但在白天发生变化。可以通过旋转 PP 来分析数据中的此类模式而无需创建额外的孤立视图。
这些用例展示了 PP 如何允许研究数据的不同方面。从传统的二维图θ 0°φ 0°开始通过旋转可视化来查看时间。当从左侧或右侧观察时例如θ 90°φ 0°连续时间戳与最小和最大属性值之间的距离是可见的。这些视图呈现了数据的时间发展时间按圆圈排列。在 PP 的顶部或底部视角例如θ 0°φ 90°中时间再次被描绘为圆圈并且地标的位置是可见的。这些视图中未描述属性值。 θ 和 φ 的其他值保证了不同视点之间的无缝过渡。
6 评估
我们进行了一项用户研究以评估 PP 在分析数据时的潜力。我们的研究包括来自不同领域的 15 名参与者如软件开发人员、放射技术专家、统计学家和计算机科学家。关于 3D 可视化参与者的专业水平八名受访者表示拥有丰富的经验四名受访者表示拥有一些经验三名受访者表示几乎没有经验。用户研究已以基于网络的形式实施。单个评估表的平均完成时间在 8 至 15 分钟之间。
我们的研究将 PP 与众所周知的时空立方体概念进行了比较。由于PP提出了一种新颖且创新的概念并不能立即与既定的接口标准相匹配因此早期阶段的评估很难设计[49]。因此我们特意以通用的方式设计了用户研究以防止评估偏向特定领域。在用户研究开始时每个参与者都会收到有关该主题的简短在线介绍其中包括一些如何解释 PP 和时空立方体的建议。在线介绍由一页内容组成其中包含描述 PP 主要特征的文本以及补充文本的插图其中使用人工数据集来绘制图表。由于用户研究是在线完成的因此用户可以花尽可能多的时间进行在线介绍。随后他们被要求完成三项任务
T1 从不同的观察方向识别数据。 T2 描述时间关系。 T3 识别数据中的异常值。
任务 T1 特别涉及方向和转换回想表 1。首先参与者必须跟踪视频序列中的数据峰值其中时空立方体和 PP 在三个维度上旋转。其次他们必须在数据峰值的最后位置放置一个圆形标记。任务 T2 解决时间编码问题回想表 1以便推断两个不同时间戳之间的时间关系。在可视化中两个时间戳用不同的颜色标记参与者被要求选择较早的时间戳。在任务 T3 中参与者被要求检测数据中的异常值。异常值之前被定义为与数据集的其余部分表现不同的数据点。参与者可以通过用鼠标绘制区域来标记异常值。只能绘制一个区域绘制新区域会自动删除旧区域。任务 T3 旨在测试是否可以以探索性方式使用 PP 来搜索数据中的重大变化或模式。
PP和时空立方体的所有任务都必须完成。我们为每个任务交替使用时空立方体和 PP 的顺序。对于任务 T2PP 和时空立方体使用了不同的颜色以避免任何相关性。对于每个给定的答案参与者必须按照 11 点李克特量表对自己的信心进行评分。该研究的实施方式是从可视化中省略参考尺度例如轴标签以最纯粹的形式比较两种可视化。对于 PP仅将 2D 图的平面绘制为线框对于时空立方体仅将周围的立方体绘制为线框。通过这种配置我们测试了参与者是否能够正确解释 PP 可视化的椭圆体形状即使在没有网格线和标签支持的情况下也是如此。
我们使用不同的人工创建的 3D 数据集进行用户研究。对于任务 T1我们生成了一个与医疗用例类似的 3D 数据集参见第 5 节具有非等距时间戳和九个地标。在两个地标处属性值随着时间的推移而增加。对于任务 T2 和 T3我们创建了一个与交通用例类似的 3D 数据集参见第 5 节具有等距时间戳和 10 个地标。该数据集包含两个簇随着时间的推移一个簇的属性值较低另一个簇的属性值较高。
通过对覆盖数据峰值最终位置的标记进行计数来计算命中率和未命中率来评估任务 T1参见图 9。我们遇到的时空立方体的命中率为 9而未命中率为 6。PP 的命中率为 14未命中率为 1。标记位置如图 9 所示。参与者较少与 PP (9.60 ± 1.06) 相比使用时空立方体 (8.67 ± 2.53) 时对放置标记更有信心。造成这种情况的原因之一可能是 PP 的无缝过渡使参与者能够更好地在视觉上跟踪峰值。第一项任务的结果表明所有参与者都能够正确解释 PP 的弯曲时空表示并在旋转绘图时正确遵循无缝过渡。
在任务 T2 中见图 10七名参与者进行了猜测正确率 43%八名参与者选择了“我不知道”时空立方体。出现这种结果的原因可能是时空立方体没有最纯粹形式的时间编码这得到了置信率 (6.80 ± 2.83) 的支持。对于 PP 可视化14 名参与者 (93%) 正确选择了较早的时间戳只有 1 名参与者 (7%) 选择了错误的时间戳参与者也非常有信心9.73 ± 0.59。 PP 的结果表明即使没有标签或网格线参与者也能够正确地将时间的视觉表示解释为环。因此PP 的概念似乎很容易理解即使对于还不熟悉它的用户来说也是如此。
对于任务 T3参见图 11我们计算了标记区域的边界框和数据中簇的边界框。准确度定义为标记区域与正确离群区域相比的 Jaccard 指数 [50] 的平均值。时空立方体的结果为 (0.54 ± 0.29)PP 的结果为 (0.66 ± 0.15)。并非所有参与者都能正确回答并且在某些情况下参与者选择的区域完全超出了实际异常值区域两个用于时空立方体一个用于 PP。时空立方体 (6.53 ± 3.20) 和 PP (7.40 ± 3.40) 的置信率支持了这一相当平均的结果。然而结果表明PP 可以在探索性环境中使用以搜索数据中有趣的模式。
我们通过将参与者分为两组来进一步评估任务 T1-3 的结果。第一组 (G1) 由已经熟悉 3D 可视化特别是时空立方体的人员组成8 名参与者。相比之下第二组 (G2) 包括没有任何 3D 可视化经验的参与者7 名参与者。 G1 组的参与者对所有三项任务的答案表现出稍高的信心例如G1 组的 PP 为 (5.33 ± 3.53)T1 中的时空立方体为 (5.13 ± 3.44)而 G1 组的参与者则为 (4.27 ± 3.58)。对于 PP对于 G2 组的 T1 中的时空立方体为 (3.53 ± 3.62)。可以看到使用 PP 时置信度的小效应量Cohen’s d [51]为 0.30而在 T1 中使用时空立方体时置信度的效应量小为 0.45。这两组之间的结果没有显着差异。例如任务 T3 的结果对于 G1 组来说PP 为0.84±0.20时空立方体为0.79±0.31PP 为0.82±0.21时空立方体为0.74±0.32。 G2组的时间立方体。 PP 的 0.10 和 0.16 的非常小的效应量证实了这一点。可以推断即使用户不熟悉 3D 可视化也能够正确解释数据并完成简单但通用的任务。
完成任务 T1-3 后我们要求参与者提供有关 PP 某些特性的定性反馈回想表 1同样按照 11 分李克特量表进行评分。 PP 的环形时间编码被评为有用 (8.07 ± 1.67) 且易于解释 (7.80 ± 1.90)。参与者认为无缝过渡是有用的 (7.47 ± 2.17) 和可解释的 (7.00 ± 2.90)。他们还表示无缝过渡支持数据探索 (7.33 ± 1.95) 和对时间背景的理解 (7.80 ± 1.97)。参与者进一步报告说“交互/视图转换看起来非常直观”并且“树木年轮的隐喻让我们很容易记住时间维度”。当被问及他们喜欢的功能时他们回答“能够旋转它们并看到无缝过渡这可以更好地理解数据的时间维度”。他们进一步认为PP“观看起来很有趣”并提供“有趣的可能性”。当被问及其他应用场景时与会者提到PP可以用于“行人计数、运动数据”、“心电图、脑电图、股票数据实时可视化”以及“PP可以应用于任何类型的数据测量” 。
7 讨论
PP 提供了一种以 3D 方式可视化时态数据的新技术。我们可以证明通过 PP我们完全能够根据自变量时间探索因变量。属性值的连续和突然变化都清晰可见。通过采用椭圆体模型进行渲染我们可以在一个视图中显示数据而时间就是交互的问题。
基于这种新方法可以应用不同的现有视觉映射技术来增强视觉印象并帮助用户分析数据。在本文中我们将数据点渲染为球体并用样条线连接具有相同时间戳的数据点。根据应用程序领域其他可视化技术可能更合适。为了说明这一点我们测试了另一种类型的视觉映射其中我们还使用样条线连接了相同地标的数据点参见图 12。我们还可以想象包含特定领域知识的方法例如在医疗用例中可以通过 2D 切片图像来丰富 PP。特定领域的知识还可以包括突出显示时间和属性的关键阈值。
我们的方法也有一些局限性。首先PP 仅限于 3D 数据集其中一维类似于时间。在时空数据的某些配置中[30]例如当将地理地图作为两个依赖属性时我们的方法可能不像令人满意的视觉表示。因此我们的方法不适用于完整分析这些数据。
其次目前并程的输入数据必须具有一定的结构。数据需要完整具有所有时间戳中每个地标的属性值。在某些应用中情况可能并非如此例如由于传感器数据丢失。这个问题可以通过在数据点之间进行插值来解决并在可视化中直观地突出显示这些插值。还假设类似于空间地标的数据维度是离散的。如果空间是连续的PP 必须以 3D 方式显示表面。我们在论文中没有遇到这样的数据集但这是未来探索的一个有趣的方向。
第三人类只能评估屏幕上的一定量的信息。与平行坐标 [52] 或图形 [53] 等其他可视化技术类似如果必须显示大量数据PP 可能会变得混乱。由于视觉混乱是可视化中的一个突出主题[54]其解决方案可以直接转移到 PP 以增强其视觉表示。为了证明这一点图 13 展示了使用 PP 渲染的大型数据集其中通过根据时间更改样条线的不透明度来强调一些时间戳。我们使用具有 120 个时间戳的数据集来渲染 PP参数设置为 λ 0.34 和 r 420。一个有趣的挑战是根据观看方向正确调整杂波减少技术因为它们在观看时可能不适合沿另一个轴的数据。或者可以使用聚类或数据降维等预处理步骤来减少要显示的数据量。
PP 提供不同数据视图之间的无缝转换。尽管这些转换可能会给熟悉新可视化技术的用户带来额外的认知负担但用户研究中 T1 的结果表明无缝转换很容易被用户理解。另一方面PP 概念使用户能够在单一视图中分析数据。从这个意义上说PP 使用户免于保留对数据的几种不同视图的概述以及正确解释刷动和链接技术的额外负担。
8 结论和未来工作
在本文中我们提出了弹出图 (PP)这是一种可视化包含两个因变量和自变量时间的 3D 数据集的方法。在这种情况下两个因变量被映射到地标和属性其中属性是特定于域的测量而地标与空间位置相关。 PP 形成了一种新颖的映射技术可以在三个维度上可视化数据。 PP 通过使用椭球模型弯曲空间将传统的二维空间图和属性扩展到时间维度。时间的可视化是一个交互问题由用户指定的 3D 旋转控制。根据 PP 的观察方向可以研究数据的不同方面。椭球模型保证旋转过程中的平滑过渡。我们将我们的技术应用于医学和交通分析的两个数据集以评估我们方法的多功能性。
对于未来的工作我们希望增强我们方法的数据分析功能。不同的视角可用于研究数据的不同方面例如θ 0°、φ 0° 显示时间戳。将来我们希望自动从数据中提取预定义的查看方向这可能会让用户感兴趣因为它们显示了数据中的某些模式。这需要评估 3D 数据集的模式识别算法并估计这些模式最可见的观看方向。模式也可以从绘图的拓扑中得出这与 Lukasczyk 等人的工作类似。 [55]他使用 Reeb 图的拓扑来检测轨迹数据中的热点。 PP 的可视化会受到两个参数 λ 和 r 的影响。这些参数能够可视化具有不同时间粒度的数据集。将来研究自动查找给定数据集的最佳参数值的技术将会很有趣。
致谢
医疗数据集由斯坦福大学医学院提供交通数据集由 AIT Austrian Institute of Technology GmbH 提供。作者感谢 Rosa Mistelbauer 对发展 PP 概念理论的支持。
参考文献