外汇平台网站开发需求说明,wordpress 缓存文件夹,上海企业公示网,浙江网站建设技术公司ICDE 2023
1 intro
1.1 背景
轨迹相似性#xff0c;可以分为两类 启发式度量 根据手工制定的规则#xff0c;找到两条轨迹之间基于点的匹配学习式度量 通过计算轨迹嵌入之间的距离来预测相似性值上述两种度量的挑战#xff1a; 无效性#xff1a; 具有不同采样率或含有噪…ICDE 2023
1 intro
1.1 背景
轨迹相似性可以分为两类 启发式度量 根据手工制定的规则找到两条轨迹之间基于点的匹配学习式度量 通过计算轨迹嵌入之间的距离来预测相似性值上述两种度量的挑战 无效性 具有不同采样率或含有噪声的轨迹会降低现有度量的有效性 使用手工制定规则的启发式度量容易受到低质量轨迹的错误影响学习式度量主要采用并非最初为轨迹数据设计的深度学习模型可能无法捕捉轨迹点之间以及相似轨迹之间的长空间相关性图1显示了Porto出租车轨迹数据集上的3-最近邻查询结果 使用t2vec图1b获得的查询结果远离查询轨迹由Hausdorff获得的结果更接近查询轨迹图1a但不如论文的TrajCL方法图1c所获得的那样接近低效
1.2 本文贡献
提出了TrajCL一种基于对比学习的轨迹相似性度量 首先利用四种轨迹增强方法来为每个训练样本生成具有不同特征的多样化轨迹变体view、 点移位、点屏蔽、轨迹截断和轨迹简化然后提出的DualSTB编码器将增强的轨迹嵌入以捕捉轨迹之间的空间距离相关性 将轨迹的结构和空间特征都编码到其学习到的嵌入中提供了轨迹的粗粒度和细粒度位置信息之后简单地将两条轨迹的相似性计算为它们的嵌入之间的L1距离
2 方法
2.1 问题描述
将轨迹 T 视为点的序列记录某实体的运动的离散位置表示为T[p1,p2,...,p∣T∣]其中pi 是 T 上的第 i 个点由其在欧几里得空间中的坐标表示即 pi(xi,yi) 问题陈述给定一组轨迹我们的目标是学习一个轨迹编码器F:T→h将轨迹 T 映射到 d 维嵌入向量h∈Rd。两条轨迹学习到的嵌入之间的距离应该与两条轨迹之间的相似性负相关论文使用L1距离 2.2 数据增强 2.3 Encoder Backbone
人们可能会将结构特征和空间特征这两种特征类型合并成一种以适应 MSM 的输入结构。然而这样的方法在经验上被证明是较差的
DualMSM 允许学习每种输入特征类型的独占注意力系数然后进行自适应集成
——确保了基于不同类型特征的点之间的相关性被独立建模
——自适应集成使得注意力机制在组合不同类型的输入特征时更为灵活 没有任何递归结构所以可以很轻松地被GPU加速
3 实验
3. 1 实验数据 波尔图——从 2013 年 7 月到 2014 年 6 月之间在葡萄牙波尔图的 170 万条出租车轨迹西安——2018 年 10 月的前两周来自中国西安的 210 万条网约车轨迹德国——从 2006 年到 2013 年之间在德国提交的 170.7 千条用户轨迹 过滤掉位于城市或国家区域之外的轨迹或包含少于 20 个点或多于 200 个点的轨迹来对每个数据集进行预处理预处理后的数据集在表 II 中进行了总结 我们使用 Adam 优化器训练 TrajCL并最多进行 20 个 epoch如果连续 5 个 epoch 没有改善损失我们将提前停止。学习率初始化为 0.001每 5 个 epoch 减半一次。 代码 https://github.com/changyanchuan/TrajCL
3.2 结果