轨迹数据管理、分析和学习调查
.介绍轨迹数据附加信息γ可以包含在基于位置服务生成的轨迹T中的每个点p上例如,文本数据可以整合到社交网络签到数据或旅行博客的轨迹中,并被称为空间-文本轨迹[19,87]、语义轨迹[193]或符号轨迹[73]。
公共轨迹数据集:人类、车辆(汽车、卡车、火车、公共汽车、有轨电车等)、其他
轨迹数据收集、管理、代表性应用和广泛使用的深度学习模型
数据管理和分析系统有几个基本组成部分:
数据清洗
数据存储
相似性度量
索引化
查询和分析
下游任务与应用
调查内容:
可伸缩性与数据存储
处理流水线分解
代表性应用
深度轨迹学习
未来轨迹数据管理挑战展望
2. 管理系统和预处理2.1 轨迹表示与存储
2.2 轨迹预处理轨迹清洗
数据分割[26]、校准[147]和丰富[13]是轨迹数据最常用的三种清洗技术
轨迹压缩
现有的轨迹压缩技术可分为基于简化的和基于路网的两类。剔除多余点是采样率较高时常用的空间约简方法,通常称为轨迹化简
可以使用道路网络来实现更好的压缩
字符串压缩技术[184]可以直接用于轨迹数据,并且使用这些技术也可以简单地存储任何时间信息。
路网匹配
利用道路网络,地图匹配 ...
轨迹建模与应用的深度生成模型
轨迹建模与应用的深度生成模型1. 介绍挑战:(1)现实世界的轨迹很难建模,因为它们的空间路径分布是时变的。通常采用路网兴趣点(POIs)、天气信息等外部时空特征来增强轨迹建模。然而,现有的轨迹工作忽略了对捕获轨迹路径模式至关重要的底层路网属性(例如,道路类型和道路方向)。道路属性是密切相关的,因此通过图1中不同道路类型上的轨迹空间分布实例,建立轨迹分布模型是十分重要的。
(2)很难对现实世界的轨迹进行建模,因为轨迹数据相对于路线边缘的数量是高维的,并且在路网上分布非常倾斜。虽然目前流行的时空图卷积模型对于常见的图节点或边属性建模是有效的,但对于高维且倾斜的轨迹建模是不够有效的
为了解决上述挑战,我们提出了一个名为MTNet的深度生成模型,通过充分利用底层道路属性,有效地建模高维但倾斜的轨迹数据。首先,我们从OpenStreetMap中收集了重要的道路属性,并将其编码为道路元知识,以增强轨迹的时空表示,解决C1挑战。
其次,MTNet采用基于知识的元学习模块,通过从倾斜轨迹中学习广义轨迹分布模式,逐步生成高维轨迹,以解决C2挑战。
贡献:(1)利用时空信息形式化地图匹配轨迹建模问题,并 ...
Trajectory Paper
Paper[TOC]
Trajectory Representation Learning2023Self-supervised Trajectory Representation Learning with Temporal Regularities and Travel Semantics. Jiawei Jiang(BUAA), Dayan Pan, Houxing Ren, Xiaohan Jiang, Chao Li, Jingyuan Wang. ICDE 2023. paper code
2022Weakly-supervised Temporal Path Representation Learning with Contrastive Curriculum Learning. Sean Bin Yang, Chenjuan Guo, Jilin Hu, Bin Yang, Jian Tang, Christian S. Jensen. ICDE 2022. paper code
Jointly Contrastive Representation Learning o ...
Weakly-supervised Temporal Path Representation Learning with Contrastive Curriculum Learning
Weakly-supervised Temporal Path Representation Learning with Contrastive Curriculum Learning动机在这种情况下,必须学习通用的时间路径表征(TPRs),同时考虑空间和时间的相关性,并能用于不同的应用,即下游任务。现有的方法无法实现这一目标,因为(1)监督方法在训练时需要大量特定任务的标签,因此无法将获得的TPR推广到其他任务中;(2)尽管无监督方法可以学习通用表征,但它们忽略了时间方面,导致了次优的结果。为了应对现有解决方案的局限性,我们提出了一个弱监督的对比学习模型。
下游任务: 旅行时间估计、路径排名和路径推荐
贡献提出了时间路径表示学习问题。
提出了一个弱监督、对比性的模型(基本框架)来学习考虑到时间信息的通用路径表征。
将课程学习整合到弱监督对比模型中,以进一步增强所学到的时间路径表征,从而产生高级框架。
定义一个道路网络被定义为一个有向图G=(V,E),其中V是一组代表交叉点的顶点vi,E⊂V×V是一组代表边的边ei=(vj,vk)
一个时间路径由tp=(p,t)
问题定义
给定一组时间 ...
Trajectory Representation Learning Based on Road Network Partition for Similarity Computation
Trajectory Representation Learning Based on Road Network Partition for Similarity Computation现有的轨迹表示学习工作要么使用网格对轨迹点进行聚类,要么需要道路网络类型等外部信息,这在查询精度和适用场景方面都不够好。
提出了一种新的基于分区的表示学习框架PT2vec,该框架利用底层道路段进行相似性计算,而不需要额外的信息。为了减少单词的数量并确保两个空间相似的轨迹在潜在特征空间中具有紧密的嵌入,我们将网络划分为多个子网络,每个子网络由一个单词表示。然后采用基于gru的seq2seq模型进行词嵌入,并设计了基于空间特征和拓扑约束的损失函数
贡献点
提出了一种道路网络约束轨迹表示学习框架,该框架利用底层道路进行相似性计算,不需要额外的信息。
提出了一种新的基于seq2seq的模型和基于PT-Gtree索引的高效相似度查询算法。
提出了一个考虑轨迹空间特征和路网拓扑约束的损失函数来学习轨迹的表示
问题定义主要问题给定一组路网约束的轨迹数据,我们的目标是为每条轨迹T学习一个表示v∈Rd (d为欧氏空间维数 ...
Debiased Contrastive Learning for Sequential Recommendation
Debiased Contrastive Learning for Sequential Recommendation 用于序列推荐的去偏差对比学习
https://doi.org/10.1145/3543507.3583361
In Proceedings of the ACM Web Conference 2023 (WWW’23), April
https://zhuanlan.zhihu.com/p/623265031
动机
认为当前基于cl的方法在解决流行偏见和用户一致性和实际兴趣的分离方面存在局限性。
提出了一种新的推荐的去偏见对比学习范式(DCRec),该范式通过自适应的一致性感知增强将顺序模式编码与全局协作关系建模相结合。该解决方案旨在解决推荐系统中的流行偏见问题。我们的去偏见对比学习框架有效地捕获了序列内的项目转换模式和跨序列用户之间的依赖关系。
贡献点
在稀疏和有噪声的用户序列数据中解决流行偏差问题的重要性,通过一种自适应的方式提取自监督信号,分离用户一致性和推荐的实际兴趣。
提出了一种新的推荐模型,称为DCRec,该模型通过多通道一致性加权网络解决了用户序列数据中 ...
Road Network Paper
Paper[TOC]
2022JournalA Multiview Representation Learning Framework for Large-Scale Urban Road Networks. Kaiqi Chen(Central South University), Guowei Chu, Kaiyuan Lei, Yan Shi, Min Deng. Applied Sciences 2022. paper
2021ConferenceRobust Road Network Representation Learning: When Traffic Patterns Meet Traveling Semantics. Yile Chen(NTU), Xiucheng Li, Gao Cong, Zhifeng Bao, Cheng Long, Yiding Liu, Arun Kumar Chandran, Richard Ellison. CIKM 2021. paper
JournalOn Representation Learning for Road Net ...
Mining dynamic preferences from geographical and interactive correlations for next POI recommendation
Mining dynamic preferences from geographical and interactive correlations for next POI recommendation介绍提出了一个名为MPGI(从地理和交互相关性中挖掘偏好)的新框架,用于下一个POI推荐。具体而言,我们首先设计了一个POI相关建模层,以捕获所有POI对之间的地理距离和交互相关性。然后,我们将来自高度相关POI的相关信号融合到目标POI中,以获得高质量的POI表示。此外,对于用户长期和短期偏好建模,我们提出了位置感知注意单元和注意网络,以动态选择签入轨迹中最有价值的信息。
存在的问题以往的工作大多只捕捉用户独立签入序列中连续访问的poi之间的过渡距离。由于POI在地理上与多个其他POI相邻,因此POI之间的地理相邻关系不能完全捕获。此外,POI之间的协作关系在基于协同过滤的模型[16]中得到了验证,但在接下来的POI推荐中很少被考虑。在实际场景中,poi之间的相关性相当复杂。
人们通常会连续访问地理上相邻的poi。
大多数现有模型仅基于最近几次签到来捕捉用户的短期偏好[12,19]。然 ...
Learning the Evolutionary and Multi-scale Graph Structure for Multivariate Time Series Forecasting
Learning the Evolutionary and Multi-scale Graph Structure for Multivariate Time Series Forecasting摘要为了使图神经网络具有灵活实用的图结构,本文研究了如何对时间序列的演化和多尺度相互作用进行建模。特别地,我们首先提供了一个与扩展卷积相配合的层次图结构来捕获时间序列之间的尺度特定相关性。然后,以递归的方式构造一系列邻接矩阵来表示每一层的演化相关性。并通过统一的神经网络集成上述各部分,得到最终的预测结果。通过这种方式,我们可以同时捕获成对的相关性和时间依赖性。最后,在单步和多步预测任务上的实验证明了我们的方法比现有方法的优越性。
1. 介绍挑战
进化图结构不仅受当前输入的影响,而且在前一个时间步上与自身有很强的相关性。循环施工方式很少被讨论。
通过已有的自学习方法生成每个时间步的图结构来建模演化,会带来过多的参数,导致模型收敛困难。
捕获节点之间特定于比例的图结构是一项艰巨的工作,因为它背后有过多的信息和混乱的关系。
为了应对上述挑战,我们提出了一种新的深度学习框架——进化多尺度图神经网络 ...
Learning Graph-based Disentangled Representations for Next POI Recommendation
Learning Graph-based Disentangled Representations for Next POI Recommendation1. Introduction首先简单理解disentangled representation(解离化表示)的相关概念:解离化旨在对数据变化因素进行建模,是指将embedding拆分成不同维度,使得每一个维度可以代表一种语义。
存在问题
(1)第一,POI对用户转变的各种潜在影响没有得到有效的分解。
例如用户u1去l3的主要原因是个人偏好,尽管l3距离他当前的位置l1较远。另外一方面,用户u2更关注l3本身的作用(例如为餐厅),并且更关心距离。然而现有方法大多专注于黑盒模型的训练,将这些因素忽略了。
(2)其次,在以往的大多数方法中,POI 的基于距离的影响也过于简化了。
例如l3和l4作用相同,l4甚至距离ll2更近,但或许由于物理因素的影响(例如河流),用户还是选择了l3。因此,POI 之间的距离影响可能包含多种因素,仅仅基于距离的表示并不合理。
论文专注于对 POI 进行更好地表征,提出了一个新的 Disentangled ...