车路协同系统是基于无线通信,传感器探测等技术获取车辆和道路信息,通过车车通信(V2V),车路通信(V2I)实现信息交互和共享,从而实现车辆和路测设备之间的协调,实现优化使用道路资源,提高交通安全,缓解拥堵等目标。实现车路协同所需的硬件一般可分为车端设备和路端设备。车端设备OBU(OnBorad Unit),主要负责与路端的通信,OBU还需要和车端的ADAS域控制器进行数据交互。路端设备RSU(RoadSide Unit),主要负责与车端OBU通信,另外还包含摄像头毫米波雷达激光雷达等感知设备,及数据处理所需的高性能计算单元。路端感知所使用的技术与自动驾驶车端所使用的技术类似,如使用深度学习,点云处理,多传感器融合等技术。

1、NGSIM

做自动驾驶或者图像处理的小伙伴一定很熟悉KITTI数据集。KITTI数据集的数据采集平台装配有2个灰度摄像机,2个彩色摄像机,一个Velodyne 64线3D激光雷达,4个光学镜头,以及1个GPS导航系统。所有传感器的数据需要进行坐标变化,最后统一转化到车载坐标系,当然“视角”都是基于车辆的。

图1

如果做车路协同路端的研究,就必然需要路端“视角”的数据集,基于车端采集的数据集便不适用。目前来看,行业内此类公开数据集较少。笔者最近发现一个很适合做车路协同方向研究的数据集——NGSIM。

NGSIM 数据集是由研究人员通过一个叫做"Next Generation Simulation"的项目收集来的。该数据集覆盖了结构化道路的路口,高速上下闸道等车路协同研究的热点区域。该项目的研究人员对原始的视频信息做了后处理,生成了交通流中每辆车的行驶轨迹数据。数据集采集于美国的四个不同地区,分别是加州南向的US 101号公路,加州洛杉矶的Lankershim Boulevard地图, 加州埃默里维尔的东向的 I-80号公路,以及佐治亚州亚特拉大的Peachtree Street,下面介绍其中的两个区域,这两个区域也是车路协同中经常研究的场景。

2、路口通行场景

图2

图2是Lankershim Boulevard地区的道路地图。该区域道路长约1600英尺(约487.7米),包含4个带有交通信号灯的路口,每个方向的道路包含3或者4条车道。摄像头采集到的原始视频数据时常约9个小时,分为早晚两个高峰录制。数据收集系统对视频中的车辆进行了感知和跟踪,如果跟踪精度和准度符合预期,则直接生成车辆运动轨迹点,并保存到数据库,否则需要进行人工修正之后再次保存。区域内车辆的轨迹点的保存周期为100ms(10Hz)。

为方便分类及过滤轨迹数据,需要对车辆的运动轨迹与道路的相对关系进行描述。下面定义了这些描述的关键词,使用这些关键词可以很方便的对每个路口,车道,区域等进行编号分类。

关键词

含义

Origin

驶入研究区域的路口,编号从101到111。即表明车辆是从哪个路口驶入这片区域的

Destination

驶离研究区域的路口,编号从201到211。即表明车辆是从哪个路口驶离这片区域的

Intersection

十字路口。此片区域共包含4个路口,从南到北依次编号为1,2,3,4

Section

分割区域编号。此研究区域被4个路口分割成5个小区域。

Lane

道路中车道的编号。具体编号由上图所示。

有了上述的这些定义,可以很方便的将任意一辆驶入或者驶离该区域的车辆轨迹描述出来。

3、匝道汇入汇出场景

图3所示的这条公路是加州洛杉矶南北走向的交通大动脉——U.S. Highway 101。紧邻着U. S. Highway 101 和 Lankershim Boulevard交互处,有一幢36层高的建筑,Universal City Plaza, 采集数据的摄像头就安装在这幢建筑上。摄像头采集数据区域长度约为2100英尺(约640米),包含五条车道(1~5号车道)。6号车道两端连接7号和8号车道,分别为匝道汇入车道和汇出车道。同样地,车辆轨迹点的保存周期为100ms (10Hz)。

图 3

4、NGSIM 车辆轨迹数据类型

NGSIM数据集可导出为csv格式表单。该表单第一行字段含义如下表所示。需要注意的是,笔者并没有罗列全部的字段,只罗列了常用的,且不太好理解的加以解释。

字段

说明

备注

Vehicle_ID

车辆编号

有可能会出现重复

Frame_ID

数据帧号

与该路径点产生的时间相关

Total_Frame

数据总帧

某辆车被跟踪的生命周期(存在长度)

Global_Time

UTC时间

13位的标准UTC时间,精确到ms

Local_X/ Local_Y

采集区域坐标系的X/Y值

局部坐标系下的位置值,常用

v_Vel / v_Acc

车辆的行进方向的速度和加速度

即运动方向的速度及加速度

Lane_ID

车辆所在的车道编号

见图2和图3中的1,2,3等

O_Zone

驶入研究区域的路口,编号从101到111。

表明车辆是从哪个路口驶入这片区域的

D_Zone

驶离研究区域的路口,编号从201到211。

表明车辆是从哪个路口驶离这片区域的

Int_ID

路口编号

共四个,由南向北序号递增

5、数据集使用示例

假设我们需要研究车辆通过路口可能的运动模式(motion pattern), 那么首先需要对原始的数据根据不同的运动模式进行分类。未分类前,将所有通过该路口的车辆轨迹全部显示出来,如图4所示。

图4

结合实际场景和生活常识,考虑车辆可能行进的方向,可将上图中的轨迹分类成8类运动模式。然后使用一些聚类算法,如K-MEANS等,可以对这些轨迹进行分类,为后面的模型训练做数据准备。图5展示了使用K-MEANS对原始轨迹进行分类后的结果,不同的颜色代表不同的运动模式。

图5

得到根据运动模式而分类的数据后,可以用这些分类好的数据分别建立模型,调试轨迹预测,规划等算法。

6、干货来了,下载地址

数据集可直接在其网站首页下载,也可在线导出csv格式文件。4个数据集除包含原始轨迹信息外,还包含数据采集区域道路信息,车流分析报告等文件,下图6红框内的压缩文件,即包含了上述的这些文件。

下载地址:

https://data.transportation.gov/Automobiles/Next-Generation-Simulation-NGSIM-Vehicle-Trajector/8ect-6jqj

图6