开源数据集是大势所趋

作为自动驾驶行业的领头羊,Waymo也在去年发布了自己的开源数据集Waymo Open Dataset。该数据集包含20万帧画面、1200万条3D标注和120万条2D注释。Waymo希望自家的数据集能够帮助研发者在2D和3D感知、场景理解、行为预测等方面取得进展,从而不断提高自动驾驶汽车的性能,并促进计算机视觉和机器人等其他相关领域的应用。

博猫官网捕鱼游戏
博猫官网捕鱼游戏

在Waymo发布开源数据集之前,Cruise、百度、Uber、Aptiv等处于领先梯队的自动驾驶公司都已发布了自己的开源数据集。而在Waymo发布开源数据集之后,又有多家公司发布了自动驾驶开源数据集,例如Lyft、福特、奥迪等。通观自动驾驶开源数据集的发展历程可见,在PandaSet发布之前,开源数据集基本都是自动驾驶公司的“专利”。而禾赛科技的“入局”,则以传感器企业的特殊视角为这一领域添上了一抹亮色,同时也让人们看到了传感器企业在自动驾驶赛场上的更多可能性。

博猫官网真人视讯
博猫官网真人视讯

事实上,相比于那些自动驾驶“头部玩家”,传感器企业在开源数据集中的表现并不逊色。以PandaSet为例,该数据集就拥有其他很多数据集没有的优势:采集数据的传感器业内顶尖,采集场景多样化,采集信息密度高,数据标注详尽准确并进行了精细的语义分割。还有非常重要的一点就是,PandaSet面向学术及商业应用均完全开源免费——不像很多开源数据集其实是有商用限制的。不过,PandaSet也有其局限性,例如:总的场景量和数据量均不够大,缺少不同天气状况下的数据,缺少短距激光雷达数据。

发表评论

电子邮件地址不会被公开。 必填项已用*标注