11 月 22 日恰逢小雪,北方城市大多已经开始供暖,一同而来的还有冬天的雾霾,口罩、棉衣等过冬装备开始涌上街头。位于祖国最南端的海南岛却是另一番景象,虽然早已入冬,但受低纬度影响,这里依然光热充足,沙滩、海浪什么都没少。
相比已经是热带度假胜地的三亚,海南岛西部还没有那么重的商业气息,这里同样气候宜人、风景优美,但旅游资源尚在开发之中,算是海南的最后一片「净土」。在这里,百度地图的采集员开始了针对全地形的数据采集工作。
我们跟随采集员来到了海南棋子湾。这里是最靠近岛屿西海岸的地方,除了不同于东海岸旅游城市的热闹场景,棋子湾最具特色的就是丰富的地形地貌。热带滨海沙漠、怪石嶙峋的峭壁、物种丰富的原始森林,这些独特的海岸景观有很高的观赏价值,而对地图采集员来说,多地形特点正是对数据采集的巨大考验。
车辆采集:孤独的旅行者
一个人一台车,这就是车辆采集的全部装备。「丈量大地」对于奔走在各处的采集员来说,既是每天的工作,也是无数次的旅行。百度地图车采队队长周通告诉我们,他们的每个采集员都至少去过十个城市,行驶七万公里以上,每年有 300 多天是在路上度过。
不少人都在路上看到过这种采集车,它由五个系统组成,供电设备、传感器平台、导航系统、拍摄系统以及全景相机。顶部的拍摄设备最引人瞩目,也是采集车的核心系统。它由三台单反相机构成,全程自动拍摄,每天有将近一万张照片产生,这样的高强度使用导致相机的快门损害率非常高。「我们自己有维修人员,经常要修设备。」采集员小哥提到。每次拍摄得到的原始数据是三张鱼眼图,后期经过处理形成全景图片,目前的技术基本能够实现全自动对接。
采集车的内部就比较复杂了,副驾驶位被一台电脑占据,用来控制顶部的三台相机拍摄和记录位置信息。控制软件由百度地图自主研发,能够实现一键采集,调整相机参数和自动对焦。所以只要经过一定的培训,就能快速上手。这位采集员向我们提到,他当时进行车辆采集只培训了一天,第二天就可以自己上路。
背包采集:用脚丈量大地
其实车辆采集相对来说是简单的,大部分工作能够自动化完成,高速道路等场景的变化也比较小。对于车辆不能到达的区域,就要用到背包采集,也就是真正的用脚丈量大地。
景区内部的道路不像外面的公共交通,没有规则可言,你在地图上看到的景区路线,大部分都是采集员一步步走出来的。全景背包重达 13 公斤,顶部是三组单反相机,背包内部是一台微型电脑,由路面系统、定位系统、控制系统、全景系统组成,其实就是将采集车的设备简化,然后由采集员背着深入到各种复杂区域。
背包采集最大的特点是灵活,在很多场景中,大型设备不易带入,全景背包的便携性让它可以适应更多环境,而且在采集过程中,还可以通过移动设备看到实时画面。不过和采集车不同的是,全景背包使用的是平面镜头,这更接近人眼看到的效果,对于边缘的处理也比鱼眼相机更真实自然。
无人机采集:广阔的上帝视角
车辆采集效率高、背包采集更灵活,但总有一些地方是人和车都无法到达的,比如陡峭的山路、悬崖。在百度地图中,一些景区内部很细致的全景也能够呈现,这都得益于无人机采集。无人机采集最大的特点就是视角不受限制,在一些地形复杂的景区,专业的采集员会操控无人机进行高空拍摄,生成景区全景。百度地图中的 3D 地图使用的也是无人机航拍数据,借助 3D 重建技术,可以多角度还原真实世界,用户能够以「上帝视角」俯视地图。
设备的简化是无止境的,尤其在百度整体迈向 AI 时代的大环境下,很多地点采集的步骤已经可以自动化完成,采集员甚至可以只用手采设备完成工作。一台单反、一个三脚架,手采设备主要适用于室内,移动性强,对环境的要求低,设备所到之处皆可自动完成 POI 采集和全景拍摄。
从采集到应用,未来的地图数据将全面自动化
数据采集是地图服务中最基础的工作,但它并不简单。「我们对数据非常『敬畏』。」车采队的周通提到这样一个词。
多种采集方式仅仅保证了数据的丰富,但这些非结构化的数据需要大量处理时间。百度地图已经在用 AI 技术简化这些操作,比如用深度学习来对道路信息进行自动筛选,从采集的影像中识别道路特征,然后提取轮廓并绘制形状,补充车采盲区部分数据。机器视觉还可以精准识别全景图像中的道路图形标牌、地面车标以及文字标牌等。不过,现在的技术还达不到全部交由机器处理,依然有五六百人在专门做数据加工。
随着地图产品从 PC 向移动设备转移,相关服务也开始向个人用户倾斜。生活场景中融入了大量地点信息,地图数据几乎无处不在。不光是开车导航,地图还出现在旅游、店铺推荐、公共交通出行等多个场景中。不过,最基础的地图数据从采集到应用,都在向自动化转变。
「未来大家可能很少了解什么是地图,只知道要去哪里。」百度地图事业部的刘玉亭说到。