很多厂商都说要在 2020 年推出自动驾驶汽车,无论这些车的自动驾驶程度如何,都要依靠“计算机视觉”技术来实现。 计算机视觉 (Computer Vision,CV),这是一门研究如何使机器” 看” 的科学,更进一步说就是用摄影机和电脑代替人眼对目标进行识别、跟踪和判别决策等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。 作为一个科学学科,计算机视觉研究与其相关的理论和技术,试图建立能从图像或者多维数据中获取「信息」的人工智能系统。比尔·盖茨说过:IT 界的下一次大事将是计算机视觉与深度学习的结合。 怎么才能让机器或智能汽车变得像人类一样聪明? 首先要让它感受到这个世界,然后再对感受到的信息处理反馈。从任天堂的 Wii 到微软的 Kinect,再到谷歌的 Project Tango,都是如此。 2014 年 2 月,谷歌已经成功为该项目研发出了一款 Android 手机原型机,配备了一系列摄像头、传感器和芯片,能实时为用户周围的环境进行 3D 建模。另外还有微软的 Hololens 全息眼镜,从这些设备上,我们看到了计算机视觉技术的飞速发展。 视频和图像之中包含了大量的数据,过去我们不知道怎么让机器来捕捉和利用这些数据。但随着深度学习的发展,卷积神经网络的提出和运用,这些数据慢慢的能被机器解读到了。这些进步为以后的汽车自动驾驶,打下了获得信息和处理信息的基础。 目前在研究计算机视觉技术的有很多公司,比如 SenseTime(商汤)、Cogtu(知图科技)、Deepglint(格灵深瞳)等。 商汤是做计算机学习和深度学习技术的典型公司,核心技术有人脸识别、图像识别、图像处理、智能监控。
此外就是格灵深瞳,这家公司的联合创始人赵勇,在刚刚闭幕的 2015 杭州云栖会议上提到:目前绝大多数自动驾驶技术非常昂贵,一辆自动驾驶汽车感知成本可能要上百万人民币,比汽车本身还贵。在他展示的视频里,计算机视觉技术让每辆车都有自己的眼睛。这套系统在汽车行驶的时候像人的眼睛一样能看懂交通标识,道路信息和各种不同的路况。 计算机视觉技术除了在汽车上使用外,还可以在智能交通领域帮上忙。在路口的红绿灯可以通过使用该技术,来判断所在道路交通流量,然后自动变灯,增加路口的通行能力。
从论文数量和创业公司数量就可以看出来,近两年计算机视觉发展速度很快。但对于自动驾驶来说,目前仍面临诸多问题,比如对芯片的计算速度要求很高、高昂的成本等等。计算机视觉可以让自动驾驶成为现实,但离普及的程度还有一段距离。
|