2015 年,在德国 Cebit 展会上,马云当众展示了蚂蚁金服最新的扫脸支付功能:手机登陆淘宝, 选择商品之后,进入支付系统,确认支付后出现了“扫脸”后台认证,然后像扫二维码一样扫一下用户人脸,即显示支付成功 。扫脸支付功能是一种相当前沿的技术,即使是苹果,其也是直到最近才在最新发布的 iPhoneX 上采用了相关的技术。
马云展示扫脸支付主要是想说明阿里对先进技术的追求,但在无意中,他也带火了蚂蚁金服扫脸支付背后的技术提供商——旷视 Face++。近日,其还为锤子新机坚果Pro2 提供了人脸识别解锁功能。
清华姚班 85 后,边上学边创业
旷视 Face++成立于 2011 年 10 月,是一家旨在帮助机器看懂世界的计算机视觉企业,由三位来自清华大学计算机系姚期智实验班的创业者(CEO 印奇、CTO 唐文斌、杨沐)创立。值得一提的是,三位创始人都是 85 后:印奇 1988 年出生、唐文斌生于 1987 年,而最小的杨沐则生于 1989 年。而且三位创始人当初创业时都还未毕业。
至于创业原因,其实也是无心插柳柳成荫的结果。“最初我们并没有想到创业。”在之前的采访中,唐文斌透露他们最初的想法其实是想将计算机视觉的技术应用到游戏中。为此,他们开发了一款名叫 Crows Coming(乌鸦来了)的 IOS 平台游戏,玩家通过摇晃头部控制游戏里的人物,从而拦截偷食的乌鸦。后来,他们还开发了另一款类似的名叫“Free Skate Xtreme 街头速滑”的游戏,通过摄像头识别人脸并跟踪头部动作,使玩家可以通过摇摆头部来躲避游戏中导弹。
不过,由于做游戏的经验不足,最后,他们决定改变公司的经营方向,转做底层技术提供商。由于当时正值深度学习算法普及之际,人脸识别临近爆发点,同时由于创始人的清华背景,其中印奇还曾任微软亚洲研究院任研究员,并攻读了哥伦比亚大学 3D 相机设计方向的博士学位,旷视 face++能较轻松地拿到融资,资自 2012 年 8 月拿到联想之星的天使轮融资之后,其很快又于 13 年 7 月完成了来自创新工场的 A 轮融资,并于 14 年 11 月宣布完成来自蚂蚁金服在内的多家机构的 2500 万美元 B 轮融资。
而在这之后,便有了后面的马云面向全世界为其站台的故事。
核心竞争力:自研深度学习引擎
在深度学习的加持下,近年来人工智能技术取得了突飞猛进的发展,同时,也衍生了一大批开源深度学习框架,其中包括 TensorFlow、Caffe、Keras、CNTK、Torch7、MXNet、Leaf、Theano、DeepLearning4、Lasagne、Neon 等等,目前,在各种开源平台中,谷歌于 2015 年底开源的 TensorFlow 无论在关注度还是用户数上都占据绝对优势。
而相信很多人不了解的是,旷视 Face++内部其实也有着一个类似的框架平台——MegBrain 深度学习引擎,而且开发时间早于 TensorFlow 的开源时间。
“我们早于谷歌推出的原因并非他们没开源,而是因为我们认为拥有自己的深度学习引擎将会是旷视作为一家专注于计算机视觉的人工智能公司的核心竞争力。”市场与品牌中心总经理谢忆楠解释:“通过自主研发全栈深度学习工具链用于内部开发的 MegBrain 深度学习引擎,我们的深度学习平台——Brain++ 可实现内部深度学习资源管理,并为研发者和大型研发团队提供一站式服务”。
立足自有原创深度学习算法引擎 MegBrain,旷视 Face++目前已经打造出了四大技术平台(:Face++ 人工智能开放平台、FaceID 身份认证平台、智能地产解决方案以及智能安全解决方案),并取得了喜人成绩:
Face++ 人工智能开放平台以 API 或 SDK 的形式为开发者提供人脸识别、文字识别、图像识别、物体识别、场景识别及其他人工智能能力,旨在帮助开发者用最简便的方式实现 AI 赋能。官网显示其目前已经服务了来自 220 个国家和地区近 10 万开发者,日调用量超过 1 千万。
FaceID 身份认证平台主要利用人脸识别技术帮助第三方企业进行用户身份认证,目前已经为包括支付宝、今日头条、滴滴出行等在内的超过 200 个互联网企业,以及超过 20 家银行机构提供用户身份验证服务,服务人数已达 2.5 亿。
智能地产解决方案主要通过软硬一体的系统集成(9 月刚刚发布新一代人像抓拍机 MegEye-C3S)和计算机视觉技术,为地产以及零售客户提供包括人员通行管理、车辆定位管理、智能视频监控等服务。服务客户包括 SOHO 3Q、优客工厂等。
智能安全解决方案则主要解决公安、海关、机场、铁路等机构对于实名制认证、人脸电子围栏、重点人员布控告警等实战诉求。目前该解决方案已在全国 26 个省市上线并被中国公安部列入重点技术推广目录。
在此,唐文斌还特别强调称外界一直以为旷视 Face++只是做人脸识别的,但这却是一个天大的误会。“我们公司成立的第一天就叫旷视,旷是大的意思,视即视觉,我们想做大的视角,即想让机器看懂这个世界。”“而人脸是视觉信息里面最重要的要素,因此,作为创业公司,我们当初决定从小处开始,才选择做人脸识别。我们一直以来都不只做人脸,只是人脸做的比较好,大家更关注我们等人脸识别而已。”“其实我们在行人车辆等识别方面都有非常深入的研究。”唐文斌如此表示。
旷视 Face++的下一步:重点关注人工智能本质创新
开源深度学习框架的出现使得企业再不需要花大把大把的时间和精力自己敲代码了,这也使得人工智能的门槛得到了极大的降低。业界也因此有一种说法:利用开源的平台和一台 GPU 机器,甚至可以运用云计算,即使是本科一年级学生,他也能够训练出一个一个车辆检测器,或者人脸检测器来!而目前,有人脸识别技术的创业公司已经越来越多,其中还不乏像格灵深瞳 、商汤科技这样的其他明星创业公司。那么,旷视 Face++将如何应对新的挑战?
旷视 face++这些年来所累积的行业资源自然是其壁垒之一,不过,更重要的,旷视 Face++还成立了旷视研究院,并邀请已经在微软研究院工作了十三年首席研究员孙剑担任旷视研究院的院长,而近日,旷视 Face++还为研究院成立了学术委员会,并邀请中国科学院院士、首位图灵奖华人获得者、清华姚班创办人姚期智担任其首席顾问。据了解,旷视 Face++的目的是做人工智能本质创新,从更高维度应对其将面临的新挑战。
至于什么是人工智能本质创新?印奇认为其只能通过时间来判断,“一篇论文出来,但其引用量低,那这绝不是本质创新。”印奇如此表示。“本质创新往往都是一种无心插柳的结果,比如我在微软期间,我们做了非常简单的网络设计 ResNet,没想到前几天 AlphaGo zero 的系统就成功应用 ResNet 作为核心技术,这个是我们当初根本没有设想到的。”孙剑补充道。
然而,杨沐表示创业公司往往更加关注眼前,没有精力关注遥远的本质创新。因此,孙剑表示设立学术委员会的主要目的就是为公司提供一种超越其当前视野的见解,帮助企业判断什么是本质创新。“本质创新怎么判断?如果你是顶级的研究机构可能自己就判断了,如果你不是顶级研究机构你可能就要通过外界对论文的反应判断了。”孙剑解释到。
显然,这种投放巨大精力于资源做“遥远”的本质创新具有极大的风险,旷视 Face++方面自己也承认如果公司出问题,研究院可能是第一个被裁的。不过,杨沐表示在现阶段,在关注眼前的同时也要关注未来了。
旷视 Face++关注本质创新的新战略或许真能为其带来更大的发展空间与潜力。
融资方面,就在 10 月底, 旷视 Face++刚刚宣布获得一笔金额达 4.6 亿美金的 C 轮融资 。“虽然我们现在团队可以靠自己养活自己,但是我们很多东西细化看,很多东西没有做扎实,我们从技术到产品到我们本质创新,到我们的业务的落地,到我们各方面其实我们交付给用户的价值,之前顶多是 85 分的状态,我们希望做到 99 分,做到 100 分。”对于融资目的,唐文斌如此表示。
据了解,在面临整容脸、双胞胎等特殊场景时,目前大多人脸识别技术都做不到完美,对此,孙剑认为下一代摄像头可能是解决这一问题的关键,“他们可能会拍摄一些连人眼都看不到的东西。”