AI公司中,泛化智能是个异类。他们的典型客户第一次听说AI可能是在《得到》上,第二次听说是担心它要毁灭世界。
但就是这群人,愿意给泛化智能付钱。他们能用泛化智能的产品Tegu,快速训练出可用的模型,代替重复劳动。而在此之前,他们只会点几下鼠标。
梅花创投创始合伙人吴世春也评价他们:拿下了一些很好的订单。在“假装赚钱”的AI行业,他们是怎么做到的?为什么创始人王汉洋说,一款所有人能用的标准化产品才是AI公司的救命稻草?
王汉洋觉得,现在AI行业大有问题,本质就是“软件外包”。
大部分AI公司是项目制,典型流程是:客户提需求、公司评估、要数据、做方案、调试交付,与软件外包无异。
可能,AI还不如软件外包。传统软件业已相当成熟,AI却是个新生事物。经常有客户说:我们有几千万条数据,你们做方案吧。结果做出来,该训练模型了,才发现大部分数据都是垃圾。
有一位深度学习的从业者,曾向媒体甲子光年抱怨:40%项目都无疾而终。阿里云有人称,好多项目做了3、4个月,才发现不是深度学习能解决的问题。方案的报废率超过50%。
大公司尚且如此,小公司项目流产几次,就可以重新创业了。
除了行业成熟度,另一个问题是项目成本。AI公司的人力十分昂贵,比传统IT高50%。而项目制中,一个人能做的业务是有限的。除非多招人,不然业务无法增长。因此项目制的业务是不能大规模、低成本复制的。
这就是“软件外包”的核心问题:AI公司其实并不像科技公司,能随变动成本下降,迎来收入指数级爆发。
在王汉洋看来,市场上AI公司云云,其实干的都是苦力活。等到两三年后,AI人才过剩,技术增长溢价消失,这些公司也将倒下。
泛化智能的核心就是做出一个标准化产品,这个产品叫做Tegu,用一个产品应对所有需求。
但问题在于,AI的应用领域是千差万别的。比如医疗影像,是从静态照片中找出模式;机场飞机识别,则要在长视频中捕捉稍纵即逝的微小细节。它们所需的数据、训练出的模型都完全不同,可复用性极低。
泛化智能的Tegu则把标准化做到了“训练模型”的前一步。客户拿到软件后,只要上传数据、自己标注,然后模型会自动建立,变成可用的成品。
举例来说,一个医生每天看胸片判断肺癌,是个重复性劳动。他有了Tegu,只要上传200张胸片,并标注完是否有肺癌。Tegu会拿这些数据自己训练模型。从此,医生只需把新的胸片传进Tegu,机器就能诊断肺癌了。
是的,Tegu的神奇之处就在于,它直接提供给了最终使用者。一个医生可能不太懂电脑,但他会看胸片。这就能让他训练出模型,并从此节省重复劳动。
Tegu努力做到“人人可用”,由泛化智能供图
融资时,曾有投资人对王汉洋说,我从没见过你们这样的公司。但他觉得这才是正路:做最标准化的产品,然后卖产品赚钱。不然,迟早会有公司走上“卖用户数据”的老路。
在AI行业,客户担心数据泄露,不愿交出数据已成普遍问题。对于泛化智能的客户来说,这都不足为虑,训练用的数据、最终模型都只属于自己,还可以离线使用。
泛化智能痛恨“AI”那一套话术。他们有本《文风手册》,简单明了地告诉客户:我们能为你做什么,要花多少钱。“别提AI,因为很多人觉得,AI要毁灭世界。”
这与AI行规大不相同。同行只找两类客户:不懂的人,可以乱抬价;大公司,可以亏本赚名声。对前者,你要暗示AI很贵,但他们又买得起。对后者,AI公司期待先做服务,后面再提价,“但其实是提不上来的,因为竞争会更激烈。”
泛化智能则希望成一单赚一单。他们卖产品,按最终模型的使用量付费。这意味着,如果产品不好用,他们就赚不到钱。但零前期投入也打消了客户疑虑,因为很多人“被AI骗怕了”。
目前,Tegu刚结束测试就已经收到了60多家客户的使用申请,而此前Tegu只在一个小型会议上做过宣传。王汉洋预计,3个月就能处理完这些订单。“60家对于做项目的公司,大概倒闭了也做不完。”据王汉洋估计,每获得1个客户,大概要花1万元和1个月时间。
吴世春也表扬泛化智能说:他们已经拿下了一些很好的订单。
对这些案例,王汉洋并不想拿来宣传,因为“模型是客户自己训练的”。但有两个案例值得一提。
一个是识别野生动物。王汉洋做过动物保护,也把Tegu拿给“猫盟”使用。猫盟成员白天上山,给野生动物拍照,晚上统计数量和品种。很多动物一闪而过,只拍到屁股和尾巴,让猫盟成员痛不欲生。
有了Tegu,猫盟成员把照片传进软件,一张一张标记动物品种。到上百张的时候,Tegu就能准确识别出狍子、豹猫和野猪了。据王汉洋说,他们白天上山,晚上标记,训练识别出19种动物,也只用了两周。
猫盟使用Tegu,由泛化智能供图
二是识别电网上的绝缘子。泛化智能创立初期,没资源没案例,他们就拿相机自己去输电线铁塔下拍照,拿回来自己标注训练。
识别绝缘子数目他们用了1000张标注照片,模型能做到近似100%准确率,每0.1秒识别一张。同行水平是,用40万张标注照片,每7秒识别一张。
识别绝缘子是否破损,他们用了236张标注照片,花费两周,准确度98%以上。某电网的自建团队,用了半年时间和上万张照片,才能做到同等水平。
事实上,就是电网案例为他们赢得了融资。当初见到吴世春,王汉洋拿出手机对他演示:这是无人机拍的电网铁塔,这是识别结果,能数出铁塔上有多少螺丝。吴世春投过无人机公司,知晓行业水平,20分钟后他叫进来财务,立刻把协议签了。
王汉洋大二时,从加拿大滑铁卢大学辍学,跟两个合伙人创办了公司。他虽计算机专业出身,但机器学习全靠自学。“这并不难,不应该妖魔化技术。”
他说,自己接触到机器学习,就像日本人看到了黑船。“一瞬间就知道传统技术输了”,马上回国。
王兴有一种信仰,认为科技会让生活变好,王汉洋同样如此。他相信,AI能将人从重复劳动中解放出来。
泛化智能创始人王汉洋,由泛化智能供图
今天,有人每天浏览重复图片,寻找可疑活动;有人每天爬电网铁塔,检查零件;有人钻进五十度的管道,他们都拿着很低的工资。这些“不赚钱”的传统行业,往往会被AI同行遗忘。
泛化智能则是去这些领域寻找客户。“他们99%没用过谷歌,没听过李飞飞。”但他们有需要优化的重复劳动,并且愿意付钱。
为了找到应用领域,泛化智能特别喜欢双学位、转专业的员工。比如做过无人机,就知道航拍、农业用不到这些技术;而像电力巡检要看大量照片,则最适合机器学习、计算机视觉来做。
最终,泛化智能希望做出一款通用工具,就像Adobe那样,运行在2500块的破电脑上,但依然能做出强大的产品。
今年,泛化智能的目标是再进入10个领域。他们希望标准化产品Tegu,能大大加快AI应用的普及速度。