中国高科技产业发展至今,呈现出反差强烈的两幅画面:
一幅画面是繁荣与蓬勃。“嫦娥四号”实现人类首次月背软着陆,5G商用牌照率先发放,全球首款异构融合类脑计算芯片发布,人脸识别广泛运用在零售等生活场景……这些都是中国科技产业崛起的证据。
而另一幅画面却是挣扎。2018年,美国商务部发布公告称,将在未来7年内禁止中兴通讯向美国企业购买敏感产品。最后,中兴通讯向美国支付4亿美元保证金以换取禁令解除。
这是中国科技产业充满隐忧的一面——在上游关键技术上被外国“卡脖子”。一旦上游断供,处于产业链下游的中国科技产业,其发展就会受到极大的影响。
中国必须掌握核心技术,必须进军产业链上游,没有退路。
不惜代价“死磕”上游技术,是一种值得鼓励的精神,但还有一种方法,是最大限度地利用自身在下游的优势,向上游做柔性的延伸。在人工智能时代,这或许是中国科技产业崛起的“另类”方式,却又暗合着产业发展的铁律。
历史不会重复,但会押韵。
“含光800”的逆袭
芯片被称为“科技巨人头上的皇冠”,是产业链上游核心技术的代名词。
2018年的“中兴事件”,让中国人体会到了“缺芯之痛”。但仅仅过去一年时间,阿里巴巴达摩院便用“中国速度”造出了一颗号称“全球最强”的AI芯片——含光800。
达摩院2017年才成立,2018年才设立专注于自研芯片开发的全资子公司,2019年就造出了第一颗自研芯片含光800,这样的速度令世人惊叹。
含光800是一款AI推理芯片,主要用于云端视觉处理。据了解,在人工智能视觉场景中,含光800能够提供全球最强的算力:在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍;能效比500 IPS/W,是第二名的3.3倍。
阿里巴巴,一家从电商平台业务发展起来的公司,为什么短短几年内能够在某个芯片设计垂直领域实现飞跃性的突破,站在世界之巅?
答案有两个:一是阿里巴巴拥有大量的数据,二是自身业务深深植根于海量的真实需求。
含光800是AI推理芯片,AI推理离不开AI的训练,而AI训练需要大数据。大数据从哪里来?从阿里巴巴自身的业务中来。
一方面,线上的淘宝、天猫,线下的盒马鲜生以及“城市大脑”,无一不与图像处理相关。阿里巴巴仅仅在日常运作中,每天就需要处理数十亿帧图像,这些图像就是宝贵的数据,使得阿里巴巴所训练的机器学习软件既准确又强大。
另一方面,这些生成大量数据的日常业务——不管是淘宝、盒马,还是帮助解决交通拥堵问题的城市大脑——都是运用图像处理能力的具体场景。这些业务是最好的试验田:就像是在田野中收割了果实后,又把种子撒到土里,再舒枝展叶结出新的果实。
从阿里巴巴集团的层面看,含光800之所以能成功,是因为它转化了阿里巴巴所拥有的整条产业链的资源。目光从阿里巴巴单单一家企业移开,放眼全中国,我们就会惊喜地发现:大量的数据和丰富的应用场景,其实是中国科技产业所共同享有的“福利”。
含光800证明了中国科技产业崛起另一条路径:根据具体的业务需要,把产业链下游的草根应用优势,转化为产业链上游的顶层设计优势,用柔性延伸而非直接进攻的方式,渗透进产业链价值最高的环节。
“世界工厂”的真实含义
“自下而上”的柔性发展道路是否可行,早已被中国制造业的发展历程所确证。
受益于20世纪80年代的第三次国际产业转移浪潮,中国从产业链下游的零部件生产和组装起步,逐渐发展成为“世界工厂”。
“世界工厂”的名号,貌似恭维,实为讽刺:中国虽然有很强的制造能力,但却被国际资本死死压在利润最微薄的制造环节,中国制造也因此常被诟病为“缺乏核心能力”。
批评者未能意识到的是:单单把组装和集成做到极致,其实已经是一种核心能力,在制造环节中,中国积累了大量的经验。中国的代工厂最清楚,什么产品该用什么样的零部件,什么零部件该用什么样的方式生产,才能最为合理和高效。这就带动了零部件的持续国产化,向产业链上游不断迈进。
零部件的国产化,从低端零部件起步,向高端零部件渗透,当全产业链实现国产化,制造企业就会开始提升生产过程中的科技含量。这就是自下而上,根据自身的需要,一步步渗透产业链上游,进而掌握全产业链的路径。
以家电行业为例,早期家电生产从引进国外的低端生产线开始,技术上以模仿为主,缺乏自主品牌,主要依靠代工生存。如今,中国家电已经掌控了几乎所有的核心零部件生产,实现了全产业链的国产化。
掌握了全产业链之后,家电厂商就会利用高科技进一步强化生产能力。这就是为什么格力在发展机器人和智能装备,美的要收购库卡机器人。这就是中国“自下而上”的磅礴伟力。
但为什么其他发展中国家没有像中国一样,从产业下游向上游自然发展?
这是因为,对于地狭人寡的小国而言,集成组装的价值已经足够丰厚,企业既没有能力也没有必要去垂直整合产业链的上游,因为狭小的国内市场无法积聚足够的资源支持这些企业升级扩张。
而中国的特殊性正是在于“大”:一是庞大的人口规模,二是海量的自然资源,三是巨大的市场空间。
在各国之间需要依靠优势互补才能分工完成的工作,却能够在中国这一片土地上全部完成,而且还能够形成闭环:中国庞大的适龄劳动人口基数,既能提供大量的廉价劳动力,又能带来需求巨大的多层次市场,市场的需求和反馈还能给生产企业指引方向,并支持它们做大做强,在海外市场攻城略地。
含光800成为“全球算力最强”AI芯片背后的深层次逻辑,其实也植根于此。
海量数据的磅礴伟力
含光800的研发过程中,阿里巴巴丰富的业务带来了巨大的数据量,这些业务同时又能成为含光800发挥具体作用的场景。
在2019年的云栖大会现场,阿里巴巴展示了含光800在智慧交通方面的应用:过去城市大脑实时处理交通视频,需要40颗传统 GPU,延时为300ms,而使用含光800仅需4颗,延时为150ms;再以淘宝的功能“拍立淘”为例,拍立淘商品库每天新增10亿幅商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。
虽然含光800在ResNet-50测试获得第一,但含光800基于台积电12nm工艺生产,尺寸比参加同一测试的其他竞品都要大,如果抛开这项要素,单纯对比性能,显然有失公允。而且,ResNet-50只是MLPerf的一组适用于图像分类任务的基准测试,含光800在其他方面的表现如何还尚未可知。
但不可否认的是,阿里巴巴用这样“倒推”的思路,造出了一块让国内外厂商都惊叹的芯片。
“自下而上”的柔性发展,隐隐然已是中国科技产业在人工智能时代的另一条崛起道路。
云天励飞副总裁兼芯片产品线负责人李爱军告诉亿欧,人工智能的上下游可以按“算法训练及设计”、“算法应用及落地”两大部分来划分。人工智能起源于美国,因此美国公司在技术研发上,平均领先中国同行半年到一年,但人工智能技术毕竟要应用于市场,中国具有庞大的市场优势和海量的数据优势,能够让算法快速迭代,从而弥补技术上的代差。
“人工智能是服务人的,因此人口优势会很关键。”李爱军说。
“中国的优势可以总结为数据优势。”邢练军认为,数据量大,而且对数据的控制不至于过于严格,是中国人工智能发展的一大优势。
邢练军是智慧城市,安防和人工智能行业多年从业者,曾在华为、易华录、比特大陆担任高管。
快商通首席科学家李海洲院士也有相似的观点,他说:“人工智能需要与深度学习和大数据紧密结合,中国在数据资源这方面的优势毋庸置疑。中国有近14亿的人口,仅是日常生活场景就能产生比全球其他国家更丰富的数据,这让深度学习的效益能够发挥到最大。”
根据2019年IDC与希捷联合发布的报告《数字化世界——从边缘到核心》,中国的数据量在未来7年中的年平均增速将达到30%,是全球数据量增长速度最快的区域;到2025年,中国将拥有全球最大的数据量。
多年以来,世人的成见是:中国善于“用”技术,却不善于从0到1的科技创新,因此中国科技只能在下游应用领域繁荣发展,却在上游研发领域鲜有建树。
如今,巨大的下游市场所产生和积累的数据,正在成为中国科技产业在人工智能时代的有力武器,帮助中国科技产业再一次攀向世界之巅。