为何大模型创业明星公司都是清华系?

为何大模型创业明星公司都是清华系?

2023-12-15 09:52Newseeders 合作伙伴
“清华系”的这片AI星云,又将孵化出怎样闪耀的未来世界?万物有时,且让我们静静等待。

清华系、清华系,还是清华系!随着“百模大战”轰轰烈烈地拉开序幕,对新技术、新变革翘首以盼的投资人们纷纷涌向人工智能赛道。市场突然发现,一家接一家斩获融资的大模型创业公司背后,大多站着一位出身清华的创始人。

作为中国最知名的高等学府之一,“清华系”创业者为何能领 先大模型创业领域?

1、1979年,中国人工智能往事

十年树木,百年树人。清华系大模型企业接二连三地开枝散叶,则要从1979年说起。

这一年,清华大学计算机工程与科学系,开设了一门新课——《人工智能导论》,这是国内大学最早开出的人工智能课程之一。

计算机工程与科学系是清华新成立的科系,时年43岁、在清华任教近20年的张钹迎来一个抉择,是留在自己深耕已久的自动化系,还是去计算机系挑战一下人工智能这个横空出世的新鲜学科?他选择了后者。

张钹与张毓凯、林尧瑞、石纯一和黄昌宁等老一代清华老师一起,将全新的“人工智能与智能控制 ”作为新的教学与科研方向。为了教好学生,1980年张钹远赴重洋,作为访问学者前往美国伊利诺伊大学香槟分校学习人工智能。这一去,让他猛然直面海内外科技发展的差距。

那是世界*个拟人机器人WABOT-1在日本早稻田大学诞生、斯坦福大学首次开始研发自动驾驶技术的年代,而国内对人工智能的研究还是一片空白,就连《人工智能导论》的教材资料,也是老师们自己一页一页结合国外教材紧急编印的。

访学过程中,张钹逐渐摸清,人工智能要深入发展下去,必须利用数学工具来提高算法的效率。于是,他找到了数学系出身、当时还在安徽大学任教的张铃教授合作,两人跨越大洋密集通信,为了节省邮票钱,用最薄的纸、写最小的字,进行学术交流和沟通。

随后,张钹回国。1984年初,张钹与张铃联手,在人工智能领域*国际期刊《IEEE模式分析与机器智能汇刊》上发表了一篇论文,这是中国学者在人工智能领域的*篇学术论文。从此,中国学人开始在人工智能这条大道上留下脚印。

作为计算机工程与科学系最早的本科学生之一,孙茂松在人工智能这个领域一待就是46年。清华老师们把什么是人工智能带到了中国,对新科技报以无限热情的孙茂松,想的则是如何让人工智能应用在中国落地。

有趣的是,这位一生都扎根科研行业的“理工男”,对语言、文字有着极大的兴趣。因此,孙茂松的研究重点之一,是中文信息处理中最基础性的课题——汉语自动分词。

很快,孙茂松在自然语言处理领域做出了重大贡献。他研制出了一个集自动分词、词性标注、专名识别和新词识别于一体的分词标注系统 CSegTag,应用于清华与欧盟近 10 个国家合作的欧盟第六框架计划(FP6)项目“超对等语义搜索引擎”中,他也由此成为国内NLP领域的开创者。

2、名师+高徒,清华系AI人才这些年

1996年,“数学神童”王小川因拿下了国际奥林匹克信息学竞赛金牌,被点招进入清华大学计算机系。这里,是他接触人工智能的起点。

作为搜狗创始人,王小川先后开发了搜狗搜索、搜狗输入法、搜狗浏览器等产品,并带领搜狗在美国纽交所上市。无论是技术还是商业,都交出了漂亮的成绩单。他很清楚,当时的人工智能技术还不够成熟,务实的他选择了开发更容易落地的输入法、搜索引擎,同时在搜狗内部默默储备AI人才。

就在王小川踏入清华一年后,他的两位王姓学弟同样在这里相遇,还成了睡在上下铺的室友,他们是王慧文与王兴。

在人才辈出、往往一路读书直到拿下海外名校博士的清华校友中,王慧文和王兴算是异类。两人虽然对科研有兴趣,但也对正风云涌动的商业社会有着强烈的好奇心。读研期间,哥俩双双退学,瞄准彼时在美国兴起的社交网络,在国内打造出当时风靡大学生群体的校内网。出售校内网后,两人分开创业,又在2010年于美团再度合作。

“清华三王”入学不久之后,滚烫的互联网时代拉开序幕。昔日首尝人工智能应用“滋味”的学生孙茂松,也留在了清华计算机系任教。

站在讲台上的这些年,孙茂松看到了一张又一张的年轻面孔加入人工智能这片蓝海。

比如2001年入学的朱军,其实是被高中班主任“忽悠”来计算机系的,高考前,农村娃出身的他甚至都不会开机。这个农村小伙喜欢给自己“制造困难”,大二时,他自觉英文水平不佳,咬着牙报了全英文授课的物理课,只为逼自己一把攻破英文难关。毕业后,已在深度神经网络领域探索的朱军,来到美国计算机科学四大牛校之一的卡内基梅隆大学访学和做博士后研究。彼时,卡内基梅隆大学向他抛出了橄榄枝,希望朱军留下来任教。清华“老院长”张钹得知后,极力邀请朱军回来。于是,朱军回到了母校,与恩师同台执教。

2002年入学的刘知远,也给孙茂松留下了深刻印象。前一年,刘知远高考被南京邮电大学录用,但他只待了两个月,觉得“不是特别符合我对大学的期望”,“与其追求几年后一个不确定的未来,不如多花一年的时间去换一个相对确定的结果”。于是毅然“回炉重造”,终于在一年后来到清华计算机系。从这一年开始,直到 2013 年博士后出站留校任教至今,刘知远一直在人工智能这条道路上探索。

对刘知远而言,孙茂松是他的恩师。他曾在知乎的一个回答中说:“我本科属于‘三无’人员,没有像样的科研经历和论文,没有程序设计竞赛经验,成绩也不突出,在年级和班级都排名1/3 左右,所以特别感谢孙茂松老师在 2005 年推研中接收了我。”

得到孙茂松信任的刘知远没放过这个机会,从当时十分热门但难以实际应用的复杂网络理论方向,转到自然语言处理应用任务上来。他先是做了词汇层面的语义分析工作,再做关键词抽取与标签推荐的研究,最后还在博士期间刘知远就于EMNLP 上发表了三篇论文,在 Google Scholar 上的引用次数达到近 400 次。

更晚一点,2009年入学的涂存超也让孙茂松记忆犹新。涂存超出生于1990年,标准90后,从高考大省山东进入清华,却从未有过刷题备考的日子。17岁,高二结束后的暑假,老师塞给他几本竞赛书,让他试试竞赛保送。一个月后,涂存超拿到了山东省数学竞赛一等奖,并以全省自主招生第四名的成绩提前被清华录取。在清华计算机系一路读到博三,涂存超专注在NLP方向的研究,一路超额完成论文任务。

除了从本科一路走出来的计算机“嫡系弟子”,孙茂松也带了不少博士生。比如本科就读清华电子工程系、博士“转行”到计算机系来的岂凡超,以及日后也留在清华计算机系任教的唐杰。

3、AI星云爆发点已至

时间飞速来到2023年,ChatGPT的横空出世,犹如一声惊雷,点燃了全世界计算机科学界对人工智能大模型的热情。

中国自己的大模型在哪?终于,此前一路默默行走在人工智能这条研究小道上的清华系大模型专家,被众人看到了。

最 先官宣创业的是王慧文。2月中旬,王慧文6天连发5条朋友圈,宣称“500万美元带资进组求组队”,发布“AI英雄榜”。很快,他的 AI大模型公司光年之外迅速拿下大把融资,4个月长成独角兽。遗憾的是,由于身体健康原因,王慧文6月底被迫离岗养病。好兄弟王兴接棒,美团全权收购了光年之外,二人继续在大模型之路探索前行。

4月,王小川也出手了,他联手前搜狗COO茹立云成立百川智能,官宣入场大模型创业,四个月时间就拿出三个大模型,半年时间内拿下独角兽。

桃李满天下的孙茂松,手下一众高徒均受到资本热捧。朱军团队打造了生数科技,基于底层多模态通用大模型,面向图像创作、3D资产创建等场景打造垂类应用,刚刚拿到蚂蚁集团和百度的近亿元天使轮融资,市场估值达到1亿美金。

刘知远联合创立了面壁智能,拿下知乎领投的数千万人民币天使轮融资,并在今年5月推出多模态大模型应用“面壁露卡Luca”。

涂存超的幂律智能专注于法律领域,最近拿到8000万元Pre-B轮融资,蓝驰创投e签宝、红杉中国、华宇科创、源码资本线性资本、智谱AI等入局。

唐杰作为联合创始人的智谱AI更是在今年一口气拿到25亿元融资,投资方阵容可谓相当豪华,有社保基金中关村自主创新基金、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家一线机构。

岂凡超的深言科技,则开发出在网络爆火、以至服务器多次被挤爆的“反向词典”,可根据词意查询对应的词语。目前,深言科技市场估值约1亿美金,还屡传王慧文有意收购。

孙茂松带出来的这批学生,大多都还留在清华任教。他们手下更年轻的弟子,也开始在大模型创业路上崭露头角。

唐杰的学生中,有位叫杨植麟的小伙,先是创立了月之暗面,又拉上另一位同样师从唐杰的同门张宇韬,联合创立了循环智能。

就在10月,月之暗面宣布在“长文本”领域实现突破,推出了*支持输入20万汉字的大模型moonshot,以及搭载该模型的智能助手产品Kimi Chat,这家公司也拿下了红杉资本今日资本、砺思资本等知名投资机构的近20亿元融资。

“四十不惑”。自1979年以来,中国的人工智能研究已前行了44年。而这一群随着中国人工智能领域一同成长的“清华系”学者和企业创始人,也正在找到自己的扎根之处。

宇宙的浩瀚璀璨,源自星云的扩散弥漫,这才孕育出无数耀眼恒星。“清华系”的这片AI星云,又将孵化出怎样闪耀的未来世界?万物有时,且让我们静静等待。

*本文作者田箫,由新芽NewSeed合作伙伴财联社授权发布,转载请联系原出处。如内容、图片有任何版权问题,请联系新芽NewSeed处理。