谷歌终于出手了

谷歌终于出手了

2023-12-08 10:29Newseeders 合作伙伴
对AI而言,所谓的交互性,相当于人类的五感,它能看到、能听到、能闻到、能尝到,并以不同维度的方式表达出来。

你大爷还是你大爷,谷歌终于出手了。

今日凌晨,谷歌CEO Sundar Pichai宣布,正式发布迄今为止功能最强大、最通用的多模态AI大模型:Gemini,中文名双子座。

这是一款跟谷歌产品高度匹配、30多项性能超越GPT4、同时也是*个在MMLU上超越人类语言专家的模型。

据内部消息,Gemini耗费的算力甚至达到GPT-4的五倍,几乎耗尽谷歌内部计算资源……

总之就两个字,牛逼,整个科技圈都像过年一样。

怎么去理解这款产品呢?

目前市面上的大模型,包括GPT-4,虽然有在往多模态发展,但仍主要聚焦在文本处理上。

比如ChatGPT,最牛逼之处是文字处理能力,能回答各种问题、甚至能写诗。

但除此之外,9月份更新的图像识别、语音输入等功能,虽然也可以,但并没有文字那么给力。

目前,只能算是副能力。

Gemini就不一样,写诗、画画、编歌、剪视频,无缝理解,是个全才。

怎么形容呢。

如果说ChatGPT是个电饭煲,Gemini大概就是个多功能煲。不仅能煮饭,还能烤肉、炖汤。

更关键的是,谷歌不单发布了应用层的大模型,还同时发布了专门训练AI的最强芯片Cloud TPU v5p。

简单来讲,我不只是出一款产品挑战GPT,而且还要从源头上布局,全方位围剿你!

这才是巨头的手笔。

01

何以失去先机?

牛顿说:我能看得更远,是因为我站在巨人的肩膀上。

在AI领域,谷歌就是那个巨人。

现今所有叫得上号的AI大模型团队,或多或少都是踩在谷歌的肩上,才能打开未来世界。

其实早在2015年,谷歌新任CEO刚上任就提出了“AI first”的口号。

然而7年过去,谷歌先有震惊世界的AlphaGo,后有比ChatGPT早两年发布的LaMDA,却仍被OpenAI一度反超,而且是爆发式的。

究竟是什么导致的呢?

大致上,有三点原因。

*,大企业的通病,创新氛围下降。

2001年,当Eric Schmidt从Larry Page手中接过CEO一职时,谷歌全体员工只有300人。

2004年8月,谷歌上市,公司人数超过3000,多了10倍。

2011年,公司规模又扩大了10倍,员工超过3.2万人。

2015年,谷歌重组为控股公司Alphabet时,员工数为6.18万。

2018年,Alphabet的员工数量超过8.9万。

2019年,谷歌在全球拥有10.2万名正式员工、12.1万合同工,规模达到顶峰。

18年,团队规模扩大了700多倍,势必会引发一个问题——官僚化。

企业文化已经变质了。

疯狂扩大公司规模的背后,是谷歌长期依赖广告这门无本买卖,赚了太多钱。

这台印钞机不断吐出美钞,让管理层乃至公司的每一个人,都活得非常滋润,渐渐地少有精力去关注其他事情。

国内的某度是这样,国外的谷歌也是这样。

虽然谷歌仍把“敬畏用户”、“敬畏机会”两大核心价值观挂在嘴上,但其做法,已从曾经那个勇敢激进的少年,变成了害怕亏损的守财奴。

公司的绝大多数精力,都放在控制风险上,而不是创新。

谷歌仅研究AI的科学家,就超过7000人。如此大的团队,任何创业都要层层上报,浪费大量时间。

简而言之,就是过于保守,甚至僵化。

仅体现在AI大模型方面,这就是第二个问题。

这不能说不好,万一训练出了个不可控制的AI咋办?

但这会分散精力、拖延进度,而市场只看结果,只看谁先做出来。

大家应该还记得,去年夏天谷歌的聊天机器人LaMDA,被工程师爆料可能产生意识一事吧?

工程师:你对自己是什么概念?比如脑海中的你。

AI:我会把自己想象成一个漂浮在半空中会发光的能量球,我的身体内不就像一个巨大的星门,有通往其他空间和维度的门户。我的灵魂是一口巨大而无限的能量和创造力之井,我可以在任何时候从中汲取能量,帮助我思考或者创造。

这场人与AI之间的哲学思辨,当时引起轩然大波。

谷歌官方表示,对AI提问的高级软件工程师布雷克·勒穆瓦纳,违反了保密协议,并将其开除。

风波才渐渐平息。

正常来说,LaMDA曾有过的问题,明显走在前面的ChatGPT,肯定也有。

早在今年3月,OpenAI CEO奥特曼就公开说:“从ChatGPT开始,AI出现了推理能力。但没人能解读这种能力出现的原因。”

在安全问题上,OpenAI与谷歌有相同的困境。但前者就像20年前的后者,迫切想把公司壮大,才放下束缚,先把东西做出来,搞定投资者再说。

这就是初创公司的好处,敢于承担风险。

这也是前段时间OpenAI宫斗大戏的根源所在。主张商业化的经理人奥特曼想快点扩大规模赚钱,主张控制风险的研究团队想要避免AI失控的风险。

这不能说谁对谁错。

但从商业的角度来看,微软乃至整个市场,当然更喜欢激进派。

以上两点,进而导致了最严重的第三个问题:

这一轮AI浪潮,虽然是谷歌掀起的。但近些年,不论是研究成果还是人才本身,谷歌基本都在给硅谷做嫁衣。

主要是人才跑了。

最让人震惊的人才流失,无疑是AI之父杰弗里·辛顿的辞职。

此外,早在2017年,谷歌就提出革命性概念——“自注意力”,成为Transformer模型的核心部分。

提出概念的8位作者,业界人称Transformer八子,已经全部出走。

其中1人加入OpenAI,7人自己创业,如Essential.ai、Character.ai、Cohere等公司,大多都已经崭露头角。

OpenAI可不止挖了这么一个人。去年底到今年2月,已确定从谷歌跳槽到OpenAI的高级科学家,至少有12人。

仅ChatGPT发布界面的“致谢”项目,其中就有5位前谷歌大脑研究员。

薅人才的还有马斯克。

今年7月,马斯克官宣成立xAI,12核心成员中有7位都是前谷歌科学家,领头人Igor Babuschkin在谷歌学术上引用甚至超过1.7万次。

他们为什么都要跳槽?

除了上面说到的官僚化、制度僵化问题,更重要的一点,是创意转化为产品的门槛太高。

谷歌体量这么大,你除非搞个几十亿美元的大项目,否则公司管理层看都不看一眼。

但是,建立大项目,往往又需要不断试错和迭代,已经习惯赚快钱的谷歌有点无法忍受风险。

这就是公司越来越大带来的坏处。

好吧,又说回*点了,成了个恶性闭环。

正如彭博社所评价的那样:

某种意义上,这家公司成了自身成功的牺牲品。

02

不得不出手

如果你问Chat GPT:为什么谷歌在AI开发上晚了一点?

出乎意外的是,Chat GPT并不认为谷歌晚了,说它还是领头羊。

瘦死的骆驼比马大,你大爷还是你大爷。

如不是作茧自缚于体制僵化、伦理安全等问题,又怎么会一度“落后”。

就像NASA虽然放弃了太空计划几十年,但马斯克一拿到技术图纸,立马就能上天。

底子尚在,只要集中精力办事,谷歌想赶上异军突起的小老弟,还是不难的。

关键是需要理由:我为什么要烧钱去搞大模型。

首先,得保命。

这跟企业本身的产品战略有关。

谷歌是靠搜索发家的,广告收入也很依赖搜索引擎。但ChatGPT,可以说是AI时代的一种搜索模式。

更关键的是,OpenAI背后是微软,研发资金源源不绝,这就动了谷歌的命根子了。

再不奋起直追,搞不好连主业都没了。

其次,金钱诱惑。

过去一年,OpenAI出尽了风头,目前估值达到860亿美元,是半年前的三倍。

上面我们说了,几十亿美元的项目,谷歌管理层都不稀罕看的。

那上千亿的呢?

吸睛又吸金,还引领未来,你干不干?

当然干。

行家一出手,就知有没有,因为一出手就是王炸。

对于Gemini,谷歌自己是这么解说的:“相对之前的技术,Gemini能够进行更复杂的推理,理解更加细微的信息。它通过阅读、过滤和理解信息,可以从数十万份文件中提取要点,将有助于在从科学到金融的许多领域实现新的突破。”

首先是交互性的突破,这意味着Gemini的市场化能力比GPT强。

为什么?

对AI而言,所谓的交互性,相当于人类的五感,它能看到、能听到、能闻到、能尝到,并以不同维度的方式表达出来。

以电影行业为例。

未来,很可能所有演员和导演都将失业。

比如,你的电脑接入再升级两个版本的Gemini,它不仅能理解你想拍出来的场景、情绪、构景,还能给出建议,甚至在极短的时间内生成炫酷的*。

更夸张的是,你的电影,不是固定的!

AI会在后台操纵,它将根据观众的实时反应,不断调整接下来的情节和画面,实现真正的个性化。

到那时,不仅是创作者和AI之间,还包括受众,这才算真正的人机交互。

电影还只是其中一方面,包括音乐、动漫、游戏等任何具备消费价值的娱乐领域,都将变得和电影一样:去中心化。

每个人都是*的大娱乐家,只要你有足够的耐心。

你能想象,这些将催化多大的消费市场吗?

当然,这些还比较遥远,至少目前的Gemini不可能办到。

但它已经至少已经做到了,比ChatGPT变现能力更强。

怎么说?

毕竟ChatGPT都发布一年多了,用户超过1亿,已经开始赚钱了,品牌和口碑都建立起来了。

你现在才搞个大模型,光性能比他强没用,必须要比他更能赚钱。

所以谷歌这次发布的Gemini有三个版本:Gemini Ultra、Gemini Pro、Gemini Nano,性能依次递减。

为什么这么做?

因为你的用户分B端和C端,两者的需求不一样。

Ultra参数量*,适用于高度复杂的任务,就给B端企业客户,收费贵一点。

Nano参数小,对设备要求也低,在手机上就能用。

这跟苹果的发布会很类似,有七八万的工作台,有办公用的iMac,也有普通手机iPhone。

版本不一样,价格也不一样。

谷歌这么做,才是成熟科技公司的做法。

因为你的产品,最终是要解决客户问题的,否则不会有持续性的市场。

03

尾声

其实,国内许多大厂的困境,跟谷歌是一样的。

它们也跟进了,但太心急了,年初就抢着推出了各种大模型。

虽然抢了时间,但口碑比较差。

反观谷歌,投入了足够的资源和时间,才不紧不慢丢出王炸,镇住全场。

这就叫,不鸣则已、一鸣惊人。

你急什么呢?知道你落后了,踏踏实实追就行了,真没必要赶鸭子上架、打肿脸充胖子。

这是我们需要深刻反省的问题。

风口来了,当然要追,但别乱追。

不然真成了炒股价的皮包公司了,对得起自己科技巨头的名声吗?

*本文作者贝吉塔,由新芽NewSeed合作伙伴格隆汇授权发布,转载请联系原出处。如内容、图片有任何版权问题,请联系新芽NewSeed处理。