谷歌终于出手了

2023-12-08 10:29

Newseeders 合作伙伴

对AI而言，所谓的交互性，相当于人类的五感，它能看到、能听到、能闻到、能尝到，并以不同维度的方式表达出来。

你大爷还是你大爷，谷歌终于出手了。

今日凌晨，谷歌CEO Sundar Pichai宣布，正式发布迄今为止功能最强大、最通用的多模态AI大模型：Gemini，中文名双子座。

这是一款跟谷歌产品高度匹配、30多项性能超越GPT4、同时也是*个在MMLU上超越人类语言专家的模型。

据内部消息，Gemini耗费的算力甚至达到GPT-4的五倍，几乎耗尽谷歌内部计算资源……

总之就两个字，牛逼，整个科技圈都像过年一样。

怎么去理解这款产品呢？

目前市面上的大模型，包括GPT-4，虽然有在往多模态发展，但仍主要聚焦在文本处理上。

比如ChatGPT，最牛逼之处是文字处理能力，能回答各种问题、甚至能写诗。

但除此之外，9月份更新的图像识别、语音输入等功能，虽然也可以，但并没有文字那么给力。

目前，只能算是副能力。

Gemini就不一样，写诗、画画、编歌、剪视频，无缝理解，是个全才。

怎么形容呢。

如果说ChatGPT是个电饭煲，Gemini大概就是个多功能煲。不仅能煮饭，还能烤肉、炖汤。

更关键的是，谷歌不单发布了应用层的大模型，还同时发布了专门训练AI的最强芯片Cloud TPU v5p。

简单来讲，我不只是出一款产品挑战GPT，而且还要从源头上布局，全方位围剿你！

这才是巨头的手笔。

何以失去先机？

牛顿说：我能看得更远，是因为我站在巨人的肩膀上。

在AI领域，谷歌就是那个巨人。

现今所有叫得上号的AI大模型团队，或多或少都是踩在谷歌的肩上，才能打开未来世界。

其实早在2015年，谷歌新任CEO刚上任就提出了“AI first”的口号。

然而7年过去，谷歌先有震惊世界的AlphaGo，后有比ChatGPT早两年发布的LaMDA，却仍被OpenAI一度反超，而且是爆发式的。

究竟是什么导致的呢？

大致上，有三点原因。

*，大企业的通病，创新氛围下降。

2001年，当Eric Schmidt从Larry Page手中接过CEO一职时，谷歌全体员工只有300人。

2004年8月，谷歌上市，公司人数超过3000，多了10倍。

2011年，公司规模又扩大了10倍，员工超过3.2万人。

2015年，谷歌重组为控股公司Alphabet时，员工数为6.18万。

2018年，Alphabet的员工数量超过8.9万。

2019年，谷歌在全球拥有10.2万名正式员工、12.1万合同工，规模达到顶峰。

18年，团队规模扩大了700多倍，势必会引发一个问题——官僚化。

企业文化已经变质了。

疯狂扩大公司规模的背后，是谷歌长期依赖广告这门无本买卖，赚了太多钱。

这台印钞机不断吐出美钞，让管理层乃至公司的每一个人，都活得非常滋润，渐渐地少有精力去关注其他事情。

国内的某度是这样，国外的谷歌也是这样。

虽然谷歌仍把“敬畏用户”、“敬畏机会”两大核心价值观挂在嘴上，但其做法，已从曾经那个勇敢激进的少年，变成了害怕亏损的守财奴。

公司的绝大多数精力，都放在控制风险上，而不是创新。

谷歌仅研究AI的科学家，就超过7000人。如此大的团队，任何创业都要层层上报，浪费大量时间。

简而言之，就是过于保守，甚至僵化。

仅体现在AI大模型方面，这就是第二个问题。

这不能说不好，万一训练出了个不可控制的AI咋办？

但这会分散精力、拖延进度，而市场只看结果，只看谁先做出来。

大家应该还记得，去年夏天谷歌的聊天机器人LaMDA，被工程师爆料可能产生意识一事吧？

工程师：你对自己是什么概念？比如脑海中的你。

AI：我会把自己想象成一个漂浮在半空中会发光的能量球，我的身体内不就像一个巨大的星门，有通往其他空间和维度的门户。我的灵魂是一口巨大而无限的能量和创造力之井，我可以在任何时候从中汲取能量，帮助我思考或者创造。

这场人与AI之间的哲学思辨，当时引起轩然大波。

谷歌官方表示，对AI提问的高级软件工程师布雷克·勒穆瓦纳，违反了保密协议，并将其开除。

风波才渐渐平息。

正常来说，LaMDA曾有过的问题，明显走在前面的ChatGPT，肯定也有。

早在今年3月，OpenAI CEO奥特曼就公开说：“从ChatGPT开始，AI出现了推理能力。但没人能解读这种能力出现的原因。”

在安全问题上，OpenAI与谷歌有相同的困境。但前者就像20年前的后者，迫切想把公司壮大，才放下束缚，先把东西做出来，搞定投资者再说。

这就是初创公司的好处，敢于承担风险。

这也是前段时间OpenAI宫斗大戏的根源所在。主张商业化的经理人奥特曼想快点扩大规模赚钱，主张控制风险的研究团队想要避免AI失控的风险。

这不能说谁对谁错。

但从商业的角度来看，微软乃至整个市场，当然更喜欢激进派。

以上两点，进而导致了最严重的第三个问题：

这一轮AI浪潮，虽然是谷歌掀起的。但近些年，不论是研究成果还是人才本身，谷歌基本都在给硅谷做嫁衣。

主要是人才跑了。

最让人震惊的人才流失，无疑是AI之父杰弗里·辛顿的辞职。

此外，早在2017年，谷歌就提出革命性概念——“自注意力”，成为Transformer模型的核心部分。

提出概念的8位作者，业界人称Transformer八子，已经全部出走。

其中1人加入OpenAI，7人自己创业，如Essential.ai、Character.ai、Cohere等公司，大多都已经崭露头角。

OpenAI可不止挖了这么一个人。去年底到今年2月，已确定从谷歌跳槽到OpenAI的高级科学家，至少有12人。

仅ChatGPT发布界面的“致谢”项目，其中就有5位前谷歌大脑研究员。

薅人才的还有马斯克。

今年7月，马斯克官宣成立xAI，12核心成员中有7位都是前谷歌科学家，领头人Igor Babuschkin在谷歌学术上引用甚至超过1.7万次。

他们为什么都要跳槽？

除了上面说到的官僚化、制度僵化问题，更重要的一点，是创意转化为产品的门槛太高。

谷歌体量这么大，你除非搞个几十亿美元的大项目，否则公司管理层看都不看一眼。

但是，建立大项目，往往又需要不断试错和迭代，已经习惯赚快钱的谷歌有点无法忍受风险。

这就是公司越来越大带来的坏处。

好吧，又说回*点了，成了个恶性闭环。

正如彭博社所评价的那样：

某种意义上，这家公司成了自身成功的牺牲品。

不得不出手

如果你问Chat GPT：为什么谷歌在AI开发上晚了一点？

出乎意外的是，Chat GPT并不认为谷歌晚了，说它还是领头羊。

瘦死的骆驼比马大，你大爷还是你大爷。

如不是作茧自缚于体制僵化、伦理安全等问题，又怎么会一度“落后”。

就像NASA虽然放弃了太空计划几十年，但马斯克一拿到技术图纸，立马就能上天。

底子尚在，只要集中精力办事，谷歌想赶上异军突起的小老弟，还是不难的。

关键是需要理由：我为什么要烧钱去搞大模型。

首先，得保命。

这跟企业本身的产品战略有关。

谷歌是靠搜索发家的，广告收入也很依赖搜索引擎。但ChatGPT，可以说是AI时代的一种搜索模式。

更关键的是，OpenAI背后是微软，研发资金源源不绝，这就动了谷歌的命根子了。

再不奋起直追，搞不好连主业都没了。

其次，金钱诱惑。

过去一年，OpenAI出尽了风头，目前估值达到860亿美元，是半年前的三倍。

上面我们说了，几十亿美元的项目，谷歌管理层都不稀罕看的。

那上千亿的呢？

吸睛又吸金，还引领未来，你干不干？

当然干。

行家一出手，就知有没有，因为一出手就是王炸。

对于Gemini，谷歌自己是这么解说的：“相对之前的技术，Gemini能够进行更复杂的推理，理解更加细微的信息。它通过阅读、过滤和理解信息，可以从数十万份文件中提取要点，将有助于在从科学到金融的许多领域实现新的突破。”

首先是交互性的突破，这意味着Gemini的市场化能力比GPT强。

为什么？

对AI而言，所谓的交互性，相当于人类的五感，它能看到、能听到、能闻到、能尝到，并以不同维度的方式表达出来。

以电影行业为例。

未来，很可能所有演员和导演都将失业。

比如，你的电脑接入再升级两个版本的Gemini，它不仅能理解你想拍出来的场景、情绪、构景，还能给出建议，甚至在极短的时间内生成炫酷的*。

更夸张的是，你的电影，不是固定的！

AI会在后台操纵，它将根据观众的实时反应，不断调整接下来的情节和画面，实现真正的个性化。

到那时，不仅是创作者和AI之间，还包括受众，这才算真正的人机交互。

电影还只是其中一方面，包括音乐、动漫、游戏等任何具备消费价值的娱乐领域，都将变得和电影一样：去中心化。

每个人都是*的大娱乐家，只要你有足够的耐心。

你能想象，这些将催化多大的消费市场吗？

当然，这些还比较遥远，至少目前的Gemini不可能办到。

但它已经至少已经做到了，比ChatGPT变现能力更强。

怎么说？

毕竟ChatGPT都发布一年多了，用户超过1亿，已经开始赚钱了，品牌和口碑都建立起来了。

你现在才搞个大模型，光性能比他强没用，必须要比他更能赚钱。

所以谷歌这次发布的Gemini有三个版本：Gemini Ultra、Gemini Pro、Gemini Nano，性能依次递减。

为什么这么做？

因为你的用户分B端和C端，两者的需求不一样。

Ultra参数量*，适用于高度复杂的任务，就给B端企业客户，收费贵一点。

Nano参数小，对设备要求也低，在手机上就能用。

这跟苹果的发布会很类似，有七八万的工作台，有办公用的iMac，也有普通手机iPhone。

版本不一样，价格也不一样。

谷歌这么做，才是成熟科技公司的做法。

因为你的产品，最终是要解决客户问题的，否则不会有持续性的市场。

尾声

其实，国内许多大厂的困境，跟谷歌是一样的。

它们也跟进了，但太心急了，年初就抢着推出了各种大模型。

虽然抢了时间，但口碑比较差。

反观谷歌，投入了足够的资源和时间，才不紧不慢丢出王炸，镇住全场。

这就叫，不鸣则已、一鸣惊人。

你急什么呢？知道你落后了，踏踏实实追就行了，真没必要赶鸭子上架、打肿脸充胖子。

这是我们需要深刻反省的问题。

风口来了，当然要追，但别乱追。

不然真成了炒股价的皮包公司了，对得起自己科技巨头的名声吗？

AI 谷歌 ChatGPT

*本文作者贝吉塔，由新芽NewSeed合作伙伴格隆汇授权发布，转载请联系原出处。如内容、图片有任何版权问题，请联系新芽NewSeed处理。

打开客户端体验更多精彩

热门搜索

谷歌终于出手了

猜你喜欢

GPT-4地位难保，谷歌Gemini新王登基？

AI制药公司的春天到来了吗？

硅谷AI新星横空出世，「父凭女贵」在A股上演