马斯克为何要作开源“秀”

2024-03-20
关注
3月11日星期一,马斯克发了一条推特,说Grok将在一周内开源。许多开发人员等待了一周,直到周日Grok才正式将代码推到开源社区。 Grok-1是一种基于Transformer架构的自回归模型,参数规模达到3140亿,是目前参数最大的开源模型之一,Grok-免费商用,就像主流开源大模型一样。 Grok最大的亮点是直接调用X中的实时数据和“幽默”。 但是开源版的Grok已经打折了——在开发者手中,Grok无法获取X数据。根据这个开源信息,Grok在2023年11月推出后调用的X数据并没有作为训练数据沉淀到Grok中。 除了源折扣,Grok本身的性能并不占主导地位。刚上线的时候,Grok的分数远远落后于当时的Palm 2、Claude 2.GPT-4。最典型的问题是,它支持的上下文只有8192个token。 Grok的关注(GitHub上线3天收获3.9万Star)似乎很大一部分来自马斯克自身的流量热度。开源Grok被马斯克说是为了实现“人工智能造福全人类”的目标,但在与OpenAI的诉讼中,有人认为,Grok 开源的目的之一是为马斯克起诉和谴责OpenAI提供的事实依据——这是马斯克亲自操作的“AI 大秀”。 开源Grok是作秀吗? 开源是企业和开发者跳双人舞的“社区游戏”,但Grok的“舞伴”根本无法被普通开发者控制。 许多开源大语言模型都是在Grok-1之前(LLM)参数只有70亿,LLaMA-开源最大参数只有700亿。 马斯克直接开源了自己最大的3140亿参数模型,据估计Grok-1需要628左右 GB GPU内存几乎不可能运行,普通开发人员几乎不可能在本地尝试Grok-1。对于云服务用户来说,A100或H100至少需要8个80GB显存 GPU。 用户在GrokGitHub讨论区留言说:谷歌云80GB A1004卡服务器每小时运行成本为20美元,不适合我。(GCP instance with 4 A100 80GB; it cost around $20 per hour; this is not for me LOL.) Grok开源后,作者还加入了一个关于Grok的开源讨论小组,但第二天,小组讨论的焦点已经转向Qwen-1.5,参数只有40亿。 不过,Grok-1还支持8bit量化。一些开发人员认为,如果模型可以量化到160GB,“可玩性”将大大提高。计算能力较差的开发人员可以等到官方或其他开发人员发布量化版本。 至少在短期内,开源Grok对普通开发人员不是很友好。那么,开源对Grok本身有什么帮助呢?从传统的开源角度来看,也很难说。 有些人认为开源模型可以聚集更多的开发者来帮助优化模型。但今天的开源人工智能几乎与传统的开源软件逻辑完全不同。代码开源对人工智能大型模型的推广并不像以前的开源软件那么明显。 在传统软件开发过程中,在系统、工具或软件开源后,开发人员可以直接修复bug并根据共享代码优化程序。然而,今天的大多数人工智能模型本身都是一个大黑盒子,要发现问题并训练和优化模型的底层算法并不容易。 “人工智能大模型培训是一项非常‘集中’的工作。”生数科技首席执行官唐家宇表示,人工智能大模型很难通过“分布式”开源收集开发者的“贡献”。相反,闭源可以更多地关注智力资源和计算能力资源,以便不断迭代。 一些开发人员认为,对于开源人工智能模型的作者,最大的好处是开放知名度——Grok当前的模型能力,只吸引一群开发人员、公司、机构试用、开发模型,逐步建立模型认可,稳定其在人工智能大模型领域的“湖地位”,提高人工智能大模型的影响力。 闭源Grok缩小了道路? 从人工智能行业的角度来看,Grok的关注度并不高。由于模型运行分数不高,过去几个月发布的大型人工智能模型在比较评估数据集得分时,很少有人标记Grok。 从业务角度来看,Grok在X平台上的表现并不理想。 Grok上线到X后,与ChatGPT Plus采用订阅制,但ChatGPTGPT-3.5免费开放,Grok一刀切,只提供给X Premium会员。X Premium会员的订阅费是每月16美元,每年168美元。 Grok从一开始就没有获得X庞大用户基础的红利,因为它设定了付费门槛。 据SimilarWeb统计,2024年2月,x.com总访问量为1.04亿次,平均访问时间仅为24秒。与其他主流闭源AI的同期流量相比,chat.openai.com访问量为15.5亿次,平均访问时间为7分33秒;gemini.google.com访问量为3.161亿次,平均访问时间为6分22秒;相对较小的claude.人工智能访问量为2086万次,平均访问时间为5分48秒。X与三个AI对话网站流量  数据来源 |SimilarWeb 虽然影响网站流量的因素很多,x.com网站的受众和属性与其他几个网站也有明显的不同。直接比较流量并不能完全解释问题,但访问时间的巨大差异也反映了X用户不太可能与付费Grok交谈。 为了补贴X的广告收入,马斯克最早的战略定位可能是为了促进X的Premium会员销售。然而,Grok在X中的作用很可能达不到马斯克的预期。而不是一直在X 在Premium中“躺平”,开源Grok可能会给马斯克和x.人工智能开启了新局面。 开源激起千层浪 在人工智能大模型热潮中,依靠开源大模型建立行业地位的公司并不少见,包括MistralAI、国内智谱、阿里通义千问等。 Meta深陷元宇宙泥潭,依靠开源LLaMA模型进行翻身。2023年,全球市场最大的变数是AI大模型,Meta最大的变数是开源AI大模型。 Meta通过开源LLaMA展示了它的大型语言模型(LLM)该领域的技术实力和开放创新的态度在一定程度上帮助公司缓解了市场对其元宇宙战略的担忧。因此,Meta的股价也在一年内翻了几番,市值从3155亿美元上升到1.2万亿美元,上升到19个京东。 LLAMA的开源,特别是其成本效益高的特点,对Meta具有战略意义。与Google、Microsoft等竞争对手的AI大模型相比,LLaMA的小巧和高性能使Meta能够以更低的成本部署高效的AI模型。这不仅提高了人工智能技术的普及率,也为Meta未来在各种应用和用例上的广泛部署提供了可能。一些分析人士认为,生成人工智能预计将推动一个价值超过500亿美元的市场,基于Meta的业务范围,从聊天机器人到游戏,再到未来的生产力软件。 虽然LLAMA最初的开源被业内传说无意中“泄露”,但其最终结果为Meta在AI大模型行业奠定了技术和市场的领先地位。 马斯克对“开源”的战略逻辑并不陌生。 2014年,马斯克在特斯拉开放了350多项电动汽车专利技术。“特斯拉的主要目标是加速世界向可持续能源的转变,”马斯克在一次采访中说。事实证明,马斯克大公无私的“开源”后来使他成为最大的受益者。 特斯拉开放专利的做法一举混乱了全球汽车市场的水。在特斯拉专利的帮助下,大量新能源汽车公司直接激活了整个新能源汽车市场。作为行业领先企业,特斯拉凭借长期积累的行业声誉和技术发展实力,继续保持行业领先地位。 虽然开源Grok可能不会像特斯拉的开放专利那样激起千层浪,改变整个人工智能行业的格局,但对于目前的X来说.人工智能也应该产生一些积极的影响。
您觉得本篇内容如何
评分

评论

您需要登录才可以回复|注册

提交评论

感知视界

这家伙很懒,什么描述也没留下

关注

点击进入下一篇

IMU 在人形机器人上的应用与挑战

提取码
复制提取码
点击跳转至百度网盘