2万亿巨兽来袭,小扎亮底牌! 首次回应Llama 4风暴,开源榜单背锅
【导读】Meta首届LlamaCon开发者大会亮点满满,Llama加持的Meta AI新升级,正式开放一行代码即可调用的API。更劲爆的是,小扎在采访中剧透,2万亿满血版Llama 4即将上线。
Meta在首届LlamaCon开发者大会上火力全开。
不仅发布了对标ChatGPT的Meta AI App,还有面向开发者的Llama API预览版,正式向OpenAI发起挑战!
Meta首席产品官Chris Cox表示,Llama及其衍生模型的下载量,两个半月内从10亿次飙升至12亿。
开源AI已是大势所趋。
Llama模型已深度融入WhatsApp、Instagram等Meta旗下应用,在对话交互、移动场景适配等方面表现出色。
最新采访中,小扎首次对Llama 4基准测试做出回应,关于开/闭源,AI未来发现给出了自己的预判。
他甚至豪言,未来12-18个月,大部分代码将由AI编写。
AI智能体不仅仅是自主完成,还会设定目标、运行测试、发现问题,能够写出比顶级工程师更优秀的代码。
2万亿Llama巨兽即将上线
访谈刚开始,扎克伯格透露现在每个月有上亿人使用Meta AI。
他说他们正在构建一种新的推荐系统,不仅包括所有你感兴趣的信息,还包括你与AI互动的内容。
为了推广LlamaCon开发者大会,小扎参加了知名科技主持人Dwarkesh播客节目
「那将是下一个非常令人兴奋的事情。我十分看重这件事。」他说。
接着,他将话题转向了刚刚发布的Llama 4。
扎克伯格说最受欢迎的Llama 3模型是8B参数的,所以这次Llama 4系列中也引入了一款这样大小的模型,他们内部代号叫「Little Llama」,会在几个月内推出。
他说已经发布的Llama 4 Scout和Maverick很棒,是市面上性价比最高的模型之一。
不过扎克伯格显然不想说这些传闻,他随后放出猛料,即将推出一款巨无霸模型Behemoth。
Behemoth是Meta的第一个前沿模型,拥有超过2万亿参数。
扎克伯格表示,这个模型太大了,以至于不得不构建大量的基础设施才能对其进行后训练。
开源、闭源之争
Dwarkesh提到在过去一年,最好的开、闭源模型之间的差距有所扩大。
Llama 4 Maverick在聊天机器人竞技场的排名已经下降到了第35,在许多主要基准测试中表现都不如o4-mini或Gemini 2.5 Flash。
对此,扎克伯格回应说,开源模型在过去一年整体上是非常好的。
他表示,过去Llama是唯一真正创新的开源代码模型,但现在有很多。并预测称,今年开源将普遍超过闭源成为最常用的模型。
然后是推理,扎克伯格说这是一个非常好的范式,他们也在研发Llama 4的推理模型,并将会适时推出。
不过他也表示,对于很多应用来说,模型的计算成本和延时也是非常关键的点。比如消费类的产品,人们不希望等待半分钟才得到答案。
至于聊天机器人竞技场排名及开源基准测试表现不佳,扎克伯格解释说,这些测试并非大家平时会做的事情。它们衡量的东西与人们实际关心的事情不同。
所以,Llama没有过度优化这类东西,他们始终将产品锚定在使用价值上,有时这与基准不完全吻合。
对此,他举例说,Sonnet 3.7是个很好的模型,但并不在竞技场的排名顶端。
他说团队可以很轻易地将Llama 4 Maverick调整到排名顶端,但他们选择不做任何调整,主要与用户价值对齐。
他认为模型需要做到:快速、非常自然地交互、原生多模态及融入到日常互动中。
回应DeepSeek
Dwarkesh把话题转向了DeepSeek,他问扎克伯格是否担心DeepSeek会超过他们。
对此,扎克表示这是一场竞争。
中国有更多的电力,而美国需要专注于建设数据中心和能源,否则会处于明显的劣势。
扎克伯格认为,由于受到算力的限制,DeepSeek做了非常令人印象深刻的底层优化。
因为出口管制,DeepSeek基本上不得不花费大量精力和时间进行底层基础设施优化,而美国的实验室则不必这样做。
提到技术进展时,扎克认为蒸馏是过去一年中真正崛起的强大技术之一,它的效果比大多数人预测的都要好。
你可以通过蒸馏捕捉到一个大模型90%-95%的智能,然后在一个10%大小的系统中运行。
这相当不错。
更有趣的是,随着多样化开源社区的发展,还可以从多个来源进行蒸馏。
比如说,Llama的多模态能力很强,另一个模型的编码方面做得更好。那你就可以从这两个模型中提取信息,蒸馏出一个更好的东西。
智能爆炸,AI编写大部分代码
Dwarkesh提到了智能爆炸概念。
简单说就是AI能够实现自主升级。
扎克伯格认为很有可能。他们在Meta内部开发了一个编码智能体和一个AI研究智能体,专门来推进Llama研究。
扎克伯格猜测,在未来12到18个月内,大部分工作代码将由AI编写。
给AI一个目标,它可以运行测试,可以改进事物,可以发现问题,可以编写比团队中非常优秀的人还要高质量的代码。
除了信息和生产力,还会有一些AI系统更注重陪伴。将会有一大堆AI只是有趣和娱乐,并出现在你的动态信息流中。
要实现智能爆炸并不容易。扎克表示,建设物理基础设施需要时间。需要一大堆的软硬件、网络、建筑、法律、能源等问题。
而且,人们学习使用、适应这些系统也需要时间。
这实际上是一种「共同进化」——人们学习如何使用这些人工智能助手,同时,人工智能助手也在学习人们关心的事情从而变得更好。
人工智能朋友、治疗师与女友
Dwarkesh接着问道,人们如何与AI保持健康的关系。
扎克伯格回答说,人们会使用对他们有价值的东西。
他说他在设计产品时的一个核心指导原则是,人们是聪明的,他们知道生活中什么是有价值的。
扎克说根据自己的经验,如果你认为某人正在做错误的事情,而他自己认为这非常有价值,那么大部分情况下,都是你搞错了。
你只是还没有理解他们所做的事为什么有价值、对他们的生活有哪些帮助。
扎克说他看到人们使用Meta AI的主要事情就是如何面对艰难的对话,比如,「我和我的女朋友有个问题。帮帮我进行这次对话。」或者「我需要在工作中和老板进行一次艰难的谈话。我该如何进行这次谈话?」。
这些都非常有帮助,随着交流的深入,AI会更好地了解你。
不过,他也表示虚拟治疗师、虚拟女友之类的产品还处在非常早期的阶段。
100倍生产力,人类不会被淘汰
想象一下,如果软件生产力在两年内提升100倍,会发生什么?
小扎表示,回顾过去100-150年发展轨迹,人类的精力从生存逐渐转向创意与文化,因为基本需求的满足也越来越容易。
他预测,随着AI工具成为超人软件工程师,这一趋势将加速。这些工具不仅能治愈疾病,解决重大问题,还将此生文化与社交活动的井喷。
100倍生产力,可能彻底改变企业的运营方式。
小扎分享了一个引人注目的例子——Meta每天服务35亿用户,提供语音客户支持是一个不切实际的想法, 成本可能高达每年100-200亿美元。
但如果AI处理90%客户咨询,就像自动驾驶汽车能应对大部分路况,Meta就能负担得起这项服务。
结果,并非是工作岗位的减少,而是增加。
通过大幅降低成本,AI可能让高接触度的服务变得可行,从而创造更多人工客服岗。
也就是说,100倍生产力同样可能扩大机会、让人们选择工作时间,追求创意和个人兴趣。
商业化AGI
此外,小扎还分享了自己对AI商业化模式的看法,包括广告、订阅制,以及多样商业模式的未来。
他指出,广告的魅力在于,它让用户无需付费就能享受优质服务。通过现代广告体系,不仅能覆盖成本,还能为用户增添价值。
在Meta,面向消费者的AI服务可能会继续以广告支撑,提供免费基础体验。
小扎也表示,「并非所有的AI服务都适合免费模式」。
他以Netflix、ESPN为例,去阐述内容生产成本高昂的服务,同样需要用户付费订阅,因为广告收入不足以覆盖成本。
同样,AI的商业化也是如此。
Meta版ChatGPT超进化
Llama 4无缝集成
大会上,Meta AI基于全新Llama 4模型再次升级,实现了全双工语音交互,就像和真人聊天一样,可以边听边说、随时打断。
它能打通Facebook和Instagram账号,摸清你的兴趣爱好,记住聊过的内容。
更酷的是,这款App能和Meta RayBan AI眼镜无缝配合,戴上眼镜就能直接和AI聊天。
对话记录也能在App和网页端随时查看。目前Meta AI App及Web版本已免费开放。
Meta AI App链接:https://ai.meta.com/
一行代码,即可调用Llama API
面向开发者,LlamaCon大会上小扎还放出了令人惊艳的Llama API。
它支持一键创建API密钥,开发者只需一行代码就能调用。
适配Python、Typescript以及OpenAI SDK,调用OpenAI API的产品可无缝切换。
在Llama API的交互式playground,开发者可以试用不同模型,调整各种参数,找到最适合的配置。
开发者还能对Llama 3.3 8B模型进行微调:上传自己的数据,或者使用Meta提供的合成数据工具包,在平台上实时查看训练进度,训练完成还能自由下载。
Meta宣布和Cerebras、Groq合作以加快推理速度。目前,Llama API预览版可以申请免费试用。
参考资料:
https://venturebeat.com/ai/metas-first-dedicated-ai-app-is-here-with-llama-4-but-its-more-consumer-than-productivity-or-business-oriented/
https://venturebeat.com/ai/meta-unleashes-llama-api-running-18x-faster-than-openai-cerebras-partnership-delivers-2600-tokens-per-second/
https://www.dwarkesh.com/p/mark-zuckerberg-2
https://ai.meta.com/blog/llamacon-llama-news/
https://www.youtube.com/watch?v=6mRP-lQs0fw
https://www.facebook.com/MetaforDevelopers/videos/1792349135036347/
声明:本文转载自新智元,转载目的在于传递更多信息,并不代表本社区赞同其观点和对其真实性负责,本文只提供参考并不构成任何建议,若有版权等问题,点击这里。

游客
- 鸟过留鸣,人过留评。
- 和谐社区,和谐点评。