能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径
文本大模型卷出新高度,Claude 3 在数学、编程、多语言理解、视觉等多个维度超越 GPT-4 和上线不足一个月的 Gemini 1.0 Ultra。...
2024-03-16
·
浏览327次
苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人
苹果也在搞自己的大型多模态基础模型,未来会不会基于该模型推出相应的文生图产品呢?我们拭目以待。...
2024-03-16
·
浏览207次
4万亿个晶体管,单机可训练比GPT4大10倍的模型,最快最大的芯片面世
刚刚,芯片创业公司 Cerebras 宣布了该公司历史上最重要的消息,「我们发布了世界上最快的芯片,该芯片拥有高达 4 万亿个晶体管。」...
2024-03-15
·
浏览143次
智能体的ChatGPT时刻!DeepMind通用AI向人类玩家进化,开始理解游戏
在 AI 智能体这个领域,谷歌 DeepMind 又有了一项里程碑式研究。...
2024-03-15
·
浏览151次
可训练24万亿参数的大模型,Cerebras 推出其下一代晶圆级 AI 芯片
CS-3 可训练高达 24 万亿个参数的神经网络模型,是当前最大 LLM 规模的 10 倍多...
2024-03-15
·
浏览135次
200 名专家编写报告:AI 发展可能对人类构成“灭绝级威胁”
美国国务院委托编写了一份新报告,警告 AI 正呈指数级发展,可能会对人类构成“灭绝级威胁”。...
2024-03-14
·
浏览178次