NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构的高效性能
大型语言模型(LLMs)虽然在适应新任务方面取得了长足进步,但它们仍面临着巨大的计算资源消耗,尤其在复杂领域的表现往往不尽如人意。...
2024-10-21
·
浏览134次
苹果内部员工自揭其短:生成式AI研发竟已落后两年多
前两天,苹果更新了 iPad mini 产品线,而这款最小型的 iPad 已经三年没有更新了。很显然,这次更新也是苹果为了让全产品线都具备其最新的 AI 能力。...
2024-10-21
·
浏览102次
黄仁勋新访谈:OpenAI是这个时代最具影响力公司之一,马斯克19天创造工程奇迹
10 月 4 日,播客节目 BG2(Brad Gerstner 和 Clark Tang)邀请到了英伟达 CEO 黄仁勋,他们一起讨论了 AGI、机器学习加速、英伟达的竞争优势...
2024-10-21
·
浏览113次
Ilya预言成真,下一个token预测直达AGI!智源首发原生多模态世界模型Emu3,不用扩散
Ilya预言成真,下一个token预测直达AGI!智源首发原生多模态世界模型Emu3,不用扩散...
2024-10-21
·
浏览126次
英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快
英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快...
2024-10-20
·
浏览167次
大模型在装傻!谷歌苹果最新发现:LLM知道但不告诉你,掌握知识比表现出来的多
大模型在装傻!谷歌苹果最新发现:LLM知道但不告诉你,掌握知识比表现出来的多...
2024-10-20
·
浏览107次
Meta 发布新 AI 模型:利用 AI 来评估 AI 的能力,无需人类参与
这种技术将复杂问题分解为多个逻辑步骤,从而提高了在科学、编程和数学等高难度领域中的答案准确性。Meta 的研究人员使用完全由 AI 生成的数据来训练这个评估器,从而在这一过程中...
2024-10-19
·
浏览165次
谷歌 Gemini Code Assist Enterprise 正式上线,可根据企业内部代码库生成 AI 见解
据谷歌官方新闻稿,谷歌 Gemini Code Assist Enterprise 企业 AI 现已正式上线,标准版 Gemini Code Assist 主要侧重于根据开发者...
2024-10-19
·
浏览153次
山姆・阿尔特曼眼球扫描加密项目推出 Orb 新品:在 AI 时代验证对象是否为人类
科技媒体 The Verge 今天(10 月 19 日)发布博文,报道称 Worldcoin 公司现已更名为 World,并推出了增强版研究扫描 Orb 设备。...
2024-10-19
·
浏览117次
微软开源 bitnet.cpp 1-bit LLM 推理框架:不靠 GPU 可本地运行千亿参数 AI 模型,能耗最多降低 82.2%
科技媒体 marktechpost 昨日(10 月 18 日)发布博文,报道称微软公司开源了 bitnet.cpp,这是一个能够直接在 CPU 上运行、超高效的 1-bit 大...
2024-10-19
·
浏览273次
Jurgen、曼宁等大佬新作:MoE重塑6年前的Universal Transformer,高效升级
7 年前,谷歌在论文《Attention is All You Need》中提出了 Transformer。...
2024-10-19
·
浏览110次