NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构的高效性能

NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构的高效性能

NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构的高效性能
大型语言模型(LLMs)虽然在适应新任务方面取得了长足进步,但它们仍面临着巨大的计算资源消耗,尤其在复杂领域的表现往往不尽如人意。...
2024-10-21 · 浏览134次
苹果内部员工自揭其短:生成式AI研发竟已落后两年多

苹果内部员工自揭其短:生成式AI研发竟已落后两年多

苹果内部员工自揭其短:生成式AI研发竟已落后两年多
前两天,苹果更新了 iPad mini 产品线,而这款最小型的 iPad 已经三年没有更新了。很显然,这次更新也是苹果为了让全产品线都具备其最新的 AI 能力。...
2024-10-21 · 浏览102次
黄仁勋新访谈:OpenAI是这个时代最具影响力公司之一,马斯克19天创造工程奇迹

黄仁勋新访谈:OpenAI是这个时代最具影响力公司之一,马斯克19天创造工程奇迹

黄仁勋新访谈:OpenAI是这个时代最具影响力公司之一,马斯克19天创造工程奇迹
10 月 4 日,播客节目 BG2(Brad Gerstner 和 Clark Tang)邀请到了英伟达 CEO 黄仁勋,他们一起讨论了 AGI、机器学习加速、英伟达的竞争优势...
2024-10-21 · 浏览113次
Jeff Dean亲授职业秘籍,力荐计算机!编码改变全世界

Jeff Dean亲授职业秘籍,力荐计算机!编码改变全世界

Jeff Dean亲授职业秘籍,力荐计算机!编码改变全世界
Jeff Dean亲授职业秘籍,力荐计算机!编码改变全世界...
2024-10-21 · 浏览101次
Ilya预言成真,下一个token预测直达AGI!智源首发原生多模态世界模型Emu3,不用扩散

Ilya预言成真,下一个token预测直达AGI!智源首发原生多模态世界模型Emu3,不用扩散

Ilya预言成真,下一个token预测直达AGI!智源首发原生多模态世界模型Emu3,不用扩散
Ilya预言成真,下一个token预测直达AGI!智源首发原生多模态世界模型Emu3,不用扩散...
2024-10-21 · 浏览126次
英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快

英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快

英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快
英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快...
2024-10-20 · 浏览167次
大模型在装傻!谷歌苹果最新发现:LLM知道但不告诉你,掌握知识比表现出来的多

大模型在装傻!谷歌苹果最新发现:LLM知道但不告诉你,掌握知识比表现出来的多

大模型在装傻!谷歌苹果最新发现:LLM知道但不告诉你,掌握知识比表现出来的多
大模型在装傻!谷歌苹果最新发现:LLM知道但不告诉你,掌握知识比表现出来的多...
2024-10-20 · 浏览107次
Meta 发布新 AI 模型:利用 AI 来评估 AI 的能力,无需人类参与

Meta 发布新 AI 模型:利用 AI 来评估 AI 的能力,无需人类参与

Meta 发布新 AI 模型:利用 AI 来评估 AI 的能力,无需人类参与
这种技术将复杂问题分解为多个逻辑步骤,从而提高了在科学、编程和数学等高难度领域中的答案准确性。Meta 的研究人员使用完全由 AI 生成的数据来训练这个评估器,从而在这一过程中...
2024-10-19 · 浏览165次
谷歌 Gemini Code Assist Enterprise 正式上线,可根据企业内部代码库生成 AI 见解

谷歌 Gemini Code Assist Enterprise 正式上线,可根据企业内部代码库生成 AI 见解

谷歌 Gemini Code Assist Enterprise 正式上线,可根据企业内部代码库生成 AI 见解
据谷歌官方新闻稿,谷歌 Gemini Code Assist Enterprise 企业 AI 现已正式上线,标准版 Gemini Code Assist 主要侧重于根据开发者...
2024-10-19 · 浏览153次
山姆・阿尔特曼眼球扫描加密项目推出 Orb 新品:在 AI 时代验证对象是否为人类

山姆・阿尔特曼眼球扫描加密项目推出 Orb 新品:在 AI 时代验证对象是否为人类

山姆・阿尔特曼眼球扫描加密项目推出 Orb 新品:在 AI 时代验证对象是否为人类
科技媒体 The Verge 今天(10 月 19 日)发布博文,报道称 Worldcoin 公司现已更名为 World,并推出了增强版研究扫描 Orb 设备。...
2024-10-19 · 浏览117次
微软开源 bitnet.cpp 1-bit LLM 推理框架:不靠 GPU 可本地运行千亿参数 AI 模型,能耗最多降低 82.2%

微软开源 bitnet.cpp 1-bit LLM 推理框架:不靠 GPU 可本地运行千亿参数 AI 模型,能耗最多降低 82.2%

微软开源 bitnet.cpp 1-bit LLM 推理框架:不靠 GPU 可本地运行千亿参数 AI 模型,能耗最多降低 82.2%
科技媒体 marktechpost 昨日(10 月 18 日)发布博文,报道称微软公司开源了 bitnet.cpp,这是一个能够直接在 CPU 上运行、超高效的 1-bit 大...
2024-10-19 · 浏览273次
Jurgen、曼宁等大佬新作:MoE重塑6年前的Universal Transformer,高效升级

Jurgen、曼宁等大佬新作:MoE重塑6年前的Universal Transformer,高效升级

Jurgen、曼宁等大佬新作:MoE重塑6年前的Universal Transformer,高效升级
7 年前,谷歌在论文《Attention is All You Need》中提出了 Transformer。...
2024-10-19 · 浏览110次
第一页 · 上一页 · 下一页 · 当前第20页