工程 标签,匹配到约143个结果, 耗时0.0400秒
精度与通用性不可兼得,北大华为理论证明低精度下scaling law难以实现
大模型量化通过将模型参数从较高的精度(如 bfoat16)压缩到低精度(如 int8 或 int4)来降低模型推理的开销,提高模型推理的速度。在大语言模型的实际部署中,量化技术...
2024-11-19
·
浏览29次
当视觉大模型陷入认知失调,马里兰大学构建了一个幻觉自动生成框架
想象一下,有一天你在沙漠中看到一个雪人,或者在雪地里发现一棵棕榈树。面对这些与周围环境格格不入的景象,你是否会感到心理上的不适?...
2024-11-12
·
浏览59次
OpenAI o1强推理能提升安全性?长对话诱导干翻o1
最近,以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。...
2024-11-08
·
浏览76次
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%
字节跳动豆包大模型团队于近日提出超连接(Hyper-Connections),一种简单有效的残差连接替代方案。...
2024-11-08
·
浏览73次
OpenAI重拾规则系统,用「AI版机器人定律」守护大模型安全
在大算力和大数据让基于统计的 AI 模型真正变得强大且有用之前,基于规则的系统长期以来是语言模型的主导范式。...
2024-11-06
·
浏览61次
NeurIPS 2024 | 机器人操纵世界模型来了,成功率超过谷歌RT-1 26.6%
对于人类而言,一旦掌握了 “打开瓶盖” 的动作,面对 “拧紧螺丝” 这样的任务通常也能游刃有余,因为这两者依赖于相似的手部动作。...
2024-11-01
·
浏览92次