Claude 标签,匹配到约188个结果, 耗时0.0274秒
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开...
2024-11-19
·
浏览22次
精度与通用性不可兼得,北大华为理论证明低精度下scaling law难以实现
大模型量化通过将模型参数从较高的精度(如 bfoat16)压缩到低精度(如 int8 或 int4)来降低模型推理的开销,提高模型推理的速度。在大语言模型的实际部署中,量化技术...
2024-11-19
·
浏览29次
消息称 OpenAI、谷歌等巨头 AI 模型遇瓶颈:训练数据难寻,成本高昂
据彭博社报道,包括 OpenAI、谷歌和 Anthropic 在内的人工智能巨头公司在开发更先进的 AI 模型方面遇到了瓶颈,面临着“收益递减”的困境。...
2024-11-14
·
浏览61次
社交平台 X 正测试向用户免费开放 AI 聊天机器人 Grok
马斯克旗下社交平台 X(原 Twitter)似乎正准备将此前仅限付费用户使用的 AI 聊天机器人 Grok 免费开放给更多用户。...
2024-11-12
·
浏览60次
当视觉大模型陷入认知失调,马里兰大学构建了一个幻觉自动生成框架
想象一下,有一天你在沙漠中看到一个雪人,或者在雪地里发现一棵棕榈树。面对这些与周围环境格格不入的景象,你是否会感到心理上的不适?...
2024-11-12
·
浏览59次
OpenAI o1强推理能提升安全性?长对话诱导干翻o1
最近,以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。...
2024-11-08
·
浏览75次
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力...
2024-11-07
·
浏览63次