Mistral新旗舰决战Llama 3.1!最强开源Large 2 123B,扛鼎多语言编程全能王
Mistral新旗舰决战Llama 3.1!最强开源Large 2 123B,扛鼎多语言编程全能王...
2024-07-25
·
浏览774次
比当前世界最快超算 Frontier 最多快 4 倍,美国发布下一代超算 Discovery 开发招标书
橡树岭国家实验室表示,“Discovery”超级计算机将运行的工作负载包括先进的人工智能、机器学习、改进的能源效率和综合系统建模。...
2024-07-25
·
浏览588次
马斯克与扎克伯格终于对上眼了:AI 大模型 Llama 3.1 开源值得赞扬
周二,Meta 发布了最新的 AI 模型 Llama 3.1。Meta 声称,该模型优于 OpenAI 的 GPT-4o,并且是开源的,已向公众免费提供。...
2024-07-25
·
浏览641次
马斯克的“世界最强大 AI 数据中心”目前由 14 台移动发电机供电,引环保担忧
埃隆・马斯克的孟菲斯超级计算集群(Memphis Supercluster)已上线,据马斯克介绍称,该集群在单个 RDMA fabric 上使用 10 万张液冷 H100,是“...
2024-07-25
·
浏览796次
贾扬清共一论文获时间检验奖,国内无缘10篇最佳论文,ICML 2024奖项新鲜出炉
ICML 全称是 International Conference on Machine Learning,由国际机器学习学会(IMLS)举办,是计算机人工智能领域的顶级会议。...
2024-07-25
·
浏览721次
从裸机到700亿参数大模型,这里有份教程,还有现成可用的脚本
我们知道 LLM 是在大规模计算机集群上使用海量数据训练得到的,机器之心曾介绍过不少用于辅助和改进 LLM 训练流程的方法和技术。...
2024-07-25
·
浏览829次
数学大统一理论里程碑进展:几何朗兰兹猜想获证明,论文超800页
历经三十年的努力,数学家已经成功证明了一个名为「朗兰兹纲领(Langlands program)」的宏大数学愿景的主要部分。...
2024-07-25
·
浏览882次
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B,Meta都写在这篇论文里了
经历了提前两天的「意外泄露」之后,Llama 3.1 终于在昨夜由官方正式发布了。...
2024-07-25
·
浏览864次
为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架
美国Argonne国家实验室、芝加哥大学Ian Foster 教授(2002年戈登贝尔奖得主)团队、澳大利亚新南威尔士大学Bram Hoex教授UNSW AI4Science团...
2024-07-25
·
浏览683次
OpenAI 调岗 AI 安全高管 Aleksander Madry,新职位专注于 AI 推理
OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)本周二在 X 平台发布推文,表示在新一轮内部架构重组中,负责 AI 安全的主管亚历山大・马德里(Aleksande...
2024-07-24
·
浏览394次
英伟达推出 AI 代工业务:携手 Meta Llama 3.1 开源模型,为客户定制部署“超级模型”
英伟达公司昨日(7 月 23 日)发布新闻稿,正式推出“NVIDIA AI Foundry”代工服务和“NVIDIA NIM”推理微服务。...
2024-07-24
·
浏览624次
强过「黄金标准」,快3,500倍,成本低10万倍,物理建模融合AI,谷歌天气模型登Nature
Google Research 研究团队提出一种将传统的基于物理建模与 ML 相结合的新方法——NeuralGCM,可以准确高效地模拟地球大气层。比现有模型更快、计算成本更低、...
2024-07-23
·
浏览441次
第四范式发布先知AIOS 5.1,升级支持GPU资源池化功能
今天,第四范式先知AIOS 5.1版本正式发布。该版本新增GPU资源池化(vGPU)能力,实现对硬件集群平台化管理、算力资源的按需分配和快速调度,最多节省80%的硬件成本...
2024-07-23
·
浏览443次
马斯克:特斯拉有望 2026 年大规模生产人形机器人,供其他公司使用
马斯克在X(推特)上发文透露,特斯拉明年将生产出“真正有用”的机器人供公司内部使用,但仅仅是小规模生产。预计到2026年,特斯拉有望大规模生产人形机器人,供其他公司使用。...
2024-07-23
·
浏览482次
谷歌发布 NeuralGCM 天气预报 AI 模型:运行成本更低、预测更准
谷歌公司最新发布了名为 NeuralGCM 的全新 AI 模型,结合机器学习和传统技术,构建了全新的 AI 天气预测模型,相关成果于昨日发表在《Nature》期刊上。...
2024-07-23
·
浏览573次
ECCV 2024 | 提升GPT-4V、Gemini检测任务性能,你需要这种提示范式
多模态大模型(Multimodal Large Language Models,MLLMs)在不同的任务中表现出了令人印象深刻的能力,尽管如此,这些模型在检测任务中的潜力仍被低...
2024-07-22
·
浏览328次
盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变
编码器模型哪去了?如果 BERT 效果好,那为什么不扩展它?编码器 - 解码器或仅编码器模型怎么样了?...
2024-07-22
·
浏览842次
AI 中文社