AI 中文社区

Mistral新旗舰决战Llama 3.1！最强开源Large 2 123B，扛鼎多语言编程全能王

Mistral新旗舰决战Llama 3.1！最强开源Large 2 123B，扛鼎多语言编程全能王...

2024-07-25 · 浏览774次

AI训AI惨遭投毒9次大崩溃，牛津剑桥等惊天发现登Nature封面！

AI训AI惨遭投毒9次大崩溃，牛津剑桥等惊天发现登Nature封面！...

2024-07-25 · 浏览532次

谷歌：AI正在毁掉互联网！

谷歌：AI正在毁掉互联网！...

2024-07-25 · 浏览422次

比当前世界最快超算 Frontier 最多快 4 倍，美国发布下一代超算 Discovery 开发招标书

橡树岭国家实验室表示，“Discovery”超级计算机将运行的工作负载包括先进的人工智能、机器学习、改进的能源效率和综合系统建模。...

2024-07-25 · 浏览588次

马斯克与扎克伯格终于对上眼了：AI 大模型 Llama 3.1 开源值得赞扬

周二，Meta 发布了最新的 AI 模型 Llama 3.1。Meta 声称，该模型优于 OpenAI 的 GPT-4o，并且是开源的，已向公众免费提供。...

2024-07-25 · 浏览641次

马斯克的“世界最强大 AI 数据中心”目前由 14 台移动发电机供电，引环保担忧

埃隆・马斯克的孟菲斯超级计算集群（Memphis Supercluster）已上线，据马斯克介绍称，该集群在单个 RDMA fabric 上使用 10 万张液冷 H100，是“...

2024-07-25 · 浏览796次

贾扬清共一论文获时间检验奖，国内无缘10篇最佳论文，ICML 2024奖项新鲜出炉

ICML 全称是 International Conference on Machine Learning，由国际机器学习学会（IMLS）举办，是计算机人工智能领域的顶级会议。...

2024-07-25 · 浏览721次

最强模型Llama 3.1 405B正式发布，扎克伯格：开源引领新时代

刚刚，大家期待已久的 Llama 3.1 官方正式发布了！...

2024-07-25 · 浏览743次

从裸机到700亿参数大模型，这里有份教程，还有现成可用的脚本

我们知道 LLM 是在大规模计算机集群上使用海量数据训练得到的，机器之心曾介绍过不少用于辅助和改进 LLM 训练流程的方法和技术。...

2024-07-25 · 浏览829次

数学大统一理论里程碑进展：几何朗兰兹猜想获证明，论文超800页

历经三十年的努力，数学家已经成功证明了一个名为「朗兰兹纲领（Langlands program）」的宏大数学愿景的主要部分。...

2024-07-25 · 浏览882次

击败GPT-4o的开源模型如何炼成？关于Llama 3.1 405B，Meta都写在这篇论文里了

经历了提前两天的「意外泄露」之后，Llama 3.1 终于在昨夜由官方正式发布了。...

2024-07-25 · 浏览864次

为大模型提供全新科学复杂问答基准与测评体系，UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架

美国Argonne国家实验室、芝加哥大学Ian Foster 教授（2002年戈登贝尔奖得主）团队、澳大利亚新南威尔士大学Bram Hoex教授UNSW AI4Science团...

2024-07-25 · 浏览683次

Llama成大模型顶流，扎克伯格掀论战：玩开源，时代变了

开源与闭源的纷争已久，现在或许已经达到了一个新的高潮。...

2024-07-25 · 浏览573次

OpenAI 调岗 AI 安全高管 Aleksander Madry，新职位专注于 AI 推理

OpenAI 首席执行官山姆・阿尔特曼（Sam Altman）本周二在 X 平台发布推文，表示在新一轮内部架构重组中，负责 AI 安全的主管亚历山大・马德里（Aleksande...

2024-07-24 · 浏览394次

英伟达推出 AI 代工业务：携手 Meta Llama 3.1 开源模型，为客户定制部署“超级模型”

英伟达公司昨日（7 月 23 日）发布新闻稿，正式推出“NVIDIA AI Foundry”代工服务和“NVIDIA NIM”推理微服务。...

2024-07-24 · 浏览624次

强过「黄金标准」，快3,500倍，成本低10万倍，物理建模融合AI，谷歌天气模型登Nature

Google Research 研究团队提出一种将传统的基于物理建模与 ML 相结合的新方法——NeuralGCM，可以准确高效地模拟地球大气层。比现有模型更快、计算成本更低、...

2024-07-23 · 浏览441次

第四范式发布先知AIOS 5.1，升级支持GPU资源池化功能

今天，第四范式先知AIOS 5.1版本正式发布。该版本新增GPU资源池化（vGPU）能力，实现对硬件集群平台化管理、算力资源的按需分配和快速调度，最多节省80%的硬件成本...

2024-07-23 · 浏览443次

马斯克19天建成世界最强AI集群！10万块H100「液冷怪兽」即将觉醒

马斯克19天建成世界最强AI集群！10万块H100「液冷怪兽」即将觉醒...

2024-07-23 · 浏览433次

Llama 3.1磁力链提前泄露！开源模型王座一夜易主，GPT-4o被超越

Llama 3.1磁力链提前泄露！开源模型王座一夜易主，GPT-4o被超越...

2024-07-23 · 浏览776次

马斯克：特斯拉有望 2026 年大规模生产人形机器人，供其他公司使用

马斯克在X（推特）上发文透露，特斯拉明年将生产出“真正有用”的机器人供公司内部使用，但仅仅是小规模生产。预计到2026年，特斯拉有望大规模生产人形机器人，供其他公司使用。...

2024-07-23 · 浏览482次

谷歌发布 NeuralGCM 天气预报 AI 模型：运行成本更低、预测更准

谷歌公司最新发布了名为 NeuralGCM 的全新 AI 模型，结合机器学习和传统技术，构建了全新的 AI 天气预测模型，相关成果于昨日发表在《Nature》期刊上。...

2024-07-23 · 浏览573次

ECCV 2024 | 提升GPT-4V、Gemini检测任务性能，你需要这种提示范式

多模态大模型（Multimodal Large Language Models，MLLMs）在不同的任务中表现出了令人印象深刻的能力，尽管如此，这些模型在检测任务中的潜力仍被低...

2024-07-22 · 浏览328次

爆火免费书《深入理解深度学习》终于出中文版了

这可能是当今最全面、最新的深度学习概述之一。...

2024-07-22 · 浏览991次

盛名一时的BERT哪去了？这个问题的答案昭示了LLM范式的转变

编码器模型哪去了？如果 BERT 效果好，那为什么不扩展它？编码器 - 解码器或仅编码器模型怎么样了？...

2024-07-22 · 浏览842次