Mistral新旗舰决战Llama 3.1!最强开源Large 2 123B,扛鼎多语言编程全能王

Mistral新旗舰决战Llama 3.1!最强开源Large 2 123B,扛鼎多语言编程全能王

Mistral新旗舰决战Llama 3.1!最强开源Large 2 123B,扛鼎多语言编程全能王
Mistral新旗舰决战Llama 3.1!最强开源Large 2 123B,扛鼎多语言编程全能王...
2024-07-25 · 浏览774次
AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面!

AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面!

AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面!
AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面!...
2024-07-25 · 浏览532次
谷歌:AI正在毁掉互联网!

谷歌:AI正在毁掉互联网!

谷歌:AI正在毁掉互联网!
谷歌:AI正在毁掉互联网!...
2024-07-25 · 浏览422次
比当前世界最快超算 Frontier 最多快 4 倍,美国发布下一代超算 Discovery 开发招标书

比当前世界最快超算 Frontier 最多快 4 倍,美国发布下一代超算 Discovery 开发招标书

比当前世界最快超算 Frontier 最多快 4 倍,美国发布下一代超算 Discovery 开发招标书
橡树岭国家实验室表示,“Discovery”超级计算机将运行的工作负载包括先进的人工智能、机器学习、改进的能源效率和综合系统建模。...
2024-07-25 · 浏览588次
马斯克与扎克伯格终于对上眼了:AI 大模型 Llama 3.1 开源值得赞扬

马斯克与扎克伯格终于对上眼了:AI 大模型 Llama 3.1 开源值得赞扬

马斯克与扎克伯格终于对上眼了:AI 大模型 Llama 3.1 开源值得赞扬
周二,Meta 发布了最新的 AI 模型 Llama 3.1。Meta 声称,该模型优于 OpenAI 的 GPT-4o,并且是开源的,已向公众免费提供。...
2024-07-25 · 浏览641次
马斯克的“世界最强大 AI 数据中心”目前由 14 台移动发电机供电,引环保担忧

马斯克的“世界最强大 AI 数据中心”目前由 14 台移动发电机供电,引环保担忧

马斯克的“世界最强大 AI 数据中心”目前由 14 台移动发电机供电,引环保担忧
埃隆・马斯克的孟菲斯超级计算集群(Memphis Supercluster)已上线,据马斯克介绍称,该集群在单个 RDMA fabric 上使用 10 万张液冷 H100,是“...
2024-07-25 · 浏览796次
贾扬清共一论文获时间检验奖,国内无缘10篇最佳论文,ICML 2024奖项新鲜出炉

贾扬清共一论文获时间检验奖,国内无缘10篇最佳论文,ICML 2024奖项新鲜出炉

贾扬清共一论文获时间检验奖,国内无缘10篇最佳论文,ICML 2024奖项新鲜出炉
ICML 全称是 International Conference on Machine Learning,由国际机器学习学会(IMLS)举办,是计算机人工智能领域的顶级会议。...
2024-07-25 · 浏览721次
最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代

最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代

最强模型Llama 3.1 405B正式发布,扎克伯格:开源引领新时代
刚刚,大家期待已久的 Llama 3.1 官方正式发布了!...
2024-07-25 · 浏览743次
从裸机到700亿参数大模型,这里有份教程,还有现成可用的脚本

从裸机到700亿参数大模型,这里有份教程,还有现成可用的脚本

从裸机到700亿参数大模型,这里有份教程,还有现成可用的脚本
我们知道 LLM 是在大规模计算机集群上使用海量数据训练得到的,机器之心曾介绍过不少用于辅助和改进 LLM 训练流程的方法和技术。...
2024-07-25 · 浏览829次
数学大统一理论里程碑进展:几何朗兰兹猜想获证明,论文超800页

数学大统一理论里程碑进展:几何朗兰兹猜想获证明,论文超800页

数学大统一理论里程碑进展:几何朗兰兹猜想获证明,论文超800页
历经三十年的努力,数学家已经成功证明了一个名为「朗兰兹纲领(Langlands program)」的宏大数学愿景的主要部分。...
2024-07-25 · 浏览882次
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B,Meta都写在这篇论文里了

击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B,Meta都写在这篇论文里了

击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B,Meta都写在这篇论文里了
经历了提前两天的「意外泄露」之后,Llama 3.1 终于在昨夜由官方正式发布了。...
2024-07-25 · 浏览864次
为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架

为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架

为大模型提供全新科学复杂问答基准与测评体系,UNSW、阿贡、芝加哥大学等多家机构联合推出SciQAG框架
美国Argonne国家实验室、芝加哥大学Ian Foster 教授(2002年戈登贝尔奖得主)团队、澳大利亚新南威尔士大学Bram Hoex教授UNSW AI4Science团...
2024-07-25 · 浏览683次
Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了

Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了

Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了
开源与闭源的纷争已久,现在或许已经达到了一个新的高潮。...
2024-07-25 · 浏览573次
OpenAI 调岗 AI 安全高管 Aleksander Madry,新职位专注于 AI 推理

OpenAI 调岗 AI 安全高管 Aleksander Madry,新职位专注于 AI 推理

OpenAI 调岗 AI 安全高管 Aleksander Madry,新职位专注于 AI 推理
OpenAI 首席执行官山姆・阿尔特曼(Sam Altman)本周二在 X 平台发布推文,表示在新一轮内部架构重组中,负责 AI 安全的主管亚历山大・马德里(Aleksande...
2024-07-24 · 浏览394次
英伟达推出 AI 代工业务:携手 Meta Llama 3.1 开源模型,为客户定制部署“超级模型”

英伟达推出 AI 代工业务:携手 Meta Llama 3.1 开源模型,为客户定制部署“超级模型”

英伟达推出 AI 代工业务:携手 Meta Llama 3.1 开源模型,为客户定制部署“超级模型”
英伟达公司昨日(7 月 23 日)发布新闻稿,正式推出“NVIDIA AI Foundry”代工服务和“NVIDIA NIM”推理微服务。...
2024-07-24 · 浏览624次
强过「黄金标准」,快3,500倍,成本低10万倍,物理建模融合AI,谷歌天气模型登Nature

强过「黄金标准」,快3,500倍,成本低10万倍,物理建模融合AI,谷歌天气模型登Nature

强过「黄金标准」,快3,500倍,成本低10万倍,物理建模融合AI,谷歌天气模型登Nature
Google Research 研究团队提出一种将传统的基于物理建模与 ML 相结合的新方法——NeuralGCM,可以准确高效地模拟地球大气层。比现有模型更快、计算成本更低、...
2024-07-23 · 浏览441次
第四范式发布先知AIOS 5.1,升级支持GPU资源池化功能

第四范式发布先知AIOS 5.1,升级支持GPU资源池化功能

第四范式发布先知AIOS 5.1,升级支持GPU资源池化功能
今天,第四范式先知AIOS 5.1版本正式发布。该版本新增GPU资源池化(vGPU)能力,实现对硬件集群平台化管理、算力资源的按需分配和快速调度,最多节省80%的硬件成本...
2024-07-23 · 浏览443次
马斯克19天建成世界最强AI集群!10万块H100「液冷怪兽」即将觉醒

马斯克19天建成世界最强AI集群!10万块H100「液冷怪兽」即将觉醒

马斯克19天建成世界最强AI集群!10万块H100「液冷怪兽」即将觉醒
马斯克19天建成世界最强AI集群!10万块H100「液冷怪兽」即将觉醒...
2024-07-23 · 浏览433次
Llama 3.1磁力链提前泄露!开源模型王座一夜易主,GPT-4o被超越

Llama 3.1磁力链提前泄露!开源模型王座一夜易主,GPT-4o被超越

Llama 3.1磁力链提前泄露!开源模型王座一夜易主,GPT-4o被超越
Llama 3.1磁力链提前泄露!开源模型王座一夜易主,GPT-4o被超越...
2024-07-23 · 浏览776次
马斯克:特斯拉有望 2026 年大规模生产人形机器人,供其他公司使用

马斯克:特斯拉有望 2026 年大规模生产人形机器人,供其他公司使用

马斯克:特斯拉有望 2026 年大规模生产人形机器人,供其他公司使用
马斯克在X(推特)上发文透露,特斯拉明年将生产出“真正有用”的机器人供公司内部使用,但仅仅是小规模生产。预计到2026年,特斯拉有望大规模生产人形机器人,供其他公司使用。...
2024-07-23 · 浏览482次
谷歌发布 NeuralGCM 天气预报 AI 模型:运行成本更低、预测更准

谷歌发布 NeuralGCM 天气预报 AI 模型:运行成本更低、预测更准

谷歌发布 NeuralGCM 天气预报 AI 模型:运行成本更低、预测更准
谷歌公司最新发布了名为 NeuralGCM 的全新 AI 模型,结合机器学习和传统技术,构建了全新的 AI 天气预测模型,相关成果于昨日发表在《Nature》期刊上。...
2024-07-23 · 浏览573次
ECCV 2024 | 提升GPT-4V、Gemini检测任务性能,你需要这种提示范式

ECCV 2024 | 提升GPT-4V、Gemini检测任务性能,你需要这种提示范式

ECCV 2024 | 提升GPT-4V、Gemini检测任务性能,你需要这种提示范式
多模态大模型(Multimodal Large Language Models,MLLMs)在不同的任务中表现出了令人印象深刻的能力,尽管如此,这些模型在检测任务中的潜力仍被低...
2024-07-22 · 浏览328次
爆火免费书《深入理解深度学习》终于出中文版了

爆火免费书《深入理解深度学习》终于出中文版了

爆火免费书《深入理解深度学习》终于出中文版了
这可能是当今最全面、最新的深度学习概述之一。...
2024-07-22 · 浏览991次
盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变

盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变

盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变
编码器模型哪去了?如果 BERT 效果好,那为什么不扩展它?编码器 - 解码器或仅编码器模型怎么样了?...
2024-07-22 · 浏览842次
第一页 · 上一页 · 下一页 · 当前第327页