AI 中文社区

树莓派 Zero“硬核改造”：8 年老设备实现本地运行大语言模型

越南开发者 Binh Pham 最近尝试使用树莓派 Zero（Raspberry Pi Zero）进行了一项创新实验。他成功地将这款设备改造为一个小型 USB 驱动器，使其能够...

2025-02-18 · 浏览567次

秘塔 AI 搜索上线“先想后搜”研究模式：采用“小模型 + 大模型”协同架构

秘塔科技宣布秘塔 AI 搜索上线新的研究模式 —— 先想后搜，可以让模型先提出思考框架与路径，再进一步进行资料的整合与分析。...

2025-02-18 · 浏览507次

短短10天，Ilya神秘初创SSI再融10亿美元！仅凭一个主页估值300亿

短短10天，Ilya神秘初创SSI再融10亿美元！仅凭一个主页估值300亿...

2025-02-18 · 浏览298次

AI教父Hinton怒批万斯，对AI无知恐葬送全人类！

AI教父Hinton怒批万斯，对AI无知恐葬送全人类！...

2025-02-17 · 浏览245次

LLM推理暴涨，数学逻辑开挂！ DeepSeek等华人团队新大招，Ai2大牛狂点赞

LLM推理暴涨，数学逻辑开挂！ DeepSeek等华人团队新大招，Ai2大牛狂点赞...

2025-02-17 · 浏览317次

DeepSeek掀低成本革命，中科院系黑马闯入全球TOP 10！破解高精度-低能耗困局

DeepSeek掀低成本革命，中科院系黑马闯入全球TOP 10！破解高精度-低能耗困局...

2025-02-17 · 浏览335次

从想太多到想不透？DeepSeek-R1等长推理模型也存在「思考不足」问题

长推理模型（Long Reasoning Models），如 OpenAI o1 [1]、QwQ-32B-Preview [2]、 DeepSeek-R1-671B [3] 和...

2025-02-17 · 浏览604次

比知识蒸馏好用，田渊栋等提出连续概念混合，再度革新Transformer预训练框架

近年来，大型语言模型（LLMs）的进展彻底改变了自然语言处理领域，并因此成为各种现实应用中的核心技术，例如代码助手、搜索引擎和个人 AI 助手。...

2025-02-17 · 浏览299次

真正的王炸组合！微信终于接入满血版DeepSeek R1，灰度测试中

一觉醒来，AI 应用的天变了！...

2025-02-17 · 浏览532次

Meta AI 版权案揭露：与出版商谈判遇阻，暂停授权合作

在 Meta Platforms（前身为 Facebook 母公司）面临的多起 AI 版权诉讼中，最新提交的法庭文件为该公司曾暂停与出版商就 AI 训练数据授权事宜进行谈判的传...

2025-02-16 · 浏览304次

马斯克称 Grok 3 将于 2 月 18 日发布：地球上最聪明的人工智能

马斯克在社交平台 X 上表示，Grok 3 大模型将于太平洋时间周一晚上 8 点（IT之家注：北京时间 2 月 17 日 12 点）发布，届时将进行现场演示，马斯克称其为地球上...

2025-02-16 · 浏览408次

深夜炸醒！微信与 DeepSeek 新合体是啥体验

接入 DeepSeek 这股风潮终究吹到了微信，两者强强联合。...

2025-02-16 · 浏览428次

本科生推翻姚期智40年前猜想！CS顶会论文刷新哈希表传统认知

本科生推翻姚期智40年前猜想！CS顶会论文刷新哈希表传统认知...

2025-02-16 · 浏览335次

新版GPT-4o登顶大模型榜首！意识觉醒疯狂「暴走」，竟要与人类开战

新版GPT-4o登顶大模型榜首！意识觉醒疯狂「暴走」，竟要与人类开战...

2025-02-16 · 浏览529次

Nature：全球博士生数量锐减，钱少、事多、前途迷茫

Nature：全球博士生数量锐减，钱少、事多、前途迷茫...

2025-02-16 · 浏览434次

刚刚，DeepSeek官方发布R1模型推荐设置，这才是正确用法

自春节以来，DeepSeek 就一直是 AI 领域最热门的关键词，甚至可能没有之一，其官方 App 成为了史上最快突破 3000 万日活的应用。...

2025-02-16 · 浏览603次

又一个Deep Research来了！1-2分钟抵人类专家数小时，所有人免费

Deep Research 又迎来一位新玩家。...

2025-02-16 · 浏览799次

大模型都喜欢拍马屁，Gemini最能拍！斯坦福：这不安全、不可靠

问题挺严重，大模型说的话可不能全信。...

2025-02-16 · 浏览338次

英特尔发布 OpenVINO 2025.0：新增图像生成场景与 DeepSeek 蒸馏模型支持

2025 年首个 OpenVINO 版本（2025.0）于 14 日正式发布，本次更新聚焦性能提升、更多生成式 AI 模型的支持，并针对英特尔神经处理单元（NPU）推出关键优化...

2025-02-16 · 浏览498次

全球 AI 算力报告出炉：LLM 最爱 A100，谷歌坐拥超 100 万 H100 等效算力

全球有多少 AI 算力？算力增长速度有多快？在这场 AI「淘金热」中，都有哪些新「铲子」？AI 初创企业 Epoch AI 发布了最新全球硬件估算报告。...

2025-02-16 · 浏览582次

比英伟达工程师还熟练！DeepSeek R1+测试时Scaling自动优化GPU内核

比英伟达工程师还熟练！DeepSeek R1+测试时Scaling自动优化GPU内核...

2025-02-15 · 浏览338次

服务器总是繁忙 DeepSeek-R1本地部署图文版教程来了

最近一段时间，国产大模型DeepSeek-R1在市场上迅速崛起，成为了众多用户的新宠。然而，伴随其热度与用户量的急剧攀升，由此导致服务器繁忙的状况频繁出现。为了摆脱服务器繁忙...

2025-02-14 · 浏览366次

阿里巴巴蔡崇信：AI 竞争很激烈，DeepSeek 转变行业思路

在蔡崇信看来，DeepSeek 对于行业意义重大，因为它通过工程创新大幅降低了大语言模型的训练和推理成本。他指出，很多问题需要借助人工智能来解决，这样人工智能才能发挥作用、提高...

2025-02-14 · 浏览490次

Anthropic 秘密“混合模型”Claude 4 首曝细节，硬刚 GPT-5

AI 竞赛白热化！Anthropic 秘密研发一种与众不同的 AI—— 语言模型与可控推理能力相结合的混合模型。模型包括一个独特的「滑动条」功能，它赋予开发者对计算资源和成本前...

2025-02-14 · 浏览519次