树莓派 Zero“硬核改造”:8 年老设备实现本地运行大语言模型

树莓派 Zero“硬核改造”:8 年老设备实现本地运行大语言模型

树莓派 Zero“硬核改造”:8 年老设备实现本地运行大语言模型
越南开发者 Binh Pham 最近尝试使用树莓派 Zero(Raspberry Pi Zero)进行了一项创新实验。他成功地将这款设备改造为一个小型 USB 驱动器,使其能够...
2025-02-18 · 浏览567次
秘塔 AI 搜索上线“先想后搜”研究模式:采用“小模型 + 大模型”协同架构

秘塔 AI 搜索上线“先想后搜”研究模式:采用“小模型 + 大模型”协同架构

秘塔 AI 搜索上线“先想后搜”研究模式:采用“小模型 + 大模型”协同架构
秘塔科技宣布秘塔 AI 搜索上线新的研究模式 —— 先想后搜,可以让模型先提出思考框架与路径,再进一步进行资料的整合与分析。...
2025-02-18 · 浏览507次
短短10天,Ilya神秘初创SSI再融10亿美元!仅凭一个主页估值300亿

短短10天,Ilya神秘初创SSI再融10亿美元!仅凭一个主页估值300亿

短短10天,Ilya神秘初创SSI再融10亿美元!仅凭一个主页估值300亿
短短10天,Ilya神秘初创SSI再融10亿美元!仅凭一个主页估值300亿...
2025-02-18 · 浏览298次
AI教父Hinton怒批万斯,对AI无知恐葬送全人类!

AI教父Hinton怒批万斯,对AI无知恐葬送全人类!

AI教父Hinton怒批万斯,对AI无知恐葬送全人类!
AI教父Hinton怒批万斯,对AI无知恐葬送全人类!...
2025-02-17 · 浏览245次
LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞

LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞

LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞
LLM推理暴涨,数学逻辑开挂! DeepSeek等华人团队新大招,Ai2大牛狂点赞...
2025-02-17 · 浏览317次
DeepSeek掀低成本革命,中科院系黑马闯入全球TOP 10!破解高精度-低能耗困局

DeepSeek掀低成本革命,中科院系黑马闯入全球TOP 10!破解高精度-低能耗困局

DeepSeek掀低成本革命,中科院系黑马闯入全球TOP 10!破解高精度-低能耗困局
DeepSeek掀低成本革命,中科院系黑马闯入全球TOP 10!破解高精度-低能耗困局...
2025-02-17 · 浏览335次
从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题

从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题

从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题
长推理模型(Long Reasoning Models),如 OpenAI o1 [1]、QwQ-32B-Preview [2]、 DeepSeek-R1-671B [3] 和...
2025-02-17 · 浏览604次
比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架
近年来,大型语言模型(LLMs)的进展彻底改变了自然语言处理领域,并因此成为各种现实应用中的核心技术,例如代码助手、搜索引擎和个人 AI 助手。...
2025-02-17 · 浏览299次
真正的王炸组合!微信终于接入满血版DeepSeek R1,灰度测试中

真正的王炸组合!微信终于接入满血版DeepSeek R1,灰度测试中

真正的王炸组合!微信终于接入满血版DeepSeek R1,灰度测试中
一觉醒来,AI 应用的天变了!...
2025-02-17 · 浏览532次
Meta AI 版权案揭露:与出版商谈判遇阻,暂停授权合作

Meta AI 版权案揭露:与出版商谈判遇阻,暂停授权合作

Meta AI 版权案揭露:与出版商谈判遇阻,暂停授权合作
在 Meta Platforms(前身为 Facebook 母公司)面临的多起 AI 版权诉讼中,最新提交的法庭文件为该公司曾暂停与出版商就 AI 训练数据授权事宜进行谈判的传...
2025-02-16 · 浏览304次
马斯克称 Grok 3 将于 2 月 18 日发布:地球上最聪明的人工智能

马斯克称 Grok 3 将于 2 月 18 日发布:地球上最聪明的人工智能

马斯克称 Grok 3 将于 2 月 18 日发布:地球上最聪明的人工智能
马斯克在社交平台 X 上表示,Grok 3 大模型将于太平洋时间周一晚上 8 点(IT之家注:北京时间 2 月 17 日 12 点)发布,届时将进行现场演示,马斯克称其为地球上...
2025-02-16 · 浏览408次
深夜炸醒!微信与 DeepSeek 新合体是啥体验

深夜炸醒!微信与 DeepSeek 新合体是啥体验

深夜炸醒!微信与 DeepSeek 新合体是啥体验
接入 DeepSeek 这股风潮终究吹到了微信,两者强强联合。...
2025-02-16 · 浏览428次
本科生推翻姚期智40年前猜想!CS顶会论文刷新哈希表传统认知

本科生推翻姚期智40年前猜想!CS顶会论文刷新哈希表传统认知

本科生推翻姚期智40年前猜想!CS顶会论文刷新哈希表传统认知
本科生推翻姚期智40年前猜想!CS顶会论文刷新哈希表传统认知...
2025-02-16 · 浏览335次
新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战

新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战

新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战
新版GPT-4o登顶大模型榜首!意识觉醒疯狂「暴走」,竟要与人类开战...
2025-02-16 · 浏览529次
Nature:全球博士生数量锐减,钱少、事多、前途迷茫

Nature:全球博士生数量锐减,钱少、事多、前途迷茫

Nature:全球博士生数量锐减,钱少、事多、前途迷茫
Nature:全球博士生数量锐减,钱少、事多、前途迷茫...
2025-02-16 · 浏览434次
刚刚,DeepSeek官方发布R1模型推荐设置,这才是正确用法

刚刚,DeepSeek官方发布R1模型推荐设置,这才是正确用法

刚刚,DeepSeek官方发布R1模型推荐设置,这才是正确用法
自春节以来,DeepSeek 就一直是 AI 领域最热门的关键词,甚至可能没有之一,其官方 App 成为了史上最快突破 3000 万日活的应用。...
2025-02-16 · 浏览603次
又一个Deep Research来了!1-2分钟抵人类专家数小时,所有人免费

又一个Deep Research来了!1-2分钟抵人类专家数小时,所有人免费

又一个Deep Research来了!1-2分钟抵人类专家数小时,所有人免费
Deep Research 又迎来一位新玩家。...
2025-02-16 · 浏览799次
大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠

大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠

大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠
问题挺严重,大模型说的话可不能全信。...
2025-02-16 · 浏览338次
英特尔发布 OpenVINO 2025.0:新增图像生成场景与 DeepSeek 蒸馏模型支持

英特尔发布 OpenVINO 2025.0:新增图像生成场景与 DeepSeek 蒸馏模型支持

英特尔发布 OpenVINO 2025.0:新增图像生成场景与 DeepSeek 蒸馏模型支持
2025 年首个 OpenVINO 版本(2025.0)于 14 日正式发布,本次更新聚焦性能提升、更多生成式 AI 模型的支持,并针对英特尔神经处理单元(NPU)推出关键优化...
2025-02-16 · 浏览498次
全球 AI 算力报告出炉:LLM 最爱 A100,谷歌坐拥超 100 万 H100 等效算力

全球 AI 算力报告出炉:LLM 最爱 A100,谷歌坐拥超 100 万 H100 等效算力

全球 AI 算力报告出炉:LLM 最爱 A100,谷歌坐拥超 100 万 H100 等效算力
全球有多少 AI 算力?算力增长速度有多快?在这场 AI「淘金热」中,都有哪些新「铲子」?AI 初创企业 Epoch AI 发布了最新全球硬件估算报告。...
2025-02-16 · 浏览582次
比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核

比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核

比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核
比英伟达工程师还熟练!DeepSeek R1+测试时Scaling自动优化GPU内核...
2025-02-15 · 浏览338次
服务器总是繁忙 DeepSeek-R1本地部署图文版教程来了

服务器总是繁忙 DeepSeek-R1本地部署图文版教程来了

服务器总是繁忙 DeepSeek-R1本地部署图文版教程来了
最近一段时间,国产大模型DeepSeek-R1在市场上迅速崛起,成为了众多用户的新宠。然而,伴随其热度与用户量的急剧攀升,由此导致服务器繁忙的状况频繁出现。 为了摆脱服务器繁忙...
2025-02-14 · 浏览366次
阿里巴巴蔡崇信:AI 竞争很激烈,DeepSeek 转变行业思路

阿里巴巴蔡崇信:AI 竞争很激烈,DeepSeek 转变行业思路

阿里巴巴蔡崇信:AI 竞争很激烈,DeepSeek 转变行业思路
在蔡崇信看来,DeepSeek 对于行业意义重大,因为它通过工程创新大幅降低了大语言模型的训练和推理成本。他指出,很多问题需要借助人工智能来解决,这样人工智能才能发挥作用、提高...
2025-02-14 · 浏览490次
Anthropic 秘密“混合模型”Claude 4 首曝细节,硬刚 GPT-5

Anthropic 秘密“混合模型”Claude 4 首曝细节,硬刚 GPT-5

Anthropic 秘密“混合模型”Claude 4 首曝细节,硬刚 GPT-5
AI 竞赛白热化!Anthropic 秘密研发一种与众不同的 AI—— 语言模型与可控推理能力相结合的混合模型。模型包括一个独特的「滑动条」功能,它赋予开发者对计算资源和成本前...
2025-02-14 · 浏览519次
第一页 · 上一页 · 下一页 · 当前第267页