DeepSeek 标签,匹配到约95个结果, 耗时0.1416秒
DeepSeek 团队开源新模型 DeepSeek-OCR:少量视觉 token 完成海量文本压缩
根据介绍,当文本 token 数量不超过视觉 token 的 10 倍(压缩比低于 10×)时,模型的 OCR 精度可达 97%;即便压缩比提高到 20×,准确率仍保持约 60%。...
2025-10-20
·
浏览104次
寒武纪已适配 DeepSeek-V3.2-Exp,同步开源推理引擎 vLLM-MLU
寒武纪宣布已适配DeepSeek-V3.2-Exp模型,并开源大模型推理引擎vLLM-MLU源代码。通过Triton算子和BangC融合算子开发,实现了快速适配和极致性能优化,大幅降低长序列场景下的训推成本。#AI技术##开源大模型#...
2025-09-30
·
浏览119次
消息称 DeepSeek V3.2、智谱 GLM4.6 等 AI 大模型即将发布
DeepSeek-V3.2 即将发布,v3.2-base 已上传至 DeepSeek 的 HuggingFace 官方页面,模型文件正在上传中,不过目前已下线。...
2025-09-29
·
浏览159次
DeepSeek-V3.2-Exp 模型正式发布并开源,API 大幅降价
作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(IT之家注:一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。...
2025-09-29
·
浏览185次
DeepSeek 线上模型升级至 V3.1-Terminus 版本,改进语言一致性及 Agent 能力
DeepSeek 今晚宣布线上模型完成升级,当前版本号 DeepSeek-V3.1-Terminus,包含思考模型和非思考模式两个版本,上下文度均为 128k,用户可以在线体验。...
2025-09-22
·
浏览153次
DeepSeek-R1 论文登上《自然》封面,通讯作者为梁文锋
由 DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 推理模型研究论文,登上了国际权威期刊《自然(Nature)》第 645 期的封面。#AI##大模型#...
2025-09-18
·
浏览154次
消息称 DeepSeek 正开发更先进模型:具备 AI 智能体能力,剑指年底发布
该公司正在打造的模型能够在用户仅提供最少指令的情况下,代表用户完成多步操作,并能根据以往操作不断学习和改进。...
2025-09-04
·
浏览170次
DeepSeek:已在平台内对 AI 生成合成内容添加标识,用户不得恶意删除
DeepSeek今日发布公告,宣布已在平台中为AI生成内容添加标识,以防止公众混淆或误解。此举旨在落实《人工智能生成合成内容标识办法》,规范AI内容使用。未来DeepSeek将继续优化标识机制,提升用户体验。#AI生成内容##DeepSee...
2025-09-01
·
浏览211次
硅基流动上线 DeepSeek-V3.1,上下文升至 160K
硅基流动上线DeepSeek-V3.1,支持160K超长上下文处理,性能比肩Claude 4 Sonnet,价格更优。新版本在多个领域实现性能提升,适用于长文档、多轮对话等复杂场景。#AI技术##DeepSeek#...
2025-08-25
·
浏览207次
DeepSeek-V3.1 上线火山方舟:无需注册登录即可免费体验
根据官方介绍,火山方舟提供的 DeepSeek-V3.1 版本效果与 DeepSeek 官方 API 保持高度一致,并为用户提供优质的体验和服务。...
2025-08-23
·
浏览184次
DeepSeek 开源新模型 V3.1:约 685B 参数,上下文长度拓展至 128K
DeepSeek昨晚在Hugging Face上开源了新模型V3.1-Base,根据介绍,该模型将上下文长度拓展至128K,参数约为685B。...
2025-08-20
·
浏览192次
DeepSeek 通知线上模型版本升级至 V3.1,上下文长度拓展至 128k
DeepSeek 官方刚刚发布通知:线上模型版本已升级至 V3.1,上下文长度拓展至 128k,可通过官方网页、App、小程序测试,API 接口调用方式保持不变。...
2025-08-19
·
浏览162次
自己卷自己:理想汽车旗下 AI 助手理想同学 MindGPT 3.1 升级为端到端智能体模型,支持边想边搜
理想同学的官方账号今日宣布:MindGPT 3.1 升级为端到端智能体模型,并戏称“自己卷自己”。据介绍,新版本理想同学将智能体能力融入大模型,支持边想边搜,在推理过程中可同步调用工具,提供更加快速、全面、准确的结果。...
2025-08-18
·
浏览202次
基于 DeepSeek 大模型,河南引入“AI 智审”系统实现货物口岸通关申报“秒级”筛查
河南省引入基于DeepSeek大模型的AI智审系统,实现货物通关申报秒级筛查。自4月24日上线以来,已筛查报关单76万次,企业端和海关端审核效率分别提高34%和70%。企业通关申报差错减少60%以上,监管精准度提高60%。#AI智审# #D...
2025-07-25
·
浏览178次
奥尔特曼:DeepSeek 团队很有才华,但他们没找到比 OpenAI 更高效的方法
中国AI初创企业DeepSeek推出的R1模型在多个领域超越OpenAI的o1模型,且成本更低。OpenAI CEO山姆・奥尔特曼承认DeepSeek团队才华横溢,但质疑其效率。AI技术的高成本引发投资者担忧。#AI技术##DeepSeek...
2025-07-21
·
浏览170次
黄仁勋力赞 DeepSeek,称中国创新的步伐不可能被阻挡
黄仁勋称,中国创新的步伐是不可能被阻挡的,相信英伟达能作出重要贡献。AI 是一个极其复杂的系统,就像多层蛋糕一样复杂,其芯片只是底层,上面还有系统、网络技术、AI 基础设施、软件、AI 算法,以及最上层的应用服务,整个系统异常复杂。一方面 ...
2025-07-21
·
浏览157次
消息称 DeepSeek-R2 AI 模型开发进程因美国当局英伟达 H20 芯片出口限制而延迟
由于美国当局对英伟达H20芯片的出口限制,DeepSeek R2 AI模型的开发进程被迫延迟。这不仅影响了新模型的研发,也对现有R1模型的实际部署造成困扰。#AI芯片# #DeepSeek#...
2025-06-27
·
浏览229次
罕见千万级大单:山西临汾将打造“AI 医院”,部署 DeepSeek
山西省政府采购网显示,山西省临汾市人民医院 6 月 23 日公布了《临汾市人民医院基于 Deepseek AI 大模型的智慧医疗应用系统建设项目》,预算金额 1569.264 万元,预计采购时间为 2025 年 9 月。...
2025-06-25
·
浏览185次
理想同学接入 DeepSeek-R1-0528 最新模型
理想同学的官方账号 @AI理想同学 今日发文宣布:理想同学已接入 DeepSeek-R1-0528 最新模型。
据介绍,理想同学手机、网页端已正式接入 DeepSeek R1-0528 最新版,切换“DeepSeek 模型”并开启“深度思考...
2025-06-12
·
浏览269次
Mistral 将推出其首个推理模型 Magistral,与 OpenAI 和 DeepSeek 展开竞争
在伦敦科技周的炉边谈话中,门施告诉 CNBC:Mistral 的新模型“擅长数学,也擅长编码”。他强调,该模型“具备与所有其他模型的竞争力”,包括 OpenAI o1 及 DeepSeek R1。...
2025-06-10
·
浏览206次
DeepSeek-R1-0528 更新官方详解:思考更深、推理更强,整体表现接近 o3
DeepSeek R1 模型昨日宣布完成小版本升级,当前版本为 DeepSeek-R1-0528。用户通过官方网站、App 或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API 也已同步更新,调用方式不变。...
2025-05-30
·
浏览606次
DeepSeek R1 模型完成小版本试升级
DeepSeek 在官方交流群中发布通知:DeepSeek R1 模型已完成小版本试升级,欢迎前往官方网页、App、小程序测试(打开深度思考),API 接口和使用方式保持不变。...
2025-05-28
·
浏览349次
(更新:对话功能恢复正常)DeepSeek 出现服务问题,登录失败、无法对话
据IT之家小伙伴反馈,DeepSeek 今日下午出现服务问题,主要影响网页端对话。#deepseek崩了##deepseek#...
2025-05-13
·
浏览259次
DeepSeek-Prover-V2-671B 新模型开源发布
DeepSeek-Prover-V2-671B 使用了更高效的 safetensors 文件格式,并支持 BF16、FP8、F32 等多种计算精度,方便模型更快、更省资源地训练和部署。...
2025-04-30
·
浏览330次
AI 中文社