文本生成 标签,匹配到约78个结果, 耗时0.3359秒
上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能
近日,上海财经大学统计与数据科学学院张立文教授与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合数据科学和统计研究院、财跃星辰、滴水湖高级金融学院正式发布首款 ...
2025-03-26 · 浏览58次
全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻

全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻

全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻
全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻...
2025-03-26 · 浏览40次
Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍

Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍

Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍
从微观世界的分子与材料结构、到宏观世界的几何与空间智能,创建和理解 3D 结构是推进科学研究的重要基石。...
2025-03-26 · 浏览44次
腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?
在过去的一两年中,Transformer 架构不断面临来自新兴架构的挑战。...
2025-03-24 · 浏览47次
单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香

单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香

单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香
多模态,性能超 GPT-4o Mini、Gemma 3,还能在单个 RTX 4090 上运行,这个小模型值得一试。...
2025-03-18 · 浏览68次
真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」

真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」

真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」
最近一段时间,智能体(Agent)再次成为 AI 领域热议的焦点。...
2025-03-18 · 浏览213次
一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们

一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们

一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们
一家高校实验室 ,能走出多少个知名 AI 初创公司的创始人?...
2025-03-14 · 浏览89次
使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独

使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独

使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独
没有任何冷启动数据,7B 参数模型能单纯通过强化学习学会玩数独吗?...
2025-03-12 · 浏览96次
陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现

陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现

陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现
陶哲轩亲测点赞,o3-mini秒证图论难题!专家级证明完整呈现...
2025-03-11 · 浏览65次
轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错

轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错
轻松拿捏高等数学,LLM平均得分90+!GPT-4o、Mistral几乎没错...
2025-03-11 · 浏览65次
DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek的MLA,任意大模型都能轻松迁移了
DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。...
2025-03-07 · 浏览96次
ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景

ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景

ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景
近年来,自动驾驶技术快速发展,萝卜快跑已经无缝融入了武汉的交通,不少车企的智驾系统也都上路了。...
2025-03-04 · 浏览60次
DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口

DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口

DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口
DeepSeek会说话了!只要2行代码,这家公司让任意大模型秒开口...
2025-02-26 · 浏览476次
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
自 OpenAI 发布 o1-mini 模型以来,推理模型就一直是 AI 社区的热门话题,而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未...
2025-02-25 · 浏览179次
10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文实锤涌现

10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文实锤涌现

10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文实锤涌现
10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文实锤涌现...
2025-02-22 · 浏览127次
语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3
近年来,大语言模型(LLMs)取得了突破性进展,展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。...
2025-02-18 · 浏览120次
攻略在手,轻松玩转 DeepSeek

攻略在手,轻松玩转 DeepSeek

攻略在手,轻松玩转 DeepSeek
IT之家已经为大家从全网,搜集总结了一份《DeepSeek 玩法攻略》,帮助大家轻松实现“从入门到精通”。从大模型的能力范围、到提示词该怎么写、再到尝试在自己电脑上本地部署的方...
2025-02-08 · 浏览159次
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
过年这几天,DeepSeek 算是彻底破圈了,火遍大江南北,火到人尽皆知。...
2025-02-03 · 浏览946次
Nature发布:2025年值得关注的七项技术

Nature发布:2025年值得关注的七项技术

Nature发布:2025年值得关注的七项技术
七项技术不仅加速科学发现,更试图为人类提供应对复杂挑战的规模化方案。...
2025-02-02 · 浏览247次
史上首次,DeepSeek登顶中美AppStore!NYU教授:全球「AI霸权」之争已结束

史上首次,DeepSeek登顶中美AppStore!NYU教授:全球「AI霸权」之争已结束

史上首次,DeepSeek登顶中美AppStore!NYU教授:全球「AI霸权」之争已结束
史上首次,DeepSeek登顶中美AppStore!NYU教授:全球「AI霸权」之争已结束...
2025-01-27 · 浏览115次
无直接数据可用,AI怎么学会「干活」?微软团队揭秘AI从语言到行动的进化之路

无直接数据可用,AI怎么学会「干活」?微软团队揭秘AI从语言到行动的进化之路

无直接数据可用,AI怎么学会「干活」?微软团队揭秘AI从语言到行动的进化之路
近年来,大语言模型(Large Language Models, LLMs)的迅猛发展推动了自然语言处理(NLP)领域的技术进步。...
2025-01-22 · 浏览115次
小红书为何让歪果仁上头?推荐算法超牛,2篇核心论文揭秘

小红书为何让歪果仁上头?推荐算法超牛,2篇核心论文揭秘

小红书为何让歪果仁上头?推荐算法超牛,2篇核心论文揭秘
小红书为何让歪果仁上头?推荐算法超牛,2篇核心论文揭秘...
2025-01-16 · 浏览120次
LLM 带来了「编程末日」?哥本哈根大学计算机教授称“永远不会”

LLM 带来了「编程末日」?哥本哈根大学计算机教授称“永远不会”

LLM 带来了「编程末日」?哥本哈根大学计算机教授称“永远不会”
LLM 会把编程淘汰吗?近日,哥本哈根大学的计算机教授,通过分析计算理论中的定理所施加的基本限制,得出结论:距离编程的终结还远得很。...
2025-01-12 · 浏览107次
LLM带来了「编程末日」?哥本哈根大学CS教授:别做梦了!

LLM带来了「编程末日」?哥本哈根大学CS教授:别做梦了!

LLM带来了「编程末日」?哥本哈根大学CS教授:别做梦了!
LLM带来了「编程末日」?哥本哈根大学CS教授:别做梦了!...
2025-01-11 · 浏览87次
第一页 · 上一页 · 下一页 · 当前第1页