文本生成 标签,匹配到约78个结果, 耗时0.3359秒

上财开源首个金融领域R1类推理大模型,7B模型媲美DeepSeek-R1 671B满血版性能

近日,上海财经大学统计与数据科学学院张立文教授与其领衔的金融大语言模型课题组(SUFE-AIFLM-Lab)联合数据科学和统计研究院、财跃星辰、滴水湖高级金融学院正式发布首款 ...
2025-03-26
·
浏览58次

全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻

全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻...
2025-03-26
·
浏览40次

Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍

从微观世界的分子与材料结构、到宏观世界的几何与空间智能,创建和理解 3D 结构是推进科学研究的重要基石。...
2025-03-26
·
浏览44次


单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香

多模态,性能超 GPT-4o Mini、Gemma 3,还能在单个 RTX 4090 上运行,这个小模型值得一试。...
2025-03-18
·
浏览68次






DeepSeek的MLA,任意大模型都能轻松迁移了

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界,特别是其训练与推理成本仅为同等性能大模型的数十分之一。...
2025-03-07
·
浏览96次

ICRA 2025|清华x光轮:自驾世界模型生成和理解事故场景

近年来,自动驾驶技术快速发展,萝卜快跑已经无缝融入了武汉的交通,不少车企的智驾系统也都上路了。...
2025-03-04
·
浏览60次


从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

自 OpenAI 发布 o1-mini 模型以来,推理模型就一直是 AI 社区的热门话题,而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未...
2025-02-25
·
浏览179次

10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文实锤涌现

10美元成功复现DeepSeek顿悟时刻,3B模型爆发超强推理!微软论文实锤涌现...
2025-02-22
·
浏览127次

语言模型新范式:首个8B扩散大语言模型LLaDA发布,性能比肩LLaMA 3

近年来,大语言模型(LLMs)取得了突破性进展,展现了诸如上下文学习、指令遵循、推理和多轮对话等能力。...
2025-02-18
·
浏览120次

攻略在手,轻松玩转 DeepSeek

IT之家已经为大家从全网,搜集总结了一份《DeepSeek 玩法攻略》,帮助大家轻松实现“从入门到精通”。从大模型的能力范围、到提示词该怎么写、再到尝试在自己电脑上本地部署的方...
2025-02-08
·
浏览159次

完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!

过年这几天,DeepSeek 算是彻底破圈了,火遍大江南北,火到人尽皆知。...
2025-02-03
·
浏览946次


史上首次,DeepSeek登顶中美AppStore!NYU教授:全球「AI霸权」之争已结束

史上首次,DeepSeek登顶中美AppStore!NYU教授:全球「AI霸权」之争已结束...
2025-01-27
·
浏览115次

无直接数据可用,AI怎么学会「干活」?微软团队揭秘AI从语言到行动的进化之路

近年来,大语言模型(Large Language Models, LLMs)的迅猛发展推动了自然语言处理(NLP)领域的技术进步。...
2025-01-22
·
浏览115次


LLM 带来了「编程末日」?哥本哈根大学计算机教授称“永远不会”

LLM 会把编程淘汰吗?近日,哥本哈根大学的计算机教授,通过分析计算理论中的定理所施加的基本限制,得出结论:距离编程的终结还远得很。...
2025-01-12
·
浏览107次
