models 标签,匹配到约149个结果, 耗时0.1227秒

业界首个,阿里通义万相“首尾帧生视频模型”开源

它可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的 720p 高清视频,此次升级将能满足用户更可控、更定制化的视频生成需求。...
2025-04-18
·
浏览35次


合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo

虽然扩散模型在视频生成领域展现出了卓越的性能,但是视频扩散模型通常需要大量的推理步骤对高斯噪声进行去噪才能生成一个视频。...
2025-04-15
·
浏览13次

无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI

无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI...
2025-04-11
·
浏览40次



三思而后行,让大模型推理更强的秘密是「THINK TWICE」?

近年来,大语言模型(LLM)的性能提升逐渐从训练时规模扩展转向推理阶段的优化,这一趋势催生了「测试时扩展(test-time scaling)」的研究热潮。...
2025-04-05
·
浏览71次


刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1

刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1...
2025-03-31
·
浏览107次

性能优于o3-mini,DeepMind发布通用医学开源LLM与问答Agent,改善治疗开发

Google DeepMind 团队发布了 TxGemma,这是一组开源模型,旨在通过利用大型语言模型的强大功能来提高治疗开发的效率。...
2025-03-28
·
浏览92次

DeepSeek 官方详解 V3 模型小版本升级:各项能力全面进阶

3月24日DeepSeek-V3模型小版本更新,今晚官方公布详情。新版在推理、前端开发、中文写作等能力提升,还优化搜索能力。模型开源,参数约660B。#DeepSeek-V3 ...
2025-03-26
·
浏览200次

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑...
2025-03-25
·
浏览115次

火了!高中生用Minecraft做AI基准,用户看图投票决定大模型排名

偶然发现了一个很有趣的 AI 基准测试,点开链接,竟然是一个 MineCraft 作品投票页面?...
2025-03-24
·
浏览82次

地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型

OpenAI 的 o1 和 DeepSeek 的 R1 模型在数学,科学等复杂领域达到甚至超过了人类专家的水平,强化学习训练和推理技术是其中的关键。...
2025-03-24
·
浏览92次




优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效

LLM 在生成 long CoT 方面展现出惊人的能力,例如 o1 已能生成长度高达 100K tokens 的序列。...
2025-03-11
·
浏览84次


阿里云推出最新通义千问 QwQ-32B 推理模型,仅 1/20 参数媲美 DeepSeek R1

通义千问官方今日宣布推出最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1...
2025-03-06
·
浏览173次


扩散模型新突破!无需微调,就能高效稳定移除目标物体

最近,扩散模型在生成模型领域异军突起,凭借其独特的生成机制在图像生成方面大放异彩,尤其在处理高维复杂数据时优势明显。...
2025-02-25
·
浏览178次

从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

自 OpenAI 发布 o1-mini 模型以来,推理模型就一直是 AI 社区的热门话题,而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未...
2025-02-25
·
浏览229次

一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

在大语言模型领域中,预训练 + 微调范式已经成为了部署各类下游应用的重要基础。...
2025-02-23
·
浏览135次