models 标签,匹配到约149个结果, 耗时0.1227秒
业界首个,阿里通义万相“首尾帧生视频模型”开源

业界首个,阿里通义万相“首尾帧生视频模型”开源

业界首个,阿里通义万相“首尾帧生视频模型”开源
它可根据用户指定的开始和结束图片,生成一段能衔接首尾画面的 720p 高清视频,此次升级将能满足用户更可控、更定制化的视频生成需求。...
2025-04-18 · 浏览35次
支付宝被AI调用,一句话运营小红书!国内最大MCP社区来了

支付宝被AI调用,一句话运营小红书!国内最大MCP社区来了

支付宝被AI调用,一句话运营小红书!国内最大MCP社区来了
支付宝被AI调用,一句话运营小红书!国内最大MCP社区来了...
2025-04-15 · 浏览47次
合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo

合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo

合成数据助力视频生成提速8.5倍,上海AI Lab开源AccVideo
虽然扩散模型在视频生成领域展现出了卓越的性能,但是视频扩散模型通常需要大量的推理步骤对高斯噪声进行去噪才能生成一个视频。...
2025-04-15 · 浏览13次
无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI

无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI

无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI
无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI...
2025-04-11 · 浏览40次
谷歌随OpenAI强势入局,劈柴4天闪电部署Gemini+MCP!

谷歌随OpenAI强势入局,劈柴4天闪电部署Gemini+MCP!

谷歌随OpenAI强势入局,劈柴4天闪电部署Gemini+MCP!
谷歌随OpenAI强势入局,劈柴4天闪电部署Gemini+MCP!...
2025-04-06 · 浏览57次
思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套

思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套

思维链不可靠:Anthropic曝出大模型「诚信」问题,说一套做一套
AI 可能「借鉴」了什么参考内容,但压根不提。...
2025-04-05 · 浏览66次
三思而后行,让大模型推理更强的秘密是「THINK TWICE」?

三思而后行,让大模型推理更强的秘密是「THINK TWICE」?

三思而后行,让大模型推理更强的秘密是「THINK TWICE」?
近年来,大语言模型(LLM)的性能提升逐渐从训练时规模扩展转向推理阶段的优化,这一趋势催生了「测试时扩展(test-time scaling)」的研究热潮。...
2025-04-05 · 浏览71次
AMD GPU性能暴涨7倍,优化算法首次开源!高效MoE支持任意专家数量

AMD GPU性能暴涨7倍,优化算法首次开源!高效MoE支持任意专家数量

AMD GPU性能暴涨7倍,优化算法首次开源!高效MoE支持任意专家数量
AMD GPU性能暴涨7倍,优化算法首次开源!高效MoE支持任意专家数量...
2025-04-03 · 浏览62次
刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1

刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1

刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1
刚刚,谷歌最强Gemini 2.5 Pro免费了!数学碾压人类研究生,拿下全球TOP 1...
2025-03-31 · 浏览107次
性能优于o3-mini,DeepMind发布通用医学开源LLM与问答Agent,改善治疗开发

性能优于o3-mini,DeepMind发布通用医学开源LLM与问答Agent,改善治疗开发

性能优于o3-mini,DeepMind发布通用医学开源LLM与问答Agent,改善治疗开发
Google DeepMind 团队发布了 TxGemma,这是一组开源模型,旨在通过利用大型语言模型的强大功能来提高治疗开发的效率。...
2025-03-28 · 浏览92次
DeepSeek 官方详解 V3 模型小版本升级:各项能力全面进阶

DeepSeek 官方详解 V3 模型小版本升级:各项能力全面进阶

DeepSeek 官方详解 V3 模型小版本升级:各项能力全面进阶
3月24日DeepSeek-V3模型小版本更新,今晚官方公布详情。新版在推理、前端开发、中文写作等能力提升,还优化搜索能力。模型开源,参数约660B。#DeepSeek-V3 ...
2025-03-26 · 浏览200次
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑

DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑
DeepSeek-V3深夜惊爆上新!代码数学飙升剑指GPT-5,一台Mac可跑...
2025-03-25 · 浏览115次
火了!高中生用Minecraft做AI基准,用户看图投票决定大模型排名

火了!高中生用Minecraft做AI基准,用户看图投票决定大模型排名

火了!高中生用Minecraft做AI基准,用户看图投票决定大模型排名
偶然发现了一个很有趣的 AI 基准测试,点开链接,竟然是一个 MineCraft 作品投票页面?...
2025-03-24 · 浏览82次
地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型

地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型

地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型
OpenAI 的 o1 和 DeepSeek 的 R1 模型在数学,科学等复杂领域达到甚至超过了人类专家的水平,强化学习训练和推理技术是其中的关键。...
2025-03-24 · 浏览92次
OpenAI语音智能体诞生,怼脸实拍语气狂到飞起!API降到每分钟0.3美分

OpenAI语音智能体诞生,怼脸实拍语气狂到飞起!API降到每分钟0.3美分

OpenAI语音智能体诞生,怼脸实拍语气狂到飞起!API降到每分钟0.3美分
OpenAI语音智能体诞生,怼脸实拍语气狂到飞起!API降到每分钟0.3美分...
2025-03-21 · 浏览82次
一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们

一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们

一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们
一家高校实验室 ,能走出多少个知名 AI 初创公司的创始人?...
2025-03-14 · 浏览99次
使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独

使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独

使用DeepSeek的GRPO,7B模型只需强化学习就能拿下数独
没有任何冷启动数据,7B 参数模型能单纯通过强化学习学会玩数独吗?...
2025-03-12 · 浏览127次
优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效

优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效

优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效
LLM 在生成 long CoT 方面展现出惊人的能力,例如 o1 已能生成长度高达 100K tokens 的序列。...
2025-03-11 · 浏览84次
微软甩开OpenAI自研大模型,还计划用DeepSeek

微软甩开OpenAI自研大模型,还计划用DeepSeek

微软甩开OpenAI自研大模型,还计划用DeepSeek
思维链引发的战争。...
2025-03-09 · 浏览78次
阿里云推出最新通义千问 QwQ-32B 推理模型,仅 1/20 参数媲美 DeepSeek R1

阿里云推出最新通义千问 QwQ-32B 推理模型,仅 1/20 参数媲美 DeepSeek R1

阿里云推出最新通义千问 QwQ-32B 推理模型,仅 1/20 参数媲美 DeepSeek R1
通义千问官方今日宣布推出最新的推理模型 QwQ-32B。这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1...
2025-03-06 · 浏览173次
DeepSeek引爆,英伟达特供版H20需求激增!特朗普「急」了?

DeepSeek引爆,英伟达特供版H20需求激增!特朗普「急」了?

DeepSeek引爆,英伟达特供版H20需求激增!特朗普「急」了?
DeepSeek引爆,英伟达特供版H20需求激增!特朗普「急」了?...
2025-02-26 · 浏览125次
扩散模型新突破!无需微调,就能高效稳定移除目标物体

扩散模型新突破!无需微调,就能高效稳定移除目标物体

扩散模型新突破!无需微调,就能高效稳定移除目标物体
最近,扩散模型在生成模型领域异军突起,凭借其独特的生成机制在图像生成方面大放异彩,尤其在处理高维复杂数据时优势明显。...
2025-02-25 · 浏览178次
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
自 OpenAI 发布 o1-mini 模型以来,推理模型就一直是 AI 社区的热门话题,而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未...
2025-02-25 · 浏览229次
一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA

一次推理解决复合问题:基于MoE的大语言模型知识模块可扩展融合推理架构MeteoRA
在大语言模型领域中,预训练 + 微调范式已经成为了部署各类下游应用的重要基础。...
2025-02-23 · 浏览135次
第一页 · 上一页 · 下一页 · 当前第1页