文本生成 标签,匹配到约105个结果, 耗时0.0178秒
谷歌推出 Imagen 4 / Ultra 系列 AI 文生图模型,每张图片 0.04 美元起

谷歌推出 Imagen 4 / Ultra 系列 AI 文生图模型,每张图片 0.04 美元起

谷歌推出 Imagen 4 / Ultra 系列 AI 文生图模型,每张图片 0.04 美元起
谷歌发布最新文本生成图像模型Imagen 4系列,包含标准版和高端Ultra版,定价分别为0.04美元和0.06美元每张。谷歌称其效果优于Dall-E和Midjourney,但实际表现仍显机械化。目前已在Gemini API付费预览版上线。...
2025-06-26 · 浏览76次
微软面临新版权诉讼:未经许可用盗版书训练 AI

微软面临新版权诉讼:未经许可用盗版书训练 AI

微软面临新版权诉讼:未经许可用盗版书训练 AI
诉状指出,微软动用了一个包含近20万本盗版书籍的数据集,用于训练其文本生成算法 Megatron。原告称,该模型不仅是建立在成千上万创作者的劳动成果之上,还能输出各种模仿原作语法、风格和主题的文本表达。...
2025-06-26 · 浏览61次
突破扩散LLM瓶颈,英伟达港大提全新Fast-dLLM,推理加速27.6倍!

突破扩散LLM瓶颈,英伟达港大提全新Fast-dLLM,推理加速27.6倍!

突破扩散LLM瓶颈,英伟达港大提全新Fast-dLLM,推理加速27.6倍!
突破扩散LLM瓶颈,英伟达港大提全新Fast-dLLM,推理加速27.6倍!...
2025-06-17 · 浏览111次
全球首次,Transformer「混血」速度狂飙65倍!英伟达已下注

全球首次,Transformer「混血」速度狂飙65倍!英伟达已下注

全球首次,Transformer「混血」速度狂飙65倍!英伟达已下注
全球首次,Transformer「混血」速度狂飙65倍!英伟达已下注...
2025-06-14 · 浏览68次
科大讯飞董事长刘庆峰透露,7 月将升级讯飞星火 X1

科大讯飞董事长刘庆峰透露,7 月将升级讯飞星火 X1

科大讯飞董事长刘庆峰透露,7 月将升级讯飞星火 X1
今日举办的科大讯飞 26 周年会上,科大讯飞董事长刘庆峰在内部讲话中透露,讯飞星火 X1 升级版将于今年 7 月推出。...
2025-06-09 · 浏览73次
顶流AI,人设崩了!6小时被攻破,泄露高危品指南,惨遭网友举报

顶流AI,人设崩了!6小时被攻破,泄露高危品指南,惨遭网友举报

顶流AI,人设崩了!6小时被攻破,泄露高危品指南,惨遭网友举报
顶流AI,人设崩了!6小时被攻破,泄露高危品指南,惨遭网友举报...
2025-06-08 · 浏览151次
专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA
专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA...
2025-05-30 · 浏览158次
基准测试揭秘大模型“字数危机”:26 个模型长文本生成普遍拉胯,最大输出长度过度宣传

基准测试揭秘大模型“字数危机”:26 个模型长文本生成普遍拉胯,最大输出长度过度宣传

基准测试揭秘大模型“字数危机”:26 个模型长文本生成普遍拉胯,最大输出长度过度宣传
“写一篇 10,000 字的长文,详细分析某个议题。”看似简单的要求,实际却往往让这些模型“力不从心”:不是生成内容不足,就是重复啰嗦,甚至直接罢工拒绝生成。...
2025-05-29 · 浏览149次
刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了
刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了...
2025-05-29 · 浏览379次
谷歌发布开源 LMEval 框架:打破 AI 模型比较壁垒,降低评测成本和时间

谷歌发布开源 LMEval 框架:打破 AI 模型比较壁垒,降低评测成本和时间

谷歌发布开源 LMEval 框架:打破 AI 模型比较壁垒,降低评测成本和时间
谷歌推出开源框架LMEval,为大语言模型和多模态模型提供标准化评测工具。该框架支持文本、图像和代码等领域的基准测试,简化跨平台比较,还具备增量评估和可视化功能。#AI评测# #谷歌开源#...
2025-05-27 · 浏览105次
微软 Edge 浏览器将开放设备端 AI 功能,助力 Web 开发者提升应用体验

微软 Edge 浏览器将开放设备端 AI 功能,助力 Web 开发者提升应用体验

微软 Edge 浏览器将开放设备端 AI 功能,助力 Web 开发者提升应用体验
微软在Build 2025大会上宣布,Edge浏览器将支持设备端AI模型Phi-4-mini,开发者可通过新API将其集成到Web应用中,提供文本生成、总结等功能。目前已在Edge Canary和Dev频道开放试用。#微软Build2025...
2025-05-20 · 浏览118次
微软 Edge 浏览器被曝将集成 Phi-4 mini 模型,实现端侧 AI 功能

微软 Edge 浏览器被曝将集成 Phi-4 mini 模型,实现端侧 AI 功能

微软 Edge 浏览器被曝将集成 Phi-4 mini 模型,实现端侧 AI 功能
Phi-4 是一种小语言模型,其所需算力较低,运行效率更高,尤其适合推理类或较复杂的任务。据微软介绍,Phi-4 拥有约140亿个参数,在文本生成方面表现出色。...
2025-05-19 · 浏览94次
PDF文件长出「AI大脑」?网友惊呼:这操作太「黑科技」了!

PDF文件长出「AI大脑」?网友惊呼:这操作太「黑科技」了!

PDF文件长出「AI大脑」?网友惊呼:这操作太「黑科技」了!
PDF文件长出「AI大脑」?网友惊呼:这操作太「黑科技」了!...
2025-05-16 · 浏览146次
SDS 技术首次用于音频:英伟达携手 MIT 推 Audio-SDS,参数化控制 AI 音效生成

SDS 技术首次用于音频:英伟达携手 MIT 推 Audio-SDS,参数化控制 AI 音效生成

SDS 技术首次用于音频:英伟达携手 MIT 推 Audio-SDS,参数化控制 AI 音效生成
SDS 技术广泛应用于文本生成 3D 图像和图像编辑中,英伟达融合该技术推出 Audio-SDS,结合预训练模型的生成先验知识,能够直接根据高级文本提示调整 FM 合成参数、冲击音模拟器或分离掩码,将信号处理的清晰可解释性与现代扩散模型的灵...
2025-05-13 · 浏览118次
欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车

欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车

欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车
欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车...
2025-05-08 · 浏览148次
Meta Token-Shuffle 登场:自回归模型突破瓶颈,可 AI 生成 2048×2048 分辨率图像

Meta Token-Shuffle 登场:自回归模型突破瓶颈,可 AI 生成 2048×2048 分辨率图像

Meta Token-Shuffle 登场:自回归模型突破瓶颈,可 AI 生成 2048×2048 分辨率图像
Meta AI 创新推出 Token-Shuffle,目标解决自回归(Autoregressive,AR)模型在生成高分辨率图像方面的扩展难题。...
2025-04-26 · 浏览193次
Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话

Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话

Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话
Character.AI 公司今天(4 月 23 日)在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。...
2025-04-23 · 浏览147次
字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1080P 图像仅需约 3 秒

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1080P 图像仅需约 3 秒

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1080P 图像仅需约 3 秒
字节跳动最新推出全新文本生成图像模型 Seedream 3.0,其性能在内部和外部评测中均表现出色,超越前代 Seedream 2.0,并与 GPT-4o、Midjourney v6.1 和 Imagen 3 等主流系统一较高下。...
2025-04-19 · 浏览130次
字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1K 图像仅需约 3 秒

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1K 图像仅需约 3 秒

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1K 图像仅需约 3 秒
字节跳动最新推出全新文本生成图像模型 Seedream 3.0,其性能在内部和外部评测中均表现出色,超越前代 Seedream 2.0,并与 GPT-4o、Midjourney...
2025-04-19 · 浏览157次
谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划

谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划

谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划
这一订阅方案不仅提供2TB云存储空间,还包含多项 AI 工具,帮助学生“更高效地学习”。其中,Gemini 2.5 Pro 驱动的 Gemini Advanced,是谷歌为对抗...
2025-04-18 · 浏览224次
AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理

AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理

AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理
AI涌现人类情感!希腊「乐之神」Orpheus开源,单卡可跑语音流式推理...
2025-04-15 · 浏览145次
无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI

无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI

无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI
无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI...
2025-04-11 · 浏览149次
三个LLM顶一个OpenAI?2亿条性能记录加持,路由n个「小」模型逆袭

三个LLM顶一个OpenAI?2亿条性能记录加持,路由n个「小」模型逆袭

三个LLM顶一个OpenAI?2亿条性能记录加持,路由n个「小」模型逆袭
三个LLM顶一个OpenAI?2亿条性能记录加持,路由n个「小」模型逆袭...
2025-04-08 · 浏览154次
7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?
语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。...
2025-04-05 · 浏览165次
第一页 · 上一页 · 下一页 · 当前第1页