文本生成 标签,匹配到约105个结果, 耗时0.0178秒

谷歌推出 Imagen 4 / Ultra 系列 AI 文生图模型,每张图片 0.04 美元起

谷歌发布最新文本生成图像模型Imagen 4系列,包含标准版和高端Ultra版,定价分别为0.04美元和0.06美元每张。谷歌称其效果优于Dall-E和Midjourney,但实际表现仍显机械化。目前已在Gemini API付费预览版上线。...
2025-06-26
·
浏览76次

微软面临新版权诉讼:未经许可用盗版书训练 AI

诉状指出,微软动用了一个包含近20万本盗版书籍的数据集,用于训练其文本生成算法 Megatron。原告称,该模型不仅是建立在成千上万创作者的劳动成果之上,还能输出各种模仿原作语法、风格和主题的文本表达。...
2025-06-26
·
浏览61次

突破扩散LLM瓶颈,英伟达港大提全新Fast-dLLM,推理加速27.6倍!

突破扩散LLM瓶颈,英伟达港大提全新Fast-dLLM,推理加速27.6倍!...
2025-06-17
·
浏览111次


科大讯飞董事长刘庆峰透露,7 月将升级讯飞星火 X1

今日举办的科大讯飞 26 周年会上,科大讯飞董事长刘庆峰在内部讲话中透露,讯飞星火 X1 升级版将于今年 7 月推出。...
2025-06-09
·
浏览73次


专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA...
2025-05-30
·
浏览158次

基准测试揭秘大模型“字数危机”:26 个模型长文本生成普遍拉胯,最大输出长度过度宣传

“写一篇 10,000 字的长文,详细分析某个议题。”看似简单的要求,实际却往往让这些模型“力不从心”:不是生成内容不足,就是重复啰嗦,甚至直接罢工拒绝生成。...
2025-05-29
·
浏览149次

刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了

刚刚,新版DeepSeek-R1正式开源!直逼o3编程强到离谱,一手实测来了...
2025-05-29
·
浏览379次

谷歌发布开源 LMEval 框架:打破 AI 模型比较壁垒,降低评测成本和时间

谷歌推出开源框架LMEval,为大语言模型和多模态模型提供标准化评测工具。该框架支持文本、图像和代码等领域的基准测试,简化跨平台比较,还具备增量评估和可视化功能。#AI评测# #谷歌开源#...
2025-05-27
·
浏览105次

微软 Edge 浏览器将开放设备端 AI 功能,助力 Web 开发者提升应用体验

微软在Build 2025大会上宣布,Edge浏览器将支持设备端AI模型Phi-4-mini,开发者可通过新API将其集成到Web应用中,提供文本生成、总结等功能。目前已在Edge Canary和Dev频道开放试用。#微软Build2025...
2025-05-20
·
浏览118次

微软 Edge 浏览器被曝将集成 Phi-4 mini 模型,实现端侧 AI 功能

Phi-4 是一种小语言模型,其所需算力较低,运行效率更高,尤其适合推理类或较复杂的任务。据微软介绍,Phi-4 拥有约140亿个参数,在文本生成方面表现出色。...
2025-05-19
·
浏览94次


SDS 技术首次用于音频:英伟达携手 MIT 推 Audio-SDS,参数化控制 AI 音效生成

SDS 技术广泛应用于文本生成 3D 图像和图像编辑中,英伟达融合该技术推出 Audio-SDS,结合预训练模型的生成先验知识,能够直接根据高级文本提示调整 FM 合成参数、冲击音模拟器或分离掩码,将信号处理的清晰可解释性与现代扩散模型的灵...
2025-05-13
·
浏览118次

欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车

欧洲黑马Mistral Medium 3来了!跑分对标最强Claude,实测大翻车...
2025-05-08
·
浏览148次

Meta Token-Shuffle 登场:自回归模型突破瓶颈,可 AI 生成 2048×2048 分辨率图像

Meta AI 创新推出 Token-Shuffle,目标解决自回归(Autoregressive,AR)模型在生成高分辨率图像方面的扩展难题。...
2025-04-26
·
浏览193次

Character.AI 推出 AvatarFX 模型:AI 实现静转动,让图片角色开口说话

Character.AI 公司今天(4 月 23 日)在 X 平台发布推文,宣布推出 AvatarFX 模型,能够让静态图片中的人物“开口说话”。...
2025-04-23
·
浏览147次

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1080P 图像仅需约 3 秒

字节跳动最新推出全新文本生成图像模型 Seedream 3.0,其性能在内部和外部评测中均表现出色,超越前代 Seedream 2.0,并与 GPT-4o、Midjourney v6.1 和 Imagen 3 等主流系统一较高下。...
2025-04-19
·
浏览130次

字节 Seedream 3.0 登场:文生图跑分超 GPT-4o,生成 1K 图像仅需约 3 秒

字节跳动最新推出全新文本生成图像模型 Seedream 3.0,其性能在内部和外部评测中均表现出色,超越前代 Seedream 2.0,并与 GPT-4o、Midjourney...
2025-04-19
·
浏览157次

谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划

这一订阅方案不仅提供2TB云存储空间,还包含多项 AI 工具,帮助学生“更高效地学习”。其中,Gemini 2.5 Pro 驱动的 Gemini Advanced,是谷歌为对抗...
2025-04-18
·
浏览224次


无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI

无痛提升文本对齐!无分类引导新范式CFG-Zero*火了,支持Diffusers/ComfyUI...
2025-04-11
·
浏览149次


7B扩散LLM,居然能跟671B的DeepSeek V3掰手腕,扩散vs自回归,谁才是未来?

语言是离散的,所以适合用自回归模型来生成;而图像是连续的,所以适合用扩散模型来生成。...
2025-04-05
·
浏览165次