图像融合 标签,匹配到约1个结果, 耗时0.0870秒

达摩院开源 VideoLLaMA3:仅 7B 大小,视频理解拿下 SOTA

它就是由达摩院出品的 Video LLaMA 3,以图像为中心构建的新一代多模态视频-语言模型。...
2025-02-14
·
浏览90次
上一页
·
下一页
· 当前第1页