可信度超越GPT-4V,清华&面壁揭秘「小钢炮」模型背后的高效对齐技术
近期,由清华大学自然语言处理实验室联合面壁智能推出的全新开源多模态大模型 MiniCPM-Llama3-V 2.5 引起了广泛关注...
2024-06-11
·
浏览358次
i人小助手:Meta推出多模态对话图,帮你轻松识别社交状态
近年来兴起的第一人称视角视频研究为理解人类社交行为提供了无法取代的直观视角,然而,绝大多数的既往工作都侧重于分析与摄像机佩戴者相关的行为,并未关注处于社交场景中其他社交对象的状...
2024-06-11
·
浏览142次
独家专访Pika:Sora is not very hard to beat,我们的算法能够以小胜大|AI Pioneers
即使Sora已经强势“炸”过场,Pika还是再次带着硅谷一众明星资方的投票回到了舆论中心。...
2024-06-11
·
浏览178次
原作者带队,LSTM卷土重来之Vision-LSTM出世
与 DeiT 等使用 ViT 和 Vision-Mamba (Vim) 方法的模型相比,ViL 的性能更胜一筹。...
2024-06-10
·
浏览166次
Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神
Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神...
2024-06-08
·
浏览182次