AI 中文社区

加州大学研究团队发现，自动驾驶汽车依赖的视觉-语言大模型存在安全漏洞，攻击者只需举起一块优化后的印刷标志，就能劫持AI决策，使其无视安全法则执行危险指令。在模拟测试中，攻击成功率最高可达95.5%。#自动驾驶安全##AI漏洞#...

2026-02-01 · 浏览208次

DeepSeek发布新一代文档识别模型DeepSeek-OCR 2，引入“视觉因果流”概念，通过DeepEncoder V2编码器动态重排视觉token顺序，更贴近人类阅读逻辑。在OmniDocBench v1.5测试中整体得分达91.09...

2026-01-27 · 浏览237次

全国超 1300 辆曹操出行定制车化身自动“AI 巡查员”，通过视觉大模型对车内遗留物进行智能识别，主动识别车内遗留物并实时报失。...

2026-01-19 · 浏览179次

其能够赋予每位驾驶者“全知视角”的能力，在面对路口或高速时，不再受限于局部视野，从而更直观预知前方路况，从容应对潜在风险。...

2025-09-19 · 浏览349次

技术文档显示，FastVLM 在保持精度的前提下，实现了高分辨率图像处理的近实时响应，同时所需的计算量比同类模型要少得多。...

2025-05-13 · 浏览431次

5月10日央视财经报道，华中科技大学盛建中团队研发视觉新生智能图像生成系统，利用AI预测失踪儿童面貌。该系统已协助警方寻回19名失踪儿童，还修复千张照片。##AI寻亲##...

2025-05-10 · 浏览369次

Meta Reality 实验室最新推出了名为 Sapiens 的 AI 视觉模型，适用于二维姿势预估、身体部位分割、深度估计和表面法线预测 4 种以人为中心的基本视觉任务。...

2024-08-25 · 浏览811次

最近，来自谷歌团队的研究人员提出了一种通用视频编码器 ——VideoPrism。它能够通过单一冻结模型，处理各种视频理解任务。...

2024-02-26 · 浏览419次

OpenCV是一个强大的计算机视觉库，它包含了大量的算法和函数，可以用于图像处理、计算机视觉、模式识别、机器学习等领域。...

2024-01-08 · 浏览482次

目前基于Transformer结构的算法模型已经在计算机视觉（CV）领域展现出了巨大的影响力。他们在很多基础的计算机视觉任务上都超过了之前的卷积神经网络（CNN）算法模型。...

2023-12-06 · 浏览747次