Универсальный детектор объектов и ситуаций по текстовому описанию
Метадетектор анализирует видеопоток в реальном времени и обнаруживает объекты или события на основе текстовых запросов на английском языке.
Как применяется метадетектор?
В основе системы — нейросеть, способная распознавать разнообразные сцены без предварительного обучения. Это гибкий инструмент, который настраивается через обычный текст и адаптируется под разные задачи.
Принцип работы
Детектирует сложные для классической видеоаналитики, но повседневные ситуации (например, «человек перелезает через забор»).
Не требует специализированных знаний — работает с понятными описаниями.
Анализирует отдельные кадры (статические сцены), но не отслеживает динамические изменения.
Как формулировать запросы?
Оптимальный запрос включает:
- Объект (например, car, human);
- Его признаки (цвет, размер, состояние);
- Контекст (место, окружение);
- Дополнительные детали (ракурс, положение).
Примеры запросов
- "human and dog"
- "running human"
- "white car on a crosswalk (top view)"
- "woman in a black dress"