Универсальный детектор объектов и ситуаций по текстовому описанию

Метадетектор анализирует видеопоток в реальном времени и обнаруживает объекты или события на основе текстовых запросов на английском языке.
Как применяется метадетектор?
В основе системы — нейросеть, способная распознавать разнообразные сцены без предварительного обучения. Это гибкий инструмент, который настраивается через обычный текст и адаптируется под разные задачи.
Принцип работы

Детектирует сложные для классической видеоаналитики, но повседневные ситуации (например, «человек перелезает через забор»).

Не требует специализированных знаний — работает с понятными описаниями.

Анализирует отдельные кадры (статические сцены), но не отслеживает динамические изменения.

Как формулировать запросы?

Оптимальный запрос включает:
  • Объект (например, car, human);
  • Его признаки (цвет, размер, состояние);
  • Контекст (место, окружение);
  • Дополнительные детали (ракурс, положение).

Примеры запросов

  • "human and dog"
  • "running human"
  • "white car on a crosswalk (top view)"
  • "woman in a black dress"