Техническое зрение и распознавание образов

В автотранспортной сфере техническое зрение и распознавание образов, то есть видеоаналитика, используется для анализа окружающей дорожной обстановки, оперативной обработки изображений в бортовых системах управления движением автомобилей различной степени автоматизации. Алгоритмы видеоаналитики используются для детектирования и распознавания дорожных знаков, детектирования и распознавания дорожной разметки, построения трехмерных моделей окружающей дорожной обстановки и анализа трехмерных данных окружающей дорожной обстановки с целью детектирования объектов. Источником данных для систем технического зрения являются радары, лидары и видеокамеры.

Применительно к автотранспортной сфере технологии технического зрения и распознавания образов являются, пожалуй, наиболее перспективными с точки зрения формирования научно-технического задела в России, по причине большого научного потенциала и потенциала разработки программного обеспечения, накопленного за предыдущие годы в этой области. Ниже приведены сведения лишь только о самых значимых наработках в видеоаналитике, непосредственно, относящихся к автомобилю.

Компания Cognitive Technologies разработала технологию компьютерного зрения, благодаря которой автономный автомобиль будет способен с высокой точностью интерпретировать сложные ситуации, возникающие, как правило, в критических ситуациях, а именно внезапном появлении на дороге других участников движения, пешеходов, посторонних предметов. При этом система хранит в памяти не всю картинку, полученную с видеокамеры, а лишь наиболее важные ее элементы, непосредственно влияющие на дорожную обстановку и безопасность. Это дает возможность не хранить все изображение целиком, а лишь 5 - 10% его объема и не требует какого-либо значительного повышения ресурсов вычислительного устройства. Также это позволяет использовать видеокамеры не с самой высокой разрешающей способностью или относительно узкоугольные объективы, говориться в электронном издании "Наука и технологии России".

По сообщениям новостного портала Спутник Компания Bright box, разработавшая connected car решения Nissan Smart Car для Ближнего Востока, KIA Remoto и Infiniti в России и более 90 мобильных приложений для 450 дилерских центров, анонсировала в ноябре 2016 года разработку системы беспилотного вождения автомобиля, работающей с применением обучающейся на сгенерированных кадрах из компьютерных игр и реальных кадрах съемки с улиц нейросети компьютерного зрения.

Компания Abbyy разработала технологию ABBYY Real-Time Recognition SDK, которая позволяет разработчикам встраивать в мобильные приложения функцию мгновенного распознавания текста в видеопотоке с документов или других объектов. Пользователю такого приложения достаточно навести камеру мобильного устройства на нужную информацию. Данные паспорта, платежных поручений, транспортных накладных и других документов, а также надписи, номера, длинные коды моментально извлекаются для последующего использования. Уникальный алгоритм, позволяющий объединять результаты обработки нескольких кадров, взятых из видеопотока, значительно увеличивает качество распознавания. "Режим реального времени" в разы быстрее и удобнее, чем обработка фотографии на сервере или в облаке.