"Точность определения текстов, которую мы получили, составляет около 90%. Решение может стать частью более современных навигационных систем, которые будут по данным регистратора или фотографии с телефона точно определять местоположение автомобиля или человека, переводить вывески и предупреждения. На сегодня программа успешно апробирована на сценах, содержащих надписи на английском и корейском языках", - пояснила Иванова ТАСС.
Для эффективного распознавания вывесок ученые "обучали" систему на примерах более 1,2 тыс. изображений с текстами. Сотрудники Томского политехнического университета также усовершенствовали процесс обработки входящих данных, дополнив архитектуру нейросети билатеральным фильтром, который сглаживал возникавшие при воспроизведении видео помехи и шумы.
"Полученные результаты были сопоставлены с другими моделями - как нейросетевыми, так и с решениями на основе классических методов машинного обучения. Анализ показал, что предлагаемый метод дает минимальное количество ложных срабатываний и наиболее точно находит текст", - подчеркнула исследователь.Подробнее читайте на https://oilru.com/news/569411/