Аналитики "Центр 2М" Татьяна Воронова и Эльвира Дяминова рассказали, как компании удается поддерживать хорошее качество распознавания нейросетевых моделей, не выходя за рамки определенного заказчиком бюджета. В статье, опубликованной на "Хабре", эксперты поделились опытом автоматического дообучения нейросети на примере проекта, связанного с подсчетом людей в очередях.
Процесс дообучения нейросети кратко можно описать как последовательность нескольких этапов: агрегация имеющихся видеоизображений, их разметка, внесение отслеженных изменений в общую xls-страницу, в случае необходимости переобучение модели на расширенном множестве.
Такой метод позволяет вовремя отследить рост ошибок второго ряда и вовремя корректировать датасет с учетом новых вводных данных: например, сезонных изменений в одежде. Так, благодаря автоматическому дообучению, эксперты смогли быстро донастроить модель во время пандемии, когда у большинства детектируемые фигур появился новый элемент — маски.
Авторы называют не только основные плюсы метода: частичную автоматизацию процесса разметки своевременное реагирование на новые ситуации, — но и указывают на минусы. Главным недостатком автоматического дообучения может стать "человеческий фактор", а именно недостаточно ответственный подход со стороны разметчика. Однако этот недостаток решается разметкой с перекрытием или использованием golden set'ов – заданий с заранее известным ответом, служащих только для контроля качества разметки.
Узнать подробнее о том, как автоматическое дообучение помогает держать качество модели на высоте, можно в
полной версии статьи Татьяны и Эльвиры на портале Habr