Posted 29 июня 2017,, 04:19

Published 29 июня 2017,, 04:19

Modified 29 мая 2023,, 09:24

Updated 29 мая 2023,, 09:24

«Самое «легкое» — это спокойствие»: красноярский аспирант о распознавании эмоций с помощью искусственного интеллекта

29 июня 2017, 04:19

«Проспект Мира» продолжает рассказывать о молодых ученых, участвующих в программе «УМНИК», по которой можно получить грант в 500 тысяч рублей и довести свою инновационную идею до практического применения. В этот раз мы поговорили с работником АО «Информационные спутниковые системы» им. акад. М. Ф. Решетнева» и аспирантом Сибирского государственного университета науки и технологий   Ильей Ивановым, который изучает эмоции человека с помощью искусственного интеллекта.

Первые шаги в науку

Я аспирант по специальности «Системный анализ управления и обработки информации» — если проще, то я занимаюсь искусственным интеллектом. Не сказал бы, что с детства увлекался компьютерами, просто так сложились обстоятельства, что я выбрал IT-направление — и тогда еще не знал, как сильно меня это затянет.

После бакалавриата поступил в магистратуру, а затем понял, что так влился в эту науку, что мне нужно в аспирантуру. Хотя, если бы у меня спросили курсе на втором, собираюсь ли я туда, я бы точно сказал, что нет.

С научным руководителем поначалу я изучал алгоритмы оптимизации. Это чистая математика: решение многих задач можно оптимизировать, ускорить — и я сравнивал определенные механизмы, модифицировал их. В магистратуре мы стали глубже изучать область искусственного интеллекта: кроме оптимизации существует, например, задача классификации — ее, по сути, решают те же приложения в смартфонах.

Вообще, что такое искусственный интеллект? Если коротко, то это набор алгоритмов для решения прикладных задач. Нейронные сети, которые базируются на модели человеческого мозга — самый известный сейчас алгоритм. Ты даешь им данные, они их изучают, обучаются, потом на этой основе данных выдают результат.

Стажировка в Германии 

На четвертом курсе мой интерес заметили на кафедре и сказали: если буду продолжать в том же духе, то смогу постажироваться в университете города Ульм в Германии. В итоге на пятом курсе я поехал на стажировку. 

Сразу стало понятно, чем у них научная деятельность отличается от нашей. В России все-таки проводят больше фундаментальные исследования. То есть у нас идут от фундаментального к прикладному. Математика, которую на матфаке проходят, как правило, на практике редко пригождается. Это, конечно, базис для последующего применения, но я сам как исследователь столкнулся с тем, что в прикладных задачах «университетская» математика не работает. Нужно что-то самому придумывать, читать новейшие исследования, изучать то, что было придумано два года или пять лет назад.

На Западе все ровно наоборот: появляется практическая задача и нужно придумать, как ее решить, — используя прикладные алгоритмы и, если нужно, фундаментальную науку. То есть методы решения выбираются от задачи: попробовал одно, не сработало — пробуешь другое, и так пока не сработает.

Я попал к исследовательской группе под предводительством профессора Вольфганга Минкера. Он изучал взаимодействие машины и человека: нужно было построить интерфейс, который мог бы автоматически определять параметры пользователей автомобиля — анализировать речь, определять эмоции и кучу других вещей. 

Делалось это по заказу автомобильной компании «Даймлер». В качестве объяснения, зачем это нужно, приводили такие кейсы: если водитель долго за рулем и у него явно сонный голос, то машина могла бы предупредить, подсказать, что человек засыпает; или наоборот, если у него слишком возбужденное состояние, то успокоить.

Стажировка длилась всего месяц, поэтому крупный проект тогда мне не дали: нужно было разработать алгоритм распознавания возраста человека по фотографии. Задача не такая комплексная, как распознавание эмоций, но все равно непростая. Очень сложно было, например, даже на глаз определять возраст афроамериканцев, которые были в фотобазе: смотришь на фото, думаешь, что человеку 30 лет, а на самом деле 60.

***

В Германии я побывал в итоге три раза. Второй раз ездил по стипендии Президента РФ для обучения за рубежом. Тогда я не занимался никакими научными исследованиями — ходил на лекции, программировал, в общем, учился.

Настоящие исследования начались уже в третий приезд, снова в группе профессора Минкера. Там я уже конкретно занимался задачей распознавания эмоций. На тот момент такие исследования уже были — отдельно по голосу, отдельно по картинкам, по видео. Моя задача состояла в том, чтобы посмотреть, позволит ли объединение аудио- и видео-потоков повысить точность определения эмоции и узнать, какие алгоритмы можно применить, чтобы это сделать. 

Эти исследования я решил продолжить после возвращения в Красноярск, уже с помощью программы «УМНИК» Фонда содействия инновациям.

О своём проекте

Поучаствовать в «УМНИК» я решил еще в Германии. Мое собеседование на программу проходило по скайпу: в Красноярске было 10 утра, а у меня – только пять. Мне задали вопросы (что я хочу делать, зачем мне это и так далее), я прошел конкурс и продолжил исследования, когда вернулся в Красноярск. 

Сейчас мой проект — это программа на компьютере, такая сборная солянка, где собрано множество алгоритмов распознавания по видео и аудио. Многие из них работают очень долго — те же нейросети обучаются часами.

Пока это больше научная разработка. В конечном счете это должно выглядеть как приложение. Теоретически алгоритмы можно применять на смартфонах для развлечения вроде условной «Призмы». Вторая идея — использование на банкоматах, которые становятся все умнее: распознают возраст, эмоции, что-то советуют. 

Определенные результаты у меня уже есть. Я решал задачу в несколько этапов, от простого к сложному. Изначально нужно было отличить нейтральное, абсолютно спокойное лицо от лица с какой-либо эмоцией. Когда точность определения на этом этапе достигла порядка 90%, я пошел по пути усложнения.

У меня в базе данных было семь основных классов эмоций: спокойствие, страх, счастье, грусть, удивление и другие. Конечно, точность сразу упала — до 40%. Я начал применять разные алгоритмы и точность удалось повысить в среднем до 70%, а по отдельным эмоциям — до 90-95%. Самая «легкая» эмоция — спокойствие, она у меня определяется на 100%. 

У женщин и мужчин, у разных возрастных групп эмоции проявляются по-разному, и, если предварительно классифицировать эти признаки, то задача распознавания в конечном счете упростится. Этим я сейчас и занимаюсь.

Какие возможности предоставил «Умник»

Программа «Умник» направлена не только на коммерциализацию проекта — основной упор там делается на научные разработки. И грант позволил мне больше времени посвятить собственно науке, заниматься тем, что мне действительно интересно. 

Для меня лично это был хороший опыт. Можно просто работать и заниматься тем, что тебе скажут, а можно подать заявку на грант, получить поддержку, делать то, что тебе нравится, и искать пути воплощения этого в жизнь.

Многие знакомые ученые боятся, что у них ничего не получится, говорят: «Куда мне там тягаться — там наверняка свои люди есть». Но ничего подобного. Когда я пробовался на программу первый раз, то с треском провалился, подумал потом даже, что это не для меня. Но через год мой научный руководитель уговорил попробовать еще раз, я попробовал и выиграл. Выигрывают те, кто докажет жюри, что они достойны, что они по-настоящему увлечены своей идеей.

_________________________________________________________________

Программа «УМНИК» направлена на поддержку коммерчески ориентированных научно-технических проектов молодых исследователей.

Принимать участие в конкурсе по данной программе могут физические лица, от 18 до 30 лет включительно, являющиеся гражданами РФ и ранее не побеждавшие в программе.

Параметры поддержки:

  • размер гранта — 500 тыс. рублей;
  • срок выполнения НИР — не более 24 месяцев (2 этапа по 12 месяцев);
  • направление расходов — проведение НИР.

Направления НИР:

  • Информационные технологии
  • Медицина будущего
  • Современные материалы
  • Новые приборы
  • Биотехнологии

Прием заявок на «УМНИК 2017» в Красноярском крае открыт и продлится до 25 сентября 2017 года.

Заявки подаются в электронном виде в Системе «УМНИК».

Оператором «УМНИК» в Красноярском крае является Красноярский региональный инновационно-технологический бизнес-инкубатор.

По всем вопросам, касающимся участия в «УМНИК 2017» (подачи заявки и получении консультаций), можно обращаться к специалистам Отдела сопровождения проектов КРИТБИ:

Гардер Кристина Александровна — начальник отдела сопровождения проектов, (391) 201-77-77 доб. 3210, gka@kritbi.ru

Рыбков Михаил Викторович — ведущий специалист отдела сопровождения проектов, (391) 201-77-77 доб. 2096, rmv@kritbi.ru

"