Статья
Личное развитие
Люди
Как мы работаем
1 марта 2024

Чем занимаются молодые учёные в Сбере и SberDevices

Спросили у кандидатов наук из Sber AI и SberDevices, как научная степень помогает в разработке инновационных продуктов. 

Я руковожу исследованиями в области компьютерного зрения и мультимодальных архитектур. Вместе с командой мы учим нейромодели решать сложные задачи — они лягут в основу сильного искусственного интеллекта, который станет доверенным помощником человека во всех сферах жизни.

— Андрей Кузнецов 

исполнительный директор по исследованию данных, 

кандидат технических наук

В Сбер я попал потому, что мне хотелось заниматься современными направлениями в области ИИ, учить большие модели, добиваться успехов на уровне международного комьюнити. Для меня, как исследователя, здесь очень много амбициозных задач — внедрение технологий генеративного ИИ, которые разрабатывает наша команда, в различных сферах позволит демонстрировать технологическое преимущество компании и её широкие возможности.


Сбер — отличное место для учёных. Они могут проверять идеи, анализировать сложные архитектурные решения, выбирать наиболее конкурентные решения, которые далее команды разработки доводят до продуктового внедрения и валидируют на специальных бенчмарках. Если вы только начинаете свой путь в науке, я бы порекомендовал обратить внимание на мультимодальные модели, генеративный ИИ, синтез 3D сцен и объектов для виртуальных миров.


Наука двигается в сторону создания сильного ИИ, способного реплицировать способности человека для повышения качества решения различных задач. Этот тренд будет сохраняться и далее внедряться в различные роботизированные среды (Embodied AI), модели научатся коммуницировать друг с другом (мультиагентные взаимодействия). В своем проекте мечты я как раз хотел бы научить ИИ рефлексии и самооценке своих ответов.


Сами учёные используют ИИ в работе — нейросети помогают при написании статей, особенно базовых блоков с обзором литературы и суммаризации. В системах подачи статей на конференции даже есть специальные чекбоксы, которые нужно выбрать, если применяешь языковые модели при написании.

Математика интересовала меня с детства, поэтому я пошла учиться на механико-математический факультет МГУ. Но я никогда не хотела быть тем учёным, который только на бумаге доказывает теоремы. Это казалось немного скучным, хотелось делать что-то, что будет полезно людям.

— Мария Тихонова

Senior data scientist в SberDevices, 

кандидат компьютерных наук

Я увлеклась машинным обучением, нашла в этом прикладное применение математических знаний и решила, что хочу связать свою жизнь с Data Science — так я попала в Сбер. 

Один из любимых проектов, который делала моя команда, называется «Нейро Пепперштейн». Мы обучили нейросеть ruGPT-3 писать рассказы в стиле современного писателя Павла Пепперштейна. В соавторстве с ним был написан сборник рассказов «Пытаясь проснуться». В этой книге 24 рассказа: 12 написаны Павлом Пепперштейном, а 12 написала наша нейросеть. Угадать, где какой, очень сложно.


В Data Science есть яркие примеры того, как учёные помогают делать разработчикам продукт лучше. Исследователи изучают архитектуру нейронных сетей, придумывают, как обучать такие модели. Мы понимаем, как правильно собирать данные для модели, как их чистить, как их подавать на вход в модели, какой должен быть процесс обучения, чтобы это дало максимальную пользу. В итоге получаются такие классные результаты, которые, например, используются в наших виртуальных ассистентах и GigaChat.

Нейросети уже помогают учёным: их активно используют для облегчения написания текста, для его оформления, для более удобного быстрого поиска релевантной информации с одновременной генерацией текста. А разработчикам нейросети помогают в написании кода, снимая с них рутинные задачи.

Ещё в Сбере мы создаём «фотошоп» для текста — это удобный инструмент текстовой редактуры, который объединяет в себе набор моделей, таких как GigaChat, Kandinsky и других. Сейчас многое можно сделать через обращение к промптам, но это не всегда удобно. Гораздо лучше, когда в редакторе есть кнопка, чтобы переписать в определённом стиле, проиллюстрировать изображение. Там будет возможность создать собственные команды, придумывать для них промпты, которые позволят облегчить работу с текстом.


Делать какие-то прогнозы в науке сегодня очень сложно. По моему мнению, активно развиваться будут мультимодальные нейронные сети, которые работают не только с текстом, но и с картинками, с аудио и звуком. Это область развития виртуальных ассистентов, возможно, их интеграция с дополненной реальностью. Скоро у нас будет такое очень виртуальное, полное генеративное окружение.

Я, конечно, всем рекомендую область Data Science, которую так люблю и которая активно развивается сегодня. Но, безусловно, помимо этого, есть и другие области — в биологии, биоинформатике. Очень востребованы все вещи, связанные с генеративными моделями, с компьютерным зрением, с обработкой видео, natural language processing. И всё больше и больше возрастают вопросы, связанные с этикой искусственного интеллекта.


Поэтому надо быть готовым, что это тоже придётся изучать. Главное — не бояться, пробовать свои силы, быть проактивным, выбирать то, что вам нравится, и искать хороший коллектив.