Разрабатываем и внедряем передовые методы мультимодальной генерации. Используются следующие модальности – на входе изображения/текст/звук/видео, на выходе – видео/звук. Фокус — разработка новых архитектур, обучение больших моделей (десятки/сотни миллиардов параметров), оптимизация и удешевление инференса.
Будет большим плюсом: