Разрабатываем и внедряем передовые методы оптимизации обучения и инференса сверхкрупных нейронных сетей (десятки миллиардов параметров) для мультимодальных генеративных моделей. Фокус — компиляция, квантизация, дистилляция, sparsity и другие техники ускорения, без компромисса по качеству.
Будет большим плюсом: