Pretrain - является самым масштабным и затратным этапом обучения VLM.
На нем закладывается огромный фундамент возможностей модели, который позволяет в дальнейшем ей быть полезной пользователю и решать задачи CV.
Нам требуется эксперт, который понимает какие данные растят качество, понимает весь скоуп задач компьютерного зрения и подходы к их решению. Нужно будет строить новые и совершенствовать имеющиеся процессы вокруг обогащения претрейна максимально качественными данными для множества необходимых доменов, оценивать качество и сложность датасетов, создавать полезные дашборды, заботиться о версионируемости и воспроизводимости. Нужен хороший организатор дата-команды и дата-пайплайнов с сильными техническими навыками.