В Центре робототехники Сбера для обучения моделей используются данные из разных источников: записи с наших роботов, захват движений MoCap, синтетические данные, внешние open source датасеты и так далее. Data Conveyor Team превращает этот поток в управляемый процесс с понятными приоритетами, сроками и качеством. Сейчас нам нужен Data Operations / Data Program Manager, который будет держать вместе сбор данных, разметку, проверку, подрядчиков и передачу результатов в обучение.
- Вести план поставки данных по источникам: записи с роботов, внешние датасеты, симуляции, тестовые запуски, корректирующие демонстрации и данные, размеченные подрядчиками.
- Переводить запросы на данные в конкретные задачи на сбор, разметку и проверку качества с объемами, приоритетами, сроками, критериями приемки и владельцами.
- Координировать исследователей, инженеров, аналитиков, операторов тестирования, инфраструктурные команды и подрядчиков.
- Фиксировать и поддерживать data contracts для сбора и подготовки датасетов к обучению: какие сигналы, метаданные, критерии качества и статусы готовности должны быть соблюдены.
- Организовывать процессы разметки: ТЗ, инструкции, эталонные наборы примеров, согласованные сроки и критерии качества, приемка, учет дефектов и циклы исправлений.
- Управлять статусами релизов датасетов.
- Вести регулярные обзоры поставки данных, учет рисков, журналы решений, планы кампаний сбора данных и отчеты для команды и руководства.
- Следить за основными метриками: скорость подготовки данных к обучению, сроки разметки, доля данных, прошедших проверку качества, и прирост полезных часов данных.
- Помогать превращать ошибки модели и пробелы в тестах в понятные задачи на сбор, разметку, проверку и обновление датасетов.
- От 3 лет опыта project/program management, data operations, technical operations, product operations, consulting или похожей роли в data/ML/R&D среде.
- Умение управлять несколькими параллельными потоками с разными командами, сроками, зависимостями и приоритетами.
- Сильная письменная коммуникация: ТЗ, инструкции, краткие сводки, журналы решений, статусные отчеты.
- Умение работать с трекерами, таблицами, метриками, согласованными сроками и критериями качества, дефектами, рисками и roadmap.
- Опыт взаимодействия с подрядчиками, внешними исполнителями, labeling teams или распределенными операционными командами.
- Готовность работать в среде, где процессы нужно не только исполнять, но и строить с нуля.
Будет плюсом:
- Опыт в robotics, AI data collection, autonomous systems, data labeling или ML operations.
- Понимание ML lifecycle.
- Опыт внедрения operational dashboards и управления throughput / quality metrics.
- Опыт работы с cross-functional hardware / software / ML командами.