Мы развиваем инфраструктуру инференса больших языковых моделей: раскатка моделей, стабильность сервисов, производительность, cost optimization, взаимодействие с продуктовыми командами и эксплуатацией. Сейчас нам нужен человек, который поможет превратить быстрорастущую инженерную среду из «тушения пожаров» в понятную и управляемую систему процессов.
Внешние коммуникации и координация:
○ снижение cost на inference
○ улучшение latency
○ стабильность сервисов
○ качество и reliability inference-платформы
Внутренние процессы команды:
○ зависшие задачи
○ потерянные коммуникации
○ выпадающие из процессов участники
Будет плюсом