Мы строим продакшн-грейд мультиагентную систему глубокого анализа макроэкономических и финансовых трендов. Сейчас система работает как MVP на облачной инфраструктуре с использованием внешних моделей (DeepSeek, Perplexity). Мы переводим её на собственные инструменты, модели и источники данных с интеграцией во внутренние системы организации и соответствием требованиям безопасности, IT-говернанса и регуляторных стандартов
Ведущий архитектор — это главный технический лидер, отвечающий за проектирование мультиагентного фреймворка и обеспечение согласованной работы LLM моделей, собственных прогнозных ML моделей, RAG, internet search и баз данных в едином масштабируемом и аудируемом контуре банка. Отвечает за решения по латентности, надёжности, управлению памятью агентов и говернансу.
1. Архитектура мультиагентной системы
* Проектирование слоя оркестрации агентов: выбор и настройка фреймворка (LangGraph — базовый вариант)
* Дизайн топологии supervisor/worker: границы специализации агентов (макроданные, финанализ, прогнозирование, генерация отчётов), протоколы передачи, обработка ошибок и graceful degradation.
* Архитектура памяти агентов: краткосрочное состояние, долгосрочные знания, общий scratchpad — без потери контекста и каскадных галлюцинаций.
2. Стратегия моделей и миграция
* Переход от внешних API моделей к собственным / self-hosted альтернативам без потери качества.
* Размещение системы в промышленном контуре: хостинг, инференс (vLLM, Triton, TGI), файнтьюнинг. Интеграция классических ML-моделей прогнозирования (временные ряды, регрессия, ансамбли) в единую оркестрацию с LLM-агентами.
3. RAG и инфраструктура знаний
* Использование и валидация RAG-пайплайна: ингестия, чанкинг, эмбеддинги, гибридный поиск (dense vector + BM25), реранкинг, grounding.
* Архитектура векторной БД и фреймворк оценки качества ретривала и детекции галлюцинаций — критично для финансового контекста.
4. Интеграция и качество
* Интеграция с внутренними БД (статистика, цены, регуляторные документы) и корпоративными системами.
* Стандарты качества: code review, тестирование (unit, integration, agent-level, e2e), бенчмарки.
5. Управление технической командой из 5-6 человек
Опыт
* 5+ лет в ML/AI-инженерии с реальным опытом разработки и вывода GenAI-агентов в продакшн.
* Разработка ML/AI-систем, доведённых до продакшн-масштаба (не только прототипы).
* Опыт с мультиагентными / compound AI-системами в профессиональном контексте.
* Опыт в финансах, макроэкономике или регулируемых отраслях (сильное преимущество).Технические навыки
Программирование:
* Python (продвинутый: async, type hints, production-grade). Знание системных языков будет плюсом (Go, Rust или C++).
* основы софтверной инженерии: паттерны, тестирование, CI/CD, code review.
Мультиагентные фреймворки и LLM-оркестрация:
* Глубокая экспертиза LangGraph (графовые воркфлоу, state machines, durable execution, human-in-the-loop).
* Знание альтернатив (CrewAI, AutoGen/AG2, OpenAI Agents SDK). Протоколы MCP и A2A.
RAG и ретривал:
* Эмбеддинг-модели, векторные БД (Pinecone, Weaviate, Milvus, pgvector), гибридный поиск, реранкинг.
* Продвинутые паттерны: GraphRAG, agentic RAG, multi-hop retrieval, семантический чанкинг.
Сервинг моделей:
* Продакшн-опыт с vLLM, Triton, TGI. Квантизация (FP8, INT8, GPTQ, AWQ), файнтьюнинг (LoRA, QLoRA). PyTorch.
Инфраструктура:
* Docker, Kubernetes (GPU scheduling), облачные ML-платформы (SageMaker, Vertex AI, Azure ML).
* Observability для LLM-систем: Langfuse, LangSmith или аналоги.
Желательно
* Знание финансовых источников данных (Bloomberg, FRED, SEC EDGAR, ЦБ).
* Публикации, патенты или значимый open-source вклад в ML/AI, NLP или information retrieval.
* Опыт лидерства/менторства команды 3–6 человек. MLOps/LLMOps (MLflow, W&B, Kubeflow).