Автор статьи Алексей Архипенко руководит группой разработки ML‑инфраструктуры в команде YTsaurus. Это основная платформа для хранения и обработки данных Яндекса, которая доступна на GitHub под лицензией Apache 2.0. В прошлых своих постах уже было рассказано про её выход в опенсорс и дальнейшее развитие, а также кейсы использования в рекламе. В этой статье автор подилится информацией о том, как Яндекс запускает в ней почти все ML‑обучения и batch‑инференс, покажет, как попробовать возможности платформы самостоятельно. Внутри статьи вы также найдёте полную инструкцию с подробным описанием пяти сценариев практического воркшопа.