Как подготовить датасет, чтобы обучить text-to-image- и text-to-video-модели

В видео Иван Кириллов, руководитель направления по исследованию данных в Sber AI, рассказывает, как собрать качественные данные для обучения современной генеративной модели и эффективно организовать непрерывную обработку петабайтов сырой информации.