В статье рассказывается об интересных и перспективных работах, представленных на конференции ICLR-2025, которые связаны с мультимодальным ранжированием. Авторы статьи — сотрудники Яндекса — обсуждают исследования в области обработки текста, изображений и видео, рассматривают проблемы и решения, связанные с Out-of-Domain объектами, энкодингом медиаконтента, применением мультимодальных LLM и другими аспектами. В статье подробно разбираются различные подходы и технологии, например Multi-Field Adaptive Retrieval, Contextual Document Embeddings, а также методики улучшения поиска и ранжирования.