Как устроены главные айтишные конференции мира
Исследователи Яндекса рассказывают, зачем они ездили на важные айтишные конференции: от Атланты до Вены. А также о том, что там увидели и услышали.
4 декабря 2025Исследователи Яндекса рассказывают, зачем они ездили на важные айтишные конференции: от Атланты до Вены. А также о том, что там увидели и услышали.
4 декабря 2025За первую половину 2025 года исследователи и инженеры Яндекса успели побывать во многих странах — от Индии до Австрии. А в сентябре представили свою работу на крупнейшей конференции по рекомендательным системам ACM RecSys в Чехии. Попросили коллег рассказать, как такие конференции выглядят изнутри — и как правильно тусить, если ты учёный.
Конференций в сфере машинного обучения много, и каждая из них имеет свой вес. Ориентироваться можно на рейтинг CORE (присуждает мероприятию категорию A*, A, B, C). Он складывается из нескольких факторов: строгости отбора, доли отклонённых заявок, влияния опубликованных статей и репутации самого мероприятия в сообществе. Конференции уровня A* считаются самыми престижными, и попасть туда особенно трудно. К ним относятся, например, ICML, ACL, ICLR.
Если статья прошла, у авторов есть ещё пара недель, чтобы внести обещанные правки в текст. В итоге в основную программу попадает лишь часть работ, которые признаются наиболее значимыми. Например, на конференцию ICML в 2024 году было принято всего 27,5% присланных статей.
Принятую работу можно представить в разных форматах: как доклад на секции, как постер, где автор лично рассказывает о статье заинтересованным коллегам, или как демо. Вот об этом и поговорим.
Я Алексей Березникер, руковожу службой генеративной рекламы в Яндексе. Мы разрабатываем и внедряем технологии для упрощения создания и роста эффективности рекламных продуктов. На ACL в Вене у меня не было доклада, я поехал за знаниями: нужно было узнать как можно больше всего полезного и привезти домой наиболее важные выводы. ACL — это крупнейшая конференция по обработке естественного языка. Я бы сказал, что ACL скорее относится к разряду академических. Хотя в этом году там был индустриальный трек.
Нас от компании было трое, но конференция настолько огромная, что иногда мы расходились по разным трекам и могли не видеть друг друга целый день. Зато это позволяло покрыть больше тем и потом обменяться впечатлениями.
В целом в Вене больше всего обсуждали три темы:
роутинг моделей — как выбирать из нескольких LLM ту, что даст лучший ответ;
агенты, которые начинают выполнять сложные цепочки задач;
и, конечно, AGI.
По числам тоже было видно, куда движемся: 67% статей в программе содержали в названии аббревиатуру LLM.
Открывал ACL часовой кейноут Люка Зеттлемойера, профессора Вашингтонского университета, руководителя в одной из FAANG-компаний и президента ACL. Он показал, что привычный пайплайн обучения LLM — токенизация, претрейн, элайнмент — далеко не предел. Вот куда всё растёт сейчас:
Повышение эффективности обработки данных после обучения.
Новые архитектуры байтового уровня BLT, которые обходятся без токенизаторов и масштабируются лучше BPE
Гибкие эксперименты с MoE.
Слушаешь доклад и понимаешь направление, в которое сейчас движется индустрия.
Из отдельных работ мне запомнились несколько. В статье Human-LLM Coevolution авторы показали, как ChatGPT незаметно меняет язык научных текстов: даже если статьи пишут люди, на словоупотребление всё равно может оказывать влияние общение с нейросетью. Epic Games на индустриальном треке рассказывали про NPC в Fortnite, которые теперь могут поддерживать разговор с игроками и даже отвечать в стиле Дарта Вейдера.
А исследователи из другой группы представили метод оценки влияния фидбека человека: оказалось, что правильные ответы усиливают LLM, а ошибочные могут заметно ухудшать результаты. И их подход помогает такие ошибки отслеживать.
Секретики. Каждый вечер проходили мероприятия, где можно было встретить коллег уже не у постера, а за бокалом вина. А в один из дней организаторы устроили настоящий бал. В Вене, конечно же, был венский вальс. Так что мой ACL прошёл именно так: днём — насыщенная деловая программа про LLM и AGI, конспекты, нетворкинг, а вечером — встречи с коллегами или изучение Вены.
Привет! Я Алексей Рак, в Яндексе руковожу службой голосового ввода. Мы занимаемся работой над теми технологиями, где на вход системе даётся звук, а на выходе происходит либо распознавание речи, либо голосовая активация, шумоподавление, повышение качества аудио, а теперь ещё и интеграция звуковых модальностей в LLM.
В этом году я ездил на ICASSP — крупнейшую конференцию по акустике и речи. Для меня это не первая поездка, но каждая такая история даёт новый угол зрения на индустрию. Интересно, как конференции меняются: лет пять назад в программах было больше «классики» — например, много говорили про методы обработки сигналов и речи. Позже стали больше говорить о нейросетевых методах, а сейчас можно наблюдать огромное количество статей про LLM: чуть ли не каждая вторая работа так или иначе касалась их. Также можно заметить, как меняется фокус ресерча у крупных компаний. Если раньше Google делал ставку на колонки с Google Assistant, то теперь всё больше внимания уделяет наушникам. Похожие сдвиги видны и у других игроков индустрии.
В другой работе предлагали кастомные keyword spotters — модели, которые можно обучить реагировать на произвольные фразы. Meta (запрещённая организация), которая к тому моменту уже перешла на ASR, объединённый с LLM, и теперь пишет статьи про ускорение таких моделей, тогда только-только принесла на конференцию свои работы о том, как ускорить распознавание речи с помощью LLM. А при удачном стечении обстоятельств с коллегами из Google или Amazon можно было поговорить напрямую — и узнать, как идеи сработали в продакшне и какие у ребят планы. Это приятное чувство — отловить инсайт, который можно попробовать применить у себя.
Люблю конференции ещё и потому, что на них можно узнать, какие идеи пробовать не стоит, — буквально из первых уст, от автора. Иногда они сами говорят, что для моего кейса их решение по каким-то причинам может не подойти.
Нормальная история, когда люди представляются друг другу, кто откуда. И один американец вспомнил про то, что пользовался нашим поиском по картинкам, кто-то ещё — про CatBoost.
Секретики. Конференция шла с утра до вечера, а вечером оставалось немного времени на общение вне мероприятий. Раньше, в Греции, например, это были танцы и музыка, в Британии — по большей части бары. В Индии на ICASSP добавили больше культурных активностей. И много музыки — это неудивительно.
Я Ермек Капушев, работаю инженером в команде претрейна YandexGPT. Мы готовим данные для обучения больших языковых моделей — это самая трудоёмкая часть, когда модель получает базовые знания. Раньше я был исследователем: писал статьи, ездил на конференции, но потом решил перейти в индустрию. Хотелось делать что-то, что быстро доходит до пользователей и приносит практическую пользу.
ICML — одна из самых престижных конференций в области машинного обучения. Она охватывает почти всё: от языковых моделей и глубоких сетей до reinforcement learning, оптимизации и компьютерного зрения. Есть и прикладные секции. Всего в этом году приняли больше 3 тысяч статей, так что программа выглядела бесконечной. Два здания конвеншн-центра, тысячи постеров, параллельные секции.
Я специально искал работы про данные для обучения LLM: именно с этим связаны наши задачи. Таких статей оказалось немного: у академических исследователей редко есть ресурсы на полноценные претрейны, поэтому они чаще работают с небольшими датасетами или делают дообучение RL (reinforcement learning) и любые другие небольшие дообучения. Но даже среди этих работ были идеи про фильтрацию, отбор и генерацию данных, которые можно попробовать у нас. Домой я возвращался с планом экспериментов.
Секретики. Как-то вечером я попал на неформальную встречу института MBZUAI из Абу-Даби и там разговорился с профессором из Нью-Йорка «за жизнь». Обсуждали всё подряд — от карьерных треков PhD до славянских языков и Казахстана, где я родился. Хотя многие из присутствующих на таких конференциях буквально живут своей работой и могут продолжать говорить о машинном обучении даже после насыщенного дня.
Но был один парень, который честно признался: «Всё, я устал, сегодня ни слова больше про ML». Так тоже бывает.
Я Влад Офицеров, работаю в международном поиске Яндекса, где отвечаю за развитие нейронных технологий. На ICLR в Сингапур я поехал без доклада, как и многие ребята со всего Яндекса.
ICLR — это огромный конгресс, где можно послушать обо всём: от фундаментальных исследований до прикладных решений для e-commerce. В этом году лейтмотив был предсказуемый: LLM. Говорили об агентах, безопасности, RAG, мультимодальных моделях.
Секретики. Неформальных воспоминаний набралось несколько. Например, одна из ассоциаций с ICLR у меня — очереди. В первый день была бесконечная очередь участников на регистрацию и приветственный ужин, а во второй — очередь из... собак. В соседнем зале проходила выставка, и люди с бейджами ICLR пересекались с хозяевами и их питомцами.
Были и другие забавные моменты. Стенды компаний часто ассоциируются у участников с рекрутерами и мерчем. Но в какой-то момент на стенде Meta* появился сам Ян Лекун — это самый известный учёный компании. Толпа моментально окружила его, все старались сфоткаться. Я просто стоял рядом и наблюдал — но в итоге моя коленка попала на общий кадр, который разошёлся в LinkedIn. Теперь шутим в команде, что это почти селфи с Лекуном.
Конечно, есть и личные открытия. На вечеринке для русскоязычных участников, которую Яндекс традиционно помогает организовать, я встретил старого знакомого из Воронежа. Мы не виделись лет десять, хотя оба живём в Москве, и вот впервые пересеклись именно в Сингапуре. Такие встречи хорошо передают суть конференций: всё же они не только про статьи, но и про живое комьюнити.
Меня зовут Мария Голицына, я руковожу службой алгоритмов нового поколения в автономном транспорте Яндекса. Мы ищем решения, которые помогут сделать настоящий breakthrough в беспилотных технологиях.
ICRA — самая высокоцитируемая конференция по робототехнике в мире. Та самая, из категории А*. Первая прошла в 1984 году, тоже в Атланте, а с 1995-го конференция стала международной. В этом году подали 4 250 работ, а комитет принял 1 606. Прослушать все было невозможно: 23 секции шли параллельно, каждый доклад длился пять минут, без возможности задать вопрос.
Конференция длилась пять дней. К концу немного устаёшь, но это того стоит. День начинался в половине девятого, заканчивался к шести, после чего оставалось время перевести дух, поужинать, обсудить увиденное. Я давно хотела побывать на мероприятии такого масштаба — и ожидания оправдались.
Машин не было, но представители компаний из сферы автономного транспорта присутствовали, и с ними я общалась в первую очередь. Темы конференции охватывали всё — от диффузионных моделей и синтетических данных до применения LLM в робототехнике. Число таких докладов растёт год от года. При этом «классика» вроде планирования движения и локализации по-прежнему остаётся базой.
Из интересного — я встретила автора статьи, которую мы недавно разбирали в команде. Оказалось, он русскоговорящий. Мы до сих пор на связи: после знакомства мы писали ему про возможность доработки его технологии, которую применяем у себя, на что он откликнулся — и этим здорово нам помог.
Отдельно запомнилось мероприятие от компании Zoox, которая делает автономные капсулы без водителя. Встреча проходила на крыше, с коктейлями и неформальным общением. Было полезно услышать, как устроены процессы у коллег.
Секретики. В четверг была финальная вечеринка, которая больше напоминала фестиваль. Перекрыли прилегающую улицу, объединили несколько ресторанов, поставили сцену с кавер-группой, рядом танцоры и люди на ходулях. Полный цирк — в хорошем смысле. Обычно на таких конференциях люди с ноутбуками и бейджами, но здесь все действительно расслабились.
И, пожалуй, самое необычное воспоминание — про соседство с косплей-фестивалем. Представьте: 1 600 докладов, гигантская выставка и один общий вход.
Вся эта толпа рассредотачивается по залам — кто к роботам, кто на аниме. Контраст невероятный, но такие моменты в том числе сделали впечатление от поездки незабываемым.
*Компания Meta признана в России экстремистской организацией.