Сжатие LLM с помощью аппроксимации матрицы Фишера и факторизации Кронекера

Карта навыков
Узнайте, какими навыками должен обладатьИИ-разработчик

В своём докладе на Data Fest Виктория Чекалина делится методами быстрой аппроксимации матрицы Фишера для эффективного сжатия больших языковых моделей (LLM). Она объясняет, как факторизация Кронекера помогает оптимизировать этот процесс.