Ученые из «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA разработали прорывной метод сжатия больших языковых моделей

11.04.2025, 15:10, Разное
  Подписаться на Telegram-канал
  Подписаться в Google News
  Поддержать в Patreon

Лаборатория исследований ИИ Yandex Research вместе с коллегами из Национального исследовательского университета «Высшая школа экономики», Массачусетского технологического института, Научно-технологического университета имени короля Абдаллы в Саудовской Аравии и Австрийского института науки и технологий создала новый метод сжатия больших языковых моделей (LLM), чтобы работать с ними на привычных устройствах — смартфонах и ноутбуках. Причем за считаные минуты и с сохранением качества. Это открывает доступ к передовым ИИ-технологиям для небольших компаний, стартапов и независимых разработчиков, которые не могут позволить себе дорогие серверы и мощные графические процессоры.

Основная сложность в работе с LLM — их высокая требовательность к аппаратным мощностям. Даже открытые модели, такие как китайская DeepSeek-R1, не помещаются на стандартных серверах для машинного обучения и ИИ. Хотя модели в открытом доступе, их применение было ограничено.

Новый метод квантизации, получивший название HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS), решает вышеописанную проблему: позволяет сжимать модели с сохранением качества и не требуя дополнительных данных. Теперь квантизацию, то есть операцию по сжатию модели, можно проводить на мобильном устройстве за минуты. Раньше на это уходило от нескольких часов до недель.

HIGGS протестировали на популярных языковых моделях Llama 3 и Qwen2.5. Согласно результатам, новый метод квантизации превзошел своих предшественников — NF4 и HQQ — по соотношению качества к размеру модели.

Исследование, в котором рассказано о достижении «Яндекса», НИУ ВШЭ, MIT, KAUST и ISTA, представят на конференции The North American Chapter of the Association for Computational Linguistics. Она пройдет с 29 апреля по 4 мая 2025 года в Альбукерке (США).

Статья уже опубликована на сервере препринтов arXiv.org, а сам метод HIGGS доступен на Hugging Face и GitHub.




Смотреть комментарииКомментариев нет


Добавить комментарий

Имя обязательно

Нажимая на кнопку "Отправить", я соглашаюсь c политикой обработки персональных данных. Комментарий c активными интернет-ссылками (http / www) автоматически помечается как spam

ЧИТАЙТЕ ТАКЖЕ

16.06 / В Иране осудили Сталина за «руководящую и направляющую роль» в создании государства Израиль

16.06 / Саломе Зурабишвили обвинила Михаила Саакашвили в подготовке государственного переворота

15.06 / Маск объявил, что передал в Иран две тысячи терминалов Starlink

15.06 / «5-я статья авансом»: в НАТО заявили о готовности немедленно защитить Израиль от неспровоцированной агрессии Ирана

15.06 / Фонд Сороса выдвинул Нетаньяху на Нобелевскую премию мира

15.06 / Учёные не в силах объяснить, почему гранёный стакан Ельцина по ночам сам наполняется водкой

15.06 / Марсоход Perseverance сделал снимок, на котором отчётливо виден герб России

15.06 / Мнение: Немецкая армия предпочитает коренных немцев

14.06 / Германия объявила о немедленной передаче Израилю сотен ракет TAURUS

14.06 / Грета Тунберг организовала в Стокгольме акцию «Вперёд, Иран!»

Политика конфиденциальности - GDPR

Карта сайта →

По вопросам информационного сотрудничества, размещения рекламы и публикации объявлений пишите на адрес: rybinskonline@gmail.com

Поддержать проект:

PayPal - rybinskonline@gmail.com; Payeer: P1124519143; WebMoney – T323003638440, X100503068090, Z399334682366

18+ © 2002-2025 РЫБИНСКonLine: Все, что Вы хотели знать...

Яндекс.Метрика