LLM Scaling Week 2025 | Семинар. Inference challenges

0
Опубликовано 1 апреля 2026, 14:07
Спикер: Роман Горб, руководитель команды ускорения инференса YandexGPT

На семинаре погрузимся в детали:
- Докажем корректность спекулятивного сэмплинга;
- Сравним параллелизмы на практике;
- Разберёмся когда нужен disaggregated prefill/decode.

Ссылка на материал спикера: disk.yandex.ru/d/Ej0AHYQgnTe0T...

Материалы интенсива, которые уже прошли:
Лекция 1: youtube.com/live/JMUWSdSD1Uk?f...
Лекция 2: youtube.com/live/IAeAKcdMtsw?f...
Лекция 3: youtube.com/live/BYiFv5PoMBw?f...
Лекция 3.1: youtube.com/live/-52RgKQENl0?f...
Лекция 4: youtube.com/live/VXI41kyQTPs?f...
Лекция 5: youtube.com/live/AHMJICS2JQ0?f...

Узнать больше о Школе анализа данных можно на сайте: shad.yandex.ru
жизньигрыфильмывесельеавтотехномузыкаспортедаденьгистройкаохотаогородзнанияздоровьекреативдетское