Брался за курс, чтобы разобраться с локальным запуском моделей без облака, и в целом цель достигнута. Тема квантизации объяснена понятно: стало ясно, как ужать модель и не угробить качество, чтобы влезть в скромную видеокарту. Развёртывание через vLLM показали по шагам, я поднял свой инференс-сервер и проверил под нагрузкой. Единственное, хотелось бы чуть глубже про мониторинг в продакшене, этот раздел показался коротковатым. Но в остальном материал плотный и применимый сразу. Для тех, кто хочет держать LLM у себя, это отличная отправная точка.
Развертывание локальных LLM: vLLM, квантование и инференс
Узнайте, как эффективно развертывать большие языковые модели, применять методы квантования для снижения требований к оборудованию и обслуживать модели в производственных средах.
О курсе
Запуск больших языковых моделей (LLM) локально или в продакшене может показаться сложной задачей из-за огромных требований к оборудованию и сложных конфигураций. По мере развития AI умение эффективно хостить собственные модели становится важным навыком для разработчиков и операционных команд.
Этот курс разбирает процесс развертывания и оптимизации LLM, превращая вас из новичка в специалиста, способного эффективно обслуживать высокопроизводительные модели AI. Вы изучите, как уменьшить объем занимаемой памяти и максимизировать скорость инференса с помощью современных методов, что позволит запускать мощные модели даже при ограниченных вычислительных ресурсах.
Чему вы научитесь:
• Поймете основополагающие концепции архитектуры LLM, инференса и управления памятью.
• Научитесь рассчитывать требования к оборудованию и оценивать потребности в VRAM GPU для моделей различных размеров.
• Будете применять современные методы квантования, такие как GGUF, AWQ и GPTQ, для оптимизации весов моделей.
• Научитесь настраивать и развертывать модели с использованием vLLM для высокопроизводительного инференса с низкой задержкой.
• Сможете создавать стандартные эндпоинты REST API для бесшовной интеграции локальных моделей в ваши приложения.
• Попрактикуетесь в контейнеризации развертываний LLM с использованием Docker для создания согласованных и масштабируемых сред.
Путешествие начинается с основной терминологии AI и основ аппаратного обеспечения, после чего вы перейдете к практическим письменным упражнениям, посвященным квантованию и развертыванию. Вы будете шаг за шагом изучать скрипты конфигурации и паттерны развертывания, используемые в современном MLOps.
Это текстовое руководство, предназначенное для разработчиков программного обеспечения, начинающих DevOps-инженеров и технических энтузиастов без предварительного опыта в машинном обучении, требует лишь базового понимания концепций программирования.
Начните чтение сегодня, чтобы развить свои навыки в современном развертывании AI и оптимизации инференса.
Что вы получите
-
📜
Сертификат об окончании
Добавьте в профиль LinkedIn -
🎧
Аудиоверсия включена
Учитесь в дороге — экран не нужен -
♾️
Пожизненный доступ
Возвращайтесь в любое время, без срока -
📱
Телефон или компьютер
Работает везде и на любом устройстве -
💸
Возврат в течение 14 дней
Без вопросов -
⚡
Кратко и по делу
1 ч 28 мин практического материала
Отзывы (1)
Студенты также прошли
🔥 Востребован
Генеративный ИИ для разработки мобильных приложений
Сертификат
Практика
300 L
→
🎓 С сертификатом
Практические инструменты ИИ для преподавателей
Сертификат
Практика
300 L
→
⚡ Лучший для старта
Основы генеративного ИИ: основные понятия и подсказки
Сертификат
Практика
300 L
→
🎓 С сертификатом
Разработка пользовательских приложений LLM с RAG и агентами
Сертификат
Практика
300 L
→
Часто спрашивают
Что нужно для прохождения курса? +
Только смартфон или компьютер с доступом в интернет. Никаких установок и оборудования.
Как оплатить? +
Банковской картой через Stripe. Данные карты обрабатывает Stripe — мы их не храним.
Можно ли вернуть деньги? +
Да — полный возврат в течение 14 дней, без вопросов.
Как долго будут доступны материалы? +
Навсегда. После покупки курс остаётся с вами — возвращайтесь в любое время.
Получу ли я сертификат? +
Да. По окончании выдаётся сертификат, который можно добавить в профиль LinkedIn.
Подходит для специалистов в
IT
Дизайн
Финансы
Маркетинг
Медицина
Образование
HoReCa
Производство