Каталог · Искусственный Интеллект · Генеративный ИИ

Развертывание локальных LLM: vLLM, квантование и инференс

Name: Развертывание локальных LLM: vLLM, квантование и инференс
Price: 300 MDL
Availability: InStock

Узнайте, как эффективно развертывать большие языковые модели, применять методы квантования для снижения требований к оборудованию и обслуживать модели в производственных средах.

⏱ 1 ч 28 мин 📚 12 уроков 🎧 Аудиоверсия

О курсе

Запуск больших языковых моделей (LLM) локально или в продакшене может показаться сложной задачей из-за огромных требований к оборудованию и сложных конфигураций. По мере развития AI умение эффективно хостить собственные модели становится важным навыком для разработчиков и операционных команд.

Этот курс разбирает процесс развертывания и оптимизации LLM, превращая вас из новичка в специалиста, способного эффективно обслуживать высокопроизводительные модели AI. Вы изучите, как уменьшить объем занимаемой памяти и максимизировать скорость инференса с помощью современных методов, что позволит запускать мощные модели даже при ограниченных вычислительных ресурсах.

Чему вы научитесь:
• Поймете основополагающие концепции архитектуры LLM, инференса и управления памятью.
• Научитесь рассчитывать требования к оборудованию и оценивать потребности в VRAM GPU для моделей различных размеров.
• Будете применять современные методы квантования, такие как GGUF, AWQ и GPTQ, для оптимизации весов моделей.
• Научитесь настраивать и развертывать модели с использованием vLLM для высокопроизводительного инференса с низкой задержкой.
• Сможете создавать стандартные эндпоинты REST API для бесшовной интеграции локальных моделей в ваши приложения.
• Попрактикуетесь в контейнеризации развертываний LLM с использованием Docker для создания согласованных и масштабируемых сред.

Путешествие начинается с основной терминологии AI и основ аппаратного обеспечения, после чего вы перейдете к практическим письменным упражнениям, посвященным квантованию и развертыванию. Вы будете шаг за шагом изучать скрипты конфигурации и паттерны развертывания, используемые в современном MLOps.

Это текстовое руководство, предназначенное для разработчиков программного обеспечения, начинающих DevOps-инженеров и технических энтузиастов без предварительного опыта в машинном обучении, требует лишь базового понимания концепций программирования.

Начните чтение сегодня, чтобы развить свои навыки в современном развертывании AI и оптимизации инференса.

Что вы получите

📜 Сертификат об окончании
Добавьте в профиль LinkedIn
🎧 Аудиоверсия включена
Учитесь в дороге — экран не нужен
♾️ Пожизненный доступ
Возвращайтесь в любое время, без срока
📱 Телефон или компьютер
Работает везде и на любом устройстве
💸 Возврат в течение 14 дней
Без вопросов
⚡ Кратко и по делу
1 ч 28 мин практического материала

Отзывы (1)

Андрій Бондаренко UA Подтверждённый учащийся

★ 4 · 2025-05-17T09:44:23+00:00

Брался за курс, чтобы разобраться с локальным запуском моделей без облака, и в целом цель достигнута. Тема квантизации объяснена понятно: стало ясно, как ужать модель и не угробить качество, чтобы влезть в скромную видеокарту. Развёртывание через vLLM показали по шагам, я поднял свой инференс-сервер и проверил под нагрузкой. Единственное, хотелось бы чуть глубже про мониторинг в продакшене, этот раздел показался коротковатым. Но в остальном материал плотный и применимый сразу. Для тех, кто хочет держать LLM у себя, это отличная отправная точка.

Студенты также прошли

🔥 Востребован

Часто спрашивают

Что нужно для прохождения курса? +

Только смартфон или компьютер с доступом в интернет. Никаких установок и оборудования.

Как оплатить? +

Банковской картой через Stripe. Данные карты обрабатывает Stripe — мы их не храним.

Можно ли вернуть деньги? +

Да — полный возврат в течение 14 дней, без вопросов.

Как долго будут доступны материалы? +

Навсегда. После покупки курс остаётся с вами — возвращайтесь в любое время.

Получу ли я сертификат? +

Да. По окончании выдаётся сертификат, который можно добавить в профиль LinkedIn.

Подходит для специалистов в

IT Дизайн Финансы Маркетинг Медицина Образование HoReCa Производство

300 L ~~None~~ None

⏱ До конца акции 72:00:00

Купить сейчас →

✓ Сертификат об окончании
✓ Аудиоверсия включена
✓ Пожизненный доступ
✓ Возврат денег в течение 14 дней
✓ Телефон или компьютер

Безопасная оплата через Stripe

Развертывание локальных LLM: vLLM, квантование и инференс

О курсе

Что вы получите

Отзывы (1)

Написать отзыв

Студенты также прошли

Генеративный ИИ для разработки мобильных приложений

Практические инструменты ИИ для преподавателей

Основы генеративного ИИ: основные понятия и подсказки

Разработка пользовательских приложений LLM с RAG и агентами

Часто спрашивают