Katalog · Künstliche Intelligenz · Generative KI

Bereitstellung lokaler LLMs: vLLM, Quantization und Inference

Name: Bereitstellung lokaler LLMs: vLLM, Quantization und Inference
Price: 12 CHF
Availability: InStock

Lernen Sie, wie Sie Large Language Models effizient bereitstellen, Quantization-Techniken anwenden, um Hardwareanforderungen zu reduzieren, und Modelle in Produktionsumgebungen bereitstellen.

⏱ 1 Std. 28 Min. 📚 12 Lektionen 🎧 Audioversion

Über diesen Kurs

Das Ausführen von Large Language Models (LLMs) lokal oder in der Produktion kann aufgrund massiver Hardwareanforderungen und komplexer Konfigurationen entmutigend wirken. Da sich AI ständig weiterentwickelt, wird die Fähigkeit, eigene Modelle effizient zu hosten, zu einer unverzichtbaren Fähigkeit für Entwickler und Operations-Teams.

Dieser Kurs schlüsselt den Prozess der Bereitstellung und Optimierung von LLMs auf und verwandelt Sie von einem Anfänger in jemanden, der in der Lage ist, leistungsstarke AI-Modelle effizient bereitzustellen. Sie werden untersuchen, wie Sie den Speicherbedarf reduzieren und die Inference-Geschwindigkeit mit modernen Techniken maximieren können, um sicherzustellen, dass Sie leistungsstarke Modelle auch mit begrenzten Rechenressourcen ausführen können.

Was Sie lernen werden:
• Verstehen Sie die grundlegenden Konzepte der LLM-Architektur, Inference und des Speichermanagements.
• Berechnen Sie Hardwareanforderungen und schätzen Sie den GPU VRAM-Bedarf für verschiedene Modellgrößen.
• Wenden Sie moderne Quantization-Methoden wie GGUF, AWQ und GPTQ an, um Modellgewichte zu optimieren.
• Konfigurieren und deployen Sie Modelle mit vLLM für High-Throughput- und Low-Latency-Inference.
• Erstellen Sie Standard-REST API-Endpunkte, um lokale Modelle nahtlos in Ihre Anwendungen zu integrieren.
• Üben Sie die Containerisierung Ihrer LLM-Deployments mit Docker für konsistente, skalierbare Umgebungen.

Die Reise beginnt mit grundlegender AI-Terminologie und Hardware-Basics, bevor sie zu praktischen schriftlichen Übungen übergeht, die sich auf Quantization und Deployment konzentrieren. Sie werden Schritt für Schritt durch Konfigurationsskripte und Deployment-Muster geführt, die in modernem MLOps verwendet werden.

Dieser textbasierte Leitfaden wurde für Softwareentwickler, angehende DevOps-Ingenieure und Tech-Enthusiasten ohne vorherige Machine Learning-Erfahrung entwickelt und erfordert lediglich ein grundlegendes Verständnis von Programmierkonzepten.

Beginnen Sie noch heute mit dem Lesen, um Ihre Fähigkeiten in modernem AI-Deployment und Inference-Optimierung auszubauen.

Was du erhältst

📜 Abschlusszertifikat
Füge es deinem LinkedIn-Profil hinzu
🎧 Audioversion enthalten
Lerne unterwegs — kein Bildschirm nötig
♾️ Lebenslanger Zugang
Komme jederzeit zurück, kein Ablauf
📱 Smartphone oder Computer
Auf jedem Gerät, überall
💸 14 Tage Rückgaberecht
Ohne Wenn und Aber
⚡ Kurz und fokussiert
1 Std. 28 Min. praktische Inhalte

Bewertungen (1)

Андрій Бондаренко UA Verifizierter Lernender

★ 4 · 2025-05-17T09:44:23+00:00

Брался за курс, чтобы разобраться с локальным запуском моделей без облака, и в целом цель достигнута. Тема квантизации объяснена понятно: стало ясно, как ужать модель и не угробить качество, чтобы влезть в скромную видеокарту. Развёртывание через vLLM показали по шагам, я поднял свой инференс-сервер и проверил под нагрузкой. Единственное, хотелось бы чуть глубже про мониторинг в продакшене, этот раздел показался коротковатым. Но в остальном материал плотный и применимый сразу. Для тех, кто хочет держать LLM у себя, это отличная отправная точка.

Andere belegten auch

🔥 Gefragt

Häufige Fragen

Was brauche ich, um diesen Kurs zu belegen? +

Nur Telefon oder Computer mit Internet. Keine Installation, keine spezielle Hardware.

Wie kann ich bezahlen? +

Per Karte über Stripe. Wir speichern keine Kartendaten — Stripe übernimmt das sicher.

Kann ich eine Rückerstattung erhalten? +

Ja — volle Rückerstattung innerhalb von 14 Tagen, ohne Wenn und Aber.

Wie lange habe ich Zugang? +

Für immer. Nach dem Kauf kannst du jederzeit zum Kurs zurückkehren.

Erhalte ich ein Zertifikat? +

Ja. Nach Abschluss erhältst du ein Zertifikat, das du in dein LinkedIn-Profil aufnehmen kannst.

Entwickelt für Lernende in

Tech Design Finanzen Marketing Gesundheit Bildung Gastgewerbe Produktion

Bereitstellung lokaler LLMs: vLLM, Quantization und Inference

Über diesen Kurs

Was du erhältst

Bewertungen (1)

Bewertung schreiben

Andere belegten auch

Generative KI für die Entwicklung mobiler Apps

Praktische KI-Tools für Lehrkräfte

Generative KI-Grundlagen: Kernkonzepte und Prompting

Entwicklung von benutzerdefinierten LLM-Anwendungen mit RAG und Agenten

Häufige Fragen