Брался за курс, чтобы разобраться с локальным запуском моделей без облака, и в целом цель достигнута. Тема квантизации объяснена понятно: стало ясно, как ужать модель и не угробить качество, чтобы влезть в скромную видеокарту. Развёртывание через vLLM показали по шагам, я поднял свой инференс-сервер и проверил под нагрузкой. Единственное, хотелось бы чуть глубже про мониторинг в продакшене, этот раздел показался коротковатым. Но в остальном материал плотный и применимый сразу. Для тех, кто хочет держать LLM у себя, это отличная отправная точка.
Bereitstellung lokaler LLMs: vLLM, Quantization und Inference
Lernen Sie, wie Sie Large Language Models effizient bereitstellen, Quantization-Techniken anwenden, um Hardwareanforderungen zu reduzieren, und Modelle in Produktionsumgebungen bereitstellen.
Über diesen Kurs
Das Ausführen von Large Language Models (LLMs) lokal oder in der Produktion kann aufgrund massiver Hardwareanforderungen und komplexer Konfigurationen entmutigend wirken. Da sich AI ständig weiterentwickelt, wird die Fähigkeit, eigene Modelle effizient zu hosten, zu einer unverzichtbaren Fähigkeit für Entwickler und Operations-Teams.
Dieser Kurs schlüsselt den Prozess der Bereitstellung und Optimierung von LLMs auf und verwandelt Sie von einem Anfänger in jemanden, der in der Lage ist, leistungsstarke AI-Modelle effizient bereitzustellen. Sie werden untersuchen, wie Sie den Speicherbedarf reduzieren und die Inference-Geschwindigkeit mit modernen Techniken maximieren können, um sicherzustellen, dass Sie leistungsstarke Modelle auch mit begrenzten Rechenressourcen ausführen können.
Was Sie lernen werden:
• Verstehen Sie die grundlegenden Konzepte der LLM-Architektur, Inference und des Speichermanagements.
• Berechnen Sie Hardwareanforderungen und schätzen Sie den GPU VRAM-Bedarf für verschiedene Modellgrößen.
• Wenden Sie moderne Quantization-Methoden wie GGUF, AWQ und GPTQ an, um Modellgewichte zu optimieren.
• Konfigurieren und deployen Sie Modelle mit vLLM für High-Throughput- und Low-Latency-Inference.
• Erstellen Sie Standard-REST API-Endpunkte, um lokale Modelle nahtlos in Ihre Anwendungen zu integrieren.
• Üben Sie die Containerisierung Ihrer LLM-Deployments mit Docker für konsistente, skalierbare Umgebungen.
Die Reise beginnt mit grundlegender AI-Terminologie und Hardware-Basics, bevor sie zu praktischen schriftlichen Übungen übergeht, die sich auf Quantization und Deployment konzentrieren. Sie werden Schritt für Schritt durch Konfigurationsskripte und Deployment-Muster geführt, die in modernem MLOps verwendet werden.
Dieser textbasierte Leitfaden wurde für Softwareentwickler, angehende DevOps-Ingenieure und Tech-Enthusiasten ohne vorherige Machine Learning-Erfahrung entwickelt und erfordert lediglich ein grundlegendes Verständnis von Programmierkonzepten.
Beginnen Sie noch heute mit dem Lesen, um Ihre Fähigkeiten in modernem AI-Deployment und Inference-Optimierung auszubauen.
Was du erhältst
-
📜
Abschlusszertifikat
Füge es deinem LinkedIn-Profil hinzu -
🎧
Audioversion enthalten
Lerne unterwegs — kein Bildschirm nötig -
♾️
Lebenslanger Zugang
Komme jederzeit zurück, kein Ablauf -
📱
Smartphone oder Computer
Auf jedem Gerät, überall -
💸
14 Tage Rückgaberecht
Ohne Wenn und Aber -
⚡
Kurz und fokussiert
1 Std. 28 Min. praktische Inhalte
Bewertungen (1)
Andere belegten auch
🔥 Gefragt
Generative KI für die Entwicklung mobiler Apps
Zertifikat
Praxis
CHF 12.00
→
🎓 Mit Zertifikat
Praktische KI-Tools für Lehrkräfte
Zertifikat
Praxis
CHF 12.00
→
⚡ Perfekt für den Einstieg
Generative KI-Grundlagen: Kernkonzepte und Prompting
Zertifikat
Praxis
CHF 12.00
→
🎓 Mit Zertifikat
Entwicklung von benutzerdefinierten LLM-Anwendungen mit RAG und Agenten
Zertifikat
Praxis
CHF 12.00
→
Häufige Fragen
Was brauche ich, um diesen Kurs zu belegen? +
Nur Telefon oder Computer mit Internet. Keine Installation, keine spezielle Hardware.
Wie kann ich bezahlen? +
Per Karte über Stripe. Wir speichern keine Kartendaten — Stripe übernimmt das sicher.
Kann ich eine Rückerstattung erhalten? +
Ja — volle Rückerstattung innerhalb von 14 Tagen, ohne Wenn und Aber.
Wie lange habe ich Zugang? +
Für immer. Nach dem Kauf kannst du jederzeit zum Kurs zurückkehren.
Erhalte ich ein Zertifikat? +
Ja. Nach Abschluss erhältst du ein Zertifikat, das du in dein LinkedIn-Profil aufnehmen kannst.
Entwickelt für Lernende in
Tech
Design
Finanzen
Marketing
Gesundheit
Bildung
Gastgewerbe
Produktion