Брался за курс, чтобы разобраться с локальным запуском моделей без облака, и в целом цель достигнута. Тема квантизации объяснена понятно: стало ясно, как ужать модель и не угробить качество, чтобы влезть в скромную видеокарту. Развёртывание через vLLM показали по шагам, я поднял свой инференс-сервер и проверил под нагрузкой. Единственное, хотелось бы чуть глубже про мониторинг в продакшене, этот раздел показался коротковатым. Но в остальном материал плотный и применимый сразу. Для тех, кто хочет держать LLM у себя, это отличная отправная точка.
Distribuzione di LLM locali: vLLM, Quantizzazione e Inferenza
Impara come distribuire modelli linguistici di grandi dimensioni in modo efficiente, applicare tecniche di quantizzazione per ridurre i requisiti hardware e servire i modelli in ambienti di produzione.
Informazioni sul corso
Eseguire Large Language Models (LLM) localmente o in produzione può sembrare scoraggiante a causa dei massicci requisiti hardware e delle configurazioni complesse. Mentre l'AI continua a evolversi, la capacità di ospitare i propri modelli in modo efficiente sta diventando una competenza essenziale per sviluppatori e team operativi.
Questo corso analizza il processo di distribuzione e ottimizzazione degli LLM, trasformandoti da principiante a qualcuno in grado di servire modelli AI ad alte prestazioni in modo efficiente. Esplorerai come ridurre l'ingombro di memoria e massimizzare la velocità di inferenza utilizzando tecniche moderne, assicurandoti di poter eseguire modelli potenti anche con risorse computazionali limitate.
Cosa imparerai:
• Comprendere i concetti fondamentali dell'architettura LLM, dell'inferenza e della gestione della memoria.
• Calcolare i requisiti hardware e stimare le necessità di VRAM della GPU per varie dimensioni di modelli.
• Applicare moderni metodi di quantizzazione come GGUF, AWQ e GPTQ per ottimizzare i pesi dei modelli.
• Configurare e distribuire modelli utilizzando vLLM per un'inferenza ad alto throughput e bassa latenza.
• Creare endpoint REST API standard per integrare perfettamente i modelli locali nelle tue applicazioni.
• Praticare la containerizzazione delle tue distribuzioni LLM utilizzando Docker per ambienti coerenti e scalabili.
Il viaggio inizia con la terminologia AI essenziale e le basi dell'hardware prima di passare a esercizi scritti pratici focalizzati sulla quantizzazione e sulla distribuzione. Progredirai passo dopo passo attraverso script di configurazione e pattern di distribuzione utilizzati nel moderno MLOps.
Progettata per sviluppatori software, aspiranti ingegneri DevOps e appassionati di tecnologia senza precedenti esperienze di machine learning, questa guida testuale richiede solo una comprensione di base dei concetti di programmazione.
Inizia a leggere oggi per sviluppare le tue competenze nella moderna distribuzione AI e nell'ottimizzazione dell'inferenza.
Cosa otterrai
-
📜
Certificato di completamento
Aggiungilo al tuo profilo LinkedIn -
🎧
Versione audio inclusa
Impara ovunque, senza schermo -
♾️
Accesso a vita
Torna quando vuoi, senza scadenza -
📱
Telefono o computer
Funziona ovunque, su qualsiasi dispositivo -
💸
Rimborso entro 14 giorni
Senza domande -
⚡
Breve e mirato
1 h 28 min di contenuto pratico
Recensioni (1)
Altri hanno seguito anche
🔥 Richiesto
IA generativa per lo sviluppo di app mobili
Certificato
Pratica
13,99 €
→
🎓 Con certificato
Pratici strumenti di IA per gli educatori
Certificato
Pratica
13,99 €
→
⚡ Perfetto per iniziare
Fondamenti dell'IA generativa: concetti fondamentali e prompting
Certificato
Pratica
13,99 €
→
🎓 Con certificato
Sviluppare applicazioni LLM personalizzate con RAG e agenti
Certificato
Pratica
13,99 €
→
Domande frequenti
Cosa serve per seguire questo corso? +
Basta un telefono o un computer con internet. Niente installazioni, nessun hardware speciale.
Come si paga? +
Con carta via Stripe. Non conserviamo i dati della carta — Stripe li gestisce in sicurezza.
Posso ottenere un rimborso? +
Sì — rimborso completo entro 14 giorni, senza domande.
Per quanto tempo avrò accesso? +
Per sempre. Una volta acquistato, il corso è tuo e puoi rivederlo quando vuoi.
Riceverò un certificato? +
Sì. Al completamento riceverai un certificato da aggiungere al tuo profilo LinkedIn.
Pensato per chi lavora in
Tech
Design
Finanza
Marketing
Sanità
Istruzione
Ospitalità
Produzione