Брался за курс, чтобы разобраться с локальным запуском моделей без облака, и в целом цель достигнута. Тема квантизации объяснена понятно: стало ясно, как ужать модель и не угробить качество, чтобы влезть в скромную видеокарту. Развёртывание через vLLM показали по шагам, я поднял свой инференс-сервер и проверил под нагрузкой. Единственное, хотелось бы чуть глубже про мониторинг в продакшене, этот раздел показался коротковатым. Но в остальном материал плотный и применимый сразу. Для тех, кто хочет держать LLM у себя, это отличная отправная точка.
Menghantar LLM Tempatan: vLLM, Quantization, dan Inference
Pelajari cara menghantar model bahasa besar secara cekap, gunakan teknik quantization untuk mengurangkan keperluan perkakasan, dan hidangkan model dalam persekitaran pengeluaran.
Tentang kursus ini
Menjalankan Large Language Models (LLMs) secara tempatan atau dalam pengeluaran boleh kelihatan menakutkan disebabkan oleh keperluan perkakasan yang besar dan konfigurasi yang kompleks. Memandangkan AI terus berkembang, keupayaan untuk mengehos model anda sendiri secara cekap menjadi kemahiran penting bagi pembangun dan pasukan operasi.
Kursus ini memperincikan proses menghantar dan mengoptimumkan LLMs, mengubah anda daripada seorang pemula kepada seseorang yang mampu menghidangkan model AI berprestasi tinggi secara cekap. Anda akan meneroka cara mengurangkan jejak memori dan memaksimumkan kelajuan inference menggunakan teknik moden, memastikan anda boleh menjalankan model yang berkuasa walaupun dengan sumber pengkomputeran yang terhad.
Apa yang anda akan pelajari:
• Memahami konsep asas seni bina LLM, inference, dan pengurusan memori.
• Mengira keperluan perkakasan dan menganggarkan keperluan GPU VRAM untuk pelbagai saiz model.
• Menggunakan kaedah quantization moden seperti GGUF, AWQ, dan GPTQ untuk mengoptimumkan berat model.
• Mengkonfigurasi dan menghantar model menggunakan vLLM untuk inference throughput tinggi dan kependaman rendah.
• Mencipta titik akhir REST API standard untuk menyepadukan model tempatan ke dalam aplikasi anda dengan lancar.
• Berlatih melakukan containerizing pada penghantaran LLM anda menggunakan Docker untuk persekitaran yang konsisten dan boleh skala.
Perjalanan bermula dengan terminologi AI yang penting dan asas perkakasan sebelum beralih ke latihan bertulis praktikal yang tertumpu pada quantization dan penghantaran. Anda akan maju langkah demi langkah melalui skrip konfigurasi dan corak penghantaran yang digunakan dalam MLOps moden.
Direka untuk pembangun perisian, bakal jurutera DevOps, dan peminat teknologi tanpa pengalaman pembelajaran mesin sebelum ini, panduan berasaskan teks ini hanya memerlukan pemahaman asas tentang konsep pengaturcaraan.
Mula membaca hari ini untuk membina kemahiran anda dalam penghantaran AI moden dan pengoptimuman inference.
Apa yang anda dapat
-
📜
Sijil tamat
Tambah ke profil LinkedIn anda -
🎧
Termasuk versi audio
Belajar sambil bergerak — tanpa skrin -
♾️
Akses seumur hidup
Kembali bila-bila masa, tiada tamat tempoh -
📱
Telefon atau komputer
Berfungsi di mana-mana, mana-mana peranti -
💸
Pulangan 14 hari
Tanpa soalan -
⚡
Pendek dan fokus
1 jam 28 min kandungan praktikal
Ulasan (1)
Pelajar lain juga mengambil
🎓 Dengan sijil
Alat AI Praktikal untuk Pendidik
Sijil
Amali
RM 66
→
⚡ Terbaik untuk permulaan
Asas AI Generatif: Konsep Teras dan Prompting
Sijil
Amali
RM 66
→
💼 Bersedia untuk bekerja
Menjalankan AI Secara Lokal: Panduan LM Studio dan Ollama
Sijil
Amali
RM 66
→
🎓 Dengan sijil
Bina Aplikasi Berkuasa AI dengan API OpenAI
Sijil
Amali
RM 66
→
Soalan lazim
Apa yang saya perlukan untuk mengikuti kursus ini? +
Hanya telefon atau komputer dengan internet. Tiada pemasangan, tiada perkakasan khas.
Bagaimana untuk membayar? +
Dengan kad melalui Stripe. Kami tidak menyimpan butiran kad — Stripe menguruskannya dengan selamat.
Bolehkah saya dapatkan bayaran balik? +
Ya — pulangan penuh dalam 14 hari, tanpa soalan.
Berapa lama saya akan mempunyai akses? +
Selamanya. Setelah membeli, kursus adalah milik anda — boleh lawat semula bila-bila masa.
Adakah saya akan mendapat sijil? +
Ya. Setelah tamat, anda akan menerima sijil yang boleh ditambah ke profil LinkedIn anda.
Direka untuk pelajar dalam
Teknologi
Reka bentuk
Kewangan
Pemasaran
Kesihatan
Pendidikan
Hospitaliti
Pembuatan