บทนำสู่ Multimodal AI Agents และการใช้งาน Tool Use
เรียนรู้วิธีสร้าง AI agents ที่ชาญฉลาดซึ่งสามารถวิเคราะห์เอกสาร แปลความหมายรูปภาพ และโต้ตอบกับเครื่องมือภายนอกได้ตั้งแต่เริ่มต้น
เกี่ยวกับคอร์สนี้
วิวัฒนาการขั้นต่อไปของปัญญาประดิษฐ์นั้นก้าวไกลไปกว่าข้อความ ปัจจุบัน Multimodal agents สามารถวิเคราะห์รูปภาพ อ่านเอกสารที่ซับซ้อน และดำเนินการโดยใช้เครื่องมือภายนอกได้ ในหลักสูตรการเขียนขั้นพื้นฐานนี้ คุณจะได้เรียนรู้วิธีออกแบบและสร้าง AI agents ที่ประมวลผลข้อมูลภาพและข้อความไปพร้อมๆ กัน คุณจะเริ่มต้นด้วยแนวคิดหลักของ agentic AI และ vision-language models จากนั้นจึงก้าวไปสู่กลยุทธ์การใช้งานจริงสำหรับการดึงข้อมูลเอกสาร การวิเคราะห์ screenshot และการเรียกใช้ tool calling แบบไดนามิก
สิ่งที่คุณจะได้เรียนรู้:
- เข้าใจคำศัพท์พื้นฐานของ multimodal AI และ agentic workflows
- ประมวลผลและดึงข้อมูลที่มีโครงสร้างจากรูปภาพ screenshot และเอกสารที่ซับซ้อน
- ปรับใช้รูปแบบ tool calling ที่ทันสมัยเพื่อให้ agents ของคุณสามารถโต้ตอบกับระบบภายนอกได้
- ประยุกต์ใช้เทคนิค prompt engineering ที่ออกแบบมาโดยเฉพาะสำหรับงาน vision-language
- สำรวจแนวคิดพื้นฐานของ Retrieval-Augmented Generation (RAG) สำหรับการจัดการข้อมูล multimodal
- ออกแบบโครงสร้าง agent ที่แข็งแกร่งซึ่งจัดการการให้เหตุผลแบบหลายขั้นตอนได้อย่างราบรื่น
หลักสูตรนี้เริ่มต้นด้วยการกำหนดนิยามที่จำเป็นและโครงสร้างพื้นฐานของระบบ multimodal จากนั้น คุณจะได้อ่านบทช่วยสอนแบบเขียนทีละขั้นตอนและ code snippets เพื่อสร้างเอกสารและ vision-processing agents ของคุณเอง หลักสูตรนี้ออกแบบมาสำหรับผู้เริ่มต้นและนักพัฒนาที่ยังใหม่กับ AI agents โดยไม่จำเป็นต้องมีประสบการณ์ด้าน machine learning มาก่อน เริ่มสร้าง AI agents ที่ชาญฉลาดและเน้นการลงมือทำในยุคถัดไปได้ตั้งแต่วันนี้
สิ่งที่คุณจะได้รับ
-
📜
ใบประกาศนียบัตร
เพิ่มในโปรไฟล์ LinkedIn ของคุณ -
🎧
รวมเวอร์ชันเสียง
เรียนได้ทุกที่ ไม่ต้องดูจอ -
♾️
เข้าถึงตลอดชีพ
กลับมาเรียนได้ตลอด ไม่มีหมดอายุ -
📱
โทรศัพท์หรือคอมพิวเตอร์
ใช้งานได้ทุกที่ ทุกอุปกรณ์ -
💸
คืนเงิน 14 วัน
ไม่ต้องอธิบาย -
⚡
กระชับและตรงประเด็น
1 ชม. 15 นาที เนื้อหาเชิงปฏิบัติ
รีวิว
ยังไม่มีรีวิว — เป็นคนแรกที่แชร์ประสบการณ์
ผู้เรียนคนอื่นเรียน
🎓 มีใบรับรอง
เครื่องมือ AI เชิงปฏิบัติสำหรับนักการศึกษา
ใบรับรอง
ลงมือทำ
฿539
→
⚡ เหมาะสำหรับผู้เริ่มต้น
พื้นฐาน Generative AI: แนวคิดหลักและการสร้าง Prompt
ใบรับรอง
ลงมือทำ
฿539
→
💼 พร้อมสำหรับงาน
การรัน AI บนเครื่อง: คู่มือ LM Studio และ Ollama
ใบรับรอง
ลงมือทำ
฿539
→
🎓 มีใบรับรอง
สร้างโปรแกรมที่ใช้พลังงานจากปัญญาประดิษฐ์ด้วย OpenAI API
ใบรับรอง
ลงมือทำ
฿539
→
คำถามที่พบบ่อย
ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +
แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ
ฉันชำระเงินอย่างไร? +
ผ่านบัตรด้วย Stripe เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย
ฉันขอคืนเงินได้ไหม? +
ใช่ — คืนเงินเต็มจำนวนใน 14 วัน ไม่ต้องอธิบาย
ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +
ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด
ฉันจะได้ใบประกาศนียบัตรไหม? +
ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้
ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี
ดีไซน์
การเงิน
การตลาด
สาธารณสุข
การศึกษา
ธุรกิจการบริการ
อุตสาหกรรม