Giới thiệu về Multimodal AI Agents và Sử dụng Tool
Học cách xây dựng các AI agents thông minh có khả năng phân tích tài liệu, diễn giải hình ảnh và tương tác với các công cụ bên ngoài từ con số không.
Về khóa học này
Bước tiến hóa tiếp theo của trí tuệ nhân tạo không chỉ dừng lại ở văn bản. Các multimodal agents hiện nay có thể phân tích hình ảnh, đọc các tài liệu phức tạp và thực hiện hành động bằng cách sử dụng các công cụ bên ngoài. Trong khóa học viết nền tảng này, bạn sẽ học cách thiết kế và xây dựng các AI agents xử lý dữ liệu hình ảnh và văn bản đồng thời. Bạn sẽ bắt đầu với các khái niệm cốt lõi về agentic AI và các mô hình vision-language models, sau đó tiến tới các chiến lược triển khai thực tế để trích xuất tài liệu, phân tích ảnh chụp màn hình và gọi công cụ (tool calling) linh hoạt.
Những gì bạn sẽ học:
- Hiểu các thuật ngữ nền tảng của multimodal AI và quy trình làm việc agentic.
- Xử lý và trích xuất dữ liệu có cấu trúc từ hình ảnh, ảnh chụp màn hình và các tài liệu phức tạp.
- Triển khai các mẫu tool calling hiện đại để cho phép các agents của bạn tương tác với các hệ thống bên ngoài.
- Áp dụng các kỹ thuật prompt engineering được thiết kế riêng cho các tác vụ vision-language.
- Khám phá các khái niệm Retrieval-Augmented Generation (RAG) cơ bản để xử lý dữ liệu multimodal.
- Thiết kế các kiến trúc agent mạnh mẽ giúp quản lý lập luận đa bước một cách mượt mà.
Khóa học bắt đầu bằng việc thiết lập các định nghĩa thiết yếu và kiến trúc cơ bản của các hệ thống multimodal. Từ đó, bạn sẽ đọc qua các hướng dẫn viết từng bước và các đoạn mã (code snippets) để xây dựng các tài liệu và vision-processing agents của riêng mình. Khóa học này được thiết kế cho người mới bắt đầu và các nhà phát triển mới làm quen với AI agents; không yêu cầu kinh nghiệm trước đó về machine learning. Hãy bắt đầu xây dựng thế hệ AI agents thông minh, hướng tới hành động tiếp theo ngay hôm nay.
Bạn sẽ nhận được
-
📜
Chứng chỉ hoàn thành
Thêm vào hồ sơ LinkedIn -
🎧
Bao gồm phiên bản âm thanh
Học mọi lúc mọi nơi — không cần màn hình -
♾️
Truy cập trọn đời
Quay lại bất cứ lúc nào, không hết hạn -
📱
Điện thoại hoặc máy tính
Hoạt động mọi nơi, mọi thiết bị -
💸
Hoàn tiền 14 ngày
Không cần lý do -
⚡
Ngắn gọn, đi vào trọng tâm
1 giờ 15 phút nội dung thực hành
Đánh giá
Chưa có đánh giá — hãy là người đầu tiên chia sẻ.
Học viên cũng học
🎓 Có chứng chỉ
Công cụ AI thực tiễn cho Giáo dục
Chứng chỉ
Thực hành
฿539
→
⚡ Tốt nhất để bắt đầu
Kiến thức cơ bản về Generative AI: Các khái niệm cốt lõi và Kỹ thuật Prompting
Chứng chỉ
Thực hành
฿539
→
💼 Sẵn sàng cho công việc
Chạy AI cục bộ: Hướng dẫn LM Studio và Ollama
Chứng chỉ
Thực hành
฿539
→
🎓 Có chứng chỉ
Xây dựng các ứng dụng hỗ trợ trí tuệ nhân tạo bằng API của OpenAI.
Chứng chỉ
Thực hành
฿539
→
Câu hỏi thường gặp
Tôi cần gì để học khóa này? +
Chỉ cần điện thoại hoặc máy tính có kết nối internet. Không cần cài đặt hay thiết bị đặc biệt.
Tôi thanh toán bằng cách nào? +
Bằng thẻ qua Stripe. Chúng tôi không lưu thông tin thẻ — Stripe xử lý an toàn.
Tôi có thể được hoàn tiền không? +
Có — hoàn tiền đầy đủ trong 14 ngày, không cần lý do.
Tôi sẽ có quyền truy cập trong bao lâu? +
Mãi mãi. Sau khi mua, khóa học là của bạn để xem lại bất cứ lúc nào.
Tôi có nhận được chứng chỉ không? +
Có. Sau khi hoàn thành, bạn sẽ nhận được chứng chỉ và có thể thêm vào hồ sơ LinkedIn.
Dành cho người học trong
Công nghệ
Thiết kế
Tài chính
Marketing
Y tế
Giáo dục
Khách sạn-Dịch vụ
Sản xuất