Introducción a los Agentes de AI Multimodales y el Uso de Herramientas
Aprende a construir agentes de AI inteligentes capaces de analizar documentos, interpretar imágenes e interactuar con herramientas externas desde cero.
Sobre este curso
La próxima evolución de la inteligencia artificial va más allá del texto. Los agentes multimodales ahora pueden analizar imágenes, leer documentos complejos y tomar medidas utilizando herramientas externas. En este curso escrito fundamental, aprenderás a diseñar y construir agentes de AI que procesan datos visuales y textuales simultáneamente. Comenzarás con los conceptos básicos de AI agéntica y modelos de visión-lenguaje, para luego avanzar hacia estrategias de implementación práctica para la extracción de documentos, el análisis de capturas de pantalla y el llamado dinámico de herramientas.
Lo que aprenderás:
- Comprender la terminología fundamental de la AI multimodal y los flujos de trabajo agénticos.
- Procesar y extraer datos estructurados de imágenes, capturas de pantalla y documentos complejos.
- Implementar patrones modernos de llamado de herramientas para permitir que tus agentes interactúen con sistemas externos.
- Aplicar técnicas de prompt engineering diseñadas específicamente para tareas de visión-lenguaje.
- Explorar conceptos fundamentales de Retrieval-Augmented Generation (RAG) para el manejo de datos multimodales.
- Diseñar arquitecturas de agentes robustas que gestionen con fluidez el razonamiento de múltiples pasos.
El curso comienza estableciendo definiciones esenciales y la arquitectura básica de los sistemas multimodales. A partir de ahí, leerás tutoriales escritos paso a paso y fragmentos de código para construir tus propios agentes de procesamiento de documentos y visión. Este curso está diseñado para principiantes y desarrolladores nuevos en agentes de AI; no se requiere experiencia previa en machine learning. Comienza a construir hoy mismo la próxima generación de agentes de AI inteligentes y orientados a la acción.
Lo que obtendrás
-
📜
Certificado de finalización
Añádelo a tu perfil de LinkedIn -
🎧
Versión en audio incluida
Aprende en cualquier momento, sin pantalla -
♾️
Acceso de por vida
Vuelve cuando quieras, sin caducidad -
📱
Teléfono o computadora
Funciona en cualquier dispositivo -
💸
Reembolso de 14 días
Sin preguntas -
⚡
Breve y enfocado
1 h 15 min de contenido práctico
Reseñas
Aún no hay reseñas — sé el primero en compartir tu experiencia.
Otros también tomaron
🔥 Muy solicitado
IA generativa para el desarrollo de aplicaciones móviles
Certificado
Práctica
COL$52.000
→
🎓 Con certificado
Herramientas prácticas de IA para educadores
Certificado
Práctica
COL$52.000
→
⚡ Ideal para empezar
Fundamentos de IA generativa: conceptos básicos y alertas
Certificado
Práctica
COL$52.000
→
🎓 Con certificado
Desarrollo de aplicaciones LLM personalizadas con RAG y agentes
Certificado
Práctica
COL$52.000
→
Preguntas frecuentes
¿Qué necesito para tomar este curso? +
Solo un teléfono o computadora con internet. Sin instalaciones ni hardware especial.
¿Cómo pago? +
Con tarjeta a través de Stripe. No almacenamos datos de tarjeta — Stripe los gestiona de forma segura.
¿Puedo obtener un reembolso? +
Sí — reembolso completo en 14 días, sin preguntas.
¿Por cuánto tiempo tendré acceso? +
Para siempre. Una vez comprado, el curso es tuyo para revisarlo cuando quieras.
¿Obtendré un certificado? +
Sí. Al finalizar recibirás un certificado que puedes añadir a tu perfil de LinkedIn.
Diseñado para profesionales en
Tecnología
Diseño
Finanzas
Marketing
Salud
Educación
Hostelería
Manufactura