Konuşmayı metne çevirip multimodal LLM'e bağladığım ilk uygulamayı kurmak şaşırtıcı derecede kolaydı, başlangıç için harika.
Construindo Aplicativos de IA Multimodais: Speech-to-Text e LLMs
Um guia amigável para iniciantes para desenvolvedores integrarem reconhecimento de voz, análise de imagem e LLMs multimodais em aplicações modernas usando APIs padrão e padrões de IA atuais.
Sobre este curso
Aplicações modernas estão indo além do simples texto. Ao integrar capacidades de processamento de voz, imagem e vídeo, os desenvolvedores podem criar experiências de usuário altamente interativas e inteligentes. Este curso fornece uma compreensão fundamental de Large Language Models (LLMs) multimodais e tecnologias de speech-to-text. Você aprenderá a escrever código que interage com modelos de IA para transcrever áudio, analisar dados visuais e gerar respostas inteligentes, transformando aplicações padrão em ferramentas poderosas impulsionadas por IA.
O que você aprenderá:
- Compreender os conceitos centrais de IA multimodal e como os modelos processam diferentes tipos de dados;
- Escrever código para integrar APIs de speech-to-text para transcrição de áudio precisa;
- Processar e analisar imagens e frames de vídeo usando capacidades modernas de LLM;
- Aplicar técnicas fundamentais de prompt engineering adaptadas para entradas multimodais;
- Implementar padrões básicos de Retrieval-Augmented Generation (RAG) para mídia rica;
- Construir scripts baseados em texto que orquestram fluxos de trabalho de IA complexos de forma integrada.
O currículo começa com terminologia essencial de IA e conceitos fundamentais antes de passar para a integração prática de API e manipulação de dados. Você progredirá através de lições escritas estruturadas e trechos de código que aumentam sua confiança no tratamento programático de vários tipos de mídia. Este curso foi projetado para desenvolvedores iniciantes e engenheiros fullstack que buscam entrar no espaço da IA, sem necessidade de experiência prévia em machine learning. Comece a ler hoje para desbloquear o potencial da IA multimodal em seu próximo projeto de desenvolvimento.
O que você vai receber
-
📜
Certificado de conclusão
Adicione ao seu perfil do LinkedIn -
♾️
Acesso vitalício
Volte quando quiser, sem expirar -
📱
Celular ou computador
Funciona em qualquer dispositivo -
💸
Reembolso em 14 dias
Sem perguntas -
⚡
Curto e focado
1 h 53 min de conteúdo prático
Avaliações (1)
Outros também fizeram
🔥 Em demanda
IA gerativa para desenvolvimento de aplicativos móveis
Certificado
Prática
13,99 €
→
🎓 Com certificado
Ferramentas práticas de IA para educadores
Certificado
Prática
13,99 €
→
⚡ Ideal para começar
Fundamentos de IA Generativa: Conceitos Básicos e Prompts
Certificado
Prática
13,99 €
→
🎓 Com certificado
Desenvolvendo aplicativos personalizados de LLM com RAG e agentes
Certificado
Prática
13,99 €
→
Perguntas frequentes
O que preciso para fazer este curso? +
Só um celular ou computador com internet. Sem instalações nem hardware especial.
Como faço para pagar? +
Com cartão via Stripe. Não guardamos dados do cartão — o Stripe processa com segurança.
Posso pedir reembolso? +
Sim — reembolso integral em 14 dias, sem perguntas.
Por quanto tempo terei acesso? +
Para sempre. Uma vez comprado, o curso é seu para revisar quando quiser.
Vou receber um certificado? +
Sim. Ao concluir, você recebe um certificado que pode adicionar ao seu perfil do LinkedIn.
Feito para profissionais em
Tecnologia
Design
Finanças
Marketing
Saúde
Educação
Hotelaria
Indústria