★ 4.5 (523)
⏱ 1 h 20 min
📚 9 aulas
🎧 Versão em áudio
Sobre este curso
Raw scanned documents and images contain valuable data, but unlocking that information requires bridging the gap between computer vision and natural language processing. This text-based course guides you through the process of building an intelligent document parsing pipeline. You will learn how to clean document images, extract raw text, and train a custom Named Entity Recognition (NER) model to automatically identify and structure crucial data points.
What you'll learn:
- Understand the foundational concepts of computer vision, optical character recognition (OCR), and natural language processing.
- Clean and preprocess document images using OpenCV to optimize them for text extraction.
- Extract text from images using Pytesseract and format it for downstream processing.
- Label text data manually using the BIO (Inside-Outside-Beginning) tagging schema for custom entity extraction.
- Train a custom Named Entity Recognition (NER) model using modern SpaCy configuration pipelines.
- Structure extracted text into clean, validated data formats using modern Python validation techniques.
We begin with the core definitions and setup of your Python environment. Next, you will progress through image preprocessing, OCR text extraction, manual text labeling, and training your custom NLP model, concluding with structuring your extracted data. This course is designed for beginner Python developers, data enthusiasts, and aspiring machine learning engineers, requiring only basic Python knowledge to start. Start reading today to turn unstructured document images into clean, actionable data.
O que você vai receber
-
📜
Certificado de conclusão
Adicione ao seu perfil do LinkedIn
-
🎧
Versão em áudio incluída
Estude em qualquer lugar, sem tela
-
♾️
Acesso vitalício
Volte quando quiser, sem expirar
-
📱
Celular ou computador
Funciona em qualquer dispositivo
-
💸
Reembolso em 30 dias
Sem perguntas
-
⚡
Curto e focado
1 h 20 min de conteúdo prático
Avaliações (2)
Machine Translated Gostei muito do fluxo disso. Os exemplos estavam no local e me ajudaram a entender o material rapidamente.
Hmm, não tenho certeza se isso é para iniciantes absolutos. Ele assume um pouco de conhecimento prévio que não foi explicitamente ensinado.
Outros também fizeram
Transformadores a partir do zero com PyTorch
Domine o mecanismo de autoatenção e construa a arquitetura fundamental por trás da IA moderna, passo a passo.
★ 5.0 (19)
R$ 24,90
Fundamentos de modelos de linguagem grandes: construção a partir do zero com PyTorch
Entenda a mecânica central da IA moderna aprendendo a implementar arquiteturas de transformadores e modelos estilo GPT do zero usando o PyTorch.
★ 4.8 (24)
R$ 24,90
Modelos de sequência para PNL: construa RNNs, LSTMs e GRUs
Aprenda os fundamentos da modelagem de sequências para criar aplicativos de geração de texto, tradução e reconhecimento de fala usando redes neurais recorrentes.
★ 4.8 (1,308)
R$ 24,90
Aprendizagem profunda para PNL: incorporação de palavras e classificação de texto em Python
Domine os fundamentos do processamento de linguagem natural implementando word2vec, GloVe e redes neurais recorrentes para criar classificadores de texto inteligentes em Python.
★ 4.7 (8,585)
R$ 24,90
Perguntas frequentes
O que preciso para fazer este curso?
+
Só um celular ou computador com internet. Sem instalações nem hardware especial.
Como faço para pagar?
+
Com cartão via Stripe. Não guardamos dados do cartão — o Stripe processa com segurança.
Posso pedir reembolso?
+
Sim — reembolso integral em 30 dias, sem perguntas.
Por quanto tempo terei acesso?
+
Para sempre. Uma vez comprado, o curso é seu para revisar quando quiser.
Vou receber um certificado?
+
Sim. Ao concluir, você recebe um certificado que pode adicionar ao seu perfil do LinkedIn.
Feito para profissionais em
Tecnologia
Design
Finanças
Marketing
Saúde
Educação
Hotelaria
Indústria