Wprowadzenie do multimodalnych agentów AI i korzystania z narzędzi
Naucz się budować od podstaw inteligentnych agentów AI zdolnych do analizowania dokumentów, interpretowania obrazów i interakcji z zewnętrznymi narzędziami.
O tym kursie
Kolejna ewolucja sztucznej inteligencji wykracza poza tekst. Multimodalni agenci mogą teraz analizować obrazy, czytać złożone dokumenty i podejmować działania przy użyciu zewnętrznych narzędzi. W tym podstawowym kursie pisemnym dowiesz się, jak projektować i budować agentów AI, którzy jednocześnie przetwarzają dane wizualne i tekstowe. Zaczniesz od podstawowych koncepcji agentowego AI i modeli vision-language, a następnie przejdziesz do praktycznych strategii wdrażania ekstrakcji dokumentów, analizy zrzutów ekranu i dynamicznego wywoływania narzędzi (tool calling).
Czego się nauczysz:
- Zrozumienie podstawowej terminologii multimodalnego AI i przepływów pracy agentów (agentic workflows).
- Przetwarzanie i wyodrębnianie ustrukturyzowanych danych z obrazów, zrzutów ekranu i złożonych dokumentów.
- Implementowanie nowoczesnych wzorców tool calling, aby umożliwić agentom interakcję z zewnętrznymi systemami.
- Stosowanie technik prompt engineering zaprojektowanych specjalnie dla zadań vision-language.
- Poznaj podstawowe koncepcje Retrieval-Augmented Generation (RAG) w zakresie obsługi danych multimodalnych.
- Projektowanie solidnych architektur agentów, które sprawnie zarządzają wieloetapowym rozumowaniem.
Kurs rozpoczyna się od ustalenia kluczowych definicji i podstawowej architektury systemów multimodalnych. Następnie zapoznasz się z pisemnymi samouczkami krok po kroku i fragmentami kodu, aby zbudować własnych agentów do przetwarzania dokumentów i obrazów. Kurs ten jest przeznaczony dla początkujących i programistów stawiających pierwsze kroki w dziedzinie agentów AI; nie jest wymagane wcześniejsze doświadczenie w uczeniu maszynowym. Zacznij budować nową generację inteligentnych, zorientowanych na działanie agentów AI już dziś.
Co otrzymasz
-
📜
Certyfikat ukończenia
Dodaj do profilu LinkedIn -
🎧
Wersja audio w zestawie
Ucz się w drodze — bez ekranu -
♾️
Dożywotni dostęp
Wracaj, kiedy chcesz — bez wygaśnięcia -
📱
Telefon lub komputer
Działa wszędzie, na każdym urządzeniu -
💸
Zwrot w 14 dni
Bez pytań -
⚡
Krótko i konkretnie
1 godz 15 min praktycznej treści
Recenzje
Brak recenzji — bądź pierwszą osobą, która podzieli się doświadczeniem.
Inni uczyli się też
🔥 Poszukiwany
Generative AI dla tworzenia aplikacji mobilnych
Certyfikat
Praktyka
59 zł
→
🎓 Z certyfikatem
Praktyczne narzędzia AI dla edukatorów
Certyfikat
Praktyka
59 zł
→
⚡ Najlepszy na start
Podstawy generatywnej sztucznej inteligencji: podstawowe pojęcia i monitowanie
Certyfikat
Praktyka
59 zł
→
🎓 Z certyfikatem
Opracowywanie niestandardowych aplikacji LLM z RAG i agentami
Certyfikat
Praktyka
59 zł
→
Najczęstsze pytania
Czego potrzebuję, by wziąć udział w tym kursie? +
Wystarczy telefon lub komputer z internetem. Bez instalacji i specjalnego sprzętu.
Jak zapłacić? +
Kartą przez Stripe. Nie przechowujemy danych karty — robi to bezpiecznie Stripe.
Czy mogę otrzymać zwrot? +
Tak — pełen zwrot w 14 dni, bez pytań.
Jak długo będę mieć dostęp? +
Na zawsze. Po zakupie kurs jest twój — wracaj, kiedy chcesz.
Czy dostanę certyfikat? +
Tak. Po ukończeniu otrzymasz certyfikat, który możesz dodać do profilu LinkedIn.
Stworzony dla uczących się w
IT
Design
Finanse
Marketing
Ochrona zdrowia
Edukacja
Hotelarstwo
Produkcja