AI jest wszędzie i zaraz wyskoczy z Twojej lodówki. Niestety większość obecnych w debacie publicznej narracji na temat AI jest myląca, ponieważ opiera się na założeniu, że są to programy komputerowe podobne do tych, z którymi mieliśmy do czynienia do tej pory, tylko bardziej skomplikowane. AI są programami komputerowymi, ale sposób ich działania jest fundamentalnie różny od algorytmicznych narzędzi i wymaga od nas zmiany perspektywy na sposoby interakcji z nimi. Dopiero wówczas współpraca z AI może być konstruktywna i otwierająca nowe możliwości twórcze.
W trakcie kursu zaproponuję metody podejścia do współpracy z AI w procesie tworzenia form audiowizualnych na wszystkich etapach: od tekstu, przez tworzenie wizualnych i dźwiękowych komponentów utworu, po montaż i postprodukcję. Aby skutecznie integrować systemy sztucznej inteligencji w proces twórczy konieczne jest zrozumienie sposobu ich działania. Bez tej wiedzy próby wdrożenia AI do twórczości audiowizualnej skazane są dużą ilość frustracji i niepowodzeń po stronie twórcy. Znajomość technicznych metod obsługi interfejsów AI, wszystkich suwaków, guzików i parametrów bez adekwatnego do tych systemów rozumienia i intuicji na temat ich funkcjonowania prowadzić będzie do rezygnacji z ich implementowania, albo do generycznych rezultatów artystycznych.
Podczas pierwszego dnia kursu spróbujemy zatem odpowiedzieć sobie na następujące pytania:
- Jakie są cechy tych systemów i jak one działają?
- W jaki sposób popularne narracje na temat AI wypaczają znaczenie i zastosowanie systemów? Jakie są możliwe i optymalne sposoby ich integracji w proces twórczy?
- Czego spodziewać się w najbliższych miesiącach i jak przygotowywać się do nadchodzących możliwości i zagrożeń?
- W jaki sposób wchodzić we współprace z systemami sztucznej inteligencji, aby efekty takich kolaboracji były jak najbardziej wartościowe dla twórców i odbiorców?
Ta wprowadzająca część zajęć, jest niezbędną podstawą dla dalszych zagadnień, prezentujących już konkretne sposoby implementacji i współpracy z AI w dziedzinie tekstu, obrazu, wideo i dźwięku.
Spotkanie drugie poświęcone będzie dużym modelom językowym. W trakcie warsztatów dokonamy przeglądu istniejących modeli LLM (Large Language Models), omówimy ich cechy specyficzne i zróżnicowanie zastosowań oraz zapoznamy się z interfejsami umożliwiającymi złożone interakcje z tymi systemami. W szczególności rozwiniemy zagadnienie skutecznych metod tworzenia zapytań (promptów) do systemów LLM, które są z kolei przydatne w interakcji modelami obrazowymi i dźwiękowymi.
Trzecie spotkanie będzie dotyczyło modeli przetwarzających obraz. W trakcie zajęć dokonamy przeglądu istniejących modeli text-to-image, image-to-image, text-to-video, image-to-video, video-to-video, text/image-to-3D, omówimy ich cechy specyficzne i zróżnicowanie zastosowań oraz zapoznamy się z interfejsami umożliwiającymi złożone interakcje z tymi systemami.
Spotkanie czwarte poświęcone będzie przeglądowi istniejących modeli i systemów związanych z produkcją i postprodukcją dźwięku (generowanie mowy, dubbing, opracowanie muzyczne, inne aspekty udźwiękowienia), produkcją i wykorzystaniem assetów 3D (przydatne również przy generowaniu obrazów i video), generowaniem środowisk, elementami VFX i narzędziami wspomagającymi montaż filmowy.
Ponadto każda z uczestniczących w warsztatach osób będzie miała możliwość dodatkowego indywidualnego spotkania online (30 min) w celu omówienia konkretnych interesujących ją zagadnień w ustalonym indywidualnie terminie.
Program szczegółowy:
Dzień 1 – Wprowadzenie do tematu – 6h – 11.11, godz, 10.00 – 16.00
Skala i znaczenie rewolucji AI
- Skąd się to wszystko wzięło – przypadkowe przełomy i emergencja w systemach sztucznej inteligencji.
- AI 1.0 i AI 2.0 – podobieństwa i różnice.
- Gdzie jesteśmy i dokąd zmierzamy: najnowsze odkrycia i osiągnięcia w dziedzinie generatywnych modeli AI, przewidywane kierunki i spodziewana dynamika dalszego rozwoju.
- Modele komercyjne i środowiska open source – omówienie różnic i znaczenie dla rozwoju i implementacji w produkcji audiowizualnej.
Jak działają obecne generatywne systemy AI? Podstawowe pojęcia.
- Ogólna konstrukcja i zasady działania modeli generatywnych różnego rodzaju (bez konieczności posiadania wiedzy specjalistycznej).
- Prompt crafting – co to jest, jak i po co rozwijać tę umiejętność?
- Trenowanie, dostrajanie i łączenie modeli.
- Datasety jako kluczowe źródło zindywidualizowanych systemów AI.
Dziesięć błędnych pojęć:
- AI – Artificial Intelligence czy Artificial Intuition?
- Antropomorfizacja, technologizacja, automatyzacja – powszechne podejścia do AI.
- Halucynacje i uprzedzenia – bug czy feature?
- Redukcja kosztów czy wzrost wartości?
- Cielesność, emocjonalność, świadomość – jaki sens (lub jego brak) mają te pojęcia w kontekście AI?
- Współmyślenie – pożądane podejścia do AI.
AI w produkcji audiowizualnej – wprowadzenie
Do czego nadaje się AI?
- Systemy algorytmiczne.
- Systemy analityczne.
- Systemy generatywne
Przegląd zastosowań:
- AI w scenarpiopisarstwie,
- AI w tworzeniu i edycji obrazu
- AI w tworzeniu i edycji dźwięku
- AI w produkcji i postprodukcji
Główne problemy wdrażania AI w produkcji audiowizualnej:
- Strategie budowania relacji i współtworzenia z systemami generatywnymi
- Etyka AI – twórczość i kreatywność w kontekście systemów generatywnych
- AI a prawo autorskie, kwestia własności intelektualnej – aktualne stanowiska
Żródła wiedzy. Dyskusja podsumowująca.
Dzień 2 – Praca z tekstem i modele językowe – 6h – 16.11, godz, 10.00 – 16.00
- Ogólne zasady konstruowania promptów (zapytań) do systemów AI w kontekście pracy twórczej.
- Prezentacja systemów AI – GPT, Claude, Gemini, Mistral, Llama, Bielik, modele Open Source – czym się różnią i jak z nich korzystać
- Podstawowe interakcje z AI przy generowaniu tekstów
- Prezentacja złożonych sposobów interakcji z systemami AI na podstawie GPT i Claude
- Studium przypadku
- Promptowanie w systemie do prowadzenia debat
- Promptowanie w systemie wspomagającym pisanie scenariuszy
- Promptowanie w zadaniach okołoscenariopisarskich
- Systemy złożone i intefejsy interakcji z LLM (Novelcrafter, NotebookLM)
- Porównanie właściwości różnych tekstowych systemów generatywnych.
- Prompt Crafting i Prompt Engineering – jak z tego korzystać i skąd czerpać wiedzę i inspiracje
Żródła wiedzy. Dyskusja podsumowująca.
Dzień 3 – Praca z obrazem i video – 6h – 17.11, godz, 10.00 – 16.00
Praca z modelami do generowania i przetwarzania obrazów
- Prezentacja systemów MidJourney, Stable Diffusion/Flux, Adobe FireFly – informacje podstawowe, porównanie metod pracy, podstawowe zastosowania
- Inpainting, outpainting, ControlNet i inne – prezentacja, zaawansowane metody pracy i zastosowania
- Co można, a czego nie można osiągnąć w obrazie generowanym w chwili obecnej
Praca z modelami video
- Prezentacja systemów: RunwayML Luma Labs, Krea, Kling, Firefly
- metody pracy
- aktualny etap i tempo rozwoju
Narzędzia wspomagające pracę z systemami do generowania obrazów i video
Przegląd innych systemów do zastosowania w produkcji AV
- generowanie obrazów 360,
- generowanie obiektów 3D,
- NeRF i Gaussian Splatting
Żródła wiedzy. Dyskusja podsumowująca.
Dzień 4 – Praca z dźwiękiem i postprodukcja – 5h – 18.11, godz, 16.00 – 21.00
Praca z modelami do generowania i przetwarzania dźwięku
- Prezentacja i zastosowania systemów Eleven Labs (Text-to-Speech, dubbing, voice cloning, elementy sound design)
- Transkrypcje (Whisper)
- Prezentacja i sposoby pracy z Suno AI i Udio AI (muzyka, sound design)
Praca z modelami 3D i VFX
- Wonder Studio
- Modele do generowania assetów 3D (Sloyd i inne)
- Generowanie środowisk 3D (Luma, Blockade Labs)
- aktualny etap i tempo rozwoju
Wspomaganie pracy montażowej
- Narzędzia wsparcia pracy z materiałem filmowym (nowe funkcje AI w Adobe Premiere, automatyzacja cięcia, strukturyzacji i opisu materiałów, Descript, RunwayML, Kling)
- Uzupełnianie i modyfikacja zarejestrowanego materiału filmowego
- Subtitling i lokalizacja
Żródła wiedzy. Dyskusja podsumowująca.
Nasza Fundacja w ramach dofinansowania ze środków KPO realizuje przedsięwzięcie: „FilmSpringers Connect”. Dzięki temu udział w kursie online jest dla Was darmowy! Obowiązują zapisy.
Fundacja Film Spring Open w ramach dofinansowania ze środków Krajowego Planu Odbudowy (KPO) realizuje przedsięwzięcie: „FilmSpringers Connect”.