AI jest wszędzie i zaraz wyskoczy z Twojej lodówki. Niestety większość obecnych w debacie publicznej narracji na temat AI jest myląca, ponieważ opiera się na
założeniu, że są to programy komputerowe podobne do tych, z którymi mieliśmy do czynienia do tej pory, tylko bardziej skomplikowane. AI są programami
komputerowymi, ale sposób ich działania jest fundamentalnie różny od algorytmicznych narzędzi i wymaga od nas zmiany perspektywy na sposoby
interakcji z nimi. Dopiero wówczas współpraca z AI może być konstruktywna i otwierająca nowe możliwości twórcze.
W trakcie kursu zaproponuję metody podejścia do współpracy z AI w procesie tworzenia form audiowizualnych na wszystkich etapach: od tekstu, przez tworzenie wizualnych i dźwiękowych komponentów utworu, po montaż i postprodukcję. Aby skutecznie integrować systemy sztucznej inteligencji w proces twórczy konieczne jest zrozumienie sposobu ich działania. Bez tej wiedzy próby wdrożenia AI do twórczości audiowizualnej skazane są na ogromną ilość frustracji i niepowodzeń po stronie twórcy. Znajomość technicznych metod obsługi interfejsów AI, wszystkich suwaków, guzików i parametrów bez adekwatnego do tych systemów rozumienia i intuicji na temat ich funkcjonowania prowadzić będzie w sposób nieunikniony albo do rezygnacji z ich implementowania, albo do bardzo miernych, generycznych rezultatów artystycznych. – Kobas Laksa
Podczas pierwszych dwóch dni kursu spróbujemy zatem odpowiedzieć sobie na następujące pytania:
- Jakie są cechy tych systemów i jak one działają?
- W jaki sposób popularne narracje na temat AI wypaczają znaczenie i zastosowanie systemów? Jakie są możliwe i optymalne sposoby ich integracji w proces twórczy
- Czego spodziewać się w najbliższych miesiącach i jak przygotowywać się do nadchodzących możliwości i zagrożeń?
- W jaki sposób wchodzić we współprace z systemami sztucznej inteligencji, aby efekty takich kolaboracji były jak najbardziej wartościowe dla twórców i odbiorców
Ta wprowadzająca część zajęć, na którą składają się dwa spotkania, jest niezbędną podstawą dla dalszych zagadnień, prezentujących już konkretne sposoby
implementacji i współpracy z AI w dziedzinie tekstu, obrazu, wideo i dźwięku.
Spotkanie trzecie poświęcone będzie dużym modelom językowym. W trakcie warsztatów dokonamy przeglądu istniejących modeli LLM (Large Language
Models), omówimy ich cechy specyficzne i zróżnicowanie zastosowań oraz zapoznamy się z interfejsami umożliwiającymi złożone interakcje z tymi systemami. W szczególności rozwiniemy zagadnienie skutecznych metod tworzenia zapytań (promptów) do systemów LLM.
Czwarte spotkanie będzie dotyczyło modeli przetwarzających obraz. W trakcie zajęć dokonamy przeglądu istniejących modeli text-to-image, image-to-image,
text-to-video, image-to-video, video-to-video, text/image-to-3D, omówimy ich cechy specyficzne i zróżnicowanie zastosowań oraz zapoznamy się z interfejsami
umożliwiającymi złożone interakcje z tymi systemami. Spotkanie piąte poświęcone będzie przeglądowi istniejących modeli i systemów związanych z produkcją i postprodukcją dźwięku (generowanie mowy, dubbing, opracowanie muzyczne, inne aspekty udźwiękowienia), produkcją i wykorzystaniem assetów 3D (przydatne również przy generowaniu obrazów i video), generowaniem środowisk, elementami VFX i narzędziami wspomagającymi montaż filmowy.
Program szczegółowy:
Dzień 1 – Wprowadzenie do tematu – 6h
1. Skala i znaczenie rewolucji AI
- Skąd się to wszystko wzięło – przypadkowe przełomy i emergencja w systemach sztucznej inteligencji.
- AI 1.0 i AI 2.0 – podobieństwa i różnice.
- Gdzie jesteśmy i dokąd zmierzamy: najnowsze odkrycia i osiągnięcia w dziedzinie generatywnych modeli AI, przewidywane kierunki i spodziewana dynamika dalszego rozwoju.
- Modele komercyjne i środowiska open source – omówienie różnic i znaczenie dla rozwoju i implementacji w produkcji audiowizualnej.
2. Jak działają obecne generatywne systemy AI? Podstawowe pojęcia.
- Ogólna konstrukcja i zasady działania modeli generatywnych różnego rodzaju (bez konieczności posiadania wiedzy specjalistycznej).
- Czym jest i jaka jest pamięć systemu? Jak jest trenowany? Faza trenowania, a faza inferencji. Przestrzeń utajona (black box). Idee i znaczenia w przestrzeni utajonej.
- Prompt crafting – co to jest, jak i po co rozwijać tę umiejętność?
- System message, information retrieval i RAG, okno kontekstowe – czym są i jak ich używać?
- Trenowanie, dostrajanie i łączenie modeli.
- Datasety jako kluczowe źródło zindywidualizowanych systemów AI.
3. Czym jest AI? Trzynaście błędnych pojęć:
- AI – Artificial Intelligence czy Artificial Intuition?
- Antropomorfizacja, technologizacja, automatyzacja – powszechne podejścia do AI.
- Halucynacje i uprzedzenia – bug czy feature?
- Redukcja kosztów czy wzrost wartości?
- Cielesność, emocjonalność, świadomość – jaki sens (lub jego brak) mają te pojęcia w kontekście AI?
- Współmyślenie – pożądane podejścia do AI.
Dzień 2 – Wprowadzenie do tematu – 6h
1. AI w produkcji audiowizualnej – wprowadzenie
- Do czego nadaje się AI?
- Systemy algorytmiczne.
- Systemy analityczne.
- Systemy generatywne.
- Dynamika i iteracyjność wdrażania AI.
- Context is the king.
- Bias jako wartość – lokalizacja AI.
- Integracje top-down i bottom-up.
- AI jako proces vs AI jako zadanie.
2. Przegląd zastosowań:
- AI w scenarpiopisarstwie,
- AI w tworzeniu i edycji obrazu
- AI w tworeniu i edycji dźwięku
- AI w produkcji i postprodukcji
3. Główne problemy wdrażania AI w produkcji audiowizualnej:
- strategie budowania relacji i współtworzenia z systemami generatywnymi
- Etyka AI – twórczość i kreatywność w kontekście systemów
generatywnych - AI a prawo autorskie, kwestia własności intelektualnej – aktualne
stanowiska i pierwsze rozstrzygnięcia prawne
4. Żródła wiedzy. Dyskusja podsumowująca
Sprzęt do pracy:
KOMPUTER stacjonarny lub laptop system Windows lub Macsoftware / aplikacje (będziemy je omawiali i instalowali w trakcie warsztatów)
software / aplikacje:
• Adobe Photoshop + Adobe FireFly
• Adobe Premiere
• Discord
• Leonardo AI
• Midjourney
• RunwayML
• ElevenLabs
• Suno AI
• Chat GPT
dodatkowe:
• Rendernet.ai
• LTX STUDIO
• storyboarder.ai
• Capcut
Stabilne łącze internetowe.
Serdecznie zapraszamy do zapisów!
Nasza Fundacja w ramach dofinansowania ze środków KPO realizuje przedsięwzięcie: „FilmSpringers Connect”. Dzięki temu udział w kursie online jest dla Was darmowy! Obowiązują zapisy: biuro@filmspringopen.eu
Kobas Laksa: artysta sztuk wizualnych, reżyser, wykładowca, 2d / 3d / AI designer, pasjonat generatywnych technologii AI w dziedzinach wykorzystujących narrację wizualną i sztuczną inteligencję. Absolwent Uniwersytetu Artystycznego w Poznaniu (malarstwo. grafika / rzeźba) i Wajda School (reżyseria, scenariusz) w Warszawie oraz PWSTiF w Łodzi na kierunku Zarządzanie Postprodukcją.
Fundacja Film Spring Open w ramach dofinansowania ze środków Krajowego Planu Odbudowy (KPO) realizuje przedsięwzięcie: „FilmSpringers Connect”.