Spezialisierungs-Track

azena motion

Du lernst die heutigen Bild-, Video- und Stimm-Werkzeuge als Handwerk: Du erzeugst saubere Bilder, hältst Marke und Figur konsistent, machst daraus bewegte Clips mit gesteuerter Kamera, lässt Figuren lippensynchron sprechen, legst eine Stimme darunter und schneidest alles ins richtige Format — rechtssicher gekennzeichnet. Am Ende planst du einen 30-Sekunden-Produktspot von der Idee bis zum Export. Ohne Coding, mit Verstand und Transparenz.

19 Lektionen 148 Min 250 Token Detailseite gratis

Track starten 250 TokenProfi-Bilder und -Videos aus Text — ohne Kamera.

Was du danach kannst

Die wichtigsten Bild- und Video-Werkzeuge unterscheiden und sinnvoll kombinieren
Mit Prompt und Referenzbild gezielt Bilder erzeugen — inklusive lesbarer Schrift im Bild
Marke und Figur über mehrere Bilder und Shots hinweg erkennbar konsistent halten
Aus Bildern bewegte Clips mit gesteuerter Kamera und Bewegung machen
Sprechende Figuren (Lip-Sync) und mehrsprachige Voiceover produzieren
Rechte, Ethik und die EU-Kennzeichnungspflicht für KI-Inhalte beachten

Das Curriculum

19 Lektionen · Schritt für Schritt

01
Was diese Werkzeuge sind — und wie sie sich unterscheiden
10′
Es gibt kein 'bestes' Tool. Profis kombinieren — und Sora ist keine Basis mehr.
02
Dein erstes KI-Bild — Prompten lernen
10′
Motiv, Stil, Licht, Komposition — und warum ein Referenzbild stärker ist als eine Textwüste.
03
Text im Bild richtig hinbekommen
9′
Schrift im Bild ist Spezialdisziplin — das falsche Tool macht Buchstabensalat.
04
Marke & Figur konsistent halten (Bild)
11′
Damit die Figur in Bild 2 noch dieselbe ist wie in Bild 1 — ab dem ersten Bild verankern.
05
Vom Bild zum Video — dein erster Clip
11′
Erst ein gutes Bild, dann Bewegung: Bild-zu-Video schlägt Text-zu-Video.
06
Kamera & Bewegung steuern
9′
Nicht 'irgendwie bewegt', sondern bewusst geführt — wie ein echter Kameramann.
07
Bildsprache — Einstellungsgrößen & die Linie
10′
Lektion 6 war, WIE die Kamera sich bewegt. Diese ist, wie NAH sie dran ist — die wichtigste Wirkung-Entscheidung pro Shot, und die Sprache, in der du der KI sagst, wie ein Bild wirken soll.
08
Mehrere Einstellungen & eine Figur durch die Szene
10′
Ein Spot ist eine kleine Geschichte aus mehreren Shots — mit derselben Figur durchgehend.
09
Lippensynchronität & sprechende Figuren
10′
Eine Figur, die glaubwürdig spricht — das Herz vieler KI-Marketingvideos.
10
Stimme & Ton — Voiceover mit ElevenLabs
10′
Eine gute Stimme trägt den Spot — verständlich, mehrsprachig, mit der richtigen Emotion.
11
Musik & Sounddesign — die unterschätzte Hälfte
10′
Lektion 9 war die Stimme. Aber Ton hat drei Schichten — Stimme, Musik, Geräusche — und viele KI-Clips sind stumm. Die richtige Tonmischung macht aus einem schönen Bild einen echten Spot.
12
Nativer Ton — Video und Klang in EINEM Zug erzeugen
9′
Die letzten Lektionen legten Ton in getrennten Spuren über stummes Video. 2026 erzeugen Spitzenmodelle wie Veo 3 Bild UND Ton zusammen aus einem Prompt — schnell und synchron.
13
Aufpolieren — Schnitt, Upscaling & Format
9′
Aus guten Einzelteilen wird ein Spot: schneiden, hochskalieren, ins richtige Format bringen.
14
KI-Tells vermeiden — woran man KI-Video erkennt
11′
Es gibt einen Moment, in dem ein KI-Video „kippt" und unecht wirkt. Diese verräterischen Fehler („Tells") zu kennen heißt, sie bei anderen zu erkennen — und in deinen eigenen Spots zu vermeiden.
15
Recht, Ethik & Kennzeichnungspflicht
11′
KI-Inhalte müssen gekennzeichnet werden — und nicht jedes Gesicht oder Logo darfst du nutzen.
16
Storyboard & Planung — vom Konzept zum Shot-Plan
10′
Erst planen, dann generieren: ein Storyboard spart Zeit, Nerven und teure Wiederholungen.
17
Soziale Formate & Seitenverhältnisse — zielgerichtet produzieren
9′
9:16, 1:1, 16:9 — das Format entscheidet mit, ob dein Spot überhaupt gesehen wird.
18
Eine Prompt-Bibliothek fürs Video aufbauen
9′
Gute Prompts sind Kapital: festhalten, ordnen, wiederverwenden — statt jedes Mal neu zu raten.
19
Capstone-Vorbereitung — vom Briefing zum Plan
10′
Alle Schritte zu einer Pipeline verbinden: Skript → Bilder → Video → Stimme → Schnitt.

Was du baust

Echte Artefakte, keine Theorie

Werkzeug-Landkarte für deinen Zweck

Ergebnis: Eine Tabelle: Schritt → gewähltes Werkzeug → ein Satz Begründung.

Erstes konsistentes Bildpaar

Ergebnis: Zwei Bilder derselben Figur/desselben Produkts + ein Satz, wie du die Konsistenz verankert hast.

Ein Bild zum Leben erwecken

Ergebnis: Ein kurzer Clip aus deinem Bild + die Kamera-Anweisung, die du verwendet hast.

Skript & Stimme in zwei Sprachen

Ergebnis: Dein Sprechertext in zwei Sprachen + ein erzeugtes Voiceover (mindestens eine Sprache).

Capstone: Dein 30-Sekunden-Produktwerbespot

Ergebnis: Der fertige, gekennzeichnete 30-Sekunden-Spot in zwei Sprachen + ein kurzer Plan, der pro Pipeline-Schritt das gewählte Werkzeug nennt.

Die lebende Produktions-Pipeline

Vom getippten Prompt bis zum gekennzeichneten 9:16-Spot — ein Frame durchläuft das ganze Fließband.

01Prompt

02Bild

03Konsistenz

04Video

05Ton

06Export

Der rote Faden ist die Konsistenz: Wer Figur und Marke erst am Ende bedenkt, baut den Spot zweimal. Verankerst du sie ab dem ersten Frame, gleitet derselbe Charakter sauber durch Bild, Varianten, Schnitte und Stimme — und am Export steht die Kennzeichnung, nicht das Aufräumen.

kein „bestes“ Tool

Profis kombinieren Modelle

Veo für Realismus & nativen Ton, Kling für mehrteiliges Storytelling, Seedance für längere Clips, Runway für referenz-getriebene Kontrolle — pro Schritt das stärkste Werkzeug.

Konsistenz

Figur & Marke verankern

Nano Banana Pro hält bis zu 5 Personen über bis zu 14 Bilder hinweg erkennbar gleich; Omni Reference (--oref) und Gen-4 References sichern die Figur ab Shot 1. Ziel: „erkennbar dieselbe“, nicht pixelgenau.

ab 2.8.2026

EU AI Act, Artikel 50

KI-erzeugte Inhalte müssen maschinenlesbar markiert und Deepfakes offengelegt werden — C2PA Content Credentials (ISO/IEC 22144) liefern die Provenienz. Nicht jedes Gesicht oder Logo ist verwendbar.

01
Prompt
Motiv, Stil, Licht, Komposition — Referenzbilder schlagen Textwüsten.
02
Bild
Aus Rauschen wird ein Frame; lesbare Schrift via Ideogram / Nano Banana Pro.
03
Konsistenz
Figur & Marke früh verankern — Omni Reference (MJ) oder Gen-4 References.
04
Video
Bild-zu-Video schlägt Text-zu-Video; 8-20s, Kamera klar beschreiben.
05
Ton
Voiceover & Stimme mit ElevenLabs, mehrsprachig; Emotion über den Satzbau.
06
Export
Schnitt, Upscale auf 2K/4K, Reframe auf 9:16 — und Kennzeichnung.

Provenienz gehört in die Pipeline — nicht ans Ende

Diese Pipeline an deinem eigenen 30-Sekunden-Spot durchlaufen — vom Skript bis zum gekennzeichneten 9:16-Export.

Track starten

Belege & Quellen

Jede Aussage ist belegt — echte, geprüfte Quellen statt Behauptungen.

Higgsfield · The 6 Best AI Video Generators in 2026 Wikipedia · Sora (text-to-video model)Google DeepMind · Nano Banana Pro: Gemini 3 Pro Image Midjourney · Omni Reference (Docs)StudioBinder · „Types of Camera Shots & Sizes“Wikipedia · „180-degree rule“Runway · Creating with Act-Two (Help)ElevenLabs · Text to Speech (Docs)ElevenLabs · Sound Effects / Video-to-Sound Adobe · Premiere Pro „Automatically duck audio“Google DeepMind · „Veo 3“ (Modellseite)Google Cloud · „Ultimate prompting guide for Veo 3.1“Reader's Digest · „How to Tell If a Video Is AI-Generated“iMerit · „Temporal Drift in AI-Generated Video“EU · Article 50 Transparency Obligations European Commission · Code of Practice on Transparency of AI-Generated Content

Reinschnuppern

Gratis-Vorschau

GO vs. NO-GO — ein echtes Beispiel aus dem Track.

Wie der Track läuft

Mit Nova als Mentor

Dein KI-Mentor erklärt jedes Konzept, gibt dir fertige Claude-Code-Prompts und hilft bei jeder Frage.

Geprüftes Siegel

Plane Nova deinen 30-Sekunden-Produktspot: Beschreibe die Pipeline vom Skript bis zur Kennzeichnung, nenne pro Schritt ein passendes Werkzeug und begründe es kurz, erkläre wie du Figur/Marke ab Shot 1 konsistent hältst und welches Zielformat du wählst — und sag, wie du den fertigen Spot nach EU AI Act Art. 50 kennzeichnest und warum du nicht einfach jedes Gesicht oder Logo verwenden darfst.

In deinem Tempo

Rund 148 Minuten Kerninhalt — plus deine eigenen Projekte. Jederzeit pausierbar.

Fehler, die du vermeidest

Zu lange, überladene Prompts schreiben, statt ein Referenzbild mitzugeben.
Sora als Haupt-Werkzeug wählen — die App ist seit April 2026 abgeschaltet.
Das falsche Tool für Text im Bild nehmen (Ästhetik-Tools machen Buchstabensalat → Ideogram / Nano Banana Pro).
Konsistenz erst am Ende bedenken, statt Figur und Marke ab Shot 1 mit einem Referenz-Anker (Omni Reference / Gen-4) festzulegen.
Kennzeichnung und Rechte ignorieren (Art. 50 ab 2.8.2026; nicht jedes Gesicht oder Logo darf verwendet werden).

Bereit für azena motion?

250 Token · 19 Lektionen · von der KI geprüft.

250 TokenTrack starten

azena motion

Was du danach kannst

Das Curriculum

Was diese Werkzeuge sind — und wie sie sich unterscheiden

Dein erstes KI-Bild — Prompten lernen

Text im Bild richtig hinbekommen

Marke & Figur konsistent halten (Bild)

Vom Bild zum Video — dein erster Clip

Kamera & Bewegung steuern

Bildsprache — Einstellungsgrößen & die Linie

Mehrere Einstellungen & eine Figur durch die Szene

Lippensynchronität & sprechende Figuren

Stimme & Ton — Voiceover mit ElevenLabs

Musik & Sounddesign — die unterschätzte Hälfte

Nativer Ton — Video und Klang in EINEM Zug erzeugen

Aufpolieren — Schnitt, Upscaling & Format

KI-Tells vermeiden — woran man KI-Video erkennt

Recht, Ethik & Kennzeichnungspflicht

Storyboard & Planung — vom Konzept zum Shot-Plan

Soziale Formate & Seitenverhältnisse — zielgerichtet produzieren

Eine Prompt-Bibliothek fürs Video aufbauen

Capstone-Vorbereitung — vom Briefing zum Plan