Zum Inhalt springen
Alle Tracks
Spezialisierungs-Track

azena motion

Du lernst die heutigen Bild-, Video- und Stimm-Werkzeuge als Handwerk: Du erzeugst saubere Bilder, hältst Marke und Figur konsistent, machst daraus bewegte Clips mit gesteuerter Kamera, lässt Figuren lippensynchron sprechen, legst eine Stimme darunter und schneidest alles ins richtige Format — rechtssicher gekennzeichnet. Am Ende planst du einen 30-Sekunden-Produktspot von der Idee bis zum Export. Ohne Coding, mit Verstand und Transparenz.

19 Lektionen 148 Min 250 Token Detailseite gratis
Track starten 250 TokenProfi-Bilder und -Videos aus Text — ohne Kamera.

Was du danach kannst

  • Die wichtigsten Bild- und Video-Werkzeuge unterscheiden und sinnvoll kombinieren
  • Mit Prompt und Referenzbild gezielt Bilder erzeugen — inklusive lesbarer Schrift im Bild
  • Marke und Figur über mehrere Bilder und Shots hinweg erkennbar konsistent halten
  • Aus Bildern bewegte Clips mit gesteuerter Kamera und Bewegung machen
  • Sprechende Figuren (Lip-Sync) und mehrsprachige Voiceover produzieren
  • Rechte, Ethik und die EU-Kennzeichnungspflicht für KI-Inhalte beachten

Das Curriculum

19 Lektionen · Schritt für Schritt

  1. 01

    Was diese Werkzeuge sind — und wie sie sich unterscheiden

    10

    Es gibt kein 'bestes' Tool. Profis kombinieren — und Sora ist keine Basis mehr.

  2. 02

    Dein erstes KI-Bild — Prompten lernen

    10

    Motiv, Stil, Licht, Komposition — und warum ein Referenzbild stärker ist als eine Textwüste.

  3. 03

    Text im Bild richtig hinbekommen

    9

    Schrift im Bild ist Spezialdisziplin — das falsche Tool macht Buchstabensalat.

  4. 04

    Marke & Figur konsistent halten (Bild)

    11

    Damit die Figur in Bild 2 noch dieselbe ist wie in Bild 1 — ab dem ersten Bild verankern.

  5. 05

    Vom Bild zum Video — dein erster Clip

    11

    Erst ein gutes Bild, dann Bewegung: Bild-zu-Video schlägt Text-zu-Video.

  6. 06

    Kamera & Bewegung steuern

    9

    Nicht 'irgendwie bewegt', sondern bewusst geführt — wie ein echter Kameramann.

  7. 07

    Bildsprache — Einstellungsgrößen & die Linie

    10

    Lektion 6 war, WIE die Kamera sich bewegt. Diese ist, wie NAH sie dran ist — die wichtigste Wirkung-Entscheidung pro Shot, und die Sprache, in der du der KI sagst, wie ein Bild wirken soll.

  8. 08

    Mehrere Einstellungen & eine Figur durch die Szene

    10

    Ein Spot ist eine kleine Geschichte aus mehreren Shots — mit derselben Figur durchgehend.

  9. 09

    Lippensynchronität & sprechende Figuren

    10

    Eine Figur, die glaubwürdig spricht — das Herz vieler KI-Marketingvideos.

  10. 10

    Stimme & Ton — Voiceover mit ElevenLabs

    10

    Eine gute Stimme trägt den Spot — verständlich, mehrsprachig, mit der richtigen Emotion.

  11. 11

    Musik & Sounddesign — die unterschätzte Hälfte

    10

    Lektion 9 war die Stimme. Aber Ton hat drei Schichten — Stimme, Musik, Geräusche — und viele KI-Clips sind stumm. Die richtige Tonmischung macht aus einem schönen Bild einen echten Spot.

  12. 12

    Nativer Ton — Video und Klang in EINEM Zug erzeugen

    9

    Die letzten Lektionen legten Ton in getrennten Spuren über stummes Video. 2026 erzeugen Spitzenmodelle wie Veo 3 Bild UND Ton zusammen aus einem Prompt — schnell und synchron.

  13. 13

    Aufpolieren — Schnitt, Upscaling & Format

    9

    Aus guten Einzelteilen wird ein Spot: schneiden, hochskalieren, ins richtige Format bringen.

  14. 14

    KI-Tells vermeiden — woran man KI-Video erkennt

    11

    Es gibt einen Moment, in dem ein KI-Video „kippt" und unecht wirkt. Diese verräterischen Fehler („Tells") zu kennen heißt, sie bei anderen zu erkennen — und in deinen eigenen Spots zu vermeiden.

  15. 15

    Recht, Ethik & Kennzeichnungspflicht

    11

    KI-Inhalte müssen gekennzeichnet werden — und nicht jedes Gesicht oder Logo darfst du nutzen.

  16. 16

    Storyboard & Planung — vom Konzept zum Shot-Plan

    10

    Erst planen, dann generieren: ein Storyboard spart Zeit, Nerven und teure Wiederholungen.

  17. 17

    Soziale Formate & Seitenverhältnisse — zielgerichtet produzieren

    9

    9:16, 1:1, 16:9 — das Format entscheidet mit, ob dein Spot überhaupt gesehen wird.

  18. 18

    Eine Prompt-Bibliothek fürs Video aufbauen

    9

    Gute Prompts sind Kapital: festhalten, ordnen, wiederverwenden — statt jedes Mal neu zu raten.

  19. 19

    Capstone-Vorbereitung — vom Briefing zum Plan

    10

    Alle Schritte zu einer Pipeline verbinden: Skript → Bilder → Video → Stimme → Schnitt.

Was du baust

Echte Artefakte, keine Theorie

Werkzeug-Landkarte für deinen Zweck

Ergebnis: Eine Tabelle: Schritt → gewähltes Werkzeug → ein Satz Begründung.

Erstes konsistentes Bildpaar

Ergebnis: Zwei Bilder derselben Figur/desselben Produkts + ein Satz, wie du die Konsistenz verankert hast.

Ein Bild zum Leben erwecken

Ergebnis: Ein kurzer Clip aus deinem Bild + die Kamera-Anweisung, die du verwendet hast.

Skript & Stimme in zwei Sprachen

Ergebnis: Dein Sprechertext in zwei Sprachen + ein erzeugtes Voiceover (mindestens eine Sprache).

Capstone: Dein 30-Sekunden-Produktwerbespot

Ergebnis: Der fertige, gekennzeichnete 30-Sekunden-Spot in zwei Sprachen + ein kurzer Plan, der pro Pipeline-Schritt das gewählte Werkzeug nennt.

Die lebende Produktions-Pipeline

Vom getippten Prompt bis zum gekennzeichneten 9:16-Spot — ein Frame durchläuft das ganze Fließband.

prompt>KI-generiert · C2PA
01Prompt
02Bild
03Konsistenz
04Video
05Ton
06Export

Der rote Faden ist die Konsistenz: Wer Figur und Marke erst am Ende bedenkt, baut den Spot zweimal. Verankerst du sie ab dem ersten Frame, gleitet derselbe Charakter sauber durch Bild, Varianten, Schnitte und Stimme — und am Export steht die Kennzeichnung, nicht das Aufräumen.

kein „bestes“ Tool

Profis kombinieren Modelle

Veo für Realismus & nativen Ton, Kling für mehrteiliges Storytelling, Seedance für längere Clips, Runway für referenz-getriebene Kontrolle — pro Schritt das stärkste Werkzeug.

Konsistenz

Figur & Marke verankern

Nano Banana Pro hält bis zu 5 Personen über bis zu 14 Bilder hinweg erkennbar gleich; Omni Reference (--oref) und Gen-4 References sichern die Figur ab Shot 1. Ziel: „erkennbar dieselbe“, nicht pixelgenau.

ab 2.8.2026

EU AI Act, Artikel 50

KI-erzeugte Inhalte müssen maschinenlesbar markiert und Deepfakes offengelegt werden — C2PA Content Credentials (ISO/IEC 22144) liefern die Provenienz. Nicht jedes Gesicht oder Logo ist verwendbar.

  1. 01

    Prompt

    Motiv, Stil, Licht, Komposition — Referenzbilder schlagen Textwüsten.

  2. 02

    Bild

    Aus Rauschen wird ein Frame; lesbare Schrift via Ideogram / Nano Banana Pro.

  3. 03

    Konsistenz

    Figur & Marke früh verankern — Omni Reference (MJ) oder Gen-4 References.

  4. 04

    Video

    Bild-zu-Video schlägt Text-zu-Video; 8-20s, Kamera klar beschreiben.

  5. 05

    Ton

    Voiceover & Stimme mit ElevenLabs, mehrsprachig; Emotion über den Satzbau.

  6. 06

    Export

    Schnitt, Upscale auf 2K/4K, Reframe auf 9:16 — und Kennzeichnung.

Provenienz gehört in die Pipeline — nicht ans Ende

Diese Pipeline an deinem eigenen 30-Sekunden-Spot durchlaufen — vom Skript bis zum gekennzeichneten 9:16-Export.

Track starten

Belege & Quellen

Jede Aussage ist belegt — echte, geprüfte Quellen statt Behauptungen.

Reinschnuppern

Gratis-Vorschau

GO vs. NO-GO — ein echtes Beispiel aus dem Track.

Wie der Track läuft

Mit Nova als Mentor

Dein KI-Mentor erklärt jedes Konzept, gibt dir fertige Claude-Code-Prompts und hilft bei jeder Frage.

Geprüftes Siegel

Plane Nova deinen 30-Sekunden-Produktspot: Beschreibe die Pipeline vom Skript bis zur Kennzeichnung, nenne pro Schritt ein passendes Werkzeug und begründe es kurz, erkläre wie du Figur/Marke ab Shot 1 konsistent hältst und welches Zielformat du wählst — und sag, wie du den fertigen Spot nach EU AI Act Art. 50 kennzeichnest und warum du nicht einfach jedes Gesicht oder Logo verwenden darfst.

In deinem Tempo

Rund 148 Minuten Kerninhalt — plus deine eigenen Projekte. Jederzeit pausierbar.

Fehler, die du vermeidest

  • Zu lange, überladene Prompts schreiben, statt ein Referenzbild mitzugeben.
  • Sora als Haupt-Werkzeug wählen — die App ist seit April 2026 abgeschaltet.
  • Das falsche Tool für Text im Bild nehmen (Ästhetik-Tools machen Buchstabensalat → Ideogram / Nano Banana Pro).
  • Konsistenz erst am Ende bedenken, statt Figur und Marke ab Shot 1 mit einem Referenz-Anker (Omni Reference / Gen-4) festzulegen.
  • Kennzeichnung und Rechte ignorieren (Art. 50 ab 2.8.2026; nicht jedes Gesicht oder Logo darf verwendet werden).

Bereit für azena motion?

250 Token · 19 Lektionen · von der KI geprüft.

250 TokenTrack starten

Weitere Tracks