jens.marketing
KI-MarketingBlog

KI-Bilder erkennen 2026: 8 Tools & Techniken im Test

Jens Polomski11 min
Worum es geht

Midjourney V7, FLUX 1.1 Pro, GPT-Image-1 und Sora-2-Frames sehen 2026 fast nicht mehr nach KI aus. Diese 8 Detection-Tools, vier manuellen Checks und der C2PA-Standard zeigen, wie du KI-Bilder heute trotzdem erkennst – ehrlich, mit Grenzen.

Kategorie · KI-MarketingTag · KI-BilderVeröffentlicht · 2023
Im Detail

Stand: 12. Mai 2026 · Von Jens Polomski. Ich teste KI-Bildgeneratoren und Detection-Tools seit dem DALL-E-2-Launch 2022 und schreibe seit 2009 über digitales Marketing.

Im Mai 2023 reichte ein Blick auf die Hand: sechs Finger, KI-Bild, Fall erledigt. Drei Jahre später funktioniert dieser Reflex nicht mehr. Midjourney V7 rendert Hände korrekt. FLUX 1.1 Pro Ultra von Black Forest Labs zeichnet Hauttextur in einer Mikrostruktur, die Foto-Forensik überfordert. GPT-Image-1 in ChatGPT setzt Reflexionen sauber. Und einzelne Frames aus Sora 2 sind in einem Vollbild-Screenshot nicht mehr von einem iPhone-Foto zu unterscheiden.

Das Bauchgefühl reicht 2026 also nicht. Was du brauchst: eine Routine mit Tools, manuellen Checks und einem klaren Wissen darüber, wo Detektoren versagen. Genau das bekommst du in diesem Artikel.

Wenn dich die Methodik dahinter interessiert – also wie das BSI 2026 KI-Bilder einordnet und welche Trainings-Gewohnheiten dein Auge wirklich schärfen – findest du in KI-Bilder erkennen 2026: Die 3-Schritte-Routine vom BSI den methodischen Begleiter zu diesem Tool-Test.

TL;DR — Die wichtigsten Detection-Tools 2026

  • 🏢 Industrie-Standard: Hive Moderation – kommerzielle API, hohe Trefferquote bei Midjourney und FLUX.
  • 🆓 Free Tier: AI or Not – Web-Upload und Browser-Plugin, schnelle Erst-Einschätzung.
  • 🛡️ Enterprise: Reality Defender – fokussiert auf Deepfake-Erkennung in Echtzeit für Banken, Versicherer und Medienhäuser.
  • 📱 Smartphone: Optic – kostenlose App für iOS und Android, ideal für Social-Media-Checks.
  • 🎬 Video-Spezialist: DeepMedia & Sensity – Deepfake-Erkennung in Bewegtbild und Audio.
  • 🏷️ Standard: C2PA / Content Credentials und Google SynthID – kryptografische Herkunfts-Signaturen im Bild selbst.

Warum KI-Bilder-Erkennung 2026 schwieriger ist als 2023

2023 reichten drei Heuristiken: Hände zählen, Text im Bild suchen, Ohren prüfen. Heute liest sich diese Liste wie ein Witz. Drei Sprünge haben das Spielfeld verschoben:

  1. Anatomie-Fortschritt: Midjourney V7 (Release Mai 2025), FLUX 1.1 Pro Ultra und GPT-Image-1 rendern Hände, Zähne, Augen und Ohren in 90+ Prozent der Fälle korrekt. Die Sechs-Finger-Methode ist tot.
  2. Foto-Realismus-Modi: Midjourney V7 hat einen expliziten "Photo Mode", FLUX 1.1 Pro Ultra wurde von Black Forest Labs in Freiburg auf Foto-Mimikry trainiert. Du bekommst Bilder, die wie ein 24-Megapixel-RAW aus einer Sony A7R V aussehen – inklusive Sensor-Rauschen.
  3. Video-Frames: Sora 2 (OpenAI), Veo 3 (Google DeepMind) und Runway Gen-4 produzieren Sekunden-Clips, aus denen sich beliebige Einzelbilder ziehen lassen. Diese Frames sind temporal konsistent, mit Bewegungsunschärfe und sauberen Schatten.

Dazu kommt der ökonomische Druck: Reuters, AP und Getty Images haben in 2024 und 2025 mehrfach versehentlich KI-Bilder in den Wire-Service eingespeist. Jedes Mal wurde es entdeckt – aber jedes Mal erst Tage später.

Wie funktioniert KI-Bilder-Erkennung 2026?

Ein Detektor stützt sich heute auf vier Mechanismen, die in der Regel parallel laufen:

  • Klassifikator-Modelle: Ein neuronales Netz, das auf Millionen von Paaren (echt / KI) trainiert wurde. Es lernt subtile Statistik-Muster, die für menschliche Augen unsichtbar sind – etwa Verteilung von Hochfrequenz-Rauschen oder Pixel-Korrelationen, die in Diffusionsmodellen anders ausfallen als in CMOS-Sensoren.
  • Frequenz-Analyse: KI-Bilder zeigen im Fourier-Spektrum charakteristische Peaks, die in echten Fotos fehlen. Tools wie Hive nutzen diese Signatur als zusätzlichen Indikator.
  • Metadaten und Wasserzeichen: C2PA-Tags, Google SynthID oder OpenAI-Wasserzeichen. Wenn vorhanden, ist die Aussage hart – wenn das Bild aber recompressed wurde (Screenshot, WhatsApp, LinkedIn-Crop), gehen die Signale teilweise verloren.
  • Reverse-Image-Search: Wenn ein Bild schon vor 2022 im Index zu finden ist, ist es kein KI-Bild aus Midjourney oder FLUX. Klingt trivial, ist 2026 aber der unterschätzteste Check.

Wichtige Einordnung: Kein einziges Tool erreicht 2026 unter realen Bedingungen Trefferquoten über 95 Prozent. Hive, AI or Not, Reality Defender und Optic schwanken in unabhängigen Benchmarks zwischen 75 und 92 Prozent – je nach Modell, Auflösung und ob das Bild komprimiert wurde. Wer dir mehr verspricht, verkauft Marketing.

Die besten Erkennungs-Tools 2026

Hive Moderation – Industrie-Standard

Hive Moderation gilt 2026 als Referenz im kommerziellen Segment. Hinter dem Service in San Francisco steht eines der größten Trainingsdatensätze für KI-Detection – Hive nutzt das Modell auch intern für Content-Moderation bei Reddit, Yubo und mehreren großen Plattformen.

  • Stärken: Hohe Treffer bei Midjourney, Stable Diffusion und FLUX. Klassifiziert auch das wahrscheinliche Generator-Modell.
  • Schwächen: Bei stark komprimierten Screenshots (LinkedIn-Crop, WhatsApp-Forward) sinkt die Quote spürbar.
  • Preis: API ab ca. 1.000 $/Monat, Demo-Upload kostenlos.

AI or Not – Free Tier für den Alltag

AI or Not aus den USA ist das Tool, das ich für die schnelle Erst-Einschätzung am häufigsten nutze. Browser-Plugin für Chrome und Firefox, Web-Upload, fertig. Du bekommst ein "Likely AI" oder "Likely Human" mit Konfidenzwert.

  • Stärken: Sehr schnell, kostenloser Tier mit einigen Checks pro Tag, gute UX.
  • Schwächen: Weniger transparent bei der Modell-Erkennung, neuere Sora-2-Frames werden teilweise als "Human" eingestuft.
  • Preis: Free-Tier kostenlos, Pro ab 9,99 $/Monat.

Reality Defender – Enterprise-Deepfake-Erkennung

Reality Defender aus New York fokussiert auf Echtzeit-Deepfake-Erkennung für Banken, Versicherer und Medienhäuser. Multi-Modell-Ansatz: parallel laufen mehrere Klassifikatoren, das Ergebnis wird ensemble-aggregiert.

  • Stärken: API-Latenz unter 200 ms, sehr stabil bei Video-Deepfakes.
  • Schwächen: Nur Enterprise, kein Free-Tier, B2B-Vertragsprozess.
  • Preis: Auf Anfrage, typischerweise Enterprise-Verträge.

Optic – Smartphone-Detection

Optic ist die Smartphone-App für KI-Detection. Du fotografierst ein Bild ab oder lädst eines aus der Galerie – Optic gibt dir eine Einschätzung mit Modell-Vermutung (Midjourney, DALL-E, Stable Diffusion, FLUX). Kostenlos im App Store und Play Store.

  • Stärken: Sofort einsatzbereit auf dem Handy, gute UX für Social-Media-Checks.
  • Schwächen: Limitierte Trefferquote bei neuesten Modellen, gelegentliche Falsch-Positive bei stark bearbeiteten Fotos.
  • Preis: Free mit In-App-Purchases für unlimited Scans.

Sensity – Deepfake-Spezialist

Sensity aus Amsterdam ist seit Jahren das europäische Schwergewicht für Deepfake-Detection in Bild, Video und Audio. Kunden sind unter anderem Banken, Behörden und Telekommunikationsunternehmen.

  • Stärken: Sehr stark bei Face-Swap-Videos und synthetischen Stimmen. EU-DSGVO-konform.
  • Schwächen: Reines B2B-Angebot, kein Self-Service.
  • Preis: Enterprise, auf Anfrage.

DeepMedia – Video-Detektion in Echtzeit

DeepMedia aus den USA hat Verträge mit dem US-Verteidigungsministerium und mehreren Nachrichtenagenturen. Spezialisiert auf Frame-by-Frame-Analyse von Video-Inhalten – inklusive Sora-2- und Veo-3-Detection.

  • Stärken: Eine der wenigen Lösungen, die explizit auf Sora-Frames trainiert sind.
  • Schwächen: Reine Enterprise-Lösung, keine öffentliche Demo.
  • Preis: Auf Anfrage.

Content Authenticity Initiative / C2PA – Der Metadaten-Standard

C2PA (Coalition for Content Provenance and Authenticity) ist kein Detektor, sondern eine Signatur. Gegründet von Adobe, Microsoft, BBC und Sony, inzwischen unterstützt von OpenAI, Google, Meta, Leica, Canon, Nikon und Sony-Kameras. Ein C2PA-Tag dokumentiert kryptografisch signiert: Kamera, Bearbeitungsschritte, KI-Generierung.

  • Stärken: Wenn vorhanden, ist die Herkunft eindeutig. ChatGPT-Bilder und Adobe-Firefly-Bilder tragen den Tag standardmäßig.
  • Schwächen: Bei Recompression (Screenshot, WhatsApp) gehen die Daten verloren. Midjourney und FLUX setzen den Tag nicht.
  • Tool: contentcredentials.org/verify – kostenlos.

Google SynthID – Unsichtbares Wasserzeichen

SynthID ist Googles Antwort auf das Wasserzeichen-Problem. In jedes Imagen-Bild (und seit 2025 auch in Veo-3-Video-Frames) wird ein unsichtbares Muster eingebettet, das auch nach Crop, Recompression und leichter Bearbeitung erhalten bleibt. Erkennung läuft über Googles SynthID-Detector.

  • Stärken: Robust gegen Bearbeitung, kein sichtbarer Eingriff.
  • Schwächen: Funktioniert nur für Google-eigene Modelle. Midjourney, FLUX, OpenAI nutzen es nicht.
  • Zugang: Detector aktuell für Vertrauenstester über Google AI Studio.

Vier manuelle Checks, die 2026 noch funktionieren

Tools sind die eine Seite. Drei Jahre Praxis haben mir gezeigt: vier manuelle Checks fangen einen großen Teil der KI-Bilder, an denen Detektoren scheitern.

  1. Reflexionen prüfen. Augen, Pupillen, Brillengläser, Schaufenster, Wasser-Oberflächen, Chrom-Details an Autos. KI-Modelle rendern Reflexionen häufig inkonsistent – das gespiegelte Bild passt nicht zur Szene, oder zwei Augen zeigen unterschiedliche Reflektions-Muster.
  2. Text und Logos. Schrift in KI-Bildern wirkt 2026 oft "fast richtig" – Buchstaben sehen passend aus, ergeben aber kein echtes Wort. Markenlogos auf T-Shirts, Kaffeebechern oder Plakaten im Hintergrund sind ein Klassiker.
  3. Schatten und Lichtquellen. Wenn das Hauptlicht von links oben kommt, müssen alle Schatten dieselbe Richtung und ungefähr dieselbe Härte haben. KI-Bilder mit komplexen Szenen zeigen oft zwei Lichtquellen, die in der Realität nicht zusammen vorkämen.
  4. Reverse-Image-Search. Google Lens, TinEye, Yandex. Wenn ein Bild schon vor Mitte 2022 im Index war, ist es kein Diffusion-Model-Bild. Das ist der schnellste Hard-Filter überhaupt – und der unterschätzteste.

Was 2026 nicht mehr funktioniert

Drei Heuristiken aus der 2023er-Schule solltest du aus deinem Erkennungs-Repertoire streichen:

  • Sechs-Finger-Methode. Tot. Midjourney V7, FLUX 1.1 Pro und GPT-Image-1 rendern Hände korrekt in der überwiegenden Mehrheit der Fälle.
  • Verschwommene Hintergründe. War 2023 ein Indiz, ist 2026 ein bewusstes Stilmittel. Bokeh-Effekte werden von KI-Modellen gezielt simuliert.
  • "AI-Glow." Der typische weiche, leicht überstrahlte Look früher KI-Bilder ist 2026 abschaltbar. Foto-Realismus-Modi liefern matt-realistische Bilder ohne diesen Bias.

Wer noch nach diesen Mustern sucht, übersieht 2026 deutlich mehr KI-Bilder, als er erkennt.

Wo Detektoren versagen

Auch der beste Stack hat Lücken. Sechs Szenarien, in denen 2026 alle aktuellen Detektoren überfordert sind:

  1. Sora-2- und Veo-3-Frames in 1080p, komprimiert für Instagram Reels.
  2. Inpainting-Eingriffe: Foto ist echt, KI hat nur ein Element ergänzt oder ersetzt (häufig bei manipulierten Pressefotos).
  3. Style-Transfer: Foto ist echt, wurde aber durch ein KI-Modell durchgereicht, das den Look verändert (etwa Stable-Diffusion-img2img).
  4. Heavy Compression: WhatsApp-Forwards, LinkedIn-Crops, Screenshots von Screenshots. Die Signaturen, auf die Detektoren reagieren, gehen verloren.
  5. Open-Source-Modelle in Fine-Tuning-Varianten: FLUX, Stable Diffusion und LLaVA gibt es in tausenden Community-Forks, die Detektoren nicht kennen.
  6. Hybride Workflows: Foto, dann Photoshop, dann Firefly, dann wieder Photoshop. Der Detektor sieht teils echte, teils synthetische Statistik – Ergebnis ist "uncertain".

Drei-Schritte-Routine für den Ernstfall

Wenn du im Job ein verdächtiges Bild siehst – etwa in einer Krisenkommunikation, im PR-Briefing oder vor dem Posten auf LinkedIn – nutze diese Routine:

  1. Quelle prüfen. Reverse-Image-Search bei Google Lens und TinEye. Älteres Bild? Kein Sora-Frame.
  2. Zwei Detektoren befragen. Hive Demo plus AI or Not. Stimmen beide überein, ist die Aussage belastbar. Widersprechen sie sich, ist es ein Fall für den dritten Check.
  3. Content Credentials checken. contentcredentials.org/verify. Wenn ein C2PA-Tag vorhanden ist, ist die Herkunft eindeutig.

Bringt keine der drei Quellen Klarheit: Im Zweifel nicht teilen. Quelle nennen, Herkunft transparent machen. Das ist 2026 keine Schwäche, sondern Standard – die Süddeutsche Zeitung, die ARD und die NZZ kennzeichnen unsichere Bilder inzwischen ebenfalls.

Anwendungsfälle: Wer braucht KI-Bild-Erkennung 2026?

  • PR und Krisenkommunikation: Bevor ein Statement zu einem viralen Bild rausgeht, muss die Herkunft geklärt sein.
  • Newsroom und Redaktion: Wire-Service-Bilder, User-Submitted-Content, Social-Media-Quellen. Reuters und AP haben dafür eigene Detection-Workflows etabliert.
  • HR und Recruiting: KI-generierte Bewerbungs-Fotos sind 2026 Alltag. Für Identitätsprüfungen reicht das Bewerbungsfoto nicht mehr.
  • Marketing und Personal Branding: Wenn du Stockfotos kuratierst oder externe Bilder einbettest, ist KI-Slop ein Reputationsrisiko.
  • Compliance und Legal: Beweis-Bilder in Versicherungsfällen, Schadens-Dokumentationen, Bild-basierte Verträge.

Verwandte Artikel

Mehr Beiträge in deinem Posteingang

Wöchentlich filtere ich, was zählt.

Über 45.000 Marketer:innen lesen den KI-Newsletter. Kein Hype, keine Affiliate-Kaskade — nur das, was wirklich weiterhilft.

Newsletter abonnieren