Build, Buy oder Partner: die Rechnung davor
Eva Mickler
7 Min. Lesezeit Die teuerste Build-vs-Buy-Entscheidung ist die, die niemand bewusst getroffen hat. In ...
Der britische Engineering-Konzern Arup verlor 22,0 Millionen Euro durch einen einzigen Deepfake-Videocall. Der Angreifer hatte CFO und Kollegen per KI nachgestellt. Ein Finanzangestellter überwies 15 Mal an einem Tag. Der Fall ist kein Einzelfall mehr: Voice-Cloning-Betrug stieg 2025 um 680 Prozent. Für CIOs und Vorstände wird Deepfake-Schutz zur persönlichen Sicherheitsfrage.
Im Januar 2024 erhielt ein Finanzangestellter des britischen Engineering-Konzerns Arup in der Hongkonger Niederlassung eine verdächtige E-Mail. Um seine Bedenken zu zerstreuen, wurde er zu einem Videocall eingeladen. Auf dem Bildschirm sah und hörte er seinen CFO und mehrere Kollegen. Alle sprachen überzeugend, reagierten auf Fragen und gaben Anweisungen für Überweisungen. Der Mitarbeiter führte 15 Transfers an fünf verschiedene Hongkonger Konten durch, insgesamt 22,0 Millionen Euro.
Keiner der Teilnehmer im Call war real. Alle waren KI-generierte Deepfakes, erstellt aus öffentlich zugänglichen Video- und Audioaufnahmen. Der Angriff wurde erst Stunden später entdeckt. Die Hongkonger Polizei machte den Fall im Februar 2024 öffentlich, Arup bestätigte im Mai 2024 seine Betroffenheit. Der Fall demonstriert, wie weit Deepfake-Technologie fortgeschritten ist: nicht mehr nur einzelne gefälschte Videos, sondern interaktive Echtzeit-Videocalls mit mehreren KI-generierten Teilnehmern.
Arup ist kein kleines Unternehmen ohne IT-Sicherheit. Es ist ein globaler Konzern mit über 18.000 Mitarbeitern, bekannt unter anderem für die Statik des Sydney Opera House. Wenn Arup getäuscht werden kann, kann jedes Unternehmen getäuscht werden. Die Frage ist nicht ob, sondern wann ein vergleichbarer Angriff das eigene Unternehmen trifft.
Die Statistiken sind eindeutig. Voice-Cloning-Betrug ist 2025 um 680 Prozent gegenüber dem Vorjahr gestiegen. Angreifer brauchen nur drei Sekunden Audiomaterial, um eine Stimmkopie mit 85 Prozent Übereinstimmung zu erzeugen. LinkedIn-Videos, Podcast-Auftritte, Konferenzmitschnitte und interne Webinare liefern das Rohmaterial kostenlos.
CEO-Fraud, also die gezielte Täuschung von Mitarbeitern durch die Imitation von Führungskräften, trifft laut Branchenberichten täglich mindestens 400 Unternehmen weltweit. 64 Prozent der US-Unternehmen waren 2024 von einem Business-Email-Compromise-Angriff betroffen, mit durchschnittlichen Verlusten von 129.000 Euro pro Vorfall. Deepfakes erhöhen die Erfolgsquote dieser Angriffe erheblich, weil sie das letzte Sicherheitsnetz der Mitarbeiter aushebeln: die visuelle und akustische Verifikation.
„Es gibt ein fundamentales Problem mit Sicherheit und Datenschutz, das den Hype um KI-Agenten überschattet.“
Meredith Whittaker, Präsidentin Signal (SXSW, März 2025)
Besonders beunruhigend: 80 Prozent der Unternehmen haben keine etablierten Protokolle oder Reaktionspläne für Deepfake-basierte Angriffe. Klassische Security-Awareness-Trainings fokussieren auf Phishing-Mails und Social Engineering via Text. Die Verteidigung gegen audiovisuelle Täuschung ist in den meisten Organisationen nicht vorgesehen. In Italien traf Anfang 2025 eine koordinierte Deepfake-Angriffswelle prominente Unternehmer: Kriminelle imitierten den Verteidigungsminister und erbeuteten mindestens 1 Million Euro von einem einzelnen Opfer.
Quellen: Deepstrike.io 2025, Fortune/CNN 2024, Branchenberichte
Vorstände und Geschäftsführer sind die bevorzugten Ziele für Deepfake-Angriffe, aus drei Gründen. Erstens: Ihre Stimmen und Gesichter sind öffentlich verfügbar. Keynotes, Interviews, Podcasts, LinkedIn-Videos und Aktionärsversammlungen liefern hochwertiges Audio- und Videomaterial für das Training von Deepfake-Modellen. Je prominenter eine Führungskraft, desto leichter ist die Fälschung.
Zweitens: Anweisungen von Vorständen werden seltener hinterfragt. In hierarchischen Organisationen ist die Hemmschwelle, eine Anweisung des CEO oder CFO in Frage zu stellen, hoch. Deepfake-Angreifer nutzen diese Dynamik gezielt aus. Der Arup-Fall zeigt: Selbst bei initialen Zweifeln reichte ein überzeugender Videocall, um den Mitarbeiter zur Ausführung zu bewegen.
Drittens: DACH-Unternehmen mit flachen Hierarchien sind besonders exponiert. In vielen mittelständischen Unternehmen hat der CFO direkten Zugang zu Überweisungssystemen. Es gibt kein Vier-Augen-Prinzip für Transfers unter 100.000 Euro. Ein einziger erfolgreich getäuschter Finanzverantwortlicher kann in Minuten sechsstellige Beträge überweisen, ohne dass ein zweiter Mensch zustimmt.
Ebene 1: Technische Erkennung. Spezialisierte Software kann Deepfake-Videos und -Audio in Echtzeit analysieren. Tools wie Pindrop, Sensity AI oder Resemble Detect prüfen auf Artefakte in Sprache und Bild, die für das menschliche Auge und Ohr unsichtbar sind. Die Erkennungsraten liegen bei 85 bis 95 Prozent, variieren aber je nach Qualität der Fälschung. CIOs sollten diese Tools in ihre Security-Architektur integrieren, insbesondere für Videocall-Plattformen und Telefonsysteme.
Ebene 2: Organisatorische Protokolle. Für alle Finanztransaktionen über einer definierten Schwelle muss ein Verifizierungsprotokoll gelten, das nicht per Video oder Audio umgangen werden kann. Konkret: Rückruf auf eine hinterlegte Festnetznummer (nicht die im Deepfake-Call genannte), Bestätigung per verschlüsseltem Messenger mit vorab vereinbartem Code-Wort oder persönliche Freigabe durch einen zweiten Berechtigten. Diese Protokolle müssen schriftlich fixiert, dem gesamten Finanzteam bekannt und regelmäßig getestet werden.
Ebene 3: Awareness-Training. Mitarbeiter müssen wissen, dass Deepfakes existieren und wie sie funktionieren. Klassische Phishing-Trainings reichen nicht. CIOs sollten spezifische Deepfake-Awareness-Module einführen, die Beispiele zeigen und die Erkennungsmerkmale schulen: unnatürliche Mundbewegungen, Latenz zwischen Lippenbewegung und Ton, fehlende Reaktion auf unerwartete Fragen und merkwürdige Beleuchtung. Das wichtigste Learning: Wenn eine Anweisung ungewöhnlich ist, muss hinterfragt werden, unabhängig davon, wer sie gibt und wie überzeugend die Person aussieht oder klingt.
Ebene 4: Reduktion des öffentlichen Fußabdrucks. CIOs und CISOs sollten gemeinsam mit der Kommunikationsabteilung prüfen, wie viel Audio- und Videomaterial von Vorständen öffentlich verfügbar ist. Nicht alles lässt sich entfernen, aber die Menge kann reduziert werden. Interne Meetings sollten nicht aufgezeichnet werden, wenn nicht nötig. Aufnahmen von Vorstandspräsentationen sollten nicht ungeschützt auf YouTube oder der Unternehmenswebsite stehen. Jede Minute öffentlich verfügbares Material ist eine Minute Trainingsmaterial für Angreifer.
Deepfake-Schutz ist kein Nischen-Thema für die Security-Abteilung. Es ist ein Board-Thema. Die persönliche Haftung der Geschäftsleitung unter NIS2 verschärft die Lage: Wenn nachweislich keine angemessenen Schutzmaßnahmen gegen eine bekannte Bedrohung getroffen wurden, kann das als grobe Fahrlässigkeit gewertet werden.
Für CIOs bedeutet das konkret: Bis Q2 2026 sollte eine Deepfake-Risikoanalyse für die eigene Organisation vorliegen. Wer sind die exponiertesten Personen? Wie viel öffentliches Material existiert? Welche Finanztransaktionsprozesse sind verwundbar? Auf Basis dieser Analyse entstehen Verifizierungsprotokolle, Erkennungstools werden evaluiert und Awareness-Trainings ausgerollt. Die Kosten sind überschaubar im Vergleich zu einem erfolgreichen Angriff. Arup hat 22,0 Millionen Euro verloren. Ein Deepfake-Schutzprogramm für ein mittelständisches Unternehmen liegt bei einem Bruchteil davon.
Angreifer nutzen öffentlich verfügbares Audio- und Videomaterial von Führungskräften, um deren Stimme und Gesicht per KI nachzubilden. Das wird in Echtzeit-Videocalls oder Sprachnachrichten eingesetzt, um Mitarbeiter zu Überweisungen oder Datenherausgabe zu bewegen. Die Qualität ist so hoch, dass sie für das menschliche Auge und Ohr nicht als Fälschung erkennbar ist.
Drei Sekunden Audiomaterial reichen für eine 85-prozentige Stimmkopie. Längere Aufnahmen verbessern die Qualität. Quellen: Interviews, Podcasts, Konferenz-Keynotes, LinkedIn-Videos und aufgezeichnete Webinare.
Spezialisierte Software erreicht Erkennungsraten von 85 bis 95 Prozent. Menschliche Erkennung ist deutlich schwieriger. Merkmale: unnatürliche Mundbewegungen, Latenz zwischen Bild und Ton, fehlende Reaktion auf unerwartete Fragen und merkwürdige Beleuchtungswechsel. Die beste Verteidigung ist jedoch nicht Erkennung, sondern Verifizierungsprotokolle.
Ein Vier-Augen-Prinzip für alle Finanztransaktionen über einer definierten Schwelle, kombiniert mit einem Rückruf auf eine hinterlegte Festnetznummer. Keine Überweisung darf allein auf Basis eines Videocalls oder einer Sprachnachricht ausgeführt werden, egal wie überzeugend die Person erscheint.
Ja, besonders der Mittelstand. Flache Hierarchien mit direktem CFO-Zugang zu Überweisungssystemen, fehlende Dual-Authorization für Transaktionen unter 100.000 Euro und eine Kultur, in der Anweisungen von Vorgesetzten selten hinterfragt werden, machen deutsche Mittelständler zu idealen Zielen für Deepfake-CEO-Fraud.
Quelle Titelbild: Tima Miroshnichenko / Pexels
Sie müssen den Inhalt von reCAPTCHA laden, um das Formular abzuschicken. Bitte beachten Sie, dass dabei Daten mit Drittanbietern ausgetauscht werden.
Mehr InformationenSie sehen gerade einen Platzhalterinhalt von Turnstile. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenSie sehen gerade einen Platzhalterinhalt von Facebook. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenSie sehen gerade einen Platzhalterinhalt von Instagram. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr InformationenSie sehen gerade einen Platzhalterinhalt von X. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Mehr Informationen