Servicios de Ciberseguridad Gestionados: El CISO no asume la responsabilidad exclusiva
Benedikt Langer
8 Min. de lectura En muchas empresas, el CISO es considerado la persona responsable de la seguridad. ...
4 min de lectura
El grupo británico de ingeniería Arup perdió 25,6 millones de dólares mediante una única llamada de videollamada con deepfake. El atacante había replicado mediante IA al director financiero (CFO) y a colegas. Un empleado financiero realizó 15 transferencias en un solo día. Este caso ya no es una excepción: el fraude mediante clonación de voz aumentó un 680 por ciento en 2025. Para los directores de tecnología (CIO) y los miembros de los consejos de administración, la protección contra deepfakes se ha convertido en una cuestión de seguridad personal.
En enero de 2024, un empleado financiero de la filial de Hong Kong del grupo británico de ingeniería Arup recibió un correo electrónico sospechoso. Para disipar sus dudas, se le invitó a participar en una videollamada. En la pantalla vio y escuchó a su director financiero (CFO) y a varios colegas. Todos hablaban de forma convincente, respondían a preguntas y daban instrucciones para realizar transferencias. El empleado llevó a cabo 15 transferencias a cinco cuentas bancarias distintas de Hong Kong, por un total de 25,6 millones de dólares.
Ninguno de los participantes en la videollamada era real. Todos eran deepfakes generados mediante inteligencia artificial, creados a partir de grabaciones de vídeo y audio disponibles públicamente. El ataque no se descubrió hasta varias horas después. La policía de Hong Kong hizo público el caso en febrero de 2024, y Arup confirmó su implicación en mayo de 2024. Este caso demuestra hasta qué punto ha avanzado la tecnología de deepfakes: ya no se trata únicamente de vídeos falsos aislados, sino de videollamadas interactivas en tiempo real con múltiples participantes generados mediante IA.
Arup no es una pequeña empresa sin medidas de ciberseguridad. Es un grupo global con más de 18.000 empleados, conocido, entre otras cosas, por haber calculado la estructura estática de la Ópera de Sídney. Si Arup puede ser engañado, cualquier empresa puede serlo. La cuestión ya no es si, sino cuándo un ataque similar afectará a su propia organización.
Las estadísticas son inequívocas. El fraude mediante clonación de voz aumentó un 680 % en 2025 respecto al año anterior. Los atacantes necesitan tan solo tres segundos de material de audio para generar una copia de voz con una coincidencia del 85 %. Los vídeos de LinkedIn, las apariciones en podcasts, las grabaciones de conferencias y los webinarios internos proporcionan gratuitamente el material bruto necesario.
El «CEO-Fraud», es decir, la engañosa manipulación intencionada de empleados mediante la imitación de altos directivos, afecta, según informes del sector, a un mínimo de 400 empresas diariamente en todo el mundo. El 64 % de las empresas estadounidenses sufrieron en 2024 un ataque de compromiso de correo electrónico empresarial (BEC), con pérdidas medias de 150.000 dólares por incidente. Los deepfakes incrementan considerablemente la tasa de éxito de estos ataques, ya que socavan la última red de seguridad de los empleados: la verificación visual y acústica.
«Existe un problema fundamental de seguridad y privacidad de datos que eclipsa el entusiasmo por los agentes de IA».
Meredith Whittaker, presidenta de Signal (SXSW, marzo de 2025)
Particularmente inquietante: el 80 % de las empresas carece de protocolos establecidos o planes de respuesta ante ataques basados en deepfakes. Las tradicionales campañas de formación en concienciación sobre seguridad se centran en los correos electrónicos de phishing y el ingenio social mediante texto. En la mayoría de las organizaciones, la defensa contra la manipulación audiovisual no está contemplada. A principios de 2025, una oleada coordinada de ataques con deepfake afectó en Italia a destacados empresarios: los criminales imitaron al ministro de Defensa y sustrajeron al menos 1 millón de euros a una sola víctima.
Fuentes: Deepstrike.io 2025, Fortune/CNN 2024, informes del sector
Los miembros de los consejos de administración y los directivos son los objetivos preferidos de los ataques con deepfake, por tres razones. Primero: sus voces y rostros están disponibles públicamente. Las intervenciones en conferencias, entrevistas, podcasts, vídeos de LinkedIn y asambleas de accionistas ofrecen material de audio y vídeo de alta calidad para entrenar modelos de deepfake. Cuanto más prominente sea un directivo, más fácil será su falsificación.
Segundo: las órdenes emitidas por los miembros de los consejos de administración se cuestionan con menor frecuencia. En las organizaciones jerárquicas, la barrera psicológica para poner en duda una instrucción del CEO o del CFO es elevada. Los atacantes que utilizan deepfakes aprovechan esta dinámica de forma deliberada. El caso Arup demuestra: incluso ante dudas iniciales, una videollamada convincente bastó para que el empleado llevara a cabo las acciones solicitadas.
Tercero: las empresas de DACH (Alemania, Austria y Suiza) con estructuras jerárquicas planas están particularmente expuestas. En muchas pymes, el CFO tiene acceso directo a los sistemas de transferencia. No existe un principio de doble verificación para transferencias inferiores a 100.000 euros. Un único responsable financiero engañado con éxito puede transferir cantidades de seis cifras en cuestión de minutos, sin que ninguna otra persona deba dar su conformidad.
Nivel 1: Detección técnica. Software especializado puede analizar vídeos y audios con deepfake en tiempo real. Herramientas como Pindrop, Sensity AI o Resemble Detect examinan artefactos en el habla y la imagen que resultan invisibles para el ojo y el oído humanos. Las tasas de detección oscilan entre el 85 % y el 95 %, aunque varían según la calidad de la falsificación. Los CIO deben integrar estas herramientas en su arquitectura de seguridad, especialmente en plataformas de videollamadas y sistemas telefónicos.
Nivel 2: Protocolos organizativos. Para todas las transacciones financieras superiores a un umbral definido debe aplicarse un protocolo de verificación que no pueda eludirse mediante vídeo ni audio. Concretamente: devolución de llamada a un número fijo registrado previamente (no al número mencionado en la videollamada con deepfake), confirmación mediante mensajería cifrada con una palabra clave acordada previamente o autorización presencial por parte de una segunda persona autorizada. Estos protocolos deben quedar formalizados por escrito, comunicarse a todo el equipo financiero y someterse periódicamente a pruebas.
Nivel 3: Formación en concienciación. Los empleados deben saber que los deepfakes existen y cómo funcionan. Las tradicionales campañas de formación contra el phishing no son suficientes. Los CIO deben introducir módulos específicos de concienciación sobre deepfakes que muestren ejemplos prácticos y enseñen a identificar sus señales reveladoras: movimientos bucales antinaturales, latencia entre el movimiento labial y el sonido, ausencia de reacción ante preguntas inesperadas y iluminación extraña. La lección más importante: si una instrucción resulta inusual, debe cuestionarse, independientemente de quién la emita y de lo convincente que parezca su apariencia o su voz.
Nivel 4: Reducción de la huella pública. Los CIO y los CISO deben colaborar con el departamento de comunicación para evaluar cuánto material de audio y vídeo de los directivos está disponible públicamente. No todo puede eliminarse, pero sí reducirse su volumen. Las reuniones internas no deben grabarse si no es estrictamente necesario. Las grabaciones de presentaciones de los consejos de administración no deben publicarse sin protección en YouTube o en la página web corporativa. Cada minuto de material disponible públicamente constituye un minuto de material de entrenamiento para los atacantes.
La protección contra deepfakes no es un tema marginal para el departamento de seguridad. Es un tema para el consejo de administración. La responsabilidad personal de la dirección ejecutiva bajo el marco normativo NIS2 agrava aún más la situación: si se demuestra que no se adoptaron medidas adecuadas de protección frente a una amenaza conocida, ello podría considerarse una negligencia grave.
Para los CIO esto significa concretamente: antes del segundo trimestre de 2026 debe estar disponible un análisis de riesgos relacionado con deepfakes para la propia organización. ¿Quiénes son las personas más expuestas? ¿Cuánto material público existe? ¿Qué procesos de transacciones financieras son vulnerables? Sobre la base de este análisis se elaborarán protocolos de verificación, se evaluarán herramientas de detección y se implementarán programas de formación en concienciación. Los costes son razonables comparados con los de un ataque exitoso. Arup perdió 25,6 millones de dólares. Un programa integral de protección contra deepfakes para una pyme representa una fracción mínima de esa cantidad.
Los atacantes utilizan material de audio y vídeo de directivos disponible públicamente para replicar mediante IA su voz y su rostro. Esto se emplea en videollamadas en tiempo real o mensajes de voz para inducir a los empleados a realizar transferencias o entregar datos. La calidad es tan alta que resulta indistinguible para el ojo y el oído humanos.
Tan solo tres segundos de material de audio bastan para crear una copia de voz con una similitud del 85 %. Grabaciones más largas mejoran la calidad. Fuentes: entrevistas, podcasts, intervenciones en conferencias, vídeos de LinkedIn y webinarios grabados.
El software especializado alcanza tasas de detección del 85 % al 95 %. La detección humana es notablemente más difícil. Señales reveladoras: movimientos bucales antinaturales, latencia entre imagen y sonido, ausencia de reacción ante preguntas inesperadas y cambios extraños en la iluminación. Sin embargo, la mejor defensa no es la detección, sino los protocolos de verificación.
Un principio de doble verificación para todas las transacciones financieras superiores a un umbral definido, combinado con una devolución de llamada a un número fijo registrado previamente. Ninguna transferencia debe ejecutarse exclusivamente sobre la base de una videollamada o un mensaje de voz, por muy convincente que parezca la persona que aparece.
Sí, especialmente las pymes. Las estructuras jerárquicas planas, con acceso directo del CFO a los sistemas de transferencia; la ausencia de autorización dual para transacciones inferiores a 100.000 euros; y una cultura en la que rara vez se cuestionan las órdenes de los superiores convierten a las pymes alemanas en objetivos ideales para el fraude CEO-Fraud con deepfake.
Fuente de imagen: Tima Miroshnichenko / Pexels