Chief AI Officer 2026: ¿Real papel o el próximo título ejecutivo?
Tobias Massow
⏱️ 9 Min. de lectura El Chief AI Officer es la función ejecutiva de nivel C más anunciada y, ...
Backblaze publica su informe anual 2025 sobre fallos de discos duros, ofreciendo así una de las bases de datos más extensas y accesibles públicamente para los responsables de TI que trabajan con infraestructuras de almacenamiento. El análisis de más de 337.000 unidades muestra que la tasa anual de fallos media sigue descendiendo, aunque entre modelos y fabricantes concretos persisten diferencias significativas.
Para los directores de información (CIO) y demás responsables de TI encargados de definir estrategias de almacenamiento para centros de datos, planes de copia de seguridad o infraestructuras híbridas, estos datos son mucho más que una mera nota técnica. Constituyen una base objetiva para tomar decisiones fundamentadas en materia de adquisición, planificación de capacidad y gestión de riesgos.

El proveedor de almacenamiento en la nube Backblaze opera su infraestructura con discos duros comerciales estándar y documenta meticulosamente, desde hace años, qué modelos fallan y cuáles no. El informe correspondiente al año completo de 2025 registra una tasa anual de fallos (Annualized Failure Rate, AFR) media del 1,36 %. El año anterior este valor era del 1,55 %: una reducción perceptible que probablemente se deba a una mejora de la calidad de fabricación, al uso creciente de discos duros para servidores de alta calidad y a la retirada progresiva de modelos antiguos.
En el cuarto trimestre de 2025, la AFR incluso descendió hasta el 1,13 %, tras haber sido del 1,55 % en el tercer trimestre. Estas fluctuaciones trimestrales no son inusuales y dependen, entre otros factores, de la antigüedad de las unidades instaladas, de influencias estacionales y del ciclo de sustitución. En total, fallaron 943 unidades en el cuarto trimestre: lo que equivale a aproximadamente diez sustituciones diarias de discos duros, que los técnicos de Backblaze tuvieron que realizar.
Un claro patrón emerge en cuanto a las capacidades empleadas: los modelos de 14 a 16 terabytes ya representan más del 52 % del parque total de unidades. Esto refleja la lógica económica vigente en los grandes centros de datos: una mayor capacidad por unidad implica menos unidades físicas, menos ranuras de conexión, menor consumo energético por terabyte almacenado y, por regla general, también unos costes operativos más bajos.
Por primera vez, Backblaze integró también discos duros de 26 terabytes en su flota. En su primer trimestre de uso, estos registraron una AFR notablemente baja del 0,40 %. Sin embargo, con unidades tan recientes hay que actuar con cautela: la base de datos aún es escasa, y los discos duros suelen mostrar sus debilidades típicas solo tras cierto tiempo de funcionamiento. La denominada «curva de la bañera» – bajas tasas de fallo al principio y al final de la vida útil, con un riesgo elevado en la fase intermedia – es un fenómeno conocido que también se observa claramente en los datos a largo plazo de Backblaze.
Quien adquiere discos duros para infraestructuras críticas para la empresa no debe fijarse únicamente en la marca del fabricante o en la capacidad indicada. Los datos de Backblaze ilustran de forma contundente cómo varía drásticamente la fiabilidad entre distintos modelos – incluso dentro de la misma marca.
En el extremo positivo destacó el modelo Toshiba MG08ACA16TA de 16 terabytes, que alcanzó una AFR de tan solo el 0,90 % durante un período de observación estadísticamente significativo. Dos modelos de Seagate – la ST8000NM000A de 8 terabytes y la ST16000NM002J de 16 terabytes – completaron el cuarto trimestre de 2025 sin registrar ni un solo fallo.
En el otro extremo del espectro se situó la HGST HUH728080ALE600, con una AFR superior al 10 %. Estas unidades antiguas de 8 terabytes han alcanzado obviamente el final de su ciclo de vida fiable. Asimismo, llama la atención la Seagate ST10000NM0086 de 10 terabytes, cuya tasa de fallos en el informe trimestral superó el 5 %. Tales casos atípicos ponen de manifiesto que el factor edad y la generación del modelo pesan mucho más que la simple marca del fabricante.
Esto lleva a una recomendación clara para los responsables de TI: no evaluar los modelos de discos duros de forma genérica según su fabricante, sino prestar atención específica a las series de modelos concretas y a su tiempo de uso. Una gestión estructurada del ciclo de vida, que sustituya oportunamente las unidades deterioradas por el paso del tiempo, reduce de forma notable el riesgo de fallos.
Un detalle fácil de pasar por alto, pero fundamental para interpretar correctamente los datos, es el siguiente: en sus primeros años, Backblaze utilizaba principalmente discos duros de sobremesa económicos para su funcionamiento continuo en centros de datos. En aquel momento, esta fue una decisión consciente orientada a reducir costes, pero también provocó tasas de fallo más altas. Actualmente, la empresa ha redefinido radicalmente su estrategia de adquisición, utilizando casi exclusivamente discos duros para servidores, diseñados expresamente para funcionar las 24 horas del día, los 7 días de la semana, en entornos de centro de datos.
Este cambio probablemente haya contribuido de forma considerable a la tendencia descendente de la AFR en los últimos años. Los discos duros para servidores difieren de los modelos para sobremesa en aspectos esenciales de diseño: cojinetes más robustos, mejor compensación de vibraciones, firmware optimizado para funcionamiento continuo y, por regla general, periodos de garantía más largos. Para su uso en entornos empresariales – ya sea en un centro de datos propio o en escenarios de colocation – , los discos duros de sobremesa no constituyen una opción seria.
Este punto también resulta relevante para comparar los datos de Backblaze a lo largo de los años: la disminución de las tasas de fallo no refleja únicamente los avances tecnológicos en los discos duros, sino también el efecto derivado de una selección de unidades más profesional.
Con sus informes, Backblaze ofrece uno de los pocos análisis independientes y metodológicamente transparentes a largo plazo sobre fallos de discos duros. Incluso pone a disposición de todos los interesados, en su página web, los datos brutos completos, permitiendo así su verificación y posterior procesamiento. Esto no es algo habitual en el sector industrial, ya que los fabricantes rara vez publican estadísticas detalladas sobre fallos reales en condiciones de explotación.
No obstante, existen limitaciones claras: los datos proceden de un escenario de aplicación específico – almacenamiento en la nube con una carga de escritura elevada, funcionamiento continuo y unas condiciones ambientales específicas en los centros de datos de Backblaze. La temperatura, las vibraciones, los perfiles de carga de trabajo y las configuraciones de firmware pueden diferir notablemente de otros entornos de uso. Por tanto, una transferencia directa de los valores de AFR a otros centros de datos o, incluso, a sistemas NAS empresariales no es posible sin más.
Tampoco se puede deducir de estos datos una predicción fiable para una unidad individual. La estadística describe poblaciones, no individuos. Un disco duro con una AFR estadística del 0,90 % puede fallar tras seis meses – o bien funcionar sin problemas durante diez años.
La reducción de las tasas de fallo es una evolución positiva, pero no exime a los responsables de TI de su obligación de implementar estrategias sólidas de copia de seguridad y redundancia. Una AFR del 1,36 % parece baja, pero significa, estadísticamente hablando, unos 14 fallos anuales en un parque de 1.000 discos duros. En una empresa que, por ejemplo, gestione 500 unidades en un clúster de almacenamiento, esto supone todavía varios fallos con los que hay que lidiar de forma concreta.
Las configuraciones RAID, la codificación por borrado (Erasure Coding), las comprobaciones periódicas de integridad y un ciclo de sustitución bien planificado siguen siendo indispensables. Asimismo, las empresas que apuesten por soluciones de almacenamiento on-premises deberían implantar un monitorización de los valores SMART de sus unidades, para detectar con antelación posibles fallos inminentes.
Para las empresas que deban decidir entre almacenamiento on-premises y almacenamiento en la nube, los datos de Backblaze ofrecen un cálculo interesante: el esfuerzo asociado a la gestión de unidades – adquisición, monitorización, sustitución, mantenimiento de stock de repuestos – se acumula. Los proveedores de almacenamiento en la nube asumen este esfuerzo operativo, lo cual puede convertirse en un factor relevante en el análisis del coste total de propiedad (Total Cost of Ownership, TCO).
El informe anual 2025 de Backblaze confirma una tendencia positiva: los discos duros se vuelven más fiables, especialmente en el segmento de servidores y entre las generaciones más recientes de modelos. La consolidación hacia mayores capacidades reduce simultáneamente el número total de unidades necesarias – y, por tanto, el número de candidatos potenciales a fallo.
Sin embargo, los datos también evidencian con claridad que existen diferencias notables entre modelos concretos. Los directivos de TI responsables de la infraestructura de almacenamiento deben tener en cuenta estas diferencias al tomar decisiones de adquisición y no basarse únicamente en las promesas genéricas de los fabricantes. Una mirada fundamentada en datos reales sobre las tasas de fallo – como la que permite Backblaze – constituye una herramienta valiosa para adoptar decisiones bien fundadas.
Al final, prevalece una verdad sencilla: ninguna mejora técnica sustituye una estrategia sólida de copia de seguridad. Los discos duros fallan, y estadísticamente lo hacen con regularidad. Quien esté preparado para ello obtiene una ventaja estratégica frente a quienes confíen únicamente en la reducción de las tasas de fallo.
La tasa anual de fallos (AFR) indica la probabilidad anual estimada de fallo de un disco duro. Se calcula a partir del número observado de fallos en relación con el número total de días de funcionamiento. Backblaze determinó para 2025 una AFR media del 1,36 % para todas las unidades instaladas.
En el informe de 2025 destacaron la Toshiba MG08ACA16TA (AFR del 0,90 %) y los modelos de Seagate ST8000NM000A y ST16000NM002J, que no registraron ningún fallo en el cuarto trimestre. Los nuevos modelos de 26 TB mostraron, en su primer trimestre de uso, una AFR de tan solo el 0,40 %.
Los discos duros para servidores están diseñados para funcionar las 24 horas del día, los 7 días de la semana, y cuentan con cojinetes más robustos, una mejor compensación de vibraciones y un firmware optimizado para funcionamiento continuo. Los modelos para sobremesa están pensados para un uso esporádico y presentan tasas de fallo claramente más altas cuando se someten a funcionamiento continuo.
Solo de forma limitada. Los datos de Backblaze provienen de un escenario específico de almacenamiento en la nube, con una carga de escritura elevada y unas condiciones ambientales determinadas. La temperatura, las vibraciones y los perfiles de carga de trabajo pueden diferir considerablemente en otros centros de datos o entornos NAS. No obstante, dichos datos sí sirven como orientación para las decisiones de adquisición.
La curva de la bañera describe el comportamiento típico de fallos de los discos duros a lo largo de su vida útil: tasas relativamente bajas al inicio (excluida la mortalidad infantil), un riesgo elevado en la fase intermedia de funcionamiento y un nuevo aumento de fallos al final de la vida útil debido al desgaste.
Las configuraciones RAID, la codificación por borrado (Erasure Coding), las comprobaciones periódicas de integridad, la monitorización SMART y una gestión estructurada del ciclo de vida siguen siendo indispensables. Incluso con una AFR del 1,36 %, 1.000 unidades implican estadísticamente unos 14 fallos anuales.
No necesariamente. La fiabilidad depende mucho más del modelo concreto, de su generación y de su antigüedad que de su capacidad. No obstante, mayores capacidades reducen el número total de unidades necesarias y, por tanto, el número estadístico de posibles fallos en el sistema global.
Fuente de imagen: Unsplash