VMware en 2026: cuatro vías tras el cambio de Broadcom

Virtualización · Infraestructura · 2026

VMware en 2026: cuatro vías tras el cambio de modelo de Broadcom.

Si tu vSphere 7 u 8 va como un tiro, no tienes ninguna obligación de tocarlo. Punto. Lo que cambió es el modelo de licencias, no la plataforma — y hay cuatro vías razonables: seguir con Broadcom, mantener lo que tienes con soporte de terceros (third-party support), migrar a Proxmox o saltar a OpenShift. La decisión sobre cuándo —o si— actualizar vuelve a tu lado. Nosotros llevamos cualquiera de las cuatro.

10 min lecturaGuía

En 30 segundos: hay cuatro vías razonables para tu VMware en 2026 — seguir con Broadcom (VCF/VVF), mantener tu vSphere con soporte de terceros, migrar a Proxmox VE o saltar a OpenShift Virtualization. Las cuatro funcionan; el encaje depende de tu pila, tu calendario y cuánto presupuesto te apetece atar al fabricante.

Llevamos VMware desde antes de que existiera Broadcom y desde que existe Broadcom. Hacemos también soporte de terceros para tu pila empresarial, migraciones a Proxmox y a OpenShift, y formación oficial en lo que toque. No tenemos caballo ganador — tenemos clientes muy distintos, y este post es lo que les contamos cuando preguntan "¿y yo qué hago?".

4
Vías razonables
en 2026
2023
Adquisición de VMware
por Broadcom
15+
Años de SIXE
en virtualización empresarial
01 · Contexto

¿Qué ha cambiado en VMware desde la adquisición por Broadcom?

Broadcom cerró la compra de VMware el 22 de noviembre de 2023. A partir de ahí cambiaron varias cosas del modelo comercial —recogidas en el artículo oficial de Broadcom sobre cambios de portfolio—. La plataforma técnica sigue siendo la misma. Lo que cambia es cómo se contrata, no cómo funciona.

  • Fin de las licencias perpetuas nuevas. El catálogo pasó a vender suscripciones, principalmente a través de dos bundles: VMware Cloud Foundation (VCF) y VMware vSphere Foundation (VVF).
  • Reorganización del catálogo. Productos que antes se vendían por separado (vSAN, NSX, Aria) se integran en los bundles, lo que cambia el cálculo de licencias por servidor.
  • Programa de partners renovado. Los acuerdos de canal se renegociaron y muchos clientes pasaron a tratar directamente con Broadcom o con un partner de nivel superior.
  • Las licencias perpetuas existentes siguen siendo válidas: los clientes que ya las habían comprado pueden seguir usándolas, aunque sin actualizaciones nuevas si no contratan soporte.
En contexto

Es un cambio de modelo comercial, no un fallo técnico de VMware. Para algunas organizaciones la transición es asumible; para otras —especialmente las que no usan todos los componentes del bundle— la factura puede multiplicarse. Conviene hacer números antes de renovar, no después.

02 · Decisión

¿Por qué muchas empresas están repensando su VMware en 2026?

Lo escuchamos en casi todas las conversaciones — tres motivos que aparecen casi siempre juntos:

  1. La factura sube. Pasar a un bundle con piezas que no usas (vSAN, NSX, Aria) multiplica el coste por core.
  2. El reloj aprieta. Contratos plurianuales que vencen, y el típico email de "tu renovación es en 90 días, ¿confirmas?".
  3. La plataforma envejece. vSphere 7 cerró soporte general el 2 de octubre de 2025; vSphere 8 está anunciado para 2027.

No todo el mundo lo vive igual. Si tienes 3 hosts y un cluster modesto, el ajuste es asumible. Si tienes 300 hosts con vSAN extendido, abrir el abanico tiene un retorno claro y rápido. La pregunta ya no es "¿qué versión compro?"; ahora es "¿qué hago con todo lo que ya tengo desplegado y funcionando?".

03 · Las cuatro vías

¿Cuáles son tus cuatro opciones reales en 2026?

A día de hoy hay cuatro caminos razonables. No hay una respuesta universal: el encaje depende de cuánto VMware tienes, qué hace tu plataforma encima, qué equipo lo opera y qué calendario manejas.

Opción Para quién encaja Lo que ganas Lo que cuesta
1. Continuar con Broadcom (VCF / VVF)
Quien usa o necesita el bundle completo (vSAN, NSX, Aria) y tiene presupuesto para el nuevo modelo de suscripción.
Plataforma íntegra, hoja de ruta oficial, soporte directo del fabricante, acceso a nuevas versiones.
Suscripción anual, factura ligada al número de cores.
2. Mantener tu VMware con soporte de terceros
Quien está estable con vSphere 7 u 8 y quiere quedarse así varios años más, con ahorro en factura de licencias y autonomía sobre cuándo —o si— migrar.
Versión actual segura y operativa; SLA contractual; presupuesto liberado para inversión o capital humano; tiempo para evaluar Proxmox u OpenShift sin prisa.
Renunciar a nuevas versiones del fabricante y a soporte directo de Broadcom mientras dure el contrato.
3. Migrar a Proxmox VE
Equipos que buscan un hipervisor open source de propósito general equivalente a vSphere para VMs y contenedores LXC.
Plataforma abierta, sin licencias por host, con suscripciones de soporte opcionales y ecosistema empresarial maduro.
Proyecto de migración (P2V/V2V), reentrenamiento del equipo, reescritura de algunos automatismos.
4. Migrar a OpenShift Virtualization
Quien ya va hacia contenedores y Kubernetes y quiere consolidar VMs y pods en una sola plataforma.
Una sola plataforma para VMs y contenedores, integración nativa con CI/CD y red Kubernetes, soporte empresarial Red Hat/IBM.
Curva de adopción Kubernetes, rediseño de red y almacenamiento, plan de migración por oleadas.

Las cuatro funcionan. Lo que NO recomendamos: decidir a contrarreloj con la renovación encima. En ese escenario casi siempre se acaba renovando por inercia, sin haber comparado nada — y esa es la peor opción de todas, porque ni siquiera la has elegido.

Toca para seleccionar

¿Qué vía encaja contigo?

Tres preguntas rápidas y te decimos cuál de las cuatro vías tiene más sentido en tu caso. Sin recoger datos, sin pedir email — todo se calcula en tu navegador.

01¿Cuándo te vence el contrato actual con VMware?
02¿Hacia dónde mira tu plataforma en los próximos 3 años?
03¿Cómo de "VMware-pesado" es tu stack hoy?
Responde las 3 para ver el resultado
Tu recomendación inicial

04 · Vía 2 en detalle

¿Qué es el soporte de terceros (third-party support) para VMware?

No es "soporte técnico" al uso. Es lo que pasa cuando el fabricante deja de ser tu proveedor de mantenimiento y otro entra a hacer ese trabajo — nosotros, en este caso. Te mantenemos vSphere 7 u 8 estable, parcheado y con SLA contractual mientras tú decides qué hacer a largo plazo. No sustituye a las actualizaciones de versión del fabricante. Sí sustituye al contrato de mantenimiento — que es donde se va el dinero.

La gente nos contrata por cuatro motivos, en distintos órdenes:

  • Quedarse en vSphere 7 u 8 cinco o diez años más sin que nadie te apriete a actualizar. Si tu plataforma está estable, no necesitas una versión nueva — necesitas que la tuya siga segura.
  • Recuperar la palanca: el calendario lo fijas tú, no la fecha de fin de soporte general que te marca Broadcom.
  • Sacar el dinero del mantenimiento de software y meterlo donde aporta — hardware nuevo, un proyecto que llevabas un año aparcando, una persona más en el equipo.
  • Un solo contrato para toda la pila (hipervisor, hardware, SO invitado). Dejas de coleccionar contratos verticales con el fabricante de turno.

Encaja particularmente bien cuando tu vSphere está sólido y quieres estirarlo mientras evalúas con calma Proxmox u OpenShift — o ninguna de las dos, si cambias de idea por el camino. Cubrimos vSphere 7 y 8 desde España, en castellano, con ingeniero asignado que no rota. El alcance exacto, el SLA y el proceso están en soporte VMware 7 y 8; si lo que necesitas es la misma idea para SAP, eso vive en el hub de soporte de terceros.

05 · Vías 3 y 4 en detalle

¿Y si lo que quiero es migrar? ¿Proxmox u OpenShift?

Depende de a dónde va tu plataforma en los próximos cinco años.

Proxmox VE — la migración lateral

Proxmox VE es la respuesta natural si lo que tienes es un VMware-shop clásico —VMs Windows y Linux, almacenamiento compartido, copias de seguridad— y quieres un hipervisor open source que se parezca a lo que ya operas. Soporta importación de VMs desde VMware, vive sobre KVM y LXC, y tiene suscripción de soporte empresarial disponible. Es una migración lateral, no un cambio de paradigma.

OpenShift Virtualization — la consolidación con Kubernetes

OpenShift Virtualization (basado en KubeVirt) es la respuesta si tu organización ya va hacia contenedores y quieres una sola plataforma para VMs y pods. Permite ejecutar máquinas virtuales como recursos de Kubernetes, junto a tus aplicaciones contenerizadas, con la misma red y el mismo almacenamiento. Tiene más curva de aprendizaje, pero también más recorrido si tu hoja de ruta es cloud-native.

Una tercera vía: OpenStack

Hay un cuarto destino que conviene tener en mente: OpenStack con Ceph sigue siendo una opción sólida para entornos grandes que quieren operar una nube privada completa. La elección entre los tres no es ideológica; es de fit técnico y de equipo.

06 · Coste y plazos

¿Cuánto cuesta migrar de VMware? ¿Y cuánto se tarda?

No hay tarifa de catálogo. Cualquiera que te dé una cifra sin mirar tu infraestructura, te la está inventando. Lo que tarde y lo que cueste depende de tres cosas:

  • Tamaño del estate: número de hosts, número de VMs, tamaño en TB, presencia de vSAN/NSX.
  • Complejidad de la red y el almacenamiento: redes distribuidas, microsegmentación, replicación, DR.
  • Dependencias de la pila superior: backup, monitorización, automatización, CI/CD.

Como referencia para planificar:

  • Un proyecto de migración de decenas de VMs desde vSphere a Proxmox o a OpenShift se ejecuta típicamente en semanas, con ventanas controladas por servicio.
  • Un proyecto sobre cientos de VMs se ejecuta en meses, por oleadas y con un strangler pattern: nuevas cargas en la plataforma destino, cargas existentes migradas por bloques.
Insight clave

Lo que más alarga (y encarece) los proyectos no suele ser el hipervisor: son las dependencias que cuelgan de élbackup, DRP, automatismos antiguos, integraciones con CMDBs. Por eso el primer entregable de cualquier migración seria es un inventario y un mapa de dependencias, no un PoC del hipervisor nuevo.

07 · Método

¿Cuál es el orden recomendado para decidir?

Este es el procedimiento que aplicamos en SIXE cuando un cliente nos pregunta "¿qué hago con VMware?". Marca los pasos a medida que los completes — la barra te indica cuánto te queda y el plan es tuyo.

Método SIXE · 5 pasos antes de renovar o migrar 0 / 5 completados
1
Inventario real del estate

Hosts, cores, VMs, vSAN, NSX, Aria, contratos vigentes y fecha de vencimiento. Sin esto, cualquier cálculo es ficción.

2
Mapa de dependencias de la pila superior

Backup, DRP, monitorización, automatización, integraciones con CMDBs. Aquí están los plazos reales — y los riesgos ocultos.

3
Tres números comparables

Coste de renovar con Broadcom bajo el nuevo modelo · Coste de third-party support 12-24 meses · Coste estimado de migración (mano de obra + herramientas + formación).

4
Decisión informada — o combinación

Las cuatro vías pueden combinarse. Ejemplo frecuente: soporte de terceros durante 18 meses + migración progresiva a Proxmox para cargas estándar y a OpenShift para cargas que vayan a contenedores.

5
Plan de ejecución por oleadas

Revisión trimestral. Lo importante es separar la decisión técnica del calendario comercial — la palanca está en tu mano, no en la fecha de renovación.

08 · Equipo

¿Y la formación del equipo?

Cualquiera de las cuatro vías exige formación, aunque en proporciones distintas:

  • Continuar con VMware bajo Broadcom: poca formación nueva, sobre todo en el modelo de licenciamiento y en los bundles.
  • Soporte independiente: ninguna formación adicional; el equipo sigue operando lo que ya conoce.
  • Proxmox VE: formación moderada; el modelo mental se parece a vSphere pero las herramientas y la red son distintas.
  • OpenShift Virtualization: formación significativa en Kubernetes y en el modelo declarativo; conviene empezarla antes de la migración, no durante.

En SIXE somos partner formativo para varias de estas plataformas: VMware, Red Hat (incluido OpenShift) y soluciones basadas en KVM. Si quieres mantener a tu equipo certificado en lo que ya operas, tenemos formación oficial en VMware vSphere. Cuando la migración la acompaña formación temprana, las oleadas van más rápido y con menos incidentes.

Sustituye el placeholder por la imagen real (1200×630) manteniendo el alt
10 · Nuestra postura

¿Es VMware una mala plataforma tras Broadcom?

No. Y conviene aclararlo. Hay cosas que podríamos decir para sacar clics fáciles, y que no vamos a decir:

  • Que VMware es un mal producto. No lo es — lo soportamos desde hace más de quince años.
  • Que Broadcom es el malo de la película. Es una decisión comercial legítima de un fabricante. A los clientes les toca decidir qué hacer con ella, no insultar al que la tomó.
  • Que Proxmox u OpenShift son "la respuesta". Son una respuesta cuando encajan. En otros casos lo que toca es quedarse en VMware — con o sin Broadcom.
Lo que sí te decimos

No decidas con prisa, haz números con las cuatro, y si te falta tiempo para hacerlo bien, el soporte de terceros está justamente para eso. Llevamos VMware desde antes de que existiera Broadcom. Soportamos también Proxmox, OpenShift y OpenStack. Lo que tú decidas, lo ejecutamos — esa es la diferencia.

Resumen

Lo esencial en 5 puntos

Si has venido a saltar al final

→ Cambió el modelo, no la plataforma. Suscripción (VCF/VVF) en lugar de perpetuas nuevas. Las perpetuas que ya tienes siguen siendo tuyas.

Cuatro vías razonables: seguir con Broadcom, soporte de terceros, migrar a Proxmox o saltar a OpenShift. Las cuatro funcionan.

Soporte de terceros = comprar tiempo sin renunciar a seguridad. Tu vSphere 7 u 8 sigue parcheado y con SLA, pero el contrato deja de ser con Broadcom.

No empieces por el PoC del hipervisor nuevo. Empieza por el inventario y el mapa de dependencias. El hipervisor casi nunca es la parte difícil.

Las cuatro vías son combinables. La pauta más frecuente: 12-18 meses de soporte de terceros + migración por oleadas en paralelo.

FAQ

Preguntas frecuentes

¿El soporte de terceros para VMware es legal?

Sí, y no es zona gris. Cubre el mantenimiento operativo de las versiones que ya tienes desplegadas, sin redistribuir software ni modificar licencias. No sustituye a las actualizaciones de versión del fabricante — sustituye al contrato de mantenimiento, que es otra cosa.

¿Puedo seguir usando VMware si no renuevo con Broadcom?

Si tienes licencias perpetuas previas, sí: puedes seguir ejecutándolas. Lo que pierdes es el acceso a actualizaciones nuevas y a soporte directo del fabricante. Para cubrir ese hueco existe el soporte independiente para VMware 7 y 8 con SLA contractual.

¿Cuándo termina el soporte de vSphere 7 y vSphere 8?

VMware vSphere 7 alcanzó el fin de soporte general (EoGS) el 2 de octubre de 2025, según la comunicación oficial de Broadcom. Para vSphere 8, el calendario apunta a 2027. Las fechas se actualizan periódicamente en el portal oficial de lifecycle.

¿Es Proxmox VE una alternativa empresarial seria?

Sí, y los que sigan diciendo lo contrario llevan años sin mirarlo. Se usa en producción en organizaciones serias, tiene suscripciones de soporte empresarial y un ecosistema maduro de backup, alta disponibilidad y clustering. La diferencia con VMware no es de madurez técnica — es de modelo (open source vs. propietario) y de herramientas.

¿OpenShift Virtualization sirve para sustituir a vSphere?

Para muchas cargas, sí. Ejecuta VMs como objetos de Kubernetes y te deja consolidar VMs y contenedores en una sola plataforma. Si tu organización no va a Kubernetes en los próximos años, no es para ti. Si ya vas en esa dirección, es de las mejores cartas que tienes sobre la mesa.

¿Cuánto se ahorra exactamente migrando o pasando a soporte de terceros?

Depende del estate y del modelo actual. Es habitual encontrar ahorros relevantes en infraestructuras grandes con bundles que no se usan al 100 % — pero solo se puede decir un número tras hacer el cálculo con tus números. Cualquier porcentaje sin tu inventario es marketing.

¿Y el mismo enfoque para SAP?

Sí. Aplicamos la misma lógica de "decide tú, ejecutamos cualquier vía" a la infraestructura SAP — IBM Power, AIX, Linux para SAP HANA. Lo cubrimos en nuestra página de soporte independiente para SAP.

Fuentes

Referencias

Broadcom. End of General Support for vSphere 7.0 (2 de octubre de 2025). knowledge.broadcom.com / KB 415405

Broadcom. VMware Product Portfolio and Licensing Changes. knowledge.broadcom.com / KB 313749

Broadcom. Product Lifecycle Portal. support.broadcom.com / productlifecycle

VMware Cloud Foundation Blog. Reminder: vSphere 7 to reach End of Service on October 2, 2025. blogs.vmware.com / vsphere-7-eos

VMware (Broadcom). VMware Cloud Foundation. vmware.com / cloud-foundation

Proxmox Server Solutions. Proxmox Virtual Environment — documentation. pve.proxmox.com

Red Hat. OpenShift Container Platform — Virtualization. docs.redhat.com / openshift

KubeVirt Project — upstream open source de OpenShift Virtualization. kubevirt.io

Northdoor. VMware vSphere End of Support: Action Plan for 2025 & 2027 (análisis independiente). northdoor.co.uk / vsphere-end-of-support

SIXE — soporte independiente para tu pila empresarial · soporte independiente para VMware 7 y 8

Escrito por el equipo de ingeniería de virtualización de SIXE — la gente que se mete dentro de tu pila cuando se cae. Última actualización: .


Segunda opinión, sin chorradas

¿Quieres ver las cuatro vías con tus números, no con los nuestros?

Te montamos un informe corto con el coste real de cada opción aplicado a tu inventario: seguir con Broadcom, soporte de terceros, Proxmox u OpenShift. La primera conversación es gratis — si no encajamos, no encajamos. Si encajamos, ya nos lo dirás tú.

Actualizar de Debian 12 a Debian 13 Trixie (guía 2026)

Linux · Debian · Sistemas

Cómo actualizar de Debian 12 a Debian 13 Trixie sin romper producción.

Debian 13 «Trixie» ya es la versión estable. Esta es la guía paso a paso que seguimos en SIXE para actualizar servidores de producción: preparación, repositorios, full-upgrade y plan de rollback. Sin sustos.

8 min lecturaGuía técnica

Para actualizar de Debian 12 Bookworm a Debian 13 Trixie: haz backup, deja Bookworm completamente parcheado, cambia los repositorios de bookworm a trixie, ejecuta primero apt upgrade --without-new-pkgs y luego apt full-upgrade, limpia y reinicia.

Simple en un servidor de laboratorio. Otra cosa es hacerlo en una flota en producción con bases de datos, servicios críticos y SLA. En SIXE llevamos más de 15 años manteniendo infraestructuras Linux en producción, y esta es la metodología exacta con la que abordamos un dist-upgrade sin downtime imprevisto. Solo se soporta el salto 12 → 13: si estás en Debian 11, pasa antes por Debian 12.

2030
Soporte de Trixie
(3 años + 2 de LTS)
~59.000
Paquetes en
los repositorios
20-60'
Duración típica
del upgrade
01 · Novedades

¿Qué es Debian 13 Trixie y qué cambia respecto a Bookworm?

Debian 13 «Trixie» es la versión estable de Debian desde el 9 de agosto de 2025. Incorpora el kernel Linux 6.12 LTS, la finalización del merge de /usr (ya obligatorio), la transición a time_t de 64 bits (preparando el problema del año 2038 en arquitecturas de 32 bits) y APT 3.0, con una salida más clara y mejor resolución de dependencias.

Para un servidor en producción no es una revolución, sino justo lo que se espera de Debian: una base más limpia, kernel moderno y cinco años de soporte de seguridad por delante. Lo más relevante a nivel operativo es que el ciclo de vida vuelve a empezar — y el de Bookworm empieza a agotarse.

En contexto

Trixie no obliga a reaprender nada: mismo APT, misma filosofía. El esfuerzo está en planificar el salto, no en adaptarse a un sistema nuevo.

02 · Ciclo de vida

¿Hasta cuándo tiene soporte Debian 12 Bookworm?

Desde que Trixie salió en agosto de 2025, Debian 12 pasó a ser oldstable. Mantiene soporte de seguridad LTS hasta aproximadamente junio de 2028, pero deja de recibir el soporte completo del equipo de seguridad. No es una urgencia crítica, pero cada mes que pasa acumulas más deuda técnica y reduces la ventana para actualizar con calma.

CICLO DE VIDA DEL SOPORTE — DEBIAN 12 vs DEBIAN 13 20232025202620282030 HOY Debian 12 «Bookworm» LTS → jun 2028 Debian 13 «Trixie» → jun 2030 Soporte completo LTS
Ventanas de soporte de Debian 12 y Debian 13 — fechas aproximadas según el ciclo de vida de Debian
Recomendación

No esperes al final del ciclo de Bookworm. Planifica la actualización en una ventana tranquila, no a contrarreloj cuando dejen de llegar los parches de seguridad.

03 · Preparación

¿Qué hay que preparar antes de actualizar?

Un dist-upgrade es seguro si lo preparas. La mayoría de los desastres que hemos visto no vienen del upgrade en sí, sino de saltarse esta fase. Marca cada punto antes de empezar:

Checklist pre-vuelo 0 / 6 completado
Backup completo o snapshot. En máquina virtual, snapshot completo: es tu botón de rollback.
Leer las notas de publicación de Debian 13 para tu caso (issues conocidos).
Espacio en disco suficiente en / y /var para descargar los paquetes nuevos.
Acceso fuera de banda (consola/IPMI/KVM) por si SSH se cae durante el proceso.
Limpiar /boot de kernels antiguos para que quepa el kernel 6.12.
Ventana de mantenimiento acordada y usuarios avisados.

¿Los seis marcados? Entonces sí, adelante con el upgrade.

04 · Paso a paso

¿Cómo actualizar de Debian 12 a Debian 13 paso a paso?

El proceso tiene seis fases: dejar Bookworm al día, apuntar los repositorios a trixie, desactivar repos de terceros, ejecutar primero la actualización mínima y luego la completa, limpiar y reiniciar verificando. Este es el flujo y los comandos exactos.

El upgrade en 6 fases
1
Parchear BookwormEl upgrade parte de un sistema 100% al día
2
Repos a Trixiebookworm → trixie (incluido trixie-security)
3
Desactivar repos de tercerosSe reactivan uno a uno al terminar
4
Upgrade mínimo + completo--without-new-pkgs y luego full-upgrade
5
Limpiezaautoremove + autoclean
6
Reinicio y verificacióncat /etc/debian_version → 13.x

1. Deja Debian 12 completamente al día

Cualquier parche pendiente se convierte en un conflicto durante el salto. Parte de un Bookworm impecable:

root@debian12 — bash
$ sudo apt update
$ sudo apt upgrade
$ sudo apt full-upgrade
$ sudo apt --purge autoremove

2. Apunta los repositorios a Trixie

Cambia bookworm por trixie en tus fuentes APT. Esto cubre también bookworm-securitytrixie-security. Revisa el resultado con cat antes de seguir.

editar fuentes APT
# Formato clásico
$ sudo sed -i 's/bookworm/trixie/g' /etc/apt/sources.list

# Formato DEB822 (instalaciones recientes de Debian 12)
$ sudo sed -i 's/bookworm/trixie/g' /etc/apt/sources.list.d/debian.sources

3. Desactiva temporalmente los repositorios de terceros

Cualquier repo externo en /etc/apt/sources.list.d/ (Docker, PostgreSQL, etc.) puede bloquear el upgrade si aún no soporta Trixie. Desactívalos ahora y reactívalos uno a uno después, comprobando que cada uno ya publica para Debian 13.

4. Ejecuta la actualización: mínima primero, completa después

La actualización mínima reduce el riesgo de conflictos de dependencias. Acompaña el proceso: responderás a algún prompt sobre ficheros de configuración modificados.

root@debian12 — dist-upgrade
$ sudo apt update
$ sudo apt upgrade --without-new-pkgs   # actualización mínima
$ sudo apt full-upgrade                 # actualización completa

5. Limpia los paquetes obsoletos

limpieza
$ sudo apt --purge autoremove -y
$ sudo apt autoclean

6. Reinicia y verifica

root@debian13 — verificación
$ sudo reboot
# tras el reinicio:
$ cat /etc/debian_version   # -> 13.x
$ uname -r                  # -> 6.12.x
$ systemctl --failed        # ningún servicio caído
05 · Rollback

¿Cuánto tarda y se puede hacer rollback?

En un servidor típico, el upgrade tarda entre 20 y 60 minutos según el número de paquetes y la velocidad de disco y red. El rollback de un dist-upgrade no es trivial una vez instalados los paquetes: por eso el snapshot previo es innegociable. En máquinas virtuales, revertir al snapshot es cuestión de minutos; en hardware físico, el plan de rollback es restaurar desde backup.

Regla de oro

Nunca hagas un salto de versión mayor en producción sin una vía de vuelta probada. Un backup que no has restaurado nunca no es un backup: es una esperanza.

06 · Errores comunes

¿Qué errores son los más comunes al actualizar a Trixie?

Lo que más vemos en producción, y cómo evitarlo:

  • Repos de terceros sin versión para Trixie que bloquean apt: desactívalos antes (paso 3).
  • /boot lleno que impide instalar el kernel nuevo: limpia kernels antiguos antes de empezar.
  • Ficheros de configuración pisados por aceptar la versión del paquete sin mirar: ante la duda, conserva tu versión y revísala después.
  • Olvidar --without-new-pkgs en la fase mínima, lo que dispara conflictos de dependencias.
  • Servicios propios que asumen rutas de /usr no fusionadas: el /usr-merge ya es obligatorio en Trixie.
07 · En contexto

¿Debian o Ubuntu para tu servidor?

Es la pregunta que más nos hacen. No hay respuesta universal: depende de si valoras más el control y la independencia (Debian) o el soporte comercial integrado y herramientas como Ubuntu Pro y Landscape (Ubuntu). Esta es la comparativa rápida:

Debian 13Ubuntu ProRHEL
Gobernanza
Comunitaria
Canonical
IBM / Red Hat
Soporte / versión
5 años + ELTS
10 años
10 años
Paquetes
~59.000
~30.000
~5.000
Coste de licencia
0 €
Por nodo
Por nodo
Soporte en español
SIXE
SIXE UP
SIXE

¿Trabajas con Ubuntu? Como partner de Canonical también te cubrimos con SIXE UP. Y si tu caso es migrar entre distribuciones, gestionamos migraciones sin interrupciones.

Ingeniero de SIXE actualizando un servidor de Debian 12 Bookworm a Debian 13 Trixie en un datacenter
08 · Soporte profesional

¿Y si prefieres no tocar producción tú mismo?

Actualizar un servidor de laboratorio es una tarde. Actualizar una flota en producción con SLA, bases de datos y servicios críticos es otra historia: hay que inventariar dependencias, validar en staging, coordinar ventanas y tener un rollback probado.

Eso es exactamente lo que hacemos en SIXE. Ofrecemos soporte profesional para Debian —upgrades de versión planificados, hardening con monitorización Wazuh, y resolución de incidencias con SLA— y, si lo necesitas urgente, contamos con soporte 24/7. ¿Quieres dejar a tu equipo formado? Tenemos formación oficial en Linux.

Más de 15 años manteniendo Linux en producción

Ingeniería senior que habla tu idioma, sin helpdesks ni escalados. ¿Tienes que actualizar varios servidores a Debian 13? Cuéntanos tu caso y te proponemos un plan con ventana de mantenimiento y rollback.

Resumen

Lo esencial en 5 puntos

Para quien tiene prisa

Debian 13 Trixie es la estable desde agosto de 2025; Debian 12 ya es oldstable (LTS hasta ~2028).

Backup/snapshot antes de nada. Es tu único rollback real.

→ Parte de un Bookworm 100% parcheado, cambia los repos a trixie y haz upgrade --without-new-pkgs antes del full-upgrade.

Desactiva los repos de terceros durante el proceso.

→ Solo se soporta 12 → 13: desde Debian 11, pasa antes por Debian 12.

FAQ

Preguntas frecuentes

¿Se puede actualizar de Debian 11 directamente a Debian 13?

No. Debian solo soporta el salto entre versiones consecutivas. Desde Debian 11 «Bullseye» hay que actualizar primero a Debian 12 «Bookworm» y, una vez ahí, a Debian 13 «Trixie».

¿Pierdo mis datos y configuraciones al actualizar?

No, un dist-upgrade conserva datos y configuraciones. Aun así, un backup o snapshot completo es obligatorio: es tu plan de rollback si algo falla.

¿Es mejor actualizar o reinstalar desde cero?

Para un servidor bien mantenido, el dist-upgrade es seguro y mucho más rápido. La reinstalación solo compensa si el sistema arrastra mucha deuda técnica o configuraciones inconsistentes.

Fuentes

Referencias

Debian. Información de la versión Debian 13 «trixie». debian.org/releases/trixie

Debian. Notas de publicación de Debian 13. debian.org/releases/trixie/releasenotes

Debian. Debian 13 «trixie» released (09-08-2025). debian.org/News/2025

Debian Security Team. debian.org/security

Última actualización: .


Soporte Debian profesional

¿Tienes que actualizar tus servidores a Debian 13?

Te proponemos un plan de actualización con auditoría previa, validación en staging, ventana de mantenimiento y rollback probado. Ingeniería senior en español, con SLA.

Cumple el ENS con Wazuh: el SIEM gratuito que tu auditor espera

Ciberseguridad · ENS · Wazuh

Cumple el ENS con Wazuh.

Si tu empresa trabaja con la Administración Pública o quiere presentarse a pliegos, el Esquema Nacional de Seguridad te afecta. Wazuh es una herramienta gratuita que permite cubrir gran parte de lo que la norma te pide en materia de monitorización y trazabilidad. Pero no basta con instalarla — y hay cosas que no cubre.

12 min lecturaCiberseguridad · Normativa

El Esquema Nacional de Seguridad (ENS) es la norma española que establece cómo deben proteger sus sistemas informáticos las administraciones públicas — y las empresas que trabajan con ellas. Si alguna vez te han dicho "necesitas el ENS para entrar al pliego", de esto hablan.

Wazuh es una plataforma de seguridad de código abierto (open source) que centraliza los registros de actividad de tus servidores, detecta comportamientos sospechosos y genera las evidencias que un auditor necesita revisar. Es gratuita, tiene adopción creciente en administraciones públicas y centros de investigación europeos — incluido el CERN — y en SIXE la desplegamos en entornos de producción con configuración específica para el ENS.

Este artículo te explica, sin jerga innecesaria, qué te exige la norma, qué parte cubre Wazuh, qué parte no cubre, y qué necesitas hacer para llegar a tu auditoría preparado.

0€
Licencias Wazuh
10
Medidas ENS soportadas
2
Años entre auditorías
3K+
Reglas preconfiguradas
01 · A quién aplica

¿Qué es el ENS y te afecta para pliegos públicos?

El ENS está regulado por el Real Decreto 311/2022. En lenguaje llano: es la norma que dice cómo hay que proteger los sistemas informáticos que manejan información de la Administración Pública. Si tu empresa toca esos sistemas de alguna forma — vendiéndole software, dándole soporte, alojando sus datos — te aplica.

Mucha gente piensa que el ENS solo afecta a ministerios y grandes organismos. No es así.

Toca cada tarjeta para descubrir si el ENS te aplica
"Somos una PYME que vende software de gestión a un ayuntamiento."
Toca para revelar
Sí te aplica Cualquier empresa que suministre tecnología o servicios a la Administración Pública entra dentro del ENS.
"Soy responsable de informática de un ayuntamiento de 5.000 habitantes."
Toca para revelar
Sí te aplica Todo el sector público entra dentro del ENS, sin importar el tamaño del municipio. Lo más probable es que tu categoría sea BÁSICA o MEDIA.
"Tenemos una tienda online y no trabajamos con la Administración."
Toca para revelar
No te aplica Sin relación con el sector público, el ENS no es obligatorio. Ojo: podrían aplicarte otras normas (RGPD, NIS2). Y si en el futuro quieres entrar a pliegos, tendrás que cumplirlo.
"Nuestra consultora ha ganado un pliego para dar soporte informático a una consejería."
Toca para revelar
Sí te aplica Al prestar servicios tecnológicos a una entidad pública, tu empresa necesita cumplir el ENS en los sistemas involucrados.
"Somos subcontratistas de otra empresa que sí trabaja con la Administración."
Toca para revelar
Probablemente sí Si manejas datos o sistemas vinculados al servicio que el contratista principal presta a la Administración, el ENS se extiende a tu actividad. Revisa el contrato.

Las tres categorías: BÁSICA, MEDIA, ALTA

El ENS clasifica los sistemas en tres niveles según lo grave que sería un incidente de seguridad. La categoría determina cuántas medidas de protección te aplican y si necesitas una auditoría externa (obligatoria cada dos años en MEDIA y ALTA) o te basta con una autoevaluación (BÁSICA).

02 · Lo que te pide la norma

El ENS describe capacidades de un SIEM — aunque no use esa palabra

Un SIEM (Security Information and Event Management) es un sistema que centraliza los registros de actividad de todos tus servidores y equipos, los analiza automáticamente buscando patrones sospechosos, y genera alertas cuando algo no cuadra. Es como una cámara de seguridad para tu infraestructura informática, pero que además entiende lo que ve.

El ENS no dice "instala un SIEM". Pero en el Anexo II del RD 311/2022 — la lista de medidas de seguridad obligatorias — hay un control que describe exactamente eso. Se llama op.exp.8 (registro de la actividad de los usuarios), y su refuerzo R5, aplicable en categoría ALTA, dice literalmente:

Cita textual — Anexo II, op.exp.8 R5 (categoría ALTA)

"Se dispondrá de un sistema automático de recolección de registros, correlación de eventos y respuesta automática ante los mismos."

Fuente: Anexo II, RD 311/2022

Recolección automática + correlación + respuesta automática. Esas son, en la práctica, capacidades propias de un SIEM. En categoría ALTA esto es obligatorio. En categoría MEDIA el ENS exige registrar la actividad y revisarla periódicamente, pero no llega a pedir correlación automatizada de forma explícita — aunque en la práctica, hacer eso manualmente de forma sostenible es muy difícil.

Hay otros controles del Anexo II que apuntan en la misma dirección:

  • Detección de intrusión (op.mon.1) — tener herramientas que detecten accesos no autorizados o comportamientos anómalos.
  • Gestión de incidentes (op.exp.9) — documentar cada incidente de seguridad de principio a fin, con evidencias que sirvan incluso ante un tribunal.
  • Protección de registros (op.exp.10) — que nadie pueda manipular los logs. Si un atacante borra sus huellas, los registros tienen que seguir ahí.
  • Vigilancia continua (op.mon.3) — monitorizar la actividad del sistema de forma permanente y actuar automáticamente ante situaciones de riesgo. Aplica en MEDIA y ALTA.
Lo importante

El ENS no te obliga a instalar un SIEM por su nombre. Describe capacidades que, en la práctica, solo un SIEM cubre de forma razonable — especialmente a partir de categoría MEDIA, y de forma explícita en ALTA. Usar Wazuh para ello es una decisión técnica y económica, no una obligación normativa directa.

03 · Qué aporta Wazuh

Qué medidas del ENS soporta Wazuh — y en qué categoría

Wazuh es una plataforma open source (gratuita) que combina varias funciones de seguridad en un solo producto: centraliza los registros de todos tus equipos, vigila cambios en ficheros críticos, detecta vulnerabilidades conocidas, comprueba que la configuración de tus servidores sigue las buenas prácticas, y puede bloquear automáticamente una IP que intente entrar por fuerza bruta.

No cubre todo lo que el ENS pide — ningún producto lo hace solo. Pero soporta las 10 medidas del Anexo II que tienen que ver con monitorización, detección y trazabilidad:

Medida del Anexo II Función de Wazuh Qué hace, en llano
op.exp.2 · Configuración segura
Auditoría de configuración
Comprueba que tus servidores siguen las guías de seguridad recomendadas
op.exp.4 · Mantenimiento
Escaneo de vulnerabilidades
Detecta software con fallos conocidos que necesita actualización
op.exp.6 · Código dañino
Vigilancia de ficheros
Alerta si alguien modifica archivos críticos del sistema
op.exp.8 · Registro de actividad
Centralización de logs
Recoge y analiza los registros de actividad de todos los equipos
op.exp.9 · Gestión de incidentes
Respuesta a incidentes
Documenta cada incidente desde la alerta hasta el cierre
op.exp.10 · Protección de registros
Archivo cifrado
Guarda los logs de forma que nadie pueda alterarlos
op.acc.5 · Autenticación
Detección de accesos
Detecta intentos de acceso por fuerza bruta o logins sospechosos
op.mon.1 · Detección de intrusión
IDS + reglas
Identifica patrones de ataque conocidos en el tráfico de red
op.mon.2 · Métricas
Paneles de control
Visualizaciones en tiempo real del estado de seguridad
op.mon.3 · Vigilancia
Respuesta automática
Bloquea IPs, aísla equipos o mata procesos sin intervención humana
Arrastra el cursor — ¿Qué exige el ENS según tu categoría?
Básica Media Alta
op.exp.2Configuración segura
op.exp.6Vigilancia de ficheros
op.exp.8Registro + revisión de actividad
op.mon.3Vigilancia y monitorización continua
op.exp.8 R5SIEM con correlación + respuesta automática
CPSTICProductos aprobados por el CCN (recomendados)
Categoría BÁSICA — Registro de actividad básico. Un SIEM como Wazuh no es exigido, pero simplifica el cumplimiento. Autoevaluación cada 2 años.

Un matiz importante: la tabla anterior muestra las capacidades técnicas que Wazuh aporta. Pero una herramienta no "cumple" controles — lo hace la organización. Wazuh es el instrumento; la política, los procedimientos y la documentación son el marco que le da validez ante un auditor.

04 · Lo que no cubre

Qué NO hace Wazuh por sí solo

Esto es lo que casi nadie te cuenta. Y es donde más credibilidad ganas si lo explicas claro.

Wazuh no sustituye

Una política de seguridad. El ENS exige que tu organización tenga una política de seguridad formal aprobada por la dirección. Wazuh no la redacta.

La Declaración de Aplicabilidad (DoA). Es el documento que justifica ante el auditor qué herramientas usas, qué controles cubren y por qué. Wazuh no la genera.

La clasificación de sistemas. Determinar si eres categoría BÁSICA, MEDIA o ALTA es un análisis de riesgos que hace tu equipo o un consultor. No lo hace una herramienta.

El análisis de riesgos. El ENS exige un análisis formal de los riesgos sobre tus activos. Wazuh detecta amenazas, pero no evalúa riesgos de negocio.

Productos certificados del CPSTIC. Si tu análisis de riesgos determina que necesitas un producto aprobado oficialmente por el CCN para alguna capa (cifrado, autenticación), Wazuh no sustituye esa pieza.

Un equipo que revise las alertas. Un SIEM que nadie mira es una cámara de seguridad con la pantalla apagada. Wazuh genera alertas, pero si nadie las revisa y actúa, el cumplimiento es nominal.

Entender estos límites no debilita el argumento de usar Wazuh — lo refuerza. Porque cuando sabes qué hace y qué no, puedes montar un proyecto realista en vez de uno que se caiga en la primera auditoría.

05 · El matiz del catálogo oficial

Wazuh no está en el catálogo oficial de productos aprobados (CPSTIC)

El CPSTIC es el catálogo que mantiene el Centro Criptológico Nacional (CCN) con los productos de seguridad que han pasado una evaluación formal. Piensa en él como un "sello de calidad" del gobierno para herramientas de ciberseguridad. El ENS recomienda usar productos de este catálogo cuando forman parte de la arquitectura de seguridad del sistema.

Wazuh no está en el CPSTIC. No porque sea inseguro, sino porque pasar la evaluación formal (llamada LINCE o Common Criteria) cuesta dinero y tiempo, y Wazuh es un proyecto open source que no ha llevado a cabo ese proceso en España.

¿Entonces no puedo usarlo para el ENS?

Sí puedes. El propio Real Decreto lo contempla. El artículo 28 del RD 311/2022 permite usar lo que se llama medidas compensatorias: si justificas documentalmente que la protección que ofreces es equivalente, puedes usar herramientas que no estén en el catálogo. Esa justificación va dentro de la Declaración de Aplicabilidad (el "DoA" que hemos mencionado antes — el documento central de tu cumplimiento ENS).

En la práctica, qué significa esto según tu categoría:

  • BÁSICA — Wazuh con una DoA bien redactada es una opción viable y aceptada en la práctica.
  • MEDIA — Wazuh + DoA detallada + complementos aprobados para otras capas (autenticación reforzada, protección de datos) es una combinación que los auditores aceptan habitualmente si está bien documentada.
  • ALTA — Posible pero complejo. Necesitas desplegar Wazuh sobre infraestructura ya certificada ENS-Alta, combinar con productos del CPSTIC donde el análisis de riesgos lo requiera, y una DoA reforzada. No es plug-and-play.
Clave para la auditoría

Cualquier despliegue de Wazuh para ENS necesita ir acompañado de una Declaración de Aplicabilidad que mapee cada módulo a los controles que soporta y justifique las medidas compensatorias. Sin ese documento, el auditor no tiene base para validar la herramienta.

06 · Si vienes de otro SIEM

Migrar desde QRadar o Splunk sin perder cumplimiento

Si tu organización ya tiene un SIEM comercial (IBM QRadar, Splunk, Elastic Security) con la licencia a punto de renovar, Wazuh es una alternativa viable. La pregunta es cómo migrar sin que haya un hueco en tu historial de cumplimiento — especialmente si tienes una auditoría programada.

De SIEM comercial a Wazuh — sin ruptura de cumplimiento
1
Inventario de reglas activasLas que alguien mira de verdad, no las que vinieron de fábrica y nadie tocó en 5 años.
2
Traducción de reglas a WazuhReescribir las reglas custom en formato Wazuh + crear decoders para tus aplicaciones.
3
Exportación del históricoArchivar los eventos pasados en formato neutro. Sin esto, el auditor ve un hueco en tus registros.
4
Despliegue en paralelo (4–6 semanas)Ambos SIEM funcionando a la vez. Verificar que Wazuh capta todo lo que captaba el anterior.
5
Validación con auditorOpcional pero recomendable en MEDIA. Que dé el visto bueno antes de apagar el SIEM antiguo.
6
Apagado + documentaciónTransición documentada en la DoA. Continuidad de cumplimiento sin ruptura.

En SIXE tenemos un vertical fuerte de IBM QRadar con formación oficial. Sabemos qué hace QRadar y qué hace Wazuh, y dónde están las piezas que hay que reconstruir cuando migras.

07 · El error que todos cometen

Instalar Wazuh y dejarlo "de fábrica" no es cumplir el ENS

Wazuh trae más de 3.000 reglas preconfiguradas. La mayoría no aplican a tu entorno. Si solo tienes servidores Linux pero dejas activas las reglas de Solaris, Windows Server 2012 y AIX, lo que consigues es ruido: alertas que nadie entiende, que nadie mira, y que al cabo de unas semanas se ignoran por sistema.

Lo que falta en la instalación por defecto

No incluye paneles de control específicos para el ENS. Los paneles que vienen son para otras normativas (PCI DSS, HIPAA, GDPR). Para el ENS hay que construirlos: uno por familia de medidas, con datos que el auditor pueda revisar de un vistazo.

No incluye reglas para tus aplicaciones internas. El portal de tramitación, el ERP, los procesos de batch nocturnos — sin reglas adaptadas, esos registros entran como texto sin analizar y la monitorización pierde sentido.

La instalación son 1–2 días. El afinado son 4–6 semanas. La instalación es lo que parece el proyecto. El afinado es el proyecto.

Si ya tienes Wazuh montado pero sin afinar, cuéntanos qué tienes — el diagnóstico inicial no tiene compromiso.

08 · Preparar la auditoría

Qué necesitas tener listo para la auditoría ENS

Si necesitas ayuda evaluando en qué punto estás, un análisis de estado de seguridad puede ser un buen punto de partida. Estos son los documentos y evidencias que un auditor ENS va a buscar:

  • Declaración de Aplicabilidad (DoA) — el documento que mapea cada control del Anexo II a las herramientas y procedimientos que lo soportan en tu organización. Es el corazón de tu cumplimiento.
  • Política de retención de registros — cuánto tiempo conservas los logs y dónde los almacenas. El ENS no fija un periodo concreto, pero la práctica habitual en auditorías es entre 12 y 24 meses según la categoría y el resultado del análisis de riesgos.
  • Procedimientos de respuesta a incidentes — qué haces cuando salta una alerta: quién la recibe, cómo se investiga, cómo se contiene, cómo se documenta.
  • Procedimientos de gestión de vulnerabilidades — cada cuánto se revisan los parches pendientes y en qué plazo se aplican según su gravedad.
  • Paneles de control específicos ENS — separados de los genéricos, con datos agrupados por familias de medidas del Anexo II.
  • Evidencias periódicas archivadas — extractos de eventos críticos, configuración de reglas vigente, registro de cambios en el sistema. Listas para entregar sin improvisar la semana antes.
  • Plan de mejora continua — el artículo 27 del RD 311/2022 lo exige.
09 · Formación

Formación Wazuh para equipos que necesitan cumplir el ENS

Un sistema de monitorización que nadie revisa no detecta incidentes — solo los registra. Si tu equipo informático no entiende qué está viendo en los paneles de Wazuh, las alertas se acumulan sin gestión y la herramienta se vuelve invisible.

El conocimiento necesario para operar Wazuh en un contexto ENS es específico: leer eventos y distinguir alertas reales de ruido, crear reglas adaptadas a tus aplicaciones, preparar las evidencias que el auditor necesita, y responder a incidentes con la trazabilidad que la norma exige.

Existen programas de formación con foco en Wazuh, in-company o virtual en vivo, con temario adaptable a tu sector y nivel.

Formación Wazuh →

Resumen

Lo esencial, para quien tiene poco tiempo

En 6 puntos

→ El ENS describe capacidades propias de un SIEM en su Anexo II. En categoría ALTA es explícito (R5); en MEDIA es la forma más viable de cumplir.

Wazuh soporta 10 medidas del Anexo II relacionadas con monitorización, detección y trazabilidad.

Wazuh no está en el catálogo oficial (CPSTIC) — pero el ENS permite documentarlo como medida compensatoria en la Declaración de Aplicabilidad.

Wazuh no sustituye la política de seguridad, el análisis de riesgos, la DoA ni el equipo humano que revisa las alertas.

Instalarlo no es cumplir. La diferencia entre "tenemos Wazuh" y "estamos preparados para la auditoría" son 4–6 semanas de trabajo serio.

Wazuh es gratis. Implementarlo bien no lo es.

FAQ

Preguntas frecuentes

¿El ENS me obliga a tener un SIEM?

No usa esa palabra. Pero el Anexo II describe capacidades que en la práctica solo un SIEM cubre: registro centralizado, correlación de eventos y respuesta automática. En categoría ALTA (refuerzo R5) es explícito. En MEDIA no lo exige literalmente, pero cumplir los requisitos de registro y monitorización sin un SIEM es muy difícil de sostener ante un auditor.

¿Wazuh cumple con el ENS?

Wazuh aporta las capacidades técnicas para soportar la mayoría de las medidas de monitorización, detección y trazabilidad del Anexo II. Pero el cumplimiento lo demuestra la organización — no la herramienta. Lo que valida el auditor es la Declaración de Aplicabilidad, los procedimientos documentados y las evidencias.

¿Está Wazuh en el CPSTIC (catálogo oficial)?

No. Wazuh no ha pasado la evaluación formal del Centro Criptológico Nacional. Pero el artículo 28 del RD 311/2022 permite documentarlo como medida compensatoria en la Declaración de Aplicabilidad. En categoría BÁSICA y MEDIA es una opción aceptada en la práctica; en ALTA necesita arquitectura combinada con productos catalogados.

¿Sirve Wazuh para categoría ALTA?

Es posible, pero requiere un diseño cuidadoso: Wazuh sobre infraestructura certificada ENS-Alta, combinado con productos del CPSTIC donde el análisis de riesgos lo requiera, y una DoA reforzada. No es instalar y listo.

¿Cada cuánto se audita el ENS?

Auditoría externa cada dos años para categorías MEDIA y ALTA. La categoría BÁSICA requiere autoevaluación. Todas las entidades reportan anualmente al CCN-CERT a través del informe INES.

¿Mi equipo necesita formación específica?

Sí. Un sistema de monitorización que nadie revisa no detecta incidentes, solo los registra. La formación específica cubre cómo leer alertas, crear reglas adaptadas a tu entorno, y preparar las evidencias que el auditor necesita.

Fuentes

Referencias y normativa citada

Real Decreto 311/2022, de 3 de mayo, por el que se regula el Esquema Nacional de Seguridad. BOE-A-2022-7191

Anexo II del RD 311/2022 — Medidas de seguridad (texto consolidado). Iberley

Catálogo de Productos y Servicios STIC (CPSTIC), guía CCN-STIC 105. CCN-CERT

Departamento de Seguridad Nacional — página oficial del ENS. dsn.gob.es

Wazuh — documentación oficial. documentation.wazuh.com

INCIBE — Catálogo de empresas de ciberseguridad. catalogo.incibe.es

Catálogo completo de formación oficial · SIXE.

Última actualización:


Wazuh + ENS

¿Hablamos de tu proyecto?

Nos cuentas qué categoría ENS te aplica, qué tienes hoy y cuándo es tu próxima auditoría. Salimos con un esbozo de arquitectura y siguientes pasos.

Chain of Thought: por qué tu IA no razona

IA · Razonamiento · LLM

Chain of Thought: por qué tu modelo de IA no razona.

El Chain of Thought no es pensamiento. Es la forma estadística del pensamiento. Apple, Arizona State y UC Berkeley lo demuestran con datos. Esto es lo que significa para quien despliega IA en producción.

9 min lecturaIA · Producción · Infraestructura

El Chain of Thought (CoT) es una técnica que hace que los modelos de lenguaje generen pasos intermedios antes de responder. Aunque mejora benchmarks, investigaciones recientes demuestran que no constituye razonamiento genuino: es una restricción estadística que imita la forma del pensamiento humano.

Para las empresas que despliegan IA en entornos de producción, entender esta diferencia no es un debate filosófico. Es una decisión de arquitectura que afecta a la fiabilidad, al coste y al riesgo operativo. En SIXE llevamos más de 15 años diseñando infraestructuras críticas donde la tolerancia al fallo es cero. Esa experiencia nos ha enseñado una regla que aplica igual a un cluster IBM Power que a un agente de IA: nunca confíes en un solo componente para algo que no se puede caer.

01 · Qué es

¿Qué es el Chain of Thought y por qué parece razonamiento?

Cuando activas el modo de "razonamiento" o "thinking" en modelos como GPT-5, Claude o DeepSeek, el modelo genera un monólogo intermedio antes de responder: "vale, primero analizo X... ahora considero Y... déjame revisar Z...". En la literatura técnica esto se conoce como Chain of Thought (CoT), literalmente "cadena de pensamiento".

El problema es que eso no es pensar. Es generar texto con la forma estadística del razonamiento humano. El modelo ha visto millones de ejemplos de razonamiento paso a paso durante su entrenamiento, y aprendió a reproducir ese patrón. Cuando le pides que "piense", lo que hace es reconocer la categoría del problema y rellenar la plantilla estadística que mejor encaja.

Un ejemplo concreto: si le planteas a un modelo "razonador" un problema de dimensionado de almacenamiento Ceph con 12 OSD, replicación 3 y tolerancia al fallo de 2 nodos, te devolverá cuatro párrafos impecables con fórmulas, consideraciones sobre dominios de fallo y un número final. Parece pensamiento estructurado. Lo que ha hecho es detectar "problema de dimensionado Ceph" y aplicar el patrón que ha visto en cientos de documentos técnicos similares.

¿Por qué funciona? Porque la mayoría de las veces acierta. La cuestión es qué pasa cuando el problema se sale del manual.

02 · La evidencia

¿Los LLM realmente razonan? Lo que dicen los papers

El CoT funciona. Mejora benchmarks de forma medible. La pregunta relevante no es si funciona, sino por qué funciona. Y la respuesta que ofrecen los estudios más rigurosos es incómoda.

El CoT como muleta estadística

Un equipo de Arizona State University demostró que el CoT brilla cuando los datos del problema están dentro de la distribución de entrenamiento. En cuanto el problema se sale de la zona conocida, el rendimiento se desmorona. Es la diferencia entre un sistema que ha memorizado soluciones y otro que realmente comprende los principios subyacentes.

El CoT como restricción arquitectónica

El CoT no es razonamiento abstracto: es una restricción que obliga al modelo a imitar la forma del razonamiento. Forzar al modelo a escribir "primero... segundo... por lo tanto..." hace que cada token generado influya con más coherencia en el siguiente. Es un truco de arquitectura que mejora la coherencia interna del texto, no un acto cognitivo. El paper Chain-of-Thought Reasoning In The Wild Is Not Always Faithful documenta cómo el CoT puede dar una imagen incorrecta del proceso real que sigue el modelo para llegar a sus conclusiones.

Conclusión técnica

El CoT es útil para muchas tareas. Pero no es razonamiento. Es coherencia formal con apariencia de lógica.

03 · Lo decorativo

¿Qué son los "pasos decorativos" del razonamiento IA?

Un paper de octubre de 2025 publicado por investigadores de UC Berkeley y UC Davis introdujo el concepto de decorative thinking steps (pasos de pensamiento decorativos), y su hallazgo es especialmente relevante para cualquiera que evalúe modelos de IA para producción.

Los investigadores descubrieron que muchos pasos intermedios del CoT son literalmente decorativos. El modelo escribe cosas como "espera, déjame revisar... creo que cometí un error... voy a recalcular", y luego ignora por completo esa autocorrección y entrega la respuesta que ya tenía decidida internamente.

La demostración fue elegante: perturbaron deliberadamente los pasos intermedios (cambiaron números, alteraron la lógica) y comprobaron si la respuesta final cambiaba. En muchos casos, no cambiaba. La conclusión ya estaba decidida. La cadena de pensamiento se generaba después, como racionalización a posteriori.

Toca cada paso para descubrir si es real o decorativo
"Hmm, espera. Creo que me he equivocado con el factor de replicación. Déjame recalcular desde el principio..."
Toca para revelar
Decorativo El modelo ya tenía la respuesta. La "autocorrección" no cambió el resultado final. Es teatro narrativo.
"Capacidad bruta = 12 × 8 TB = 96 TB. Con replicación 3: 96 / 3 = 32 TB útiles."
Toca para revelar
Real Este paso contiene el cálculo que determina la respuesta final. TTS alto: el output depende de él.
"Voy a verificar mi respuesta paso por paso para asegurarme de que no he cometido ningún error de cálculo en la estimación anterior..."
Toca para revelar
Decorativo Pura fórmula retórica. El modelo no re-ejecuta ningún cálculo: ya emitió los tokens de la respuesta. Solo añade palabras que parecen rigor.
"Interesante pregunta. Antes de responder, voy a considerar varios ángulos: el dominio de fallo, el balanceo de OSD y el overhead de metadatos..."
Toca para revelar
Decorativo Enumerar factores sin procesarlos no es análisis. Es la forma estadística de lo que haría un experto. El modelo ya eligió la respuesta.
"Con tolerancia al fallo de 2 nodos y 4 OSD por nodo, el peor caso pierde 8 OSD. Capacidad mínima garantizada: (12−8) × 8 / 3 ≈ 10,7 TB."
Toca para revelar
Real Introduce variables nuevas (nodos, OSD por nodo) que sí cambian el resultado. Sin este paso, la respuesta sería diferente.

Un dato concreto del estudio: en el dataset AIME, solo el 2,3% de los pasos de razonamiento del CoT tenían una influencia causal real sobre la predicción final del modelo. El resto era decoración. (Fuente: Can Aha Moments Be Fake?, UC Berkeley)

Implicación directa

Que un modelo te explique bien por qué ha llegado a una conclusión no significa que esa conclusión sea correcta. La explicación se genera junto con (o después de) el resultado, y en muchos casos es una justificación construida sobre una respuesta predeterminada.

04 · Apple

"The Illusion of Thinking": el estudio de Apple que lo cambia todo

Si los pasos decorativos demuestran que el CoT no garantiza razonamiento ni siquiera cuando acierta, el estudio de Apple va un paso más allá: demuestra que cuando el problema se complica de verdad, los modelos se rinden.

En junio de 2025, Apple publicó The Illusion of Thinking, un estudio que puso a modelos de razonamiento de última generación a resolver puzzles clásicos de informática: la Torre de Hanói, problemas de cruce de río y otros ejercicios que cualquier estudiante de primer curso resuelve con lápiz y papel.

RENDIMIENTO POR COMPLEJIDAD — DATOS APPLE "ILLUSION OF THINKING" (2025) 100% 75% 50% 25% 0% 88% 72% Fácil 55% 82% Media 8% 10% Difícil Sin CoT Con CoT
Rendimiento de modelos con y sin CoT según complejidad — Basado en datos de Apple ML Research, "The Illusion of Thinking", junio 2025
Arrastra el cursor — ¿cómo rinde el CoT según la complejidad?
Fácil Media Difícil
Sin CoT
88%
Con CoT
72%
El modelo sin CoT gana. El "pensamiento" extra solo añade coste y latencia.

El hallazgo más significativo es el tercero. Los modelos "razonadores" no solo fallan en problemas complejos — reducen el esfuerzo computacional precisamente cuando deberían aumentarlo. Es el equivalente a un sistema de monitorización que deja de generar alertas cuando la infraestructura más lo necesita.

Cabe señalar que el paper generó debate: un equipo del CSIC en Madrid replicó parte de los experimentos y matizó que algunos fallos se debían a límites de tokens de salida, no a limitaciones cognitivas puras. Pero las conclusiones de fondo — que el rendimiento colapsa con la complejidad y que el CoT no escala de forma predecible — se mantuvieron.

05 · Costes

¿Merece la pena pagar por modelos de razonamiento?

Depende. Y esa es precisamente la respuesta que la mayoría de proveedores no quiere darte.

Un caso que ilustra el riesgo: una empresa europea montó un agente "razonador" para clasificar tickets de soporte. La cadena de pensamiento que generaba el modelo era impecable desde el punto de vista narrativo. El problema es que el 30% de los tickets acababan en la cola equivocada, y el modelo explicaba con elocuencia impecable por qué esa clasificación errónea era la correcta. Narrativa perfecta, resultado erróneo.

Esto ocurre porque estamos confundiendo calidad de la explicación con calidad de la decisión. Son cosas distintas. Un modelo puede producir un razonamiento formalmente impecable y llegar a una conclusión incorrecta, exactamente igual que una presentación con gráficos espectaculares puede defender una estrategia equivocada.

Regla práctica

Antes de pagar por modelos de razonamiento, benchmarkea con tu caso real. Los marketing decks de los proveedores muestran los resultados de sus mejores días. Tus datos, tu casuística y tus edge cases son los que determinan si el coste adicional compensa.

06 · Perspectiva

¿La IA es inútil entonces?

No. Y esto es importante entenderlo bien, porque el péndulo puede irse al otro extremo con la misma facilidad.

Que un LLM no razone como un humano no significa que sea inútil. Significa que hay que entender qué hace exactamente para usarlo correctamente.

Un sistema IBM Power10 con AIX no "piensa" sobre las cargas de trabajo. No tiene intuición. Lo que tiene es una arquitectura RISC de alto rendimiento, ancho de banda de memoria que un x86 equivalente no alcanza, y fiabilidad (RAS) de nivel mainframe. Si entiendes lo que hace, lo usas para lo que vale: bases de datos críticas, HPC, inferencia de IA a escala. Si no lo entiendes, lo usas como un servidor x86 caro y te preguntas por qué no rinde.

Con los LLM pasa exactamente lo mismo. Son procesadores de lenguaje extraordinarios. Sintetizan, traducen, redactan, clasifican y extraen patrones de texto a una velocidad que ningún equipo humano alcanza. Eso es real, tiene valor medible y está transformando operaciones en todos los sectores.

Lo que no son es agentes pensantes con comprensión genuina del mundo. Y vender lo segundo cuando lo que tienes es lo primero es lo que está creando una burbuja de expectativas que, tarde o temprano, se ajustará.

07 · En producción

¿Cómo usar IA en producción sin caer en la trampa?

En el mundo de la infraestructura crítica — IBM Power, AIX, clusters de alta disponibilidad — hay un principio que nunca falla: diseña con redundancia. Nunca confías en un solo componente para algo que no se puede caer.

1. No uses la explicación como garantía de la respuesta

La explicación del modelo se genera junto con (o después de) el resultado. Muchas veces es una racionalización a posteriori. Si el sistema toma decisiones críticas, necesitas verificación independiente. No importa lo bien que lo explique.

2. Benchmarkea con tu caso real antes de elegir modelo

Para tareas simples, el modelo barato puede superar al caro. Para tareas medias, el CoT compensa. Para tareas muy complejas, fallan ambos. La única forma de saberlo es probar con tus datos reales, no con los del proveedor.

3. Diseña arquitecturas con verificación externa

Si tu arquitectura de IA es "le pregunto al modelo y confío en lo que diga", no tienes una arquitectura. Un despliegue serio de IA incluye validación cruzada, reglas de negocio como capa de control, alertas cuando la confianza del modelo baja, y humanos en el loop para decisiones críticas.

4. Exige pruebas, no promesas

El mercado de la IA está lleno de afirmaciones extraordinarias sin evidencia proporcional. Un proveedor serio te muestra benchmarks sobre tu tipo de datos. Un proveedor menos serio te muestra una demo espectacular con datos preparados.

08 · Nuestra metodología

¿Cómo evaluamos los modelos de IA para entornos de producción?

En SIXE aplicamos a la IA los mismos criterios que llevamos más de 15 años aplicando a cualquier componente de infraestructura crítica:

  • Pruebas con datos reales del cliente, no con datasets genéricos ni demos preparadas.
  • Medición de rendimiento en los edge cases, no solo en el caso feliz. Los errores no aparecen en la mediana, aparecen en los extremos.
  • Arquitectura redundante siempre. La IA es una capa más del sistema, no el sistema entero. Se complementa con reglas de negocio, validación cruzada y supervisión humana donde la decisión es crítica.
  • Selección de modelo por caso de uso, no por marketing. Un modelo con CoT puede ser perfecto para análisis de texto complejo y totalmente innecesario (y más caro) para clasificación simple.
  • Infraestructura dimensionada para inferencia. Un modelo de IA es tan bueno como la infraestructura que lo sustenta. Lo hemos comprobado de primera mano con vLLM sobre IBM Power y con Ceph como backend de almacenamiento para IA.
Resumen

Para directivos con poco tiempo

Lo esencial en 6 puntos

→ El Chain of Thought no es pensamiento: es la forma estadística del pensamiento, una restricción que mejora la coherencia del texto generado.

Apple demostró que los modelos de razonamiento colapsan en problemas complejos y reducen su esfuerzo justo cuando deberían aumentarlo.

Solo el 2,3% de los pasos de razonamiento tienen influencia causal sobre la respuesta del modelo. El resto es decoración.

No pagues por "razonamiento" sin medirlo en tu caso de uso concreto con tus datos reales.

Nunca uses la explicación del modelo como garantía de que la respuesta es correcta.

Diseña con verificación externa. La IA es una herramienta extraordinaria, no un oráculo.

Fuentes

Referencias y papers citados

Apple Machine Learning Research. The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity. Junio 2025. machinelearning.apple.com

Zhao, C. et al. (Arizona State University). Is Chain-of-Thought Reasoning of LLMs a Mirage? A Data Distribution Lens. Agosto 2025. arxiv.org/abs/2508.01191

Zhao, J. et al. (UC Berkeley, UC Davis). Can Aha Moments Be Fake? Identifying True and Decorative Thinking Steps in Chain-of-Thought. Octubre 2025. arxiv.org/abs/2510.24941

Arcuschin, I. et al. Chain-of-Thought Reasoning In The Wild Is Not Always Faithful. Marzo 2025. arxiv.org/abs/2503.08679

Dellibarda Varela, I. et al. (CSIC, Madrid). Rethinking the Illusion of Thinking. Julio 2025. arxiv.org/abs/2507.01231

Última actualización:


IA en producción

¿Necesitas evaluar cómo integrar IA en tu infraestructura?

En SIXE diseñamos arquitecturas de IA con la misma filosofía que aplicamos a cualquier sistema crítico: redundancia, verificación externa y benchmarks reales. Cuéntanos tu caso.

Servidores y almacenamiento en stock | Entrega < 30 días | SIXE

Disponibilidad · Mayo 2026

Servidores y almacenamiento en stock. Entrega en menos de 30 días.

La crisis de suministro de SSDs y la demanda de infraestructura para IA están llevando los plazos de entrega del sector a 3–6 meses. En SIXE tenemos hardware disponible, lo configuramos internamente y lo entregamos en menos de 30 días.

8 min lecturaStorage · Servidores · Infraestructura

Si estás buscando comprar un servidor o una cabina de almacenamiento y tu proveedor habitual te ha dicho que tardan semanas o meses, no es un caso aislado. Es la nueva normalidad del sector.

La buena noticia: tenemos stock. Servidores IBM Power10 y Power11, Dell PowerEdge, Lenovo ThinkSystem. Cabinas IBM FlashSystem de todas las gamas. Configurados por nuestros propios ingenieros y listos para poner en producción.

<30
Días de entrega
garantizada
3–6
Meses de lead time
media del sector
100%
Configuración
interna — sin intermediarios
01 · Contexto

Por qué conseguir hardware es un problema real en 2026

La crisis de suministro de hardware no terminó con la pandemia. Se transformó. En 2026, la situación es diferente pero igual de complicada: ya no faltan chips, pero la demanda global de capacidad para inteligencia artificial está absorbiendo producción de SSDs, memoria y componentes de servidor a una velocidad que la cadena de suministro no puede seguir.

Las consecuencias para cualquier empresa que necesite renovar o ampliar su infraestructura on premise son concretas:

  • Proyectos de migración detenidos por falta de hardware disponible.
  • Contratos de mantenimiento vencidos sin equipo de reemplazo en plazo.
  • Ampliaciones de capacidad que llegan tarde a compromisos de negocio.
  • Precios al alza en el canal por escasez de unidades flash y SSDs NVMe.
Plazos de entrega reales — sector vs SIXE (mayo 2026)
Storage
all-flash
SIXE
FlashSystem
Servidor
GPU (IA)
SIXE
Servidores
Servidor
rack x86
SIXE
Dell / Lenovo
Sector — lead time alto
Sector — variable
SIXE — stock propio
Dato crítico

IBM diseña y fabrica sus propias unidades flash (FlashCore Modules). A diferencia de fabricantes como Dell, HPE o NetApp — que dependen de proveedores externos de SSDs —, IBM controla su propia cadena de suministro de almacenamiento flash. Eso se traduce directamente en plazos de entrega más cortos y predecibles para los IBM Business Partners como SIXE.

02 · Almacenamiento

Cabinas IBM FlashSystem en stock

Si hay un producto donde la urgencia es mayor y la entrega de SIXE marca más diferencia, es el almacenamiento empresarial. La escasez de SSDs NVMe está tensando los plazos de todas las cabinas all-flash del mercado. Pero IBM fabrica sus propias unidades — y eso nos permite tener stock cuando otros no lo tienen.

Cabinas IBM FlashSystem — almacenamiento all-flash NVMe con FlashCore Module de quinta generación
IBM FlashSystem — nueva generación 2026 con FlashCore Module 5 (FCM5)

Gama entrada: FlashSystem 5015 y 5045

La puerta de entrada al almacenamiento all-flash empresarial. Una cabina 2U con controladora dual, compresión, deduplicación y analítica predictiva con IA incluida. Ideal como servidor de almacenamiento para pyme, backup o consolidación de cargas de trabajo mixtas. Consulta disponibilidad y condiciones.

Gama media: FlashSystem 5200 y nueva 5600

Para empresas que necesitan rendimiento real. La nueva FlashSystem 5600 incorpora el FlashCore Module de quinta generación (FCM5) en formato NVMe EDSFF con capacidades de hasta 105 TB por unidad. Detección de ransomware a nivel de hardware en sub-minuto, snapshots inmutables (safe-guarded copies) y cifrado de datos en reposo como estándar.

Gama enterprise: FlashSystem 7200/7600 y 9600

Para entornos de misión crítica: SAP HANA, bases de datos Oracle, factoría de IA, HPC. La 9600 escala a cientos de PB con latencias sub-100μs. Si tu proyecto de infraestructura IA necesita almacenamiento NVMe paralelo a esa escala, esta es la respuesta.

Protección anti-ransomware en hardware

Todas las cabinas FlashSystem incluyen detección de amenazas a nivel de I/O, por debajo del sistema operativo y del filesystem. Los safe-guarded copies crean snapshots inmutables que no se pueden borrar ni modificar, ni siquiera con acceso root. Si un atacante cifra tus datos, tienes copias limpias garantizadas.

Más allá de las cabinas

También disponemos de IBM Storage Scale (GPFS) para entornos HPC e inferencia IA con acceso POSIX paralelo, Storage Protect y Storage Defender para backup empresarial y resiliencia de datos, y Storage Fusion para arquitecturas basadas en Red Hat OpenShift y Kubernetes.

Condiciones competitivas

Como IBM Business Partner directo tenemos acceso a condiciones que otros distribuidores no pueden ofrecer. Si ya tienes una oferta de otro proveedor, contacta con nosotros antes de decidir — podemos sorprenderte.

03 · Servidores

Servidores para empresas: IBM Power, Dell PowerEdge, Lenovo

IBM Power10
S1012, S1022, S1024, E1050, E1080. AIX, IBM i y Linux. PowerVM. Consolidación extrema.
En stock
IBM Power11
S1122, S1124, E1150, E1180. La nueva generación. IA integrada y eficiencia energética.
Nuevo 2026
Dell PowerEdge
T360 (torre pyme), R660, R760 (rack), XE9680 (8× GPU NVIDIA H100 para IA).
En stock
Lenovo ThinkSystem
Servidores x86 para virtualización, bases de datos y aplicaciones empresariales.
En stock

IBM Power: corren Linux exactamente igual que un x86

Este es el punto donde muchos clientes paran. «Ah, pero es que son Power…». Bien: los servidores IBM Power ejecutan Red Hat, SUSE y Ubuntu de forma nativa. Instalas tu distribución Linux, montas tus contenedores, despliegas OpenShift o Kubernetes. La experiencia del administrador es idéntica.

La diferencia está debajo. Un solo servidor Power10 o Power11 consolida lo que antes necesitabas en cuatro o cinco racks de servidores commodity. PowerVM virtualiza con una fiabilidad que VMware ya no puede prometerte — ni cobrarte, desde que Broadcom cambió el modelo de licencias. Para quien busca una alternativa a VMware sin pasar por KVM desde cero, Power es la opción que menos riesgo tiene.

Dell y Lenovo: x86 cuando x86 es la respuesta correcta

No todo necesita un Power. Para un servidor torre para pyme que va a correr un ERP local, un Dell T360 resuelve el problema sin complicaciones. Para el rack del CPD, los R660 y R760 son el estándar del mercado. Y si lo que necesitas es un servidor GPU NVIDIA para inferencia IA on premise, el Dell XE9680 con 8 GPUs H100 es probablemente el servidor de IA más versátil que se puede comprar hoy. Consulta disponibilidad y condiciones.

04 · Catálogo

Qué tenemos y para qué sirve cada producto

Producto Caso de uso Disponibilidad
FlashSystem 5015/5045
Pyme, backup, consolidación
En stock
FlashSystem 5200/5600
ERP, SAP, virtualización, IA
En stock
FlashSystem 7600/9600
Misión crítica, HPC, Oracle
En stock
Dell T360
Torre pyme, ERP, fileserver
En stock
Dell R660 / R760
Rack, virtualización, BBDD
En stock
Dell XE9680
IA on premise, 8× NVIDIA H100
Consultar
Power10 S1022/S1024
Linux, AIX, IBM i, consolidación
En stock
Power11 S1122/S1124
Nueva generación, IA integrada
En stock
Lenovo ThinkSystem
x86 estándar, gestión simplificada
En stock

Consultar disponibilidad y condiciones →

05 · Servicio

Lo que entregamos no es una caja: es un sistema en producción

Cada proyecto de hardware incluye diseño de la solución junto al cliente, configuración y validación en nuestras instalaciones, instalación on-site o remota, y soporte post-venta. No enviamos hardware sin configurar.

Nuestros ingenieros — los mismos que imparten la formación oficial de IBM y prestan el soporte L2/L3 — conocen cada producto porque trabajan con ellos a diario. Si necesitas migrar desde VMware, desde una cabina de otra marca o desde un servidor que ya no tiene soporte, lo hacemos nosotros.

Opcionalmente: contratos de mantenimiento anuales 8×5 o 24×7 con SLA garantizado.

Sin intermediarios

Somos IBM Business Partner directo. No hay distribuidores, resellers ni capas intermedias entre tu proyecto y el fabricante. Eso significa acceso directo a stock IBM, condiciones de partner, y capacidad de escalar al soporte del fabricante cuando se necesite.


Confirma disponibilidad

No esperes a que la cadena de suministro se ponga peor.

Cuéntanos qué necesitas — servidor, almacenamiento o ambos — y te confirmamos disponibilidad y plazo real en menos de 24 horas laborables.

Storage Scale vs Ceph para inferencia IA: cuál elegir

Storage Scale vs Ceph · Inferencia IA

Storage Scale vs Ceph para inferencia IA: cuál elegir.

Implementamos los dos. Llevamos años con ambos en producción. Y no, la respuesta no es «usa los dos»: es entender qué hace bien cada uno, en qué fallan, y cuál encaja en tu caso.

12 min lecturaStorage · IA · Arquitectura

Últimamente nos llega la misma pregunta con distintos disfraces: «¿Storage Scale o Ceph para inferencia IA?»

Somos IBM Business Partner. Vendemos Storage Scale. También damos formación en Ceph y hacemos consultoría de Ceph en producción. Así que cuando decimos «este es mejor para tu caso», es porque realmente analizamos y sabemos qué puede funcionar para cada cliente.

Esto es lo que le contamos a un cliente cuando se sienta con nosotros a diseñar la arquitectura de almacenamiento para inferencia IA.

01 · Lo primero

Antes de elegir: qué le pide la inferencia al almacenamiento

Mucha gente empieza por el producto. Nosotros empezamos por el patrón de acceso, porque es lo que determina si la elección funciona o te da dolor de cabeza durante años.

Un entorno de inferencia de verdad — no un Llama corriendo en un portátil — tiene esta pinta:

Lo que vive en tu storage de inferencia
# Lo gordo — lectura paralela, muchos nodos a la vez models/llama-70b/ ← 40-140 GB en shards safetensors models/embedding/ ← pequeños pero se leen constantemente# RAG — millones de ficheros pequeños, acceso mixto rag/raw/ ← PDFs, emails, imágenes, audio rag/parsed/ ← salida de Docling/OCR rag/chunks/ ← fragmentos, JSONL, parquet rag/embeddings/ ← vectores# Operación — batch, logs, adapters batch-jobs/ ← input/output de inferencia batch checkpoints/ ← LoRA adapters, fine-tuning logs/ ← trazabilidad, evaluación

Y esos datos los consume un zoo de procesos: nodos GPU con vLLM o TGI, nodos CPU, Spark o Ray preprocesando, pipelines de Docling y OCR, la base vectorial, aplicaciones legacy que entran por NFS, y alguien de compliance que quiere ver un PDF desde Windows por SMB.

Si tu caso se parece a esto — muchos consumidores, muchos protocolos, datos compartidos — ese patrón es el que tiene que mandar en la decisión. No el precio por TB ni el logo del vendor.

02 · Storage Scale

Dónde gana Storage Scale para inferencia IA

POSIX nativo: tus frameworks esperan un directorio, no un bucket

Esto parece obvio hasta que te toca montarlo. Mira cómo cargan modelos las herramientas que vas a usar:

Así cargan modelos los frameworks reales
# HuggingFace Transformers model = AutoModel.from_pretrained("/models/mistral-7b")# vLLM vllm serve /models/Meta-Llama-3-8B-Instruct# Triton Inference Server model_repository: /models/triton-repo/

Piden un path. Un directorio. No un endpoint S3. Storage Scale (el antiguo GPFS) es un filesystem paralelo POSIX nativo. Ese /models es un directorio compartido que todos los nodos leen a la vez, con acceso concurrente real, sin copias intermedias. No hay que inventar nada.

IBM Storage Scale — documentación oficial

Cero copias entre capas: el argumento que más nos convence

Con Ceph S3, el patrón típico para servir un modelo es: descargar del bucket → escribir en disco local o PVC → arrancar el motor de inferencia → servir. Son tres pasos antes de que la primera query entre. Y si tienes 16 nodos, los 16 descargan su copia.

Con Storage Scale, el motor de inferencia apunta a /gpfs/models/llama-70b/ y arranca. Ya está. Sin descarga, sin caché, sin «¿este nodo tiene la última versión del modelo?». Cuando cambias el modelo, lo cambias una vez y todos los nodos lo ven.

Eso se nota especialmente cuando estás iterando — cambiando modelos, probando adapters LoRA, rotando entre configuraciones. Con caché local acabas manteniendo scripts de sincronización, invalidación y limpieza de disco. Con un filesystem paralelo no hay nada que mantener.

Multiprotocolo sobre el mismo fichero

Esto es lo que a los clientes enterprise les resuelve la vida. Un mismo fichero en Storage Scale se puede consumir por POSIX (nodo GPU), por S3 (app moderna), por NFS (equipo de datos), por SMB (alguien en Windows) y por CSI (pod en Kubernetes). El mismo fichero. No una copia por protocolo. No un namespace diferente por interfaz.

IBM lo implementa a través de Cluster Export Services (CES), que expone acceso S3, NFS y SMB sobre el mismo dato del filesystem paralelo.

En un entorno donde conviven contenedores modernos con aplicaciones legacy que no sabes ni quién mantiene, esto es lo que te permite montar una factoría de IA sin romper lo que ya funciona.

Metadata: cuando tienes millones de ficheros pequeños

RAG enterprise no es «tres PDFs en un bucket». Son millones de documentos, millones de chunks, millones de embeddings, ficheros de configuración, índices auxiliares, shards, logs. Operaciones intensivas sobre directorios grandes con muchos ficheros pequeños. Storage Scale lleva décadas resolviendo esto en entornos HPC — Summit, Sierra y otros supercomputadores corrían sobre GPFS. CephFS puede funcionar para esto, pero en nuestra experiencia hay que afinar bastante más el diseño para que no sufra.

03 · Ceph

Dónde gana Ceph para inferencia IA

Object storage masivo: S3 de verdad, no S3 como feature

Ceph nació como almacenamiento distribuido para objetos, bloques y ficheros. Su RGW (RADOS Gateway) ofrece una API S3 completa, con lifecycle policies, versioning, multitenancy, IAM — todo lo que necesitas para operar un object store serio. No es un add-on. Es su razón de ser.

Si tu pipeline de inferencia es S3-native — los modelos se descargan de un bucket, los datasets se leen por API, los resultados se escriben como objetos — Ceph va como un tiro. Un cluster Ceph bien diseñado escala horizontalmente a cientos de PB añadiendo nodos commodity.

Coste por TB: aquí Ceph arrasa

Seamos directos: Storage Scale cuesta más. Necesita licencias IBM, hardware con ciertos requisitos, y gente que sepa operarlo (no abunda). Ceph corre en hardware commodity, no tiene coste de licencias de software, y un equipo con experiencia en Linux puede operarlo.

Para un cliente con petabytes de datos donde la mayoría son «fríos» — datasets de entrenamiento, archivos históricos, backups de modelos — no tiene sentido pagar Storage Scale por TB que se leen una vez al mes. Ceph con erasure coding bien configurado es la respuesta correcta ahí.

Kubernetes: Rook lo hace todo trivial

Para equipos que viven en Kubernetes u OpenShift, Ceph con Rook es difícil de superar. Un operador que te da RBD (ReadWriteOnce), CephFS (ReadWriteMany) y RGW (S3) desde un solo clúster. OpenShift Data Foundation (ODF) es literalmente Ceph empaquetado por Red Hat — lo contamos en detalle en nuestra guía Ceph vs MinIO 2026.

Storage Scale también tiene CSI, pero Rook/Ceph lleva más tiempo en el ecosistema Kubernetes y la comunidad es mucho más grande. Si tu equipo piensa en operadores, en Helm charts y en GitOps, Ceph es su idioma.

Block storage para VMs y bases de datos

Si además de inferencia tienes OpenStack, virtualización o necesitas volúmenes de bloque para bases de datos, el RBD de Ceph es de lo mejor que hay. Storage Scale no compite aquí — no es su territorio.

Dato

El CERN opera más de 60 PB en Ceph en producción, vertebrando su infraestructura OpenStack. Ha pasado de unos pocos PB a escala exabyte en una década, añadiendo nodos sin saltos arquitectónicos. Lo contamos con más detalle en nuestro artículo sobre almacenamiento open source para IA y HPC.

04 · Las pegas

En lo que falla cada uno — y nadie te quiere contar

Aquí es donde la mayoría de artículos se ponen tibios. Nosotros no. Implementamos los dos, y los dos tienen cosas que no nos gustan.

Lo que no nos gusta de Storage Scale

  • Es caro. Licencias IBM, hardware con requisitos específicos, y un rack con Storage Scale ECE + GPUs no baja de una inversión considerable. Para un piloto de IA o una startup, no tiene sentido.
  • Operarlo exige un perfil HPC. No es que sea difícil — es que es un mundo diferente al cloud-native. Si tu equipo vive en Kubernetes y nunca ha tocado un filesystem paralelo, la curva de aprendizaje es real.
  • S3 no es su punto fuerte. Storage Scale tiene acceso S3 vía CES, y funciona. Pero si lo comparas con RGW de Ceph en features S3 puras — lifecycle, multitenancy, versioning avanzado — Ceph le saca ventaja.
  • Block storage: prácticamente no existe. Si necesitas RBD o volúmenes de bloque para VMs, Storage Scale no es tu herramienta.

Lo que no nos gusta de Ceph

  • CephFS no es GPFS. CephFS funciona, pero para muchos clientes concurrentes haciendo I/O paralelo sobre millones de ficheros (el patrón clásico de IA/HPC), Storage Scale tiene bastante más rodaje. Lo explicamos en nuestra comparativa de 2023.
  • El patrón de caché local añade complejidad. Si tus modelos viven en S3, cada nodo de inferencia descarga su copia. Con 4 nodos es trivial. Con 32, estás manteniendo scripts de sincronización, controlando versiones de caché, y rezando para que no se llene el disco local.
  • Multiprotocolo no es limpio. Ceph habla RGW (S3), RBD (bloque), CephFS (fichero) y NFS (vía Ganesha). Pero cada protocolo opera sobre su pool o namespace. No puedes leer el mismo fichero por S3 y por NFS a la vez de forma transparente como en Storage Scale.
  • Metadata bajo presión. Operaciones intensivas sobre directorios con millones de ficheros pequeños (el caso RAG) pueden ser un cuello de botella en CephFS si no se diseña bien. Ceph no se improvisa.
Trampa habitual

Montar s3fs o goofys para darle POSIX a Ceph S3 y poder usar from_pretrained() directamente. Técnicamente funciona. En producción, la semántica POSIX es parcial, el rendimiento es impredecible y los errores son creativos. No lo recomendamos como solución permanente.

05 · La comparativa

Storage Scale vs Ceph para almacenamiento de inferencia IA: resumen

Criterio Storage Scale Ceph
POSIX para IA
Nativo
CephFS
Object store S3
Vía CES
Nativo
Block storage
No
RBD
Model loading compartido
Directo
Con caché
RAG / muchos ficheros
Fuerte
Si es S3
Multiprotocolo / mismo dato
No limpio
Kubernetes
CSI
Rook
Coste por TB
Alto
Bajo
Operación
HPC
SRE
Heritage IA/HPC
Décadas
Creciente

En crudo: Storage Scale gana cuando los datos están «vivos» — muchos procesos leyendo modelos compartidos, pipelines POSIX, entornos mixtos donde coexisten Kubernetes y aplicaciones legacy. Ceph gana cuando los datos son objetos — S3 como interfaz principal, modelos que se cachean en local, equipos cloud-native, presupuesto ajustado.

Intentar usar Storage Scale como object store barato es tirar dinero. Intentar que CephFS se comporte como un filesystem paralelo HPC es buscar problemas. Cada uno es muy bueno en lo suyo.

06 · Opinión SIXE

Lo que le diríamos a un cliente que nos preguntase hoy

Si nos pones contra la pared: para inferencia IA en entornos enterprise con datos compartidos y RAG, Storage Scale da menos quebraderos de cabeza. Los modelos están vivos, compartidos, accesibles por el protocolo que necesite cada consumidor. No hay que mantener scripts de sincronización ni cruzar los dedos con la caché.

Pero si tu patrón es cloud-native de verdad — pods stateless, S3 como fuente de verdad, equipo SRE que sabe operar Ceph — entonces Ceph es la respuesta correcta y te va a costar bastante menos. No lo decimos por quedar bien: lo hemos visto funcionar así en producción muchas veces.

Y si tu entorno tiene datos sensibles en IBM Power, integración con DB2 u Oracle, y la inferencia va a convivir con cargas HPC o analytics — ahí Storage Scale no tiene rival real. Es su terreno natural. Lo contamos con más detalle en el contexto de IBM Fusion y las GPUs NVIDIA Blackwell, donde Storage Scale + Content-Aware Storage empieza a convertir el almacenamiento en un motor activo de preparación de datos para RAG.


¿Storage Scale o Ceph?

Depende. Cuéntanoslo y te decimos.

Implementamos los dos en producción. Te ayudamos a elegir el que encaja en tu caso, no el que nos da más margen.

IBM Fusion y NVIDIA Blackwell: qué cambia para la IA on-premises

IBM Storage · NVIDIA · IA

IBM Fusion y NVIDIA Blackwell: el almacenamiento ahora procesa datos para IA.

GTC 2026 trajo una alianza IBM-NVIDIA mucho más profunda de lo que parece. Fusion ya no es solo storage para contenedores: con Content-Aware Storage y GPUs Blackwell, el almacenamiento se convierte en un motor activo de preparación de datos para IA.

8 min lecturaStorage · IA · Infraestructura

El 16 de marzo, IBM subió al escenario de GTC 2026 en San José con un anuncio que pasó relativamente desapercibido fuera de los círculos de storage: una colaboración expandida con NVIDIA que abarca GPUs Blackwell Ultra en IBM Cloud, analítica de datos nativa en GPU, procesamiento inteligente de documentos y despliegues on-premises para sectores regulados.

Tres semanas después, IBM publicó un Redbook técnico que detalla cómo integrar Storage Scale, Fusion y Content-Aware Storage (CAS) con la plataforma NVIDIA AI Data Platform. Y hace días, IBM, NVIDIA y Samsung demostraron un sistema CAS capaz de gestionar 100 mil millones de vectores en un solo servidor.

¿Qué significa todo esto en la práctica? ¿Es un cambio real o es marketing de keynote? Lo analizamos.

El anuncio

GTC 2026: IBM y NVIDIA se toman en serio la IA empresarial

Lo que IBM anunció en GTC no es un partnership genérico. Son cinco líneas de trabajo concretas que afectan directamente a cómo las empresas despliegan IA on-premises:

  • GPUs Blackwell Ultra en IBM Cloud — disponibles desde Q2 2026 para entrenamiento a gran escala, inferencia de alto rendimiento y razonamiento IA.
  • Content-Aware Storage (CAS) integrado en la próxima versión de Fusion — el almacenamiento deja de ser pasivo y empieza a procesar datos para IA.
  • Red Hat AI Factory con NVIDIA — OpenShift + GPUs NVIDIA como plataforma estandarizada para desplegar IA en producción.
  • IBM Consulting + NVIDIA Blueprints — servicios de integración para llevar IA de piloto a producción.
  • Soporte para NVIDIA AI Data Platform (AIDP) — un diseño de referencia que integra compute, networking y storage en un sistema unificado para IA.
Fuente: IBM Newsroom, 16 marzo 2026

El dato que más impacto tiene para infraestructura on-premises: Fusion HCI ya incluye servidores GPU con NVIDIA H200 y RTX Pro 6000 Blackwell Edition. Esto no es un roadmap — el hardware está disponible. Cada sistema admite hasta 4 servidores GPU con 8 tarjetas cada uno.

Para entender cómo encajan todas las piezas, este es el stack completo que IBM ha definido como referencia para AIDP sobre Fusion:

Y Rob Davis, VP de Storage Networking Technology en NVIDIA, fue directo en su declaración: los agentes de IA necesitan acceder, buscar y procesar datos a escala, y hoy esos pasos ocurren en silos separados. La integración de CAS con NVIDIA orquesta datos y compute a través de una red optimizada para superar esos silos.

La tecnología

Content-Aware Storage: cuando el almacenamiento entiende lo que guarda

Esto es lo más interesante del anuncio y lo que menos se ha cubierto. Hasta ahora, el almacenamiento empresarial era un repositorio pasivo: guardaba ficheros y los servía cuando se los pedían. Para hacer RAG (Retrieval-Augmented Generation) o alimentar modelos de IA con datos corporativos, necesitabas una pipeline separada que extraía documentos, los troceaba en chunks, los vectorizaba y los metía en una base de datos vectorial.

CAS elimina esa pipeline externa. Opera en dos fases — visualízalo así:

Fase 1: Ingesta y preparación continua

CAS monitoriza carpetas en Storage Scale (o en almacenamiento externo vía AFM) y detecta cambios en tiempo real. Cuando un documento se modifica o se añade, CAS lo procesa automáticamente: extracción de contenido de texto, tablas, gráficos e imágenes usando NVIDIA NeMo Retriever, chunking semántico, y conversión a embeddings de alta dimensión. Los vectores se indexan en una base de datos vectorial gestionada por CAS sobre Storage Scale ECE.

Fase 2: Consulta y recuperación

Cuando un usuario o un agente de IA hace una pregunta, CAS realiza búsqueda semántica, por keywords (BM25) o híbrida. Los resultados pasan por un reranker de NVIDIA optimizado para máxima relevancia. Y lo crítico: los vectores heredan los controles de acceso (ACLs) de los documentos originales. Si un usuario no tiene permiso para ver un fichero, tampoco ve sus vectores en los resultados de RAG.

Fuente: IBM Redbook MD248598 — Enabling AI Inference at Scale, abril 2026
Por qué importa

La mayoría de despliegues RAG empresariales fallan en dos puntos: los datos se quedan obsoletos porque nadie actualiza la base vectorial, y no hay control de acceso sobre los vectores. CAS resuelve ambos problemas a nivel de infraestructura, no de aplicación. Eso es un cambio de paradigma real.

Demo IBM + NVIDIA + Samsung
100mil millones
de vectores en un solo servidor con compute y storage desacoplados, indexación jerárquica acelerada por GPU. A esa escala, los índices RAG tradicionales se vuelven inmanejables.
Fuente: SDxCentral, abril 2026
El hardware

H200, RTX Pro 6000 y Blackwell Ultra: qué GPU va dónde

Hay tres líneas de GPU NVIDIA en el ecosistema IBM que conviene no confundir. Cada una tiene un rol distinto — pincha cada pestaña para ver dónde se despliega y para qué sirve:

NVIDIA Blackwell Ultra
GTC 2026 · Cloud-first
IBM Cloud
DisponibilidadIBM Cloud · Q2 2026
Caso de usoEntrenamiento a gran escala, inferencia de alto rendimiento, razonamiento IA
DespliegueCloud puro · sin opción on-prem en Fusion
IntegraciónRed Hat AI Factory + VPC servers con compliance
Si tu carga de trabajo puede ir a cloud y no tienes restricciones de residencia de datos, Blackwell Ultra en IBM Cloud es la opción más potente del catálogo. Pero si tus datos no pueden salir del perímetro, mira las otras dos pestañas.
NVIDIA H200
Hopper · Memoria HBM3e ampliada
Fusion HCI on-prem
DisponibilidadFusion HCI · Mayo 2026
Caso de usoEntrenamiento, fine-tuning e inferencia pesada de LLMs
Memoria141 GB HBM3e · 4,8 TB/s bandwidth
Configuración2 GPUs por servidor · Hasta 4 servidores por rack
Total máximo32 GPUs por sistema Fusion
La H200 es la opción para entrenamiento serio on-premises. Su memoria HBM3e ampliada respecto a la H100 la hace ideal para modelos grandes que antes no cabían sin sharding agresivo. En Fusion HCI accede directamente a Storage Scale ECE por red 200 GbE.
NVIDIA RTX Pro 6000
Blackwell Edition · Inferencia + visualización
Fusion + AIDP
DisponibilidadFusion HCI · Mayo 2026
Caso de usoInferencia, RAG, vectorización con CAS, visualización profesional
ArquitecturaBlackwell Server Edition · 96 GB GDDR7
Configuración2 GPUs por servidor · Hasta 4 servidores por rack
Stack AIDP+ BlueField-3 DPU · ConnectX-7/8 SuperNICs
La RTX Pro 6000 Blackwell es la GPU del stack AIDP de referencia. Acelera el chunking semántico y la vectorización de CAS, y combinada con BlueField-3 DPU descarga el procesamiento de red y storage de la CPU principal. Es la pieza clave para CAS-RAG en producción.
Fuente: IBM Redbook MD248598 — Reference Stack AIDP
Lo que no es obvio

BlueField-3 no es solo un NIC rápido. Es un DPU (Data Processing Unit) que descarga operaciones de red, storage y seguridad de la CPU principal. En un sistema AIDP, los BlueField-3 aceleran la comunicación entre Storage Scale y las GPUs, reduciendo la latencia de acceso a datos para inferencia en tiempo real. Es una pieza crítica que no aparece en las keynotes pero marca la diferencia en rendimiento real.

La lectura

Qué significa esto para la IA on-premises

Si juntamos todas las piezas, el mensaje de IBM es claro: Fusion ya no es un producto de almacenamiento para contenedores. Es una plataforma de IA on-premises que integra compute (OpenShift), aceleración (GPUs NVIDIA), almacenamiento inteligente (Storage Scale + CAS) y networking optimizado (Spectrum-X + BlueField-3) en un appliance unificado.

Para organizaciones que no pueden — o no quieren — enviar sus datos a la nube, esto es relevante. Especialmente en tres escenarios:

Sector regulado

Banca, sanidad, administración pública. Los datos no pueden salir del perímetro. Con Fusion HCI + CAS + GPUs NVIDIA puedes tener RAG corporativo sobre documentos internos sin que nada salga del rack. Y los ACLs se respetan a nivel de vector — compliance integrado, no bolted-on.

IA sobre datos propios a gran escala

IBM cifra que el 80-90% de los datos empresariales son no estructurados. CAS convierte ese volumen en datos consumibles por IA de forma continua y automática. No es un proyecto de ETL puntual — es una capacidad permanente de la infraestructura.

Alternativa a cloud cuando el TCO no cuadra

IBM sigue repitiendo el dato de rendimiento equivalente a Databricks al 60% del coste. Es un benchmark interno sobre operaciones seleccionadas, así que hay que tomarlo con cautela. Pero la lógica económica de on-premises para cargas predecibles y de alto volumen sigue siendo sólida. Si sabes que vas a tener 30 GPUs corriendo 24/7, el TCO on-premises suele ganar.

Nuestra lectura

¿Es real o es marketing?

Un poco de ambos, como siempre. Lo que es indiscutiblemente real:

  • El hardware existe y se puede comprar. Las H200 y RTX Pro 6000 están disponibles como servidores GPU para Fusion HCI. No es un roadmap.
  • CAS funciona. La demo de 100 mil millones de vectores es verificable. El Redbook detalla la arquitectura paso a paso.
  • NVIDIA AIDP es un diseño de referencia real con adopción temprana en sanidad (UT Southwestern Medical Center) y finanzas.
  • Red Hat AI Factory estandariza el despliegue de OpenShift + GPU como plataforma de IA, que es exactamente lo que Fusion HCI entrega como appliance.

Lo que hay que matizar:

  • CAS aún no está en Fusion GA. IBM dijo Q2 2025, luego Q2 2026. Está integrado en Storage Scale desde marzo 2025, pero la versión embebida en Fusion todavía está aterrizando.
  • El dato del 60% del coste vs Databricks es un benchmark interno en condiciones controladas. En producción real, el beneficio dependerá de tu carga de trabajo.
  • Fusion HCI no es barato. Un rack con GPU H200, 16 nodos de storage y licencias OpenShift es una inversión considerable. Tiene sentido para organizaciones con datos sensibles y cargas predecibles, no para un piloto de IA.
Opinión de SIXE

Lo más significativo de esta oleada no son las GPUs — esas las tienen todos. Es CAS. Que el almacenamiento entienda semánticamente lo que guarda y mantenga una base vectorial actualizada en tiempo real con ACLs heredados es un cambio arquitectónico real. Si funciona como promete (y las demos sugieren que sí), resuelve los dos problemas principales de RAG empresarial: freshness y seguridad.

Dicho esto, no todo el mundo necesita Fusion HCI para beneficiarse. CAS vive en Storage Scale, que también se puede desplegar como software-defined sobre tu propio hardware. Y si tu volumen de datos no justifica Storage Scale, Ceph con una pipeline RAG convencional sigue siendo una alternativa viable y más económica.

Como siempre, la respuesta depende del volumen, la sensibilidad de los datos y el presupuesto. Te ayudamos a evaluarlo.


¿Evaluando IA on-premises?

Cuéntanos tu caso de uso. Te ayudamos a dimensionar.

Fusion HCI, Fusion Software, Storage Scale standalone o Ceph — depende de lo que necesites. No vendemos una solución; te ayudamos a elegir la correcta.

¿Sigues en Informix 12.10? Esto te interesa

IBM Informix · Migración

¿Sigues en Informix 12.10? Esto te interesa.

El soporte de 12.10 se ha acabado. Pero mientras no mirabas, Informix ha cambiado bastante: contenedores standalone para Kubernetes, un motor nuevo por dentro, backup nativo a S3 y una certificación que cambia de versión.

6 min lecturaBases de datos · Cloud-native

En marzo, Anup Nair — Principal Technical Product Manager de Informix — publicó en IBM TechXchange el anuncio del Informix Standalone Container. Imágenes enterprise-grade para Kubernetes y OpenShift, con soporte oficial, sin depender de Cloud Pak for Data. El post acumula 13 visualizaciones y cero comentarios. Casi nadie se ha enterado.

Y sin embargo, es probablemente el cambio más significativo en la forma de desplegar Informix desde que IBM lo compró. Junto con el fin del soporte de 12.10, las novedades de Informix 15 y la transición de la certificación a v15, el panorama ha cambiado bastante. Aquí lo resumimos.

Novedades de Informix — contenedores standalone, migración desde 12.10 y formación oficial
La noticia

Contenedores standalone: qué ha cambiado

Hasta hace poco, si querías Informix en contenedores con soporte enterprise en producción, el único camino era Cloud Pak for Data (CP4D). Las imágenes de Docker Hub — que se han movido al IBM Container Registry (ICR) — eran Developer Edition: válidas para desarrollo, sin soporte para producción.

El Informix Standalone Container elimina esa dependencia:

  • Imágenes production-grade para Informix v14 y v15 en IBM Container Registry.
  • Despliegue directo en Kubernetes y OpenShift sin CP4D.
  • Soporte enterprise bajo el entitlement existente — no es un producto adicional.
  • Upgrade de Developer a Enterprise Edition cambiando imagen y aplicando installer.
  • CASE bundles en GitHub: ibm-informix-standalone.
Fuente: Anup Nair, IBM TechXchange Community, marzo 2026

En la práctica esto significa integrar Informix en pipelines CI/CD, levantar instancias para tests automatizados, desplegar con Helm Charts en hybrid-cloud y tener entornos dev idénticos a producción. Daniel Weber, Informix Container Dev Lead, hizo demo del proceso en la IIUG Tech Talk de abril.

Es el tipo de anuncio que no sale en titulares pero cambia cómo se opera un producto en el día a día.

El corte

Informix 12.10 ha perdido el soporte

El 30 de abril, IBM ha completado la transición de Informix 12.10 a Extended Support. Tres consecuencias directas:

  • Sin parches de seguridad. Cualquier vulnerabilidad descubierta queda sin resolver.
  • Sin correcciones de bugs. El fixpack actual es el último.
  • Soporte técnico solo de pago bajo Extended Support, hasta 2030.
Fuente: IBM Product Lifecycle — Informix 12.10

El CSDK 4.10 (Client SDK) también pasa a Extended Support en la misma fecha, lo que afecta a drivers ESQL/C, ODBC y JDBC antiguos.

12.10 se lanzó en 2013. Trece años es un ciclo razonable. Pero muchos entornos siguen corriendo esta versión porque «funciona» y nunca hubo presión suficiente para migrar. Ahora la presión existe — y coincide con que hay un camino de modernización real: contenedores, cifrado nativo, backup a S3.

La decisión

14.10 o 15: cuál elegir para migrar

Informix 15 (noviembre 2024) es la primera release major en más de un lustro, con cambios profundos en las estructuras internas del motor: límites ampliados drásticamente (una partición puede tener 140 billones de páginas), cifrado nativo por dbspace, Wire Listener mejorado (MongoDB 3.2–4.2), backup a S3/Azure/IBM COS con ON-Bar, Helm Charts oficiales y Java 11 obligatorio.

Informix 14.10xC13 (enero 2026) es la última release de la rama 14.10: mejoras en archecker para SmartLOBs, Direct I/O para bloques 2K/4K, y las correcciones acumuladas. Madura, probada, conservadora.

Estable · Probado
Informix 14.10xC13
Enero 2026 · Release madura
RiesgoBajo
UpgradeIn-place desde 12.10
DriversAlta compatibilidad
Cifrado dbspaceNo
Backup S3No nativo
ContainersStandalone ✓

Nuestra recomendación: si el entorno es estable y no necesitas las funcionalidades de 15, la ruta 12.10 → 14.10 es la más segura. Te da tiempo a que Informix 15 acumule fixpacks. Si el proyecto es nuevo o necesitas cifrado at-rest, backup a cloud o Kubernetes nativo, ve directo a 15.

Lo que no recomendamos

Quedarse en 12.10 bajo Extended Support «hasta que no haya más remedio». El Extended Support tiene fecha de fin y cuanto más esperes, menos flexibilidad tendrás. Migrar con prisas es caro. Migrar planificadamente es un proyecto controlable.

El equipo

Por qué formar al equipo importa tanto como migrar

Lo vemos proyecto tras proyecto. Un equipo actualiza Informix y sigue operando con los mismos procedimientos de hace ocho años. El servidor está en versión nueva; el conocimiento sigue en la antigua.

14.10 introdujo AUTO_TUNE que convierte en innecesarios muchos ajustes manuales. 15 cambia la filosofía de cifrado, backup y despliegue. Y con los contenedores standalone hay un modelo operativo nuevo que requiere competencias de Kubernetes que un DBA clásico no necesariamente tiene. La documentación oficial está en la guía de despliegue containerizado de Informix 15, pero la documentación no sustituye a la formación práctica.

La certificación oficial también ha cambiado: el IIUG e IBM han confirmado la transición a la nueva IBM Certified Informix v15.0 Database Administrator – Professional. La certificación v14 se está retirando.

Nuestros cursos de Informix

En SIXE llevamos más de 15 años impartiendo formación oficial de IBM. Hemos actualizado todo el temario de Informix a v15 con laboratorios nuevos y documentación propia.

Informix 15 & 14.10 System Administration (SIFMX819G) — 3 días / 24 horas. Desde la arquitectura del servidor hasta troubleshooting en producción, con módulo de migración 12.10→14.10/15 y despliegue en contenedores. Impartido por DBAs en activo sobre una instancia Informix 15 en vivo.

El catálogo completo de Informix incluye administración de sistemas, administración de bases de datos y cursos personalizados para migración. En español, inglés y francés — online, presencial, abierto o in-company.

Ver todos los cursos de Informix →


¿Migración, contenedores o formación?

Cuéntanos qué Informix tienes y te decimos por dónde empezar.

Versión actual, si estáis mirando contenedores, si necesitáis formar al equipo antes de mover producción. Sin pitch comercial.

IBM COS vs Ceph: cuándo migrar y en qué dirección (2026)

Object Storage · Abril 2026

IBM COS vs Ceph: cuándo migrar, en qué dirección y por qué.

Tres caminos para hacer object storage a escala petabyte — y cómo llegamos a la recomendación correcta en cada caso. Con quince años de despliegues en producción y tres casos reales sobre la mesa.

Abril 202611 min lecturaInfraestructura · Open Source

En 2026, si llevas un despliegue de object storage de varios petabytes y te planteas qué hacer con él los próximos cinco años, tienes tres opciones realistas sobre la mesa: IBM Cloud Object Storage (el heredero de Cleversafe), Ceph upstream apoyado en un partner de soporte, o Ceph empaquetado comercialmente — típicamente IBM Storage Ceph.

Nuestra preferencia es el open source y lo decimos al principio para no hacer perder el tiempo a nadie. Pero también hemos recomendado IBM COS a clientes concretos sabiendo que era la respuesta correcta, y nos hemos opuesto a migraciones que nos habrían facturado bien pero que habrían complicado la vida del cliente sin ganancia real. En este artículo explicamos cuándo y por qué, con casos vividos.

Comparativa IBM COS vs IBM Storage Ceph vs Ceph upstream — criterios de elección para migración de object storage
El contexto

El contexto de 2026, sin adornos

El mercado de object storage on-premise lleva tres años en reacomodo. IBM ha ido reposicionando COS varias veces desde que absorbió Cleversafe en 2015: primero como producto independiente, luego empujado hacia IBM Storage Ready Nodes, después integrado en el discurso de «cyber vault» dentro del portfolio de Storage Defender. Los clientes históricos de Cleversafe — muchos de ellos con despliegues legacy de más de diez años sobre hardware Cisco UCS que ya tocaron fin de vida — se preguntan cuál es el camino a cinco años.

Ceph, mientras tanto, ha hecho lo contrario. Ha consolidado. La release actual Tentacle (20.2.1, abril de 2026) cierra un ciclo de madurez que arrancó con Reef y Squid, y el proyecto tiene contribuciones activas de CERN, DigitalOcean, Bloomberg, OVH, Clyso, Red Hat/IBM y SUSE. Es difícil encontrar un proyecto open source de infraestructura con más actividad sostenida.

En el medio ha aparecido IBM Storage Ceph: Ceph upstream empaquetado y soportado comercialmente por IBM, heredero directo de Red Hat Ceph Storage. Técnicamente es el mismo Ceph. Comercialmente es una suscripción con SLA vendor tier-1. Existe porque hay clientes cuyos pliegos exigen soporte enterprise con nombre conocido, y Ceph upstream «a secas» no pasa ese corte aunque técnicamente sea idéntico.

Tres productos, tres modelos de negocio, tres perfiles de cliente distintos.

Las opciones

Los tres protagonistas, en sesenta segundos

IBM COS
IDA patentado (SecureSlice), arquitectura cerrada de tres capas, hardware certificado. Fuerte en compliance regulatorio avanzado.
Propietario
IBM Cloud Object Storage
Heredero Cleversafe · ClevOS
LicenciaPropietaria IBM
HardwareLista cerrada cert.
ProtocolosObject S3 / Swift
Coste 5 añosAlto
Lock-inAlto
Op. complejidadBaja
IBM Storage Ceph
Ceph upstream con suscripción IBM. Mismo código, SLA contractual tier-1. Para quienes necesitan vendor enterprise en el pliego.
Ceph + IBM
IBM Storage Ceph
Red Hat Ceph heredero · ppc64le
LicenciaSuscripción IBM
HardwareCualquier x86/ARM
ProtocolosS3 · RBD · CephFS · NVMe-oF
Coste 5 añosMedio-alto
Lock-inMedio
Op. complejidadMedia

Hover sobre cada tarjeta para más detalle · La opción correcta depende de la realidad operativa de cada cliente

Los tres funcionan. A nivel técnico, las diferencias que importan no están en el qué hacen sino en el cómo se operan y en el cuánto cuestan a cinco años. IBM Storage Ceph e IBM COS no compiten entre sí — sirven a perfiles distintos. Si te interesa la comparativa de Ceph frente a Storage Scale, GPFS o NFS, tenemos un artículo específico: IBM Storage Ceph vs Storage Scale, GPFS, GFS2, NFS y SMB.

Nuestra posición

Por qué preferimos open source

No es ideología. Es el resultado de ver, proyecto tras proyecto, que un cliente con buen equipo interno o con un partner competente detrás obtiene sobre Ceph upstream la misma estabilidad operativa que sobre cualquier alternativa comercial, con bastante más libertad y por menos dinero.

El lock-in de los productos propietarios no es solo de hardware, es también de roadmap. Si mañana IBM reposiciona COS otra vez — y ya ha pasado varias veces desde 2015 —, el cliente mira el cambio desde la barrera. Con Ceph, si tu distribuidor comercial cambia de estrategia o sube precios, te mueves a upstream o a otro distribuidor sin migrar datos. La portabilidad es real, no es marketing.

La comunidad es garantía de continuidad de una manera que un solo fabricante no puede serlo. Un producto propietario depende en última instancia de una hoja de cálculo en la sede del fabricante. Ceph tiene tantos contribuidores institucionales que si uno se va — cosa que ha pasado — el proyecto sigue. Para infraestructura que vas a tener quince o veinte años en producción, esto cuenta.

La versatilidad arquitectónica se paga sola. Object storage hoy, block mañana para virtualización, file puntual, NVMe-oF cuando aparezca la necesidad. Todo sobre el mismo hardware y el mismo equipo. COS solo hace object bien. Separar plataformas por protocolo duplica equipos, procedimientos y contratos de soporte. Y para los casos donde Ceph actúa como backend NFS, hemos documentado el proceso en este artículo: NFS de alta disponibilidad con Ceph Ganesha.

La transparencia operativa es otro tipo de seguridad. Cuando algo falla en Ceph, tienes el código. Cuando algo falla en COS, abres un caso y esperas. Para equipos técnicos serios, la primera vale más de lo que aparenta en una comparativa de features.

El matiz importante

El open source no es gratis. Es distinto. Lo que te ahorras en licencias lo pagas en horas de equipo, propio o contratado. Si no tienes el equipo ni un partner que actúe como extensión de él, la cuenta puede darse la vuelta. Por eso la siguiente pregunta importa tanto como la filosofía: ¿quién opera esto en el día a día?

Honestidad técnica

Cuándo IBM COS es la respuesta correcta

Si fuéramos talibanes del open source estaríamos vendiendo humo y ya hay suficiente en el mercado. COS es la elección correcta para un perfil de cliente bastante concreto.

Equipos operativos pequeños, sin skills profundos en SDS y sin presupuesto para contratarlos ni para externalizar de forma continua. La curva de aprendizaje de Ceph es real. Si la organización no puede asumirla, un producto empaquetado como COS reduce la superficie de problemas operativos.

Sectores regulados con requisitos de compliance muy específicos — WORM auditado, retención bajo SEC 17a-4, Compliance Enabled Vaults, NENR. El ecosistema IBM está muy maduro aquí y las auditorías van más rápido cuando todo el stack es del mismo fabricante.

Política corporativa de «una sola garganta que apretar» con preferencia explícita por vendor tier-1. Hay organizaciones — banca conservadora, administración pública, defensa — donde el CISO no acepta una arquitectura sin SLA contractual. Discutir con esa política desde fuera es perder el tiempo; lo correcto es ayudar al cliente a elegir el producto que mejor encaje.

Ecosistema IBM ya desplegado. Si el cliente ya tiene Spectrum Protect, Storage Defender, Fusion, Power o Z, consolidar object storage dentro del mismo paraguas vendor tiene lógica operativa y comercial.

Escala muy grande (petabytes altos o exabytes) con workload predecible y estable, donde la simplicidad operativa de un producto maduro compensa el coste de la licencia. Hemos visto clientes con más de un exabyte bajo soporte IBM para los que migrar supondría un proyecto de tres años y decenas de millones; en esos casos la respuesta es quedarse y optimizar.

Lo que no justifica quedarse en COS

La inercia, el miedo mal informado al open source, o dar por buena la partida anual de licencia sin cuestionarla. Eso sí lo cuestionamos siempre.

La mayoría del mercado

Cuándo Ceph upstream con buen partner es la respuesta

Este es el escenario donde creemos que está la mayoría del mercado, aunque no siempre lo sepa.

Perfiles donde Ceph upstream gana claro:

  • Cliente con equipo técnico competente en Linux e infraestructura, o dispuesto a tener partner de soporte continuado.
  • Escala media-grande, de cientos de TB a decenas de PB, donde la suscripción comercial empieza a dolerle al presupuesto.
  • Necesidad o intención de unificar object, block y file en la misma plataforma.
  • Refresh de hardware en curso sin ganas de atarse a una lista certificada de un único fabricante.
  • Integración nativa con Kubernetes vía Rook, si hay plataforma cloud-native en el mapa.
  • Preferencia, simplemente, por poder ver lo que hay debajo del capó.

Aquí toca enfrentar un mito que lleva años rondando: que Ceph es difícil. Lo es a medias. Ceph es complejo — como lo es cualquier sistema distribuido serio — pero no es caótico ni inestable. La diferencia entre un cluster Ceph que da guerra y uno que corre años sin incidentes no está en el software. Está en el diseño del despliegue, en el tuning de los placement groups y del balancer, en la elección de hardware coherente, en la monitorización, y en tener a alguien al otro lado del teléfono que sepa qué hacer cuando algo raro aparece en ceph health detail. Tenemos un artículo específico sobre el error más común de Ceph y cómo corregirlo.

El problema no es Ceph. El problema es desplegarlo sin expertise. Eso es un problema de cualquier infraestructura compleja, no un defecto del producto.

La pregunta honesta. No es «¿puedo yo solo con Ceph?». Es «¿tengo a alguien — propio o contratado — que me cubra las espaldas?». Si la respuesta es sí, Ceph upstream da el mejor ratio coste/resultado del mercado. Si es no, hay que conseguir el alguien antes de firmar nada.

Un cluster Ceph bien operado funciona igual de bien con soporte upstream más partner competente que con una suscripción enterprise. La diferencia real es quién coge el teléfono a las tres de la mañana. Si te estás planteando Ceph frente a alternativas más ligeras de object storage, el artículo Ceph vs MinIO para 2026 cubre ese análisis en detalle.

La opción intermedia

IBM Storage Ceph: la opción intermedia

Aquí nos mojamos más, porque sobre este producto se escribe poco con claridad.

IBM Storage Ceph es, en lo técnico, Ceph. El mismo Ceph que te bajas de la web del proyecto. Empaquetado, probado, integrado con herramientas propias de IBM, soportado comercialmente con SLA, y certificado en varios entornos regulados. Eso es lo que pagas. Técnicamente no tienes nada que no puedas tener con upstream.

Cuándo tiene sentido pagarlo:

  • Pliegos de contratación pública o privada que exigen vendor tier-1 con soporte contractual, sin margen de negociación.
  • Organizaciones donde la política de compras obliga a soporte enterprise sí o sí, y no hay manera de homologar a un partner externo como sustituto.
  • Clientes que ya tienen un ELA con IBM y añadir Storage Ceph al paquete sale razonable frente al precio de lista.
  • Sectores con auditorías donde el nombre del fabricante en la factura acorta el proceso.

Cuándo no vale la pena: en prácticamente todos los demás casos. Si tu compliance no te obliga y tienes un partner decente, pagar suscripción por upstream es un sobrecoste evitable. A escala decenas de petabytes, la diferencia entre suscripción comercial y partner de soporte sobre upstream puede rondar cientos de miles de euros al año. A escala exabyte, pasa a millones. Ese dinero, para la mayoría de los clientes, vale más reinvertido en equipo, hardware o cualquier otra cosa.

Sin floritura. COS = producto completo, vendor único, coste alto, lock-in alto, simplicidad operativa alta. IBM Storage Ceph = Ceph de la comunidad con factura IBM, tranquilidad contractual, coste medio-alto. Ceph upstream con partner = máximo control, coste bajo, requiere madurez — propia o prestada.

Si tu realidad te empuja al primero o al segundo, ahí estaremos para ayudarte a operarlo bien. Pero la mayoría de clientes con los que trabajamos descubren, tras un assessment honesto, que el tercero les encaja mejor de lo que pensaban.

Casos reales

Tres casos reales

Anonimizados, porque los NDAs son los NDAs. La moraleja siempre es la misma: la pregunta correcta no es «cuál es mejor en abstracto» sino «cuál encaja con esta realidad concreta».

Casuística real · Tres perfiles, tres decisiones distintas
A
Operador telco europeo · 50 PB · COS → Ceph upstream
Hardware Cisco UCS M4 en fin de vida, refresh en hardware certificado IBM prohibitivo. Coste de licencia COS cuestionado internamente desde hacía años. Intención estratégica de consolidar object y block para la plataforma Kubernetes interna. Migración en fases durante 18 meses con dual-running. Resultado: coste operativo total reducido significativamente, equipo autosuficiente, SIXE como soporte de segundo nivel. Tres años después el cluster sigue estable.
Hardware EoLCoste licenciaConsolidación K8s
B
Entidad financiera regulada · 8 PB · Se quedaron en COS
Nos llamaron para evaluar una posible migración motivada por el coste. Hicimos el assessment completo. Recomendamos no migrar: equipo pequeño, sin presupuesto para asumir Ceph de forma autónoma, requisitos SEC 17a-4 con Compliance Enabled Vaults profundamente integrados en sus auditorías anuales, y aversión al riesgo operativo legítimamente alta. Ganamos menos, pero ganamos un cliente de largo plazo. Seguimos trabajando con ellos en optimización del despliegue existente y planificación del siguiente refresh.
SEC 17a-4Equipo pequeñoRespuesta: quedarse
C
Administración pública · 3 PB · Ceph self-managed → IBM Storage Ceph
Cluster Ceph desplegado internamente sin expertise suficiente: inestable, con incidentes recurrentes que habían quemado al equipo. Nuevo requisito de pliego exigía vendor tier-1 con soporte por contrato — upstream quedaba fuera. Los acompañamos en la migración a IBM Storage Ceph, la estabilización y la formación del equipo. Terminaron con un cluster sano. No era la opción más barata, pero era la única posible dadas las restricciones externas.
Pliego vendor tier-1Cluster inestable→ IBM Storage Ceph
Lo que nadie cuenta

Lo que la mayoría de comparativas no cuenta

Cuatro cosas que en los whitepapers de vendor nunca aparecen y que hemos visto tropezar a muchos equipos técnicos.

Migrar a escala petabyte no es copiar datos

Es migrar configuración: lifecycle policies, retention, legal holds, ACLs, CORS, bucket policies, versioning, notificaciones de eventos, tagging, replicación. Se migra el contexto tanto como los bytes. Un proyecto de migración mal escopado se da cuenta de esto a mitad de camino y se le duplica el calendario.

El dialecto S3 no es uniforme

Entre AWS S3, Ceph RGW e IBM COS hay diferencias sutiles en headers, en comportamiento de LIST con muchos objetos, en casos borde de multipart upload, en la semántica de versioning. Las aplicaciones cliente a veces necesitan ajustes. Hay que probar, no asumir.

La protección de datos cambia de filosofía según el producto

El IDA de COS, el erasure coding de Ceph y la replicación triple tradicional no son intercambiables a nivel de garantías de durabilidad ni de perfil de fallos que toleran. Traducir un IDA 10/8/7 de COS a un perfil de erasure coding de Ceph requiere criterio, no es aritmética.

El día a día operativo es radicalmente distinto

En COS diagnosticas con storagectl list y el shell del Manager. En Ceph con ceph -s, ceph osd tree, ceph health detail, placement groups, OSDs, CRUSH maps. Reentrenar a un equipo cuesta entre seis y doce meses de transición efectiva. Hay que presupuestarlo, no puede ser una nota al pie del proyecto.

Cómo trabajamos

Cómo trabajamos en SIXE

El esquema lleva años funcionando. Primero un assessment: revisamos la arquitectura actual, los workloads reales, el perfil del equipo operativo, las restricciones regulatorias, el presupuesto a tres o cinco años y las opciones técnicas viables. El output es una recomendación motivada, con alternativas, y a veces es «quédate donde estás». Lo hemos dicho más de una vez.

Luego un diseño, si hay migración o cambio sustancial. Arquitectura objetivo, plan por fases, ventanas operativas, matriz de riesgos, runbooks. No hay dos migraciones iguales.

Después la ejecución. Migración en fases con dual-running cuando es posible, validación de datos, QA funcional con aplicaciones cliente, ajuste fino post-corte.

Y finalmente el handover con mentoring al equipo del cliente, más soporte técnico Ceph continuado si quieren que sigamos al otro lado del teléfono. Muchos clientes prefieren este modelo — SIXE como extensión de su equipo — frente a una suscripción comercial. Es exactamente lo que hace viable Ceph upstream en producción seria. Para los equipos que quieren construir capacidad interna, tenemos el curso de administración de Ceph y el curso práctico de IBM Storage Ceph.

Nuestro equipo diagnostica un DONT-START-DAEMON de un slicestor ClevOS con la misma soltura que un placement group inactive+incomplete de Ceph. No somos un partner «de IBM» ni «de Ceph». Somos un partner de object storage, y conocemos las tres opciones lo suficientemente bien como para recomendar la que toca en cada caso.


¿Tienes object storage que revisar?

Una conversación técnica honesta, sin pitch comercial.

Cuéntanos tu despliegue actual — capacidad, workloads, equipo, restricciones regulatorias — y te decimos qué tiene sentido hacer. Si la respuesta es «quédate donde estás», también te lo decimos.

IBM DataStage: qué es, para qué sirve y cómo funciona el ETL de IBM

Data Integration · Abril 2026

Qué es IBM DataStage y por qué sigue siendo el ETL de referencia en entornos enterprise.

Mientras el mercado de integración de datos se fragmenta entre herramientas cloud-native, notebooks y orquestadores de moda, DataStage lleva tres décadas moviendo los datos que importan — los de banca, sanidad, telecomunicaciones y administraciones públicas. Te contamos qué es, cómo funciona y cuándo tiene sentido en 2026.

Abril 20269 min lectura

Si trabajas con datos en una empresa grande, probablemente ya has oído hablar de DataStage — aunque quizá no sepas exactamente qué es, o lo confundas con "esa cosa de IBM que se usa para mover datos". Es bastante más que eso.

IBM DataStage es la herramienta ETL (Extract, Transform, Load) de la suite IBM InfoSphere. Lleva más de 25 años en producción, ha pasado por varias adquisiciones y rebrandings, y en 2026 sigue siendo una de las piezas centrales del ecosistema de datos de IBM — ahora también disponible como servicio dentro de IBM Cloud Pak for Data.

Los fundamentos

Qué es DataStage y de dónde viene

IBM DataStage es una herramienta de integración de datos que permite diseñar, desplegar y ejecutar pipelines que extraen información de múltiples fuentes, la transforman según reglas de negocio y la cargan en sistemas destino. En el mundo de la ingeniería de datos, esto se conoce como ETL — Extract, Transform, Load — y DataStage es una de las implementaciones más veteranas y robustas del mercado.

La historia es larga y vale la pena resumirla porque explica mucho de lo que es hoy. DataStage nació en los años 90 como producto de Ardent Software, fue adquirida por Informix, que a su vez fue comprada por IBM en 2001. Desde entonces forma parte de la familia IBM InfoSphere — una suite de herramientas para integración, calidad y gobierno de datos.

Lo que diferencia a DataStage de un script de Python o de un flujo en Apache Airflow no es lo que hace (mover datos de A a B), sino cómo lo hace: con una interfaz visual de diseño de jobs, un motor de procesamiento paralelo distribuido, conectores nativos para prácticamente cualquier base de datos o sistema del planeta, y un sistema de metadatos integrado que permite trazar de dónde viene cada dato y qué transformaciones ha sufrido.

En cristiano: DataStage es lo que usan las organizaciones que mueven millones de registros cada noche entre decenas de sistemas, y que necesitan que eso funcione siempre, sea auditable y no requiera un equipo de 15 personas para mantenerlo.

La arquitectura

Cómo funciona: el motor de procesamiento paralelo

El componente central de DataStage es su motor paralelo (Parallel Framework). A diferencia de las herramientas ETL que procesan datos de forma secuencial — un registro detrás de otro —, DataStage distribuye el trabajo entre múltiples particiones que se ejecutan simultáneamente. Es la misma idea que MapReduce o Spark, pero implementada antes de que esas tecnologías existieran.

Un pipeline típico en DataStage tiene esta estructura:

Pipeline ETL · DataStage Parallel Engine
Extracción
Conectores nativos para más de 80 fuentes de datos. Soporte bulk load, pushdown optimization y lecturas incrementales.
Extract
Fuentes
Db2 Oracle SAP APIs CSV Kafka
Procesamiento paralelo
El motor distribuye automáticamente la carga entre N nodos. Particionado inteligente, sort, join, aggregation y custom transforms.
Transform
DataStage
Reglas Limpieza Enriquec. Paralelo N nodos
Carga
Entrega a DWH, data lakes y plataformas cloud con soporte batch y near-real-time via CDC. Rollback y auditoría incluidos.
Load
Destinos
DWH Data Lake Cloud Batch/RT
Consumo
Los datos transformados alimentan herramientas de BI, dashboards ejecutivos y modelos de ML/AI en producción.
Analytics
Consumo
Cognos Power BI AI/ML
Hover sobre cada nodo para más detalle · DataStage gestiona E + T con procesamiento paralelo distribuido

Lo interesante del motor paralelo es que el desarrollador no tiene que pensar en el paralelismo. Diseñas el job como si fuera secuencial — arrastrando stages en el Designer — y el engine decide cómo particionar los datos, cuántos nodos usar y cómo redistribuir la carga. Puedes forzar particionado manual cuando necesitas control fino (por ejemplo, para garantizar que todas las filas con el mismo customer_id acaben en la misma partición), pero en la mayoría de casos el motor lo hace solo.

Los componentes del stack

  • DataStage Designer. La interfaz visual donde se diseñan los jobs. Arrastras stages (fuentes, transformaciones, destinos), los conectas con links, defines los metadatos de cada columna, y compilas. Es visual pero potente — detrás genera OSH (Orchestrate Shell), que es el lenguaje que el motor paralelo ejecuta.
  • DataStage Director. La consola de monitorización. Ves qué jobs están corriendo, cuáles han fallado, logs, estadísticas de rendimiento, y puedes relanzar o abortar ejecuciones.
  • Information Server. La capa que envuelve todo: seguridad, metadatos compartidos con otras herramientas InfoSphere (Quality Stage, Information Analyzer, IGC), API REST para automatización, y el repositorio central de definiciones de jobs.
  • Conectores. DataStage tiene conectores nativos para un catálogo enorme: Db2, Oracle, SQL Server, PostgreSQL, MySQL, SAP, Teradata, Netezza, Snowflake, Amazon Redshift, S3, Azure Blob, Kafka, ficheros planos, XML, JSON, APIs REST — la lista es larga. Estos no son wrappers genéricos ODBC — son conectores optimizados para cada motor, con soporte de bulk load, pushdown optimization y control fino de sesiones.
Casos de uso

Para qué se usa DataStage en la práctica

La pregunta no es tanto "para qué se puede usar" (la respuesta sería "para mover cualquier dato entre cualquier sitio") sino "para qué tiene sentido usarlo frente a alternativas más modernas o más baratas". Porque DataStage no es la herramienta más sencilla del mercado, y tiene un coste de licencia que no es trivial. Lo que justifica ese coste son escenarios muy concretos.

Alimentación de datawarehouses

Este es el caso clásico y sigue siendo el más común. Organizaciones que tienen un DWH — ya sea IBM Db2 Warehouse, Teradata, Snowflake o Redshift — y necesitan cargar datos limpios, transformados y enriquecidos cada noche (o cada hora) desde docenas de sistemas fuente. DataStage brilla aquí por el procesamiento paralelo: donde un script en Python tarda horas, un job de DataStage bien diseñado procesa el mismo volumen en minutos.

Migración de datos entre sistemas

Cuando una organización cambia de ERP, de core bancario o de sistema hospitalario, hay un proyecto de migración de datos que puede durar meses. DataStage se usa para mapear esquemas viejos a nuevos, aplicar reglas de conversión, validar integridad referencial y ejecutar cargas masivas con rollback. La trazabilidad de metadatos es crucial aquí — necesitas demostrar a auditoría que cada dato migrado tiene origen conocido.

Integración en tiempo real con CDC

Con IBM CDC (Change Data Capture) integrado, DataStage puede replicar cambios en bases de datos con latencias de milisegundos. Esto se usa en entornos donde los datos operacionales tienen que estar sincronizados entre sistemas en casi-tiempo-real — por ejemplo, entre el core bancario y el sistema de antilavado, o entre el ERP y el datawarehouse operacional.

Calidad y gobierno de datos

DataStage se integra nativamente con el resto de la suite InfoSphere: Quality Stage para limpieza y estandarización, Information Analyzer para profiling, e IBM Knowledge Catalog (antes IGC) para gobierno y linaje. Esto hace que los proyectos de gobierno de datos que necesitan trazabilidad de extremo a extremo tengan todo bajo el mismo paraguas.

Dónde DataStage tiene más sentido

Banca, seguros, telecomunicaciones, sanidad, administración pública y utilities. Son sectores con volúmenes masivos, regulación estricta (NIS2, PCI DSS, HIPAA, ENS), y entornos IBM Power donde DataStage corre de forma nativa. Si tu infraestructura ya es IBM — Power11, AIX, Db2 — DataStage encaja como un guante.

La evolución

DataStage en Cloud Pak for Data: la evolución de 2025-2026

La historia reciente de DataStage tiene un protagonista claro: IBM Cloud Pak for Data. Es la plataforma de datos unificada de IBM, construida sobre Red Hat OpenShift, que agrupa todos los servicios de datos (DataStage, Watson Studio, Knowledge Catalog, Db2, etc.) bajo una interfaz común.

El cambio más importante de los últimos meses fue en junio de 2025, con la versión 5.2 de Cloud Pak for Data: DataStage está disponible en OpenShift sobre IBM Power (ppc64le). Esto significa que las organizaciones con servidores Power que antes tenían que ejecutar DataStage en el stack clásico de InfoSphere ahora pueden containerizarlo y gestionarlo con la misma orquestación que el resto de sus workloads cloud-native.

La versión actual — Cloud Pak for Data 5.3 — trae DataStage con soporte completo para ETL y ELT, ejecución en remoto (puedes correr jobs en cloud sin mover los datos de tu datacenter), y el nuevo DataStage Flow Designer integrado en la interfaz web de Cloud Pak for Data. El Designer clásico de escritorio sigue siendo el preferido de los desarrolladores veteranos, pero IBM está empujando el flujo web para proyectos nuevos.

Un apunte sobre seguridad. En febrero y marzo de 2026, IBM publicó varios parches de seguridad para DataStage on Cloud Pak for Data 5.1.2 a 5.3.0, incluyendo vulnerabilidades de inyección de comandos y filtración de información sensible via HTTP. Si tienes DataStage en Cloud Pak for Data, asegúrate de estar en la versión 5.3.1 o posterior. No es un problema de la herramienta en sí — es mantenimiento normal de un producto enterprise — pero sí es un recordatorio de que los entornos on-premise necesitan gestión activa de parches.
El contexto competitivo

DataStage vs las alternativas en 2026

Sería deshonesto hablar de DataStage sin reconocer que el mercado de integración de datos en 2026 es muy diferente al de 2015. Hay alternativas serias, y la decisión depende mucho del contexto. Aquí va el mapa sin discurso comercial.

IBM DataStage Referencia
Licencia IBM
FuerteParalelo, IBM Power, regulación
DébilCoste, curva de aprendizaje
Informatica IDMC
SaaS / on-prem
FuerteCuota de mercado, conectores
DébilMás caro que DataStage
Apache Spark / dbt
Open source
FuerteCloud-native, flexibilidad
DébilNo es llave en mano
Talend (Qlik)
Comercial
FuerteFácil de usar, open core
DébilRoadmap incierto tras Qlik
Azure Data Factory
SaaS Azure
FuerteIntegración nativa Azure
DébilLock-in, limitado fuera Azure
AWS Glue
SaaS AWS
FuerteServerless, coste bajo
DébilLock-in, limitado fuera AWS

¿Cuándo tiene sentido DataStage? Cuando ya tienes inversión en el ecosistema IBM (Power, Db2, InfoSphere), cuando necesitas procesamiento paralelo on-premise con volúmenes que otros no manejan bien, cuando la regulación te exige trazabilidad de metadatos end-to-end, o cuando tu equipo ya sabe DataStage y el coste de reentrenamiento supera al de la licencia.

¿Cuándo no tiene sentido? Cuando tu stack es cloud-native puro (AWS/Azure/GCP sin IBM), cuando tus volúmenes son pequeños, cuando prefieres código sobre interfaz visual, o cuando el presupuesto no da para la licencia IBM y prefieres invertir en ingeniería con herramientas open source.

Formarse en DataStage

Formación oficial de IBM DataStage en España

Si DataStage es parte de tu stack actual o va a serlo, formarse bien es la diferencia entre un equipo que diseña jobs eficientes y uno que genera pipelines que tardan horas en ejecutarse y nadie sabe depurar. Los cursos oficiales de IBM cubren eso — no solo los menús y los botones, sino las mejores prácticas de diseño, particionado, debugging y puesta en producción.

SIXE es IBM Authorized Training Partner y ofrece los siguientes cursos de DataStage impartidos en español:

Los dos cursos se imparten con instructores acreditados por IBM, materiales oficiales y laboratorios prácticos. Modalidad presencial en España (Madrid, Barcelona, Sevilla, Valencia, Bilbao, Málaga), remota, o in-company adaptada a tu equipo. También disponible en inglés y francés para equipos internacionales.

Formación a medida

Si necesitas un curso adaptado — por ejemplo, centrado en migración de jobs clásicos a Cloud Pak for Data, o en optimización de rendimiento para un entorno concreto — lo diseñamos sobre los materiales oficiales con contenido adicional de nuestros propios despliegues. Consulta el catálogo completo de formación oficial IBM o escríbenos directamente por WhatsApp.

Para seguir leyendo


¿Trabajas con IBM DataStage?

Formación oficial. En español. Con gente que lo despliega.

Ya sea que empieces con DataStage o quieras llevar a tu equipo al siguiente nivel, los cursos oficiales IBM impartidos por SIXE cubren desde los fundamentos hasta la administración avanzada del motor paralelo.

SIXE