Formación Avanzada

Ceph Production Operations | Curso

Cuando un cluster de 200TB falla a las 3AM y necesitas respuestas, no teoría

3 DÍAS

Intensivos

100%

Hands-on

REAL

Escenarios

Independiente de distribución

IBM Storage Ceph, Red Hat, Ubuntu, Rocky, Alma Linux o Ceph upstream

✦ Certificación incluida — Badge digital: Ceph Production Operations Credencial verificable en Credly · Ver badge → ¿Necesitas más info sobre este curso?

3:00 AM

CLUSTER CRITICAL

OSD Failure

12 OSDs down

CephFS

Metadata corrupt

Performance

IOPS -80%

Recovery

Plan activo

Aprenderás a resolver:

Fallos críticos en clusters de 200TB+

Recovery de 40TB de CephFS corrupto

Tuning extremo para AI/ML (500TB/día)

Troubleshooting bajo presión 24/7

¿Para quién?

Administradores certificados o con experiencia en producción que necesitan dominar escenarios críticos reales que los vendors no enseñan.

Estructura del curso

Programa intensivo de 3 días diseñado para enfrentar crisis reales y optimizar clusters de producción a escala petabyte

Performance Engineering & Forensics Avanzado

De arquitectura a troubleshooting forense real

Mañana: Optimización Arquitectural

• BlueStore internals: RocksDB tuning, compaction, write amplification
• CPU optimization: C-states impact (labs 5x degradation), NUMA
• Network: 100GbE patterns, TCP tuning, nf_conntrack
• NVMe-specific: reactor tuning, bdevs_per_cluster optimization

Tarde: Troubleshooting Forense

• Diagnostic toolchain: blktrace, perf, objectstore-tool
• Case studies reales: NVMe degradation, OSD flapping post-upgrade
• PG lifecycle avanzado: stuck states, manual intervention
• Labs: Cluster con problemas reales para diagnosticar

Disaster Recovery, Multi-Site & Petabyte Scaling

Recuperación extrema y arquitecturas multi-sitio

Mañana: DR Avanzado

• Edinburgh 40TB case: error chain completo y recovery procedures
• CephFS disasters: metadata corruption, MDS failure handling
• RBD mirroring: pool vs image-based, failover automation
• Physical DR: disk extraction, journal, whoami preservation

Tarde: Multi-Site & Petabytes

• RGW multisite: master zone failure, manual promotion, sync fairness
• WAN planning: formulas 1 GbE per 8TB daily ingest
• Petabyte challenges: CERN 30PB (7,200 OSDs), 310M objects
• Labs: Simulación multi-site failover y recovery

Security, AI/ML Workloads & Cost Engineering

Seguridad enterprise y optimización para cargas modernas

Mañana: Security Hardening

• Encryption: LUKS/dmcrypt OSDs, msgr2 secure, RGW SSE-S3/KMS
• Key management: rotation (Squid 19.2.3+), Barbican integration
• Compliance: HIPAA architecture, GDPR, audit logging
• Threat detection: monitoring patterns, vulnerability management

Tarde: AI/ML & ROI Engineering

• S3 Select: Trino integration (2.5x-9x performance), analytics pushdown
• AI/ML patterns: checkpointing, parallel access optimization
• TCO analysis: EC efficiency, commodity hardware savings
• Hybrid architectures: OpenStack DCN, edge-to-core, multi-cloud

Especificaciones del laboratorio

Infraestructura realista en cloud enterprise

🖥️ Infraestructura

• Cluster de 5-6 nodos reales
• 500GB+ datos pre-poblados por alumno
• Acceso 24/7 durante + 7 días post-curso

⚠️ Escenarios reales

• Disk failures & network partitions
• Corrupción simulada de metadata
• Performance degradation injected

🔧 Herramientas

• blktrace, perf, objectstore-tool
• Debugging symbols pre-instalados
• Datasets reales con I/O patterns

Distribuciones y versiones soportadas

Distribuciones disponibles:

• Rocky Linux 9
• Ubuntu 24.04 LTS
• Red Hat Enterprise Linux

Versiones Ceph:

• Upstream Squid 19.2+
• IBM Storage Ceph 7.1
• Red Hat Ceph Storage 7.x

Próximas convocatorias

Formación intensiva de 3 días diseñada para grupos reducidos (máximo 10 participantes) para maximizar la interacción y el troubleshooting colaborativo

Presencial

En nuestras instalaciones con acceso completo a laboratorios y equipamiento especializado

On-site

En tu organización para equipos de 4+ personas con configuración personalizada

Remota

Con laboratorio cloud dedicado y acceso completo a recursos de práctica en tiempo real

¿Listo para eliminar ese "respeto" a escenarios críticos?

Solicita información sobre próximas fechas, programa detallado y condiciones.
Respuesta garantizada en menos de 24 horas.

Solicitar Información completa

O llámanos directamente para resolver tus dudas

+34 91 198 02 43

Ceph Production Operations | Curso

Independiente de distribución

3:00 AM

Aprenderás a resolver:

¿Para quién?

Estructura del curso

Performance Engineering & Forensics Avanzado

Mañana: Optimización Arquitectural

Tarde: Troubleshooting Forense

Disaster Recovery, Multi-Site & Petabyte Scaling

Mañana: DR Avanzado

Tarde: Multi-Site & Petabytes

Security, AI/ML Workloads & Cost Engineering

Mañana: Security Hardening

Tarde: AI/ML & ROI Engineering

Especificaciones del laboratorio

🖥️ Infraestructura

⚠️ Escenarios reales

🔧 Herramientas

Distribuciones y versiones soportadas

Próximas convocatorias

Presencial

On-site

Remota

¿Listo para eliminar ese "respeto" a escenarios críticos?

Formación técnica en Ceph

Administración Ceph

Ceph Avanzado

Ceph Production Operations

Solicitar este curso en CEPH

FAQ

Preguntas frecuentes

¿Necesito haber hecho vuestros cursos anteriores?

¿Y si no tengo certificación EX260?

¿Qué distribución de Ceph usáis?

¿Cómo se diferencia de vuestro curso avanzado?

¿Qué equipamiento necesito?

¿Ofrecen modalidad remota?

¿Hay certificado o acreditación?

¿Qué pasa si no puedo resolver los labs?

Blog!

¿Hablamos?

Partners

Nuestra mision