Sabemos que la supervivencia de un paciente en parada cardíaca depende de nuestra excelencia técnica en el box o en la calle, y que esa destreza se forja a base de horas de formación y simulacros. Sin embargo, cuando intentamos demostrar científicamente qué método de enseñanza salva más vidas, nos topamos con un muro metodológico: hasta ahora, cada hospital y unidad docente medía el éxito de sus cursos a su manera, haciendo imposible comparar los estudios entre sí.

Para resolver este caos, el Comité Internacional de Enlace sobre Reanimación (ILCOR) ha publicado un documento que marca un antes y un después en la formación en RCP: el Estilo Utstein para la Investigación en Educación en Reanimación. Este informe de consenso establece, por primera vez, las reglas mundiales universales sobre exactamente qué variables cuantitativas debemos medir al investigar en docencia. Abarcan desde la recomendación de abandonar las dudosas “notas automáticas” de los maniquíes, hasta la obligación de evaluar con rigor la calidad del debriefing o la fatiga mental del propio instructor.

Este nuevo marco busca transformar nuestras intuiciones pedagógicas en evidencia científica sólida, garantizando que el entrenamiento en soporte vital se traduzca matemáticamente en más pacientes que recuperan el pulso.

Aquí tienes, como siempre, un resumen traducido al español.

Si quieres citar este texto:

Plaza-Moreno E. ¿Estamos midiendo bien lo que enseñamos en soporte vital? Nuevo consenso ILCOR – Utstein [Internet]. Urgencias y Emergencias. 2026. Disponible en: https://www.urgenciasyemergen.com/estamos-midiendo-bien-lo-que-ensenamos-en-soporte-vital-nuevo-consenso-ilcor-utstein/

El término ‘Utstein’ en reanimación hace referencia a una familia de consensos internacionales que buscan uniformizar cómo se reportan datos clínicos y de investigación. El primero nació en 1991 en la Abadía de Utstein (Noruega) y se enfocó en la parada cardiorrespiratoria extrahospitalaria. Desde entonces han surgido consensos Utstein para PCR intrahospitalaria, parada neonatal y pediátrica, ahogamiento, registros de reanimación y laboratorio.

El de 2026 es el primero dedicado exclusivamente a la educación. No mide lo que ocurre con el paciente en la PCR, mide lo que ocurre con quien aprende RCP.

Un grupo de expertos internacionales en medicina de urgencias, enfermería, cuidados críticos, educación médica y transferencia del conocimiento realizó tres rondas de un proceso Delphi modificado para alcanzar consenso. Se consideró representación geográfica y equidad de género y profesión. La barra de consenso se fijó en el 75% para inclusión o exclusión, alineándose con otros consensos Utstein previos.

El resultado se puede ver en la siguiente tabla.

Tabla 1. Resultado del proceso Delphi: categorías y resultados consensuados.

Grupo de estudioCategoríasResultados específicos
Profesionales sanitarios16 categorías60 resultados
Población general (legos)16 categorías51 resultados

El consenso organiza todos los resultados en una pirámide con cuatro niveles. No implica que cada nivel cause automáticamente el siguiente, pero sí que el éxito en los niveles inferiores es condición necesaria para aspirar a los superiores.

Figura 1. Pirámide de resultados de la educación en reanimación traducida al español. Imagen creada con IA. Fuente original: https://doi.org/10.1016/j.resuscitation.2026.111047

El instructor es el cimiento de todo el sistema educativo. Si no enseña bien, nada de lo que viene después funciona. Los resultados propuestos incluyen conocimiento del instructor, calidad de la instrucción, calidad del feedback y calidad del debriefing. También se incorporan la carga cognitiva y el estrés del instructor, aspectos que la investigación actual apenas ha explorado pero que son determinantes para la calidad de la enseñanza.

💡 El debriefing como métrica crítica. La calidad del debriefing no solo mide la habilidad técnica del instructor, sino su capacidad para crear seguridad psicológica en el equipo. Esa seguridad es lo que permite que los errores durante la simulación se conviertan en aprendizaje real.

Es el nivel más amplio y concentra la mayor parte de los resultados. Se subdivide en motivación (solo para legos), aceptabilidad del entrenamiento, adquisición y retención del conocimiento teórico, variables cognitivas (carga de trabajo, carga cognitiva y estrés), habilidades técnicas de RCP, otras habilidades clínicas, trabajo en equipo, liderazgo, comunicación y resultados de proceso como tiempos de actuación y adherencia a guías.

La retención de conocimientos también queda protocolizada en tres ventanas temporales: corto plazo (hasta 3 meses), medio plazo (3-6 meses) y largo plazo (más de 6 meses). Esta decisión no es arbitraria ya que la evidencia muestra que las habilidades de RCP empiezan a deteriorarse a los 3 meses y el declive se acelera después de los 6.

Aquí llegan los resultados que más interesan desde la perspectiva clínica: retorno de circulación espontánea (RCE/ROSC), supervivencia al evento, supervivencia al alta o a 30 días con función neurológica preservada, y supervivencia al año. Son los más difíciles de atribuir directamente a la formación por los múltiples factores de confusión que median entre el aula y la PCR real, pero son el horizonte final al que apunta todo el esfuerzo educativo.

Tasa de RCP por testigo, tasa de uso de DEA por testigo, tiempos de respuesta, eventos adversos, éxito de implementación del programa formativo, coste y coste-efectividad. Son los indicadores que responden a la pregunta de si la inversión en formación se traduce en una comunidad más protegida.

➡️ Recuerda que puedes ✍🏻 suscribirte a mi boletín gratuito para recibir por email todas las actualizaciones y no perderte nada.
➡️ Tienes disponible la membresía 🏆 Equipo Excelencia con contenido ampliado mes a mes aquí.
➡️ Comparte esta entrada 📲.
GRACIAS 🫀

Este es uno de los cambios más concretos e inmediatos del consenso. La puntuación compuesta que genera automáticamente el maniquí al final del ejercicio, ese porcentaje que aparece en pantalla y que solemos usar para decirle al alumno si ha ‘aprobado’, queda desaconsejada de forma explícita.

Los motivos son sólidos: esa puntuación no existe en la reanimación real, por lo que carece de relevancia clínica. Además, la fórmula con la que cada fabricante la calcula es propia y confidencial, así que nadie sabe exactamente qué variables tienen más peso ni qué errores específicos oculta un buen resultado global.

Figura 2. Pirámide de resultados de la educación en reanimación traducida al español. Imagen creada con IA. Fuente: https://doi.org/10.1016/j.resuscitation.2026.111047

La alternativa estandarizada que propone el consenso se llama ‘RCP excelente global’ (overall excellent CPR): el porcentaje de intervalos de 30 segundos en los que el reanimador cumple simultáneamente con la profundidad y la frecuencia recomendadas por las guías. Esta métrica sí es clínicamente significativa porque replica lo que medimos en pacientes reales, y los intervalos cortos de 30 segundos permiten detectar el deterioro de la calidad por fatiga a lo largo del evento.

Aunque la reexpansión de la pared torácica puede considerarse muy relevante para la calidad de la compresión torácica, han decidido no incluir esta variable por varias razones:

  • La unidad de medida de la reexpansión incompleta es inconsistente entre los dispositivos de retroalimentación de RCP, maniquíes y desfibriladores, ya que algunos capturan la velocidad o presión de liberación y otros una unidad de profundidad.
  • La medición fiable del retroceso torácico completo en maniquíes depende en gran medida de que el diseño del maniquí permita un retroceso completo, lo cual puede ser problemático e inconsistente tras un uso repetido.
  • Aunque el retroceso torácico completo se describe como el objetivo ideal en las guías y declaraciones recientes, la evidencia actual que respalda esta variable como un factor contribuyente clave a los resultados de supervivencia del paciente es mixta.

Consideran que la inclusión de la reexpansión torácica completa como parte de la métrica de RCP de excelente calidad general debería revisarse en años futuros a medida que la evidencia evolucione y el diseño de los maniquíes mejore.

Para entornos de formación e investigación, el consenso define exactamente qué parámetros de RCP hay que recoger. Las habilidades de RCP deben reportarse idealmente durante la duración de todo el evento de parada cardiaca. Se deben definir claramente las horas de inicio y fin del evento.

Tabla 2. Métricas estándar de calidad de RCP según el consenso Utstein 2026.

ResultadoDefinición
Profundidad de la compresión torácicaDepresión posterior máxima de la pared torácica anterior/esternón antes del retroceso torácico, reportada en centímetros
Frecuencia de la compresión torácicaFrecuencia de las compresiones torácicas, reportada en compresiones por minuto
Apoyo residual / liberación incompletaProporción de compresiones torácicas con liberación incompleta
Profundidad de compresión torácica conforme a las guíasProporción de compresiones torácicas que cumplen las recomendaciones de las guías para una profundidad adecuada
Frecuencia de compresión torácica conforme a las guíasProporción de compresiones torácicas que cumplen las recomendaciones de las guías para una frecuencia adecuada. La proporción se calcula a partir de la frecuencia media de compresión torácica capturada en intervalos cortos (30 s)
RCP de excelente calidad generalProporción de compresiones torácicas que cumplen simultáneamente las recomendaciones de las guías para una profundidad y frecuencia adecuadas. La proporción se calcula a partir de la profundidad y frecuencia medias de compresión torácica capturadas en intervalos cortos (30 s)
Fracción de compresión torácicaProporción del tiempo de reanimación sin circulación espontánea durante el cual se administraron compresiones torácicas
Duración de la pausa perichoqueDuración total de la pausa prechoque y postchoque, reportada en segundos
Duración de la pausa prechoqueIntervalo de tiempo entre el cese de la compresión torácica y la administración del choque, reportado en segundos
Duración de la pausa postchoqueIntervalo de tiempo entre la administración del choque y la reanudación de la compresión torácica, reportado en segundos
Duración de la pausa más largaIntervalo de tiempo de la pausa más larga en las compresiones torácicas, reportado en segundos
Posición de las manosProporción de compresiones torácicas con la posición de las manos recomendada en las guías de reanimación
Ventilación exitosaProporción de ventilaciones con elevación visible del tórax o volumen de ventilación adecuado

Tabla 3. Métricas estándar de calidad de otras habilidades de la RCP según el consenso Utstein 2026.

ResultadoDefinición
Habilidades del DEAUso adecuado de un DEA, incluyendo (1) capacidad para realizar los pasos recomendados por las instrucciones de voz, (2) colocación correcta de los electrodos, (3) demostración de seguridad, (4) desfibrilación exitosa y (5) uso del DEA con interrupciones mínimas en las compresiones torácicas
Adherencia a las guías de reanimaciónDesempeño de la secuencia correcta de acciones según lo establecido en las guías de reanimación y desempeño correcto de las tareas para cada paso.
Desviaciones de las guías de reanimaciónDesviaciones del proceso de atención respecto a las guías de reanimación, incluyendo secuencia incorrecta de acciones, retrasos en el desempeño de tareas o errores en el desempeño de tareas.
Tiempo hasta el reconocimiento de la parada cardíacaIntervalo de tiempo desde el inicio de la ausencia de pulso (o colapso del paciente, dependiendo del entorno o escenario) hasta el reconocimiento de la parada cardíaca.
Tiempo hasta la rcpIntervalo de tiempo desde el inicio de la ausencia de pulso (o colapso del paciente, dependiendo del entorno o escenario) hasta el inicio de la RCP (primera compresión o primer intento de ventilación, dependiendo del entorno).
Tiempo hasta la colocación de los parches del deaIntervalo de tiempo desde el inicio de la ausencia de pulso (o colapso del paciente, dependiendo del entorno o escenario) hasta que ambos parches del DEA están colocados en el tórax.
Posición de los parches del deaReportado como (1) distancia en centímetros desde la posición real a la recomendada o (2) colocación exitosa de los parches definida como dentro de 5 cm de la posición recomendada por la guía.
Tiempo hasta la primera desfibrilaciónIntervalo de tiempo desde el inicio de un ritmo desfibrilable hasta que se administra la primera descarga.
Tiempo hasta pedir ayudaIntervalo de tiempo desde el inicio de la ausencia de pulso (o colapso del paciente, dependiendo del entorno o escenario) hasta que se inicia una llamada de ayuda o más asistencia.

Por primera vez, el consenso incorpora para los profesionales sanitarios tres variables que van más allá de lo técnico: la carga de trabajo, la carga cognitiva y el estrés.

Figura 3. Nuevas variables cognitivas en los profesionales de la salud. Imagen creada con IA. Fuente: https://doi.org/10.1016/j.resuscitation.2026.111047

La investigación en estas variables durante simulacros de alta fidelidad ayuda a entender cómo el estrés del reanimador afecta a su rendimiento técnico, qué diseños formativos reducen la carga cognitiva y qué diferencias hay entre profesionales con distinta experiencia. Se miden con escalas autoinforme validadas (como la NASA-TLX), marcadores fisiológicos o bioquímicos, y tareas secundarias durante la simulación.

En la formación de población general, el consenso añade dos categorías que no existen para profesionales sanitarios: motivación para formarse y motivación para actuar. Esto es porque la barrera principal del testigo lego no suele ser la habilidad técnica, sino la voluntad de intervenir. Medir qué factores aumentan esa voluntad, qué barreras la frenan y si la formación las reduce es tan importante como medir si el alumno ejecuta bien las compresiones.

💡 La paradoja del testigo lego. Formar a una mayor proporción de la población mediante el uso de material educativo atractivo es más probable que incremente el grupo de posibles reanimadores. Esto aumenta la probabilidad de que una persona sin formación profesional proporcione cuidados vitales a un individuo que sufre una parada cardiaca. Reconociendo que la mayoría de las paradas cardiacas extrahospitalarias ocurren en el entorno doméstico, donde la víctima es conocida por el reanimador, debemos esforzarnos por llegar a más miembros de nuestra comunidad haciendo que las opciones de formación sean más accesibles y aceptables (por ejemplo, formación individual, formación en grupos pequeños o actividades de formación masiva).

El estudio dedica un apartado fundamental a la figura del docente, reconociendo que el desempeño del instructor es una pieza crítica que influye directamente en los resultados del alumno. De hecho, si recuerdas la “Pirámide de Resultados de Educación en Reanimación” de la que hablamos antes, los resultados del instructor conforman la base absoluta de toda la estructura. Sin una buena base docente, es imposible alcanzar la cima: la supervivencia del paciente.

A pesar de esta enorme importancia, los autores del consenso señalan una carencia importante en la evidencia actual: se sabe muy poco sobre cómo optimizar el desarrollo del profesorado para mejorar su desempeño al dar cursos de reanimación. Para solucionar esto y empezar a investigar a los instructores con el mismo rigor metodológico que a los alumnos, el estilo Utstein define exactamente qué variables debemos medirles.

Figura 4. Qué variables medir sobre los instructores de RCP. Imagen creada con IA. Fuente: https://doi.org/10.1016/j.resuscitation.2026.111047
  • Conocimiento del instructor. No basta con asumir que el profesor sabe. Se debe evaluar su comprensión de los conceptos, objetivos y prácticas necesarias para enseñar reanimación de forma efectiva. ¿Cómo se mide? Mediante exámenes teóricos, ya sean orales o escritos.
  • Calidad de la instrucción. Mide la eficacia con la que el docente transmite los materiales del curso para fomentar el aprendizaje y mejorar el rendimiento futuro del alumno. ¿Cómo se mide? A través de herramientas de evaluación (rúbricas validadas), datos observacionales o medidas autodeclaradas.
  • Calidad del feedback (retroalimentación). Evalúa la habilidad del instructor para dar información al alumno sobre cómo ha hecho la técnica para que este pueda corregirla.
  • Calidad del debriefing. Fundamental en simulación clínica. Mide cómo el docente facilita esa discusión guiada y estructurada después del simulacro, creando un entorno de seguridad psicológica que permita al equipo reflexionar sobre sus errores y aciertos.
  • Carga de trabajo y carga cognitiva. Los instructores también se fatigan. El estudio exige medir las demandas mentales, físicas y emocionales que sufre el profesor durante el curso (carga de trabajo), así como el esfuerzo mental de su memoria de trabajo al procesar lo que hacen los alumnos (carga cognitiva). ¿Cómo se mide? Mediante cuestionarios autodeclarados, medidas fisiológicas o evaluando si su docencia empeora cuando se le añade una tarea secundaria.

Por otro lado, el documento hace un guiño muy interesante al futuro de la docencia en urgencias y emergencias. Reconocen la rápida evolución de la Inteligencia Artificial como “instructor sustituto” y como fuente automatizada de feedback. Sin embargo, advierten que el uso de la IA requerirá mucha más exploración e investigación antes de poder integrarse de forma generalizada en las oportunidades de formación habituales.

Finalmente, el consenso lanza un reto a los investigadores: el objetivo supremo a partir de ahora es explorar la asociación matemática entre las métricas de rendimiento del instructor y el rendimiento clínico del sanitario, no basta solo con saber si un instructor imparte buenas clases

Si trabajas en docencia o tienes en mente diseñar un estudio sobre formación en reanimación, este consenso es tu referencia obligada a partir de ahora. Antes de elegir qué medir, revisa si el resultado está en las listas del consenso [En el artículo original vienen tablas más extensas de las aquí traducidas]. Si lo está, usa la definición que propone. Si no lo está, justifica por qué y aporta evidencia de validez del instrumento que empleas. Para los responsables de programas de formación en urgencias y emergencias y paciente crítico, el documento ofrece un marco con el que comparar resultados internamente año a año y, en el futuro, con otros centros que adopten los mismos estándares.

Sobre herramientas de evaluación, el estudio establece una postura muy clara y metodológicamente exigente respecto a esto: de forma deliberada, no impone ni recomienda el uso de ninguna herramienta, marca comercial o cuestionario específico para evaluar a los alumnos o instructores. Esto es debido a que afirman que la validez de una herramienta depende enteramente del contexto exacto en el que se va a utilizar, como las características específicas del grupo de alumnos o el tipo de paciente simulado.

Por ello, en su lugar, el consenso se centra en proporcionar las reglas metodológicas para que los investigadores aprendan a elegir y validar correctamente cualquier herramienta que decidan utilizar.

Para elegir una buena herramienta, el consenso recomienda utilizar la regla mnemotécnica CARVE (basada en el marco del Consenso de Ottawa). Antes de implementar una herramienta, debemos confirmar que cumple con estos cinco puntos:

  • Costo-efectividad: ¿Supone un costo humano y financiero asumible realizar esta evaluación?
  • Aceptabilidad: ¿Es una herramienta bien vista y aceptada por los educadores, los alumnos y la sociedad?
  • Fiabilidad: ¿Sus decisiones son consistentes? (Es decir, si dos instructores evalúan a la misma enfermera, ¿llegan a puntuaciones similares?).
  • Validez: ¿La herramienta evalúa realmente lo que se pretende evaluar? El consenso subraya que esta es la característica más importante para investigar en educación, pero sorprendentemente es la que menos se aporta en los estudios publicados.
  • Impacto educativo: ¿Aporta esta evaluación un valor real al aprendizaje del alumno?.

Por otro lado, afirman que demostrar que una herramienta es realmente válida requiere construir un argumento científico complejo. El documento sugiere utilizar el marco de Kane, el cual exige demostrar cosas como que los evaluadores están bien calibrados (tienen el mismo modelo mental al puntuar) y que el escenario del examen representa fielmente el mundo real de la clínica. Como crear un cuestionario desde cero y demostrar su validez bajo este marco requiere años de trabajo, los autores recomiendan encarecidamente utilizar herramientas de medición que ya hayan sido publicadas previamente y que cuenten con evidencia de validez demostrada. Si necesitas buscar una, sugieren consultar el catálogo de herramientas respaldadas en la declaración científica de la American Heart Association (AHA) del año 2018: https://www.urgenciasyemergen.com/lo-mas-destacado-de-la-declaracion/

  • El consenso Utstein Education 2026 es el primer documento internacional que estandariza qué resultados deben medirse y reportarse en investigación sobre formación en reanimación.
  • Define 16 categorías de resultados para profesionales sanitarios (60 específicos) y 16 para legos (51 específicos), organizados en una pirámide de cuatro niveles: instructor, alumno, paciente y sistema.
  • Desaconseja expresamente los scores compuestos de los maniquís comerciales. El estándar es ‘RCP excelente global’: cumplimiento simultáneo de profundidad y frecuencia en intervalos de 30 segundos.
  • Establece 3 ventanas de retención estandarizadas: corto plazo (<3 meses), medio plazo (3-6 meses) y largo plazo (>6 meses), alineadas con la curva de deterioro conocida de las habilidades de RCP.
  • Incluye por primera vez los resultados del instructor como categoría propia, reconociendo que su desempeño es la base de todo el sistema educativo.
  • Para la formación de legos, incorpora motivación para formarse y motivación para actuar como resultados específicos, reflejando que la barrera más frecuente no es la habilidad sino la disposición a intervenir.
  • El objetivo final es que los estudios de diferentes centros y países puedan compararse y agruparse en metaanálisis, fortaleciendo las guías futuras y mejorando la práctica clínica en reanimación

Cheng A, Lauridsen K, Greif R, Finn J, Eastwood K, Yeung J, et al. Uniform reporting of outcomes from resuscitation education research: the resuscitation education Utstein style: a consensus report from the International Liaison Committee on Resuscitation. Resuscitation. 2026;223(111047):111047. Disponible en: http://dx.doi.org/10.1016/j.resuscitation.2026.111047


Si te gusta mi trabajo, compártelo. Es lo que más me llena, que llegue a todo el mundo. También puedes invitarme a un café:


Última actualización: 21/06/2026. 

Autoría del postElena Plaza Moreno, Enfermera | CEO Academia Urgencias y Emergencias® | PDI en Universidad Internacional de Valencia | Divulgadora sanitaria | Speaker y Formadora de IA generativa y RRSS en salud | Máster en Urgencias y Emergencias | Máster en Tecnología educativa y competencias digitales

Deja un comentario

error: La selección está desactivada