Los datos para la gestión de la crisis sanitaria
Si hay algo que ha quedado patente en la actual crisis COVID es la tremenda ceremonia de la confusión en lo que respecta a los datos suministrados por las autoridades de casi todo el planeta, con escasas excepciones, entre las cuales, desde luego, no se encuentra España.
Fundamentalmente se producen cuatro tipos de problemas:
En primer lugar, se observa una falta de criterio homogéneo a la hora de definir un dato. Un ejemplo claro es el número de fallecidos por el virus, cuya forma de conteo varía de un país a otro, e incluso de una comunidad autónoma a otra. Incluso un mismo organismo cambia su modo de conteo a lo largo de la crisis.
El segundo problema es un clásico en la ciencia de datos: la calidad del dato. El ejemplo más evidente es que, al no haberse realizado test masivos, desconocemos cuántos infectados hay, por lo que el número que se maneja no deja de ser un subconjunto, aparentemente minoritario, del número real de personas infectadas. La poca fiabilidad de los datos es un inconveniente, pero lo convertimos en un verdadero problema de ceguera informativa si no cumplimos dos reglas: comunicar de forma transparente el carácter aproximativo de los datos y no apalancarnos en dichos datos para tomar decisiones de calado, ya que lo más probable es que resulten equivocadas.
Un tercer problema es el del reprocesado de datos. Un ejemplo: si ahora detecto un positivo o anticuerpos a una persona que se contagió hace dos semanas, ¿lo cuento como contagio ahora o rehago la serie histórica asignándolo a la fecha más probable de contagio? Otro ejemplo: Si realizo un cambio de criterio, algo normal en el mundo de los datos, ¿debo rehacer la serie para poder analizar evolutivos homogéneos? De la respuesta técnica que se dé a estas cuestiones depende crucialmente el análisis de la evolución de la pandemia. Podríamos afirmar que, en este caso, un cambio de criterio tiene el poder de salvar vidas. Y nuevamente: transparencia total sobre la construcción de las estadísticas. Por favor, no intenten animarnos con análisis bienintencionados. El paternalismo político es un mal aliado contra las pandemias.
Por último, el cuarto problema son las llamadas variables de flujo. No solo quiero saber cuántos hospitalizados hay hoy, sino además las distintas fases por las que ha pasado cada paciente: sano, infectado sin síntomas, con síntomas, hospitalizado, en UCI, alta en cuarentena, alta curado, fallecido, etc. Se han llegado a dar situaciones esperpénticas en las cuales el número de hospitalizados más curados más fallecidos ha sido superior al número de infectados. El tratamiento de estas variables requiere de un criterio muy claro y homogéneo y, en este caso, dicho criterio resulta vital, nunca mejor dicho.
Estas cuatro dificultades no son desconocidas para las personas que nos dedicamos a los datos, es más, se trata del pan nuestro de cada día. Para solucionarlas, las grandes compañías crearon hace años la figura del Chief Data Officer, responsable del gobierno del dato, que puede definirse como la adecuada gestión de todo el ciclo de vida del dato, desde la captura hasta su uso, para maximizar el valor que aportan, normalmente en forma de análisis.
Si no defines y acuerdas cómo medir una cosa, acabarás sumando peras y manzanas. Si tus datos no tienen la suficiente calidad, no sabrás en qué situación te encuentras, ni si tus acciones están dando resultado. Sin buenos datos, caminas a ciegas junto a un acantilado.
Ahora bien ¿qué hubiera hecho un Chief Data Officer gubernamental en el caso de una crisis como la de COVID? Fundamentalmente dos cosas:
Para empezar, se hubiera planteado la siguiente pregunta: ¿para qué voy a usar esos datos? La respuesta a esta pregunta es fundamental para orquestar toda la gestión de datos requerida, y solo puede hacerse hablando con todos los organismos involucrados: médicos, autoridades sanitarias mundiales, investigadores, gestores de hospitales y funerarias, fabricantes de material, sindicatos, empresarios, ejército… y, sí, por supuesto, todos los partidos políticos.
Hay múltiples posibles finalidades: ¿quiero los datos para informar a la OMS? ¿para medir la efectividad de las medidas adoptadas? ¿para controlar los contagios? ¿para predecir el comportamiento del virus? ¿para organizar las urgencias y la infraestructura funeraria? ¿para acordar las medidas económicas? ¿para analizar la evolución de las distintas cepas? ¿los quiero por zonas geográficas, por hospitales, por niveles de renta, por condiciones meteorológicas?
Tras el primer análisis de este conjunto de necesidades de información, nuestro CDO gubernamental hubiera consensuado dos aspectos muy relevantes: un modelo de datos común (la forma de organizar y recopilar los datos) y un diccionario común (a qué llamamos fallecido, a qué llamamos contagiado, etc). Eso sí: ningún modelo de gobierno del dato se consigue desde la imposición, muy al contrario. En el caso que nos ocupa, la mejor manera de que todos los intervinientes adopten un modelo de datos centralizado es hacerles partícipes de su creación. Por desgracia, la cooperación no es algo que abunde en los tiempos que corren. El gobierno más sostenible es el que se ejerce desde la persuasión, no desde la imposición. Y esto no sólo aplica al mundo de los datos.
El por qué el Gobierno no ha encargado la gestión informacional de la pandemia a alguna de las excelentes profesionales del dato que tiene entre sus filas, es un gran misterio. Si todos estamos de acuerdo en que son los profesionales sanitarios los que deben guiar nuestras actuaciones frente al virus, ¿qué nos hace pensar que cualquiera puede gestionar datos?
Dada la relevancia que éstos han ido adquiriendo en los últimos años, la figura del Chief Data Officer es más necesaria que nunca, también en las administraciones públicas. Los datos requieren gestión profesional y total transparencia. Y hoy resultan especialmente claves, nada menos que para salvar vidas humanas.
Algunos países como Francia ya han nombrado un CDO nacional. ¿Hasta cuándo seguiremos en España dejando la gestión de los datos en manos de personas sin preparación para ello? ¿Hasta cuándo seguiremos utilizando los datos para que parezcan darnos la razón, o para quitársela al otro?
Y ya que hablamos de datos: ¿alguien ha analizado por países la relación existente entre la transparencia informativa y la eficacia en la gestión de la crisis? ¿y la relación entre la eficacia en la gestión y el sexo de sus dirigentes políticos?