En este repositorio encontrarás resultados de algunos análisis que realizamos como parte de los reportes que un equipo de académicos y académicas de la Escuela de Salud Pública de la Universidad de Chile realiza semana a semana. Los informes semanales que están publicados directamente en la página web de la Escuela, no obstante este repositorio tiene por objetivo dejar disponible para la comunidad las bases de datos procesadas, gráficos y código utilizado. La mayor parte de los datos utilizados para estos analizados son obtenidos directamente del repositorio de a Jorge Pérez quien gentilmente aloja también nuestros resultados.
¡Pueden usar los datos para lo que quieran! Agréguenos en sus agradecimientos sí lo usan para publicar algo 🥰. Pueden escribir a ccuadrado_arroba_uchile.cl si notan cualquier error o tienen alguna pregunta de los datos.
-
Estimaciones por día del número de reproducción efectivo a nivel de región, servicio de salud y comuna. El número de reproducción efectivo para cada tiempo (día) se calcula utilizando el método desarrollado por Cori (Cori et al 2020) utilizando el paquete R0. Se utiliza un intervalo serial τ = 5 días (Nishiura et al 2020) con la variabilidad habitual entre 3 y 7 días (Sanche et al 2020) con una ventana de 14 días para la estimación. El detalle del seteo utilizado para reproducibilidad puede encontrarse en el script en la sección Estimaciones del número de reproducción (Re). La interpretación más sencilla de este valor es el número de nuevos contagiados que produce cada caso (casos secundarios) en un intervalo serial en un contexto en la que no toda la población es susceptible y donde hay medidas epidemiológicas de control instaladas. Si Re=1 el numero de casos es estable (endemia). Si Re>1 la epidemia esta en crecimiento. Si Re<1 la epidemia esta siendo controlada con una reducción del número de casos activos. Estimamos el Re para regiones, servicios de salud y comunas de Chile con sus respectivos intervalos de credibilidad. Debe tenerse precaución que para áreas pequeñas o con pocos casos (comunas pequeñas o regiones bajamente pobladas como Aysén) las estimaciones son inestables, por lo que las estimaciones deben ser analizadas con particular precaución.
-
Estimaciones de subreporte de casos sintomáticos a nivel nacional y regional: Calcular el subreporte no es una tarea trivial. Más aún hacerlo durante una epidemia en curso. Russel y colaboradores (Russel et al, 2020a) han propuesto una metodológica que puede entregar una razonable aproximación al cálculo. La lógica es bastante sencilla y permite una aproximación rápida a la pregunta sobre que tan eficaz esta siendo un sistema de salud en identificar los casos. En términos conceptuales, la propuesta de Russel utiliza como referencia la tasa de letalidad ajustada calculada para una epidemia ya concluida (Wuhan) en la que se ya se han realizado ajustes para dar cuenta del subreporte de casos. De esta manera, desviaciones de la letalidad observada en una epidemia en curso de la cifra de letalidad de una epidemia ya concluida pueden atribuirse principalmente al subreporte de casos. Esta aproximación tiene limitaciones sin duda, una de las más importantes es que asume que los datos de casos fallecidos son confiables, pero permite una primera aproximación al fenómeno de interés de manera oportuna. Para poder realizar la estimación, el primer paso es calcular una tasa de letalidad corregida por el retardo entre el desenlace y la exposición (ver abajo)
-
Estimaciones de letalidad de casos cruda y ajustada por retraso a nivel nacional y regional Una tasa de letalidad cruda “ingenua” (naive) es aquella que se calcula dividiendo los fallecidos acumulados por los casos confirmados acumulados. Uno de los principales problemas de una tasa de letalidad cruda naive es que esta forma de cálculo subestima la tasa de letalidad de una epidemia en curso, ya que el desenlace (ya sea sobrevivir o morir por COVID-19) no es conocido para todos los casos en un momento dado al no haber podido observar durante el tiempo suficiente a los individuos como para conocer el curso completo de la enfermedad para cada uno. Una forma de resolver este problema es ajustar el denominador por el tiempo promedio de demora entre la confirmación de un caso hasta el desenlace de interés, en este caso la muerte. Esta es una tasa de letalidad de caso corregida por retraso (TLCc o cCFR por su sigla en ingles), para lo cuál utilizamos la metodología propuesta por Russel y colaboradores (Russel et al, 2020b).
El código utilizado para las estimaciones de subreporte y letalidad ajustada son adaptaciones para Chile del desarrollado por Tim Russel disponible en su repositorio.
Los datos disponibles son los siguientes:
-
Estimaciones del número de reproducción (Re): Estimaciones por día del número de reproducción efectivo a nivel de región, servicio de salud y comuna. Se incorporan además algunas visualizaciones básicas de estos datos. Las estimaciones de Re a nivel regional se construyen a partir de los reportes diarios del MINSAL. Las estimaciones de Re a nivel de servicios de salud y comuna utilizan los reportes bisemanales del MINSAL con desagregación a nivel comunal. Una nota de cautela adicional sobre los datos a nivel comunal: los reportes han tenido variaciones en su frecuencia y los días en que se reportan. A modo de ejemplo, el último reporte presento una distancia de 5 días entre los datos reportados entre reporte y reporte, lo que hace que los resultados de las interpolaciones de casos entre fechas sea mucho más incierta. Mientras no tengamos datos diarios de casos por comuna nuestras estimaciones a nivel de comuna y servicio de salud están sujetas a alta incertidumbre.
-
Estimaciones de subreporte de casos: Estimaciones de subreporte de casos sintomáticos por día a nivel nacional y el acumulado para cada región. Se incorporan además algunas visualizaciones básicas de estos datos. Una nota de cautela: los datos de nivel regional para fallecidos no han sido ajustados retrospectivamente por la autoridad. Esto es evidente con el salto de casi 600 fallecidos a inicios de Junio, mayoritariamente en la RM. Esos fallecidos deben ser incorporados a la fecha respectiva de ocurrencia del fallecimiento, lo que aún no ocurre en las series oficiales que publica el Ministerio de Ciencias. Esto hace que el subreporte y la letalidad estén muy subestimados durante Mayo (y quizás Abril).
-
Estimaciones de letalidad de caso: Estimaciones de letalidad de casos cruda y ajustada por subreporte por día a nivel nacional y el acumulado para cada región. Se incorporan además algunas visualizaciones básicas de estos datos. Ninguna de estas dos métricas es adecuada para realizar comparaciones internacionales con otros países. Aquí pueden encontrar una explicación en simple de por qué es una mala idea intentar hacer esas comparaciones. Si pueden ser útiles para comparar al interior del mismo país, así como la trayectoria observada por Chile en el tiempo.
DISCLAIMER: Hay que tener mucho ojo con los datos presentados en este repositorio, pues en su mayoría provienen de información oficial que ha esta en entredicho en varias ocasiones. Las estimaciones son tan buenas como la calidad de los datos. No obstante, tanto los datos de casos confirmados, como las estadísticas de fallecidos COVID-19 pueden estar sujetos a importantes errores de medición. A principios de Junio la autoridad ha reconocido la existencia de un número mayor de fallecidos lo que aún no esta incorporado en las cifras retrospectivas, con lo cuál se subestima tanto la letalidad como el subreporte de casos. La interpretación juiciosa de estos resultados, a la luz de las limitaciones de los datos, es esencial, por lo que llamamos a la prudencia en los usos que se le den.
Agradecimientos 🥰 en especial a María Paz Bertoglia y Karla Yohannessen por sus aportes como revisoras de nuestros reportes semanales, además de Jorge Pérez por su apoyo para montar este repositorio.