En la Web de Hola Don Pepito, generamos un documento que muestra información, en forma de tablas, gráficos y mapas, de la evolución de la infección causada por el coronavirus Covid-19 en España.
El usuario puede interactuar con los gráficos y mapas, pasando el ratón por encima de los mismos o seleccionando los diferentes controles de las barras de herramientas (que se muestran cuando se pasa el ratón por encima de un gráfico o mapa).
El documento ha sido generado a partir de un fichero RMarkdown de R versión 3.6.3.
Antes de comenzar con el análisis de los datos, se quiere comentar que los datos agregados de incidencia en bruto (excluyendo los de población e incidencia por sexo y edad) han sido obtenidos del fichero que todos los días se publica en la Web del Gobierno (ver fuentes de datos al final del documento). Este fichero ha ido sufriendo multitud de ajustes y variaciones desde la Web del Gobierno. Lo anterior, por un lado, ha producido que se haya tenido que modificar más de una vez la forma de leer los datos en este informe, y por otro, en momentos puntuales, también ha producido que los datos parecieran mostrar comportamientos anómalos. En ocasiones, a lo largo del documento, se intentan explicar estos comportamientos anómalos y también se explican algunos cambios de criterio ajenos a este estudio, pero se quiere dejar claro que no se ha parado a explicar todos y cada uno de los cambios, ya que estos se han producido demasiadas veces y no es el objetivo del documento.
No obstante, mencionamos algunos de los cambios más importantes que se han ido produciendo, a lo largo del tiempo, por parte de la Web del Gobierno:
El día 20 de Mayo, se elimina la serie de Recuperados.
Cambio de la URL de descarga del fichero de datos agregados del Gobierno desde el 9 de Mayo.
Cambio de metodología de conteo de nuevos casos a partir del 24 de Abril.
Cambios en los criterios de algunas comunidades para el conteo de datos en alguna de las series, ya que había comunidades que no lo estaban haciendo cómo estipuló el Gobierno.
No uniformidad diaria a la hora de informar los datos por parte de las comunidades. En ocasiones no se informaban todos los datos a tiempo ciertos días y por tanto al día siguiente se informaban datos de un día más parte del anterior.
Ajustes de datos, con carácter retroactivo, para muchos días, de prácticamente todas las series. De tal forma que en el fichero se han ido modificado valores de datos de días ya pasados.
Por todo lo anterior, se invita a leer las NOTAS del Gobierno, al final de este documento, en las que se pueden ver las explicaciones precisas.
Casos Totales | 233037 |
Fallecidos | 27940 |
Hospitalizados | 124521 |
Hospitalizados UCI | 11454 |
Casos últimas 24h | 344 |
Fallecidos últimas 24h | 48 |
En el gráfico a continuación se muestra la evolución de la incidencia a nivel nacional, se pueden observar las curvas acumuladas de Casos, Hospitalizados, Fallecidos y pacientes en UCI.
El día 24 Abril se revisa la metodología de conteo de nuevos casos, de tal forma que a partir del 15 de Abril y de forma retroactiva, en muchas comunidades se desglosa el recuento de casos en pruebas PCR y en pruebas rápidas serológicas. Además, desde 25 de Abril, el Gobierno indica que solo se van a tener en cuenta los casos de las pruebas PCR, por ser poco fiables los casos de las pruebas rápidas serológicas. Este ajuste produce que se vean algunos comportamientos anómalos en algún día, por ejemplo, el 18 de Abril se observan menos casos acumulados que en el día anterior.
Por otro lado, en los días 11 y 25 de Abril, se observan algunos saltos considerables en cuanto a Hospitalizados e ingresos en UCI, esto se produjo por cambios en la forma en la que se reportaban los datos de Castilla La Mancha y Madrid hasta dichos días.
Haga click con el ratón en cada nombre de curva, en la lista a la derecha, para mostrar/ocultar una curva o pase el ratón por encima para interactuar con ellas. Además puede seleccionar las diferentes herramientas, que se encuentran en la parte superior derecha del gráfico, para realizar diferentes acciones.
En la Tabla 1 se muestra el incremento diario de Casos, Hospitalizados, Fallecidos y pacientes en UCI, para el conjunto de España.
En la misma tabla se pueden obtener varias lecturas interesantes, por ejemplo, los días con mayores registros de incrementos:
Mayor registro de incremento de Casos: 26-03-2020, con 9177 nuevos contagios.
Mayor registro de incremento de Fallecidos: 31-03-2020, con 930 nuevos fallecidos.
Puede hacer click con el ratón, en los nombres de las columnas de la tabla, para ordenar por fecha o por valore máximo (o mínimo) de la variable deseada.
Haga click con el ratón en cada nombre de curva, en la lista a la derecha, para mostrar/ocultar una curva o pase el ratón por encima de los puntos o gráficos para interactuar con ellos. Además puede seleccionar las diferentes herramientas, que se encuentran en la parte superior derecha del gráfico, para realizar diferentes acciones.
En los gráficos a continuación se muestra el incremento porcentual de los datos de interés a nivel nacional de últimos 30 días. Se confirma de nuevo la tendencia bajista en lo que respecta a la infección, si bien es cierto que se aprecian pequeñas oscilaciones en los últimos días.
Pase el ratón por encima de las barras para obtener la información precisa del día y el porcentage de incremento.
En la Tabla 2 se puede visualizar un resumen de los datos acumulados, así cómo sus incrementos diarios, de Casos y Fallecidos, para cada Comunidad Autónoma (últimos 30 días).
Puede hacer click con el ratón, en los nombres de las columnas de la tabla, para ordenar por fecha, por comunidad o por valore máximo (o mínimo) de la variable deseada. También puede utilizar el campo “Filtrar” para buscar un día en concreto, una comunidad o una cifra en particular.
En las siguientes gráficas, se puede realizar una comparativa entre las diferentes comunidades para los datos acumulados de Casos y Fallecidos. Cada línea de color corresponde a una comunidad tal y cómo se indica en la lista de comunidades a la derecha.
Haga click con el ratón en cada nombre de comunidad, en la lista de comunidades a la derecha, para mostrar/ocultar una comunidad en cuestión, después pase el ratón por las gráficas para interactuar con ellas. Además puede seleccionar las diferentes herramientas que se encuentran en la parte superior derecha del gráfico, por ejemplo, haga click en el icono que se encuentra más a la derecha y pase el ratón por cualquiera de las gráficas.
En las siguientes gráficas, se puede realizar una comparativa entre las diferentes comunidades para los incrementos diarios de las variables relevantes, se verán líneas suavizadas de tendencia, para la nube de puntos de cada comunidad. Es decir, se muestran los nuevos Casos y los nuevos Fallecimientos para cada día transcurrido. Cada línea de color corresponde a una comunidad tal y cómo se indica en la lista de comunidades a la derecha.
Haga click con el ratón en cada nombre de comunidad, en la lista de comunidades a la derecha, para mostrar/ocultar una comunidad en cuestión, después pase el ratón por las gráficas para interactuar con ellas. Además puede seleccionar las diferentes herramientas que se encuentran en la parte superior derecha del gráfico, por ejemplo, haga click en el icono que se encuentra más a la derecha y pase el ratón por cualquiera de las gráficas.
En el mapa de España a continuación se muestran los casos acumulados por cada 100.000 habitantes de las comunidades autónomas. En color azul oscuro veremos las comunidades con más casos por cada 100.000 habitantes y en azul claro las que menos tienen.
Tal y cómo se puede observar, La Rioja es la comunidad que más casos tiene por cada 100.000 habitantes. Hay que tomar los datos con cautela, ya que es sabido que los casos han sido subestimados en todas las comunidades en mayor o menor medida.
Se evidencia en el mapa que, no existe correlación geográfica con respecto al número de casos por cada 100.000 habitantes entre comunidades.
Pase el ratón por encima de cada comunidad para visualizar exactamente los casos acumulados por cada 100.000 habitantes en cada una de ellas. Además puede seleccionar las diferentes herramientas que se encuentran en la parte superior derecha del gráfico, por ejemplo, seleccione un área cuadrada del mapa, sobre Ceuta o Melilla, para ampliarlo si lo desea.
En el siguiente mapa de España se puede ver la letalidad de la Covid-19 por comunidad autónoma. En color marrón más oscuro vemos las comunidades con la letalidad más elevada, y a medida que baja la letalidad vemos las comunidades de color más ocre.
Se puede ver en el mapa que C. Mancha es la comunidad que más letalidad tiene, con más de un 17.39%. Obviamente, este valor de letalidad es muy elevado, lo que nos lleva a pensar que los datos de casos acumulados están más infravalorados para esta comunidad y otras que para el resto, y que bien deberían multiplicarse de 10 a 20 veces para ajustarse a la realidad.
Puede verse una banda central de comunidadades adyacentes, Extremadura, Madrid, La Mancha y Aragón, dónde la letalidad del Covid-19 es mayor que en el resto, pero no indica que haya una correlación geográfica.
Pase el ratón por encima de cada comunidad para visualizar exactamente la letalidad en cada una de ellas. Además puede seleccionar las diferent es herramientas que se encuentran en la parte superior derecha del gráfico, por ejemplo, seleccione un área cuadrada del mapa, sobre Ceuta o Melilla, para ampliarlo si lo desea.
En esta ocasión se va a realizar un estudio de la letalidad del Covid-19 en los diferentes grupos de edad y sexo. Definimos la letalidad del Covid-19 cómo el porcetage de fallecimientos con el virus entre los casos detectados con el virus. Hay que tener en cuenta que no todas las notificaciones de fallecimientos y casos han incluido la edad y sexo de las personas, por lo que en los análisis por grupos de edad y/o sexo, los datos totales de casos y fallecimientos son algo menores que las cantidades reales (que sí que son las que se han mostrado al inicio de este documento).
En el gráfico de más abajo, se muestra el porcentage de letalidad para cada rango de edad. Se confirma que a medida que aumenta la edad aumenta la letalidad de la infección drásticamente.
Pase el ratón por encima de cada barra de color para obtener información más precisa de letalidad para los para los diferentes rangos de edad.
Pase el ratón por encima de cada barra de color para obtener información más precisa de letalidad para los para los diferentes sexos.
Pase el ratón por encima de cada barra de color para obtener información más precisa de letalidad para los para los diferentes rangos de edad y sexo.
NOTA 1: El objetivo de los datos que se publican en esta web es saber el número de casos acumulados a la fecha y que por tanto no se puede deducir que la diferencia entre un día y el anterior es el número de casos nuevos ya que esos casos pueden haber sido recuperados de fechas anteriores. Cualquier inferencia que se haga sobre las diferencias de un día para otro deben hacerse con precaución y son únicamente la responsabilidad del autor.
NOTA 2: Los datos de estas comunidades son datos de prevalencia (personas ingresadas a fecha de hoy). No reflejan el total de personas que han sido hospitalizadas o ingresadas en UCI a lo largo del periodo de notificación(CL(UCIs*)-GA(UCIS**)-CM***-MD****)
* Desde el día 17/04/2020 las cifras de UCIs de CL son casos acumulados. Previamente se refieren a personas ingresadas ese día.
** Desde el día 28/04/2020 las cifras UCIs de GA son casos acumulados. Previamente se refieren a personas ingresadas ese día. Se actualizará la serie cuando esté disponible.
*** Desde el día 11/04/2020 las cifras de hospitalizados de CM son casos acumulados. Previamente se refieren a personas ingresadas ese día.
*** Desde el día 12/04/2020 las cifras de UCIs de CM son casos acumulados. Previamente se refieren a personas ingresadas ese día.
**** Desde el día 26/04/2020 las cifras de Hospitalizados y UCIs de MD son casos acumulados. Previamente se refieren a personas ingresadas ese día. Se actualizará la serie cuando esté disponible
NOTA 3:Se excluyen de la serie las notificaciones de personas con anticuerpos positivos sin síntomas en el momento de realización de la prueba en los que no se puede establecer un momento de contagio ni si han padecido o no la enfermedad.
NOTA 4: El total de PCR+ de Cataluña incluye 2791 casos pendientes de distribuir en la serie histórica. Estos datos se han sumado al dato del día 10/05 de forma provisional hasta su correcta distribución.
Se quiere incidir en que tal y cómo se deduce de las NOTAS del Gobierno, las interpretaciones de los datos de un día para otro deben hacerse con precaución ya que pueden no reflejar la realidad.
Fuentes de datos:
Los datos de incidencia en bruto han sido descargados de la Web del Gobierno de España: https://cnecovid.isciii.es/covid19/resources/agregados.csv
Los datos de población se ha descargado de la página oficial del INE: https://www.ine.es/jaxiT3/Datos.htm?t=2853#!tabs-tabla
Los datos de incidencia por sexo y edad han sido descargados del GitHub de datadista: https://raw.githubusercontent.com/datadista/datasets/master/COVID%2019/nacional_covid19_rango_edad.csv