En la Web de Hola Don Pepito, generamos un documento que muestra información, en forma de tablas, gráficos y mapas, de la evolución de la infección causada por el coronavirus Covid-19 en España.

El usuario puede interactuar con los gráficos y mapas, pasando el ratón por encima de los mismos o seleccionando los diferentes controles de las barras de herramientas (que se muestran cuando se pasa el ratón por encima de un gráfico o mapa).

El documento ha sido generado a partir de un fichero RMarkdown de R versión 3.6.3.


Antes de comenzar con el análisis de los datos, se quiere comentar que los datos agregados de incidencia en bruto (excluyendo los de población e incidencia por sexo y edad) han sido obtenidos del fichero que todos los días se publica en la Web del Gobierno (ver fuentes de datos al final del documento). Este fichero ha ido sufriendo multitud de ajustes y variaciones desde la Web del Gobierno. Lo anterior, por un lado, ha producido que se haya tenido que modificar más de una vez la forma de leer los datos en este informe, y por otro, en momentos puntuales, también ha producido que los datos parecieran mostrar comportamientos anómalos. En ocasiones, a lo largo del documento, se intentan explicar estos comportamientos anómalos y también se explican algunos cambios de criterio ajenos a este estudio, pero se quiere dejar claro que no se ha parado a explicar todos y cada uno de los cambios, ya que estos se han producido demasiadas veces y no es el objetivo del documento.

No obstante, mencionamos algunos de los cambios más importantes que se han ido produciendo, a lo largo del tiempo, por parte de la Web del Gobierno:

Por todo lo anterior, se invita a leer las NOTAS del Gobierno, al final de este documento, en las que se pueden ver las explicaciones precisas.



La Web del Gobierno ha dejado de publicar los datos desde el 21 de Mayo de 2020, por lo que los datos de esta página no se han podido actualizar desde hace varios días.


Datos a 21 de mayo de 2020 a las 00:00 horas


Casos Totales 233037
Fallecidos 27940
Hospitalizados 124521
Hospitalizados UCI 11454
Casos últimas 24h 344
Fallecidos últimas 24h 48



En el gráfico a continuación se muestra la evolución de la incidencia a nivel nacional, se pueden observar las curvas acumuladas de Casos, Hospitalizados, Fallecidos y pacientes en UCI.

El día 24 Abril se revisa la metodología de conteo de nuevos casos, de tal forma que a partir del 15 de Abril y de forma retroactiva, en muchas comunidades se desglosa el recuento de casos en pruebas PCR y en pruebas rápidas serológicas. Además, desde 25 de Abril, el Gobierno indica que solo se van a tener en cuenta los casos de las pruebas PCR, por ser poco fiables los casos de las pruebas rápidas serológicas. Este ajuste produce que se vean algunos comportamientos anómalos en algún día, por ejemplo, el 18 de Abril se observan menos casos acumulados que en el día anterior.

Por otro lado, en los días 11 y 25 de Abril, se observan algunos saltos considerables en cuanto a Hospitalizados e ingresos en UCI, esto se produjo por cambios en la forma en la que se reportaban los datos de Castilla La Mancha y Madrid hasta dichos días.

Haga click con el ratón en cada nombre de curva, en la lista a la derecha, para mostrar/ocultar una curva o pase el ratón por encima para interactuar con ellas. Además puede seleccionar las diferentes herramientas, que se encuentran en la parte superior derecha del gráfico, para realizar diferentes acciones.


En la Tabla 1 se muestra el incremento diario de Casos, Hospitalizados, Fallecidos y pacientes en UCI, para el conjunto de España.

En la misma tabla se pueden obtener varias lecturas interesantes, por ejemplo, los días con mayores registros de incrementos:

Puede hacer click con el ratón, en los nombres de las columnas de la tabla, para ordenar por fecha o por valore máximo (o mínimo) de la variable deseada.




En la gráfica que podemos ver debajo, se ha realizado un ajuste GAM sobre la nube de puntos de los incremenos diarios de las variables de interés. Los puntos son los datos reales y las curvas son los modelos ajustados. Pueden visualizarse las formas de las diferentes “campanas” que nos indican el progreso de la infección, obervando que ya hemos alcanzado los máximos y que estamos en la parte descendente para todas las variables.

Haga click con el ratón en cada nombre de curva, en la lista a la derecha, para mostrar/ocultar una curva o pase el ratón por encima de los puntos o gráficos para interactuar con ellos. Además puede seleccionar las diferentes herramientas, que se encuentran en la parte superior derecha del gráfico, para realizar diferentes acciones.


En los gráficos a continuación se muestra el incremento porcentual de los datos de interés a nivel nacional de últimos 30 días. Se confirma de nuevo la tendencia bajista en lo que respecta a la infección, si bien es cierto que se aprecian pequeñas oscilaciones en los últimos días.

Pase el ratón por encima de las barras para obtener la información precisa del día y el porcentage de incremento.


En la Tabla 2 se puede visualizar un resumen de los datos acumulados, así cómo sus incrementos diarios, de Casos y Fallecidos, para cada Comunidad Autónoma (últimos 30 días).

Puede hacer click con el ratón, en los nombres de las columnas de la tabla, para ordenar por fecha, por comunidad o por valore máximo (o mínimo) de la variable deseada. También puede utilizar el campo “Filtrar” para buscar un día en concreto, una comunidad o una cifra en particular.


En las siguientes gráficas, se puede realizar una comparativa entre las diferentes comunidades para los datos acumulados de Casos y Fallecidos. Cada línea de color corresponde a una comunidad tal y cómo se indica en la lista de comunidades a la derecha.

Haga click con el ratón en cada nombre de comunidad, en la lista de comunidades a la derecha, para mostrar/ocultar una comunidad en cuestión, después pase el ratón por las gráficas para interactuar con ellas. Además puede seleccionar las diferentes herramientas que se encuentran en la parte superior derecha del gráfico, por ejemplo, haga click en el icono que se encuentra más a la derecha y pase el ratón por cualquiera de las gráficas.


En las siguientes gráficas, se puede realizar una comparativa entre las diferentes comunidades para los incrementos diarios de las variables relevantes, se verán líneas suavizadas de tendencia, para la nube de puntos de cada comunidad. Es decir, se muestran los nuevos Casos y los nuevos Fallecimientos para cada día transcurrido. Cada línea de color corresponde a una comunidad tal y cómo se indica en la lista de comunidades a la derecha.

Haga click con el ratón en cada nombre de comunidad, en la lista de comunidades a la derecha, para mostrar/ocultar una comunidad en cuestión, después pase el ratón por las gráficas para interactuar con ellas. Además puede seleccionar las diferentes herramientas que se encuentran en la parte superior derecha del gráfico, por ejemplo, haga click en el icono que se encuentra más a la derecha y pase el ratón por cualquiera de las gráficas.


En el mapa de España a continuación se muestran los casos acumulados por cada 100.000 habitantes de las comunidades autónomas. En color azul oscuro veremos las comunidades con más casos por cada 100.000 habitantes y en azul claro las que menos tienen.

Tal y cómo se puede observar, La Rioja es la comunidad que más casos tiene por cada 100.000 habitantes. Hay que tomar los datos con cautela, ya que es sabido que los casos han sido subestimados en todas las comunidades en mayor o menor medida.

Se evidencia en el mapa que, no existe correlación geográfica con respecto al número de casos por cada 100.000 habitantes entre comunidades.

Pase el ratón por encima de cada comunidad para visualizar exactamente los casos acumulados por cada 100.000 habitantes en cada una de ellas. Además puede seleccionar las diferentes herramientas que se encuentran en la parte superior derecha del gráfico, por ejemplo, seleccione un área cuadrada del mapa, sobre Ceuta o Melilla, para ampliarlo si lo desea.

En el siguiente mapa de España se puede ver la letalidad de la Covid-19 por comunidad autónoma. En color marrón más oscuro vemos las comunidades con la letalidad más elevada, y a medida que baja la letalidad vemos las comunidades de color más ocre.

Se puede ver en el mapa que C. Mancha es la comunidad que más letalidad tiene, con más de un 17.39%. Obviamente, este valor de letalidad es muy elevado, lo que nos lleva a pensar que los datos de casos acumulados están más infravalorados para esta comunidad y otras que para el resto, y que bien deberían multiplicarse de 10 a 20 veces para ajustarse a la realidad.

Puede verse una banda central de comunidadades adyacentes, Extremadura, Madrid, La Mancha y Aragón, dónde la letalidad del Covid-19 es mayor que en el resto, pero no indica que haya una correlación geográfica.

Pase el ratón por encima de cada comunidad para visualizar exactamente la letalidad en cada una de ellas. Además puede seleccionar las diferent es herramientas que se encuentran en la parte superior derecha del gráfico, por ejemplo, seleccione un área cuadrada del mapa, sobre Ceuta o Melilla, para ampliarlo si lo desea.


En esta ocasión se va a realizar un estudio de la letalidad del Covid-19 en los diferentes grupos de edad y sexo. Definimos la letalidad del Covid-19 cómo el porcetage de fallecimientos con el virus entre los casos detectados con el virus. Hay que tener en cuenta que no todas las notificaciones de fallecimientos y casos han incluido la edad y sexo de las personas, por lo que en los análisis por grupos de edad y/o sexo, los datos totales de casos y fallecimientos son algo menores que las cantidades reales (que sí que son las que se han mostrado al inicio de este documento).

En el gráfico de más abajo, se muestra el porcentage de letalidad para cada rango de edad. Se confirma que a medida que aumenta la edad aumenta la letalidad de la infección drásticamente.

Pase el ratón por encima de cada barra de color para obtener información más precisa de letalidad para los para los diferentes rangos de edad.


En el gráfico a continuación se muestra el porcentage de letalidad para mujeres y para hombres, pudiéndose observar que la letalidad es mucho mayor en hombres que en mujeres.

Pase el ratón por encima de cada barra de color para obtener información más precisa de letalidad para los para los diferentes sexos.


Finalmente, se presenta un gráfico de pirámide para enfrentar el porcentage de letalidad entre sexos y diferenciando por rango de edad. Puede observarse una pirámide totalmente asimétrica, evidenciando la mayor letalidad del virus en hombres para casi todos los rangos de edad, sobre todo a medida que la edad va en aumento.

Pase el ratón por encima de cada barra de color para obtener información más precisa de letalidad para los para los diferentes rangos de edad y sexo.


A continuación, se replican las NOTAS que el Gobierno incluye en el fichero de dónde se han extraído los datos en bruto:

NOTA 1: El objetivo de los datos que se publican en esta web es saber el número de casos acumulados a la fecha y que por tanto no se puede deducir que la diferencia entre un día y el anterior es el número de casos nuevos ya que esos casos pueden haber sido recuperados de fechas anteriores. Cualquier inferencia que se haga sobre las diferencias de un día para otro deben hacerse con precaución y son únicamente la responsabilidad del autor.

NOTA 2: Los datos de estas comunidades son datos de prevalencia (personas ingresadas a fecha de hoy). No reflejan el total de personas que han sido hospitalizadas o ingresadas en UCI a lo largo del periodo de notificación(CL(UCIs*)-GA(UCIS**)-CM***-MD****)

* Desde el día 17/04/2020 las cifras de UCIs de CL son casos acumulados. Previamente se refieren a personas ingresadas ese día.

** Desde el día 28/04/2020 las cifras UCIs de GA son casos acumulados. Previamente se refieren a personas ingresadas ese día. Se actualizará la serie cuando esté disponible.

*** Desde el día 11/04/2020 las cifras de hospitalizados de CM son casos acumulados. Previamente se refieren a personas ingresadas ese día.

*** Desde el día 12/04/2020 las cifras de UCIs de CM son casos acumulados. Previamente se refieren a personas ingresadas ese día.

**** Desde el día 26/04/2020 las cifras de Hospitalizados y UCIs de MD son casos acumulados. Previamente se refieren a personas ingresadas ese día. Se actualizará la serie cuando esté disponible

NOTA 3:Se excluyen de la serie las notificaciones de personas con anticuerpos positivos sin síntomas en el momento de realización de la prueba en los que no se puede establecer un momento de contagio ni si han padecido o no la enfermedad.

NOTA 4: El total de PCR+ de Cataluña incluye 2791 casos pendientes de distribuir en la serie histórica. Estos datos se han sumado al dato del día 10/05 de forma provisional hasta su correcta distribución.

Se quiere incidir en que tal y cómo se deduce de las NOTAS del Gobierno, las interpretaciones de los datos de un día para otro deben hacerse con precaución ya que pueden no reflejar la realidad.

Fuentes de datos:

Los datos de incidencia en bruto han sido descargados de la Web del Gobierno de España: https://cnecovid.isciii.es/covid19/resources/agregados.csv

Los datos de población se ha descargado de la página oficial del INE: https://www.ine.es/jaxiT3/Datos.htm?t=2853#!tabs-tabla

Los datos de incidencia por sexo y edad han sido descargados del GitHub de datadista: https://raw.githubusercontent.com/datadista/datasets/master/COVID%2019/nacional_covid19_rango_edad.csv