Statística

Estadísticas

Un catálogo de referencia debe ofrecer los parámetros estadísticos de los tres valores más documentados, peso, módulo y posición de cuños. Para ello, se ha desarrollado una herramienta de análisis dinámico que muestre los parámetros estadísticos de estos tres bloques de datos, ya que se trata de un catálogo abierto, con un aumento anual significativo de nuevas monedas acuñadas en diferentes cecas.

La herramienta de análisis muestra:

Los diagramas de violín y de cajas de todos los tipos de cada ceca en una secuencia continua;
el diagrama de violín del tipo seleccionado se muestra a continuación, al hacer clic en uno de ellos .

Al navegar por el catálogo, la ventana que describe un tipo individual, y muestra las copias documentadas, siempre incluye al final de la página el resumen estadístico del tipo.

De las diferentes representaciones estadísticas que existen para mostrar gráficamente un conjunto de datos hemos elegido el modelo de diagrama de violín (violin plot), combinado con el diagrama de cajas, que marca algunas estadísticas de resumen específicas, aunque no muy diferentes de un diagrama de cajas (box plot).

Un diagrama de violín es una combinación de un diagrama de caja y un diagrama de densidad de núcleo. Específicamente, comienza con un diagrama de caja. A continuación, añade un diagrama de densidad del núcleo rotado a cada lado del diagrama de caja. Ambos se pueden ver por separado. En este tipo de representación, el ancho del diagrama es proporcional al número de puntos de datos en esa sección de la muestra. Un gráfico de densidad del núcleo puede ser considerado un refinamiento de un histograma o gráfico de frecuencia. El diagrama de densidad KERNEL estima la función de densidad de probabilidad subyacente y la función de distribución acumulativa (cdf), que presenta una aproximación suavizada de la muestra de datos utilizada.

 

¿Cómo leer nuestros diagramas?



Nuestros diagramas combinan las representaciones violin plot y box plot.

En la representación box plot:

1. El punto blanco representa la mediana
2. La caja roja en el centro representa el rango intercuartílico Los cuartiles son los valores que dividen una lista de números en cuartos. El "Rango Intercuartílico" se extiende de Q1 a Q3.
3. Los bigotes representan la parte de la distribución no cubierta por la caja, menos el 20 % de los datos. El 30 % de todos los datos de la distribución, los que están comprendidos entre los percentiles 75 al 90 y del 10 al 25, se encuentran dentro de los bigotes. Los bigotes están conectados a la caja, pero su longitud cubre hasta los percentiles 10 y 90, dejando sin cubrir la parte más externa de la distribución de la muestra. Por supuesto, el bigote superior e inferior pueden diferir en longitud. En esta representación los bigotes se dibujan como líneas sólidas.
4. Las partes no cubiertas por los bigotes corresponden a los valores atípicos representados por puntos.

Por debajo del box plot se representa el diagrama violín. En cada lado de la caja roja hay una estimación de la densidad del núcleo para mostrar la forma de distribución de los datos, donde hay más pesos. Las secciones más anchas del diagrama de violín representan una mayor probabilidad de que los pesos y los módulos se incluyan dentro de esos valores; las secciones más delgadas representan una menor probabilidad.

El tipo de diagrama y su forma pueden elegirse desplegando el panel de control, que permite personalizar la representación. Se han desarrollado dos tipos de gráficos estadísticos; los diagramas de cajas (box plot) se superponen a los violin plot, pero también se pueden ver de forma separada. Se pueden visualizar las líneas que marcan los pesos y facilitan la lectura. También se puede variar el ancho de las cajas y de los violines y mostrar / ocultar diversos componentes (bigotes y oultliers). En el caso de los violines se pueden elegir ocho modos de representación, basis, Bump-Y… 

Los diagramas sirven también para detectar errores en la introducción de los datos, ya que aparecen en los diagramas como valores extremadamente atípicos. Alguna vez sucede que no se teclea bien el punto de los decimales, o que módulos se han introducido en centímetros, en vez de milímetros.

Referencias:

https://www.itl.nist.gov/div898/software/dataplot/refman1/auxillar/violplot.htm 

https://matplotlib.org/1.4.0/users/whats_new.html#violin-plots

https://root.cern/doc/master/classTHistPainter.html#HP140b

https://www.mathsisfun.com/data/quartiles.html 

https://en.wikipedia.org/wiki/Violin_plot