¡Buenas a todos!
Esta semana hemos dado el TEMA 5: ESTADÍSTICOS UNIVARIABLES:
MEDIDAS RESUMEN PARA VARIABLES
CUANTITATIVAS.
Además de las tablas de frecuencia dadas la semana pasada (explicadas en el último post), podemos resumir una serie de
observaciones mediante “estadísticos”: “Función de los
datos observados”.
Encontramos tres grandes tipos de medidas de estadística:
- Medidas de tendencia central: dan idea de los valores alrededor de los cuales el resto de los datos tienen tendencia a agruparse. Se encuentra:
- Media aritmética: Se calcula para variables cuantitativas y se trata del centro geométrico o de gravedad de nuestros datos. Es la suma de todos valores de la variable observada entre el total de observaciones. La fórmula es:
Cuando los datos son agrupados, para calcular
la media utilizamos como valor de referencia de
cada intervalo su marca de clase.
- Mediana: Es el valor de la observación tal que un 50% de los datos es menor y otro 50% es mayor.
Si el número de observaciones es par corresponde a la media entre los dos
valores centrales, es decir, la media entre la
observación n/2 y la observación (n/2)+1
- Moda: Es el valor con mayor frecuencia. Si hay más de una se dice que la muestra es bimodal (dos modas) o multimodal (más de dos) Se puede calcular para cualquier tipo de variable – Si los datos están agrupados, se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor (hi /ci ).
- Medidas de posición: dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.
- Cuantiles: Los cuantiles más usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100, 10 ó 4 partes, respectivamente.
- Percentiles: Dividen la muestra ordenada en 100 partes. El percentil “i” (Pi ), es aquél valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i)% restante son mayores.
- Deciles. Dividen la muestra ordenada en 10 partes. El decil “i” (Di ), es aquél valor que, ordenadas las observaciones en forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante son mayores.
- Cuartiles. Dividen la muestra ordenada en 4 partes.
- Medidas de dispersión o variabilidad: dan información acerca de la heterogeneidad de nuestras observaciones.
- Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra
- Desviación media: Media aritmética de las distancias de cada observación con respecto a la media de la muestra.
- Desviación típica: Cuantifica el error que cometemos si representamos una muestra únicamente por su media.
- Varianza: expresa la misma información en valores cuadráticos.
- Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil. |Q3 -Q1|
- Coeficiente de variación: es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas.
Por otro lado, existe lo que se llama distribución normal,
distribución de Gauss o distribución gaussiana,y es una de las distribuciones de probabilidad de
variable continua que con más frecuencia aparece
en fenómenos reales. La gráfica de su función de densidad tiene una
forma acampanada y es simétrica respecto de los
valores posición central (media, mediana y moda,
que coinciden en estas distribuciones).
Esta curva se conoce como campana de Gauss.
También pueden ser
asimétricas positiva (hacia la derecha) y negativa (hacia la izquierda).
G1 < 0: Asimetría a la izquierda
G1 = 0: Simetría
G1 > 0: Asimetría a la derecha
Por otro lado, se encuentran las curtosis, que sirve para medir el grado de
concentración de los valores que toma en
torno a su media. Existen tres tipos:
- Distribución mesocúrtica: Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).
- Distribución leptocúrtica: Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.
- Distribución platicúrtica: Presenta un reducido grado de concentración alrededor de los valores centrales de la variable
G2 < 0: Platicúrtica
G2 = 0: Mesocúrtica
G2 > 0: Leptocúrtica
Y hasta aquí todo por hoy, espero que os haya gustado.
¡Hasta la próxima!