3/18/2018

SESIONES TEÓRICAS ESTADÍSTICA Y TIC: SEMANA 6.

¡Buenas a todos!
Esta semana hemos dado el TEMA 5: ESTADÍSTICOS UNIVARIABLES: MEDIDAS RESUMEN PARA VARIABLES CUANTITATIVAS.
Además de las tablas de frecuencia dadas la semana pasada (explicadas en el último post), podemos resumir una serie de observaciones mediante “estadísticos”: “Función de los datos observados”.
Encontramos tres grandes tipos de medidas de estadística:

  • Medidas de tendencia central: dan idea de los valores alrededor de los cuales el resto de los datos tienen tendencia a agruparse. Se encuentra:
    • Media aritmética: Se calcula para variables cuantitativas y se trata del centro geométrico o de gravedad de nuestros datos. Es la suma de todos valores de la variable observada entre el total de observaciones. La fórmula es:


Cuando los datos son agrupados, para calcular la media utilizamos como valor de referencia de cada intervalo su marca de clase. 
    • Mediana: Es el valor de la observación tal que un 50% de los datos es menor y otro 50% es mayor. 
Si el número de observaciones es impar:
Si el número de observaciones es par  corresponde a la media entre los dos valores centrales, es decir, la media entre la observación n/2 y la observación (n/2)+1

    • Moda: Es el valor con mayor frecuencia. Si hay más de una se dice que la muestra es bimodal (dos modas) o multimodal (más de dos) Se puede calcular para cualquier tipo de variable – Si los datos están agrupados, se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor (hi /ci ).
  • Medidas de posición: dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.
    • Cuantiles: Los cuantiles más usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100, 10 ó 4 partes, respectivamente. 
      • Percentiles: Dividen la muestra ordenada en 100 partes. El percentil “i” (Pi ), es aquél valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i)% restante son mayores.
      • Deciles. Dividen la muestra ordenada en 10 partes. El decil “i” (Di ), es aquél valor que, ordenadas las observaciones en forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante son mayores.
      • Cuartiles. Dividen la muestra ordenada en 4 partes.
  • Medidas de dispersión o variabilidad: dan información acerca de la heterogeneidad de nuestras observaciones.
    • Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra 
    • Desviación media: Media aritmética de las distancias de cada observación con respecto a la media de la muestra.
    • Desviación típica: Cuantifica el error que cometemos si representamos una muestra únicamente por su media.
    Resultado de imagen de desviacion tipica formula

    • Varianza: expresa la misma información en valores cuadráticos.

    • Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil. |Q3 -Q1|
    • Coeficiente de variación: es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas.

Por otro lado, existe lo que se llama distribución normal, distribución de Gauss o distribución gaussiana,y es una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales. La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de los valores posición central (media, mediana y moda, que coinciden en estas distribuciones).

Esta curva se conoce como campana de Gauss.

También pueden ser asimétricas positiva (hacia la derecha) y negativa (hacia la izquierda).

G1 < 0: Asimetría a la izquierda

G1 = 0: Simetría

G1 > 0: Asimetría a la derecha

Por otro lado, se encuentran las curtosis, que sirve para medir el grado de concentración de los valores que toma en torno a su media. Existen tres tipos:
  • Distribución mesocúrtica: Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). 


  • Distribución leptocúrtica: Presenta un elevado grado de concentración alrededor de los valores centrales de la variable. 


 
  • Distribución platicúrtica: Presenta un reducido grado de concentración alrededor de los valores centrales de la variable 
 

G2 < 0: Platicúrtica

G2 = 0: Mesocúrtica

G2 > 0: Leptocúrtica

Y hasta aquí todo por hoy, espero que os haya gustado.
¡Hasta la próxima!

3/13/2018

SEMINARIOS ESTADÍSTICA Y TIC. SEMINARIO 3.

¡Buenas mis queridos lectores!
Esta semana hemos tenido el seminario 3, el cual, ha sido bastante interesante y útil ya que nos han enseñado a utilizar el programa Epi Info. 
Y os preguntareis, ¿Qué es Epi Info? 
Se trata de un programa de software gratis del dominio público desarrollado por los Centros para el Control y la Prevención de Enfermedades de los Estados Unidos (CDC). 
Epi Info nos permite realizar 3 acciones básicas que nos servirán para el desarrollo del trabajo de investigación 

  • Creación de formularios, cuestionarios y estructura de bases de datos. 
  • Grabación de datos en un cuestionario o formulario previamente creado. 
  • Análisis de los datos grabados en un formulario o de los datos importados a través de un fichero de datos confeccionado en otras aplicaciones.

En este seminario aprendimos a manejar las dos primeras acciones. 
Para finalizar el seminario, pusimos en práctica lo aprendido en el seminario, avanzando de esta manera el trabajo de investigación. 


3/12/2018

SESIONES TEÓRICAS ESTADÍSTICA Y TIC: SEMANA 5.

¡Hola a todos!
Esta semana ha sido un poco intensa. No obstante, aquí estamos, un día más, actualizando. Aún seguimos por el eterno tema 4. Parece que el nivel de dificultad va aumentando.

En el análisis descriptivo se usan en gran medida los números relativos, que son la expresión de la relación de dos o más cantidades. La frecuencia absoluta no puede ser un indicador pues le falta un denominador que la relacione con el tamaño de la muestra o población, y/o el periodo en el que se presentaron los eventos. Se define indicador como la medida de la frecuencia de un determinado suceso en una población, expresado como un número que puede ser: 

  • Proporción 
  • Tasa 
  • Razón 
  • Odds 


PROPORCIONES
Se define como una medida resumen para variables cualitativas, que consiste en la comparación, a través de un cociente (división) entre un subconjunto y el conjunto al que pertenece. Ej: proporción de personas que presentan una enfermedad: 

El numerador siempre está incluido en el denominador. Adopta valores reales entre 0 y 1, expresando la frecuencia relativa del suceso que medimos. Se suele multiplicar por 100, para una mejor comprensión, expresando los porcentajes correspondientes.Si el suceso que medimos es muy poco frecuente, podemos multiplicar por 1.000, por 10.000, etc.

TASAS (RATE)

Es una medida que expresa el riesgo de ocurrencia del evento (enfermedad) estudiado. En realidad es una proporción, pero con relación espacial y temporal. El denominador incluye una unidad de tiempo. Consiste en la comparación, a través de una división, entre el número de veces que ocurre un cierto tipo de evento y la población en la que puede ocurrir dicho evento en un tiempo determinado. Usualmente el resultado de tal división consiste en una cifra fraccionaria menor a 1, por lo que el resultado suele ser multiplicado por alguna constante que sea múltiplo de 10 (100, 1.000, 10.000, etc.)

Ejemplo: 

La prevalencia es una proporción. Tiene valores entre 0 y 1.

INCIDENCIA: 

Número de nuevos casos de enfermedad que ocurren en un período específico de tiempo, en una población a riesgo de desarrollar la enfermedad. 
La incidencia mide cambio: de ausencia a presencia de enfermedad, de vivo a muerto, de no tener una característica a tenerla. 
La incidencia es una medida de riesgo. 
La incidencia tiene 2 maneras de calcularla: 
  •  Incidencia acumulada (proporción de incidencia): Riesgo de que se produzca el suceso 
    • Se calcula utilizando un período de tiempo durante el cual consideramos que todos los individuos de la población están a riesgo de la enfermedad. 
    • Es la proporción de sujetos que desarrollan la enfermedad, en un período de tiempo, del total de población a riesgo al inicio del período. 
    • Mide el riesgo promedio de padecer la enfermedad (probabilidad de desarrollar la enfermedad).
    • Es el nº de casos nuevos detectados durante el período de tiempo en el que se realiza el estudio. 
    • Adopta valores entre 0 y 1. 
    • Los que ya tienen la enfermedad no entran en el estudio. 
    • No tiene unidades. Es una proporción. 
    • No lleva implícito el periodo de tiempo. Debe expresarse siempre.
    • Los inconvenientes son que puede haber pérdidas en el seguimiento (pues deben seguirse a todos los sujetos durante todo el periodo) . No se pueden inferir los resultados a otros tiempos.
       


  • Tasa de incidencia (densidad de incidencia): Velocidad de aparición de nuevos casos con respecto al tamaño de la población 
    • Con frecuencia, no todos los individuos a riesgo (denominador) son seguidos durante el mismo período de tiempo. 
    • Si se disponen de los diferentes tiempos de observación (“tiempos en riesgo”) de los diferentes individuos, se puede calcular la densidad de incidencia o tasa de incidencia. 
    • Es necesario especificar la unidad de tiempo a las que se refiere la tasa (personas–año; personas–mes, personas–semana, etc.). 
    • Una misma cantidad de personas-tiempo se puede obtener mediante el seguimiento de distintos grupos de población. 
    • Ej: “1000 personas-año” se pueden obtener siguiendo a 1000 personas durante un año, o siguiendo a 500 personas durante 2 años o siguiendo a 2000 personas durante 6 meses.
    • No son proporciones, es una tasa instantánea 
    • Expresa la “tasa” a la cual ocurren los eventos en sujetos de la población en riesgo en cualquier momento. 
    • Expresa velocidad: la tasa de cambio instantáneo o la rapidez con la que se desarrolla el evento en la población. 
      • Tasa: datos agregados 
      • Densidad de incidencia: tasa obtenida de datos individuales


RAZONES O “RATIOS”:
Es una medida de resumen para variables cualitativas que consiste en la comparación, a través de una
división entre dos conjuntos.
Los dos conjuntos son distintos, es decir, uno no incluye al otro.
El numerador del cociente, por tanto, no está incluido en el denominador, como sí sucedía en las
proporciones.
Ej: La razón de sexos:
- En una empresa trabajan 1.200 hombres y 345 mujeres
- La razón de sexos será de 1.200/345, es decir, 3,47 hombres por cada mujer, o 347 hombres por
cada 100 mujeres.

ODDS O VENTAJA:
Es el cociente entre la proporción o probabilidad de ocurrencia de un evento y la proporción o probabilidad (complementaria) de no ocurrencia.

Forma de cálculo:




No hay un término exacto en español, ni consenso en su traducción. El más aceptado es “ventaja” u
“oportunidad”.
La odds representa la frecuencia de un aspecto relativa a los sujetos que no presentan dicho aspecto, por lo que es un tipo especial de razón.
Sus valores van desde 0 (eventos que nunca ocurren) hasta el infinito (eventos que ocurren siempre).

MEDIDAS DE ASOCIACIÓN:
Las tres más importantes son:

  • Razón de prevalencias: Estudios descriptivos de corte transversal. Razón calculada entre dos prevalencias (proporciones).
  • Riesgo relativo o razón de riesgos: Se usa tanto en estudios experimentales como observacionales de seguimiento. Realiza razón entre 2 incidencias acumuladas (proporciones) o entre 2 densidades de incidencia (aunque es más común las incidencias acumuladas).
  • Odds ratio: Estudios de casos y controles. Realiza una ratio entre dos medidas “odds” o ventajas.










Por último, realizamos varios problemas para poner en práctica lo dicho anteriormente. Uno de ellos fue:

  1. En un centro de salud, se pretende realizar un estudio sobre la influencia del tabaquismo sobre las EPOCs (enf. pulmonares obstructivas crónicas). Para ello, a partir, de unos 337 pacientes con EPOCs que acuden al centro, se selecciona un grupo de otros 432 pacientes que no presentaban EPOC pero que acudían a consulta de enfermería del centro por otras patologías crónicas.


  • Tras recoger los datos de los antecedentes de tabaquismo de los sujetos de estudio se comprueba que en el 1º grupo había 215 pacientes con antecedentes de tabaquismo. Mientras que en el 2º grupo se detectaron 184 pacientes con antecedentes de tabaquismo. Calcular la medida de la magnitud de asociación.
  • Hipótesis alternativa (H1) -> Fumar influye en la aparición de EPOC
  • Hipótesis nula (H0) -> Fumar no influye en la aparición de EPOC.
  • Variable independiente -> Fumar / Variable dependiente -> EPOC (tenerlo o no)
  • Son variable cualitativa nominal dicotómica (ambas).
  • Partimos de la variable dependiente.
  • Sería un estudio observacional 
  • Utilizamos una Odds radio -> (Odds de casos / Odds de controles)
  • N casos = 337 -> De ellos, 215 tienen antecedentes de tabaquismo
  • 237 – 215 = 122 Pacientes con EPOC que no tienen antecedentes de tabaquismo
  • N controles = 432 ->  De ellos, 184 tienen antecedentes de tabaquismo.
  • 432 – 184 = 248 Personas sin EPOC que no tienen antecedentes de tabaquismo.
  • Odds de casos -> Presencia del factor entre los casos / Ausencia del factor entre los casos = 215/122= 1,76
  • Odds de controles -> Presencia del factor entre los controles /Ausencia del factor entre los controles=184/248=0,74
  • Odds radio -> Odds de casos /Odds de controles -> 1,76 / 0,74 = 2,4 -> Es mayor a 1
  • Conclusión: Aceptamos la H1. Hay 2,4 más veces de pacientes con EPOC que tienen antecedentes de tabaquismo.


3/04/2018

SESIONES TEÓRICAS ESTADÍSTICA Y TIC: SEMANA 4.

¡Buenas a todos!
Esta semana hemos dado el Tema 4: Introducción a la estadística descriptiva. Este tema, es bastante práctico. Nos han enseñado: La frecuencia absoluta (Fi), la frecuencia relativa (Hi), la frecuencia absoluta y relativa acumulada (solo se puede calcular para variables cuantitativas) y la marca de clase (MC). 

Por último, nos han enseñado a hacer una tabla de frecuencia en la que se detalla todo lo aprendido en esta clase. 

Ejemplo de tabla: 


INTERVALOS
Fi
Hi
Hi%
Fi%
MC

[26,37)
3
3
3/28 (por cien) = 10,7%
10,7%
31,5
[37,48)
2
5 (3+2)
2/28 (por cien) = 7,1%
17,8% 
42,5
[48,59)
9
14 (3+2+9...)
9/28 (por cien) = 32,1%
49,9%
53,5
[59, 70)
7
21
7/28 (por cien) = 25%
74,9%
64,5
[70, 81]
7
28
7/28 (por cien) = 25%
100%
75,5
                               
n=28
La Fi se calcula sumando con los datos que nos tienen que dar para poder realizar la tabla. El resto, se refleja en la tabla su operación.

Y os preguntareis, ¿cómo se realiza una tabla de frecuencia? Para ello:

  • Calculamos RC (rango recorrido): 81-26= 55
81: Hace referencia al número más grande.
26: Hace referencia al número más pequeño.
  • Calculamos el número de intervalos: √28=5.29 (se redondea a 5)
28: Hace referencia al total de la muestra (n).
  • Calculamos la amplitud: 55/5= 11
55: RC
5: Intervalos 

Ya tenemos los datos suficientes para hacer la tabla. Mediante la amplitud podemos ir sumando para realizar los intervalos que aparecen en la tabla. 
En el primer intervalo, lo que hacemos es sumar 11 (amplitud) al número más pequeño de la muestra, que es 26. Y así con todos. Cabe destacar que el paréntesis excluye y el corchete incluye.

Espero que hayáis entendido todo. Si tenéis alguna duda, ¡no dudad en preguntarme!
Para finalizar, os dejo con una frase muy reflexiva. 



¡Espero que tengáis una semana estupenda!

SEMINARIOS ESTADÍSTICA Y TIC. SEMINARIO 2.

¡Hola a todos! 
¿Qué tal vuestro fin de semana? Espero que bien.
El pasado 22 de febrero, en el segundo seminario, todos los grupos de investigación expusimos acerca de nuestras búsquedas bibliográficas sobre los siguientes casos:

  • ¿Soluciones alcohólicas vs Jabones antisépticos? 
Mi grupo de investigación trabajó sobre este caso, con objetivo de decidir cuál era el mejor método para disminuir las infecciones nosocomiales. Por suerte, pudimos encontrar mucha información. He de decir que gracias al uso de los booleanos (click para más información), se nos hizo más fácil encontrar los artículos que más se adecuaban a lo que íbamos buscando. 
Como conclusión, el uso de soluciones alcohólicas es más eficaz, más duradero y requiere un menor tiempo de lavado. Por otro lado, hay que tener en cuenta el factor cultural, ya que existen culturas, que asocian el jabón antiséptico tradicional a un método más eficaz, cosa que como ya hemos dicho anteriormente es falso. 

  • ¿Diabetes Mellitus tipo II en intervenciones grupales o individuales?
Este caso tenía el objetivo de averiguar cómo se mejoraba la adherencia al régimen terapéutico en intervenciones grupales o individuales. Los resultados reflejaron que con ambas intervenciones se conseguía la misma adherencia. 

  •  ¿Hidrocoloide vs azúcar no estéril? 
Este caso tenía el objetivo de resolver qué método era mejor para el tratamiento de Úlceras por Presión (UPP). Llegaron a la conclusión de que no hay suficientes artículos que afirmen que uno de  los dos es mejor. Sin embargo, podemos destacar que el azúcar no estéril es útil para una infección de una úlcera, y con el hidrocoloide la aparición de la costra es más rápida y se elimina más rápido, mejorando así el tratamiento. 

Para finalizar con el seminario, el profesor dio una serie de indicaciones para el trabajo final de investigación. A medida que vayamos avanzando con el trabajo iré actualizando.