5/31/2018

REFLEXI脫N FINAL


OBJETIVO馃挭
El objetivo de los seminarios de la asignatura de Estad铆stica y TIC's, ha sido proporcionarnos la informaci贸n necesaria para poder realizar el trabajo de investigaci贸n. 
ESTRATEGIAS DE APRENDIZAJE馃挰
En cuanto a las estrategias de aprendizaje, hemos podido realizar b煤squedas bibliogr谩ficas de manera eficaz para la realizaci贸n del marco te贸rico. Por otro lado, gracias al programa de Epi Info hemos podido elaborar los dos cuestionarios utilizados, uno acerca de los antecedentes personales y otro sobre salud f铆sica/mental; hemos podido introducir la informaci贸n de los cuestionarios recogidos; recodificar, agrupar las variables de salud f铆sica y mental y por 煤ltimo, calcular las medias. 
¿CON QU脡 HE APRENDIDO?馃挮
Recursos materiales:
  • Equipo inform谩tico: Port谩til con conexi贸n a internet, concretamente haciendo uso del navegador Google Chrome. 
  • Windows 10. 
  • Programa inform谩tico de estad铆sticas: Epi Info. 
  • Microsoft Word y Power Point. 
Recursos humanos:
  • Las cinco investigadoras del trabajo. 
  • Asociaciones contra el c谩ncer de mama: Asociaci贸n Espa帽ola Contra el C谩ncer (AECC), concretamente en la sede de Carmona y la Asociaci贸n AMAMA, con sede en Sevilla. 
  • Pacientes con c谩ncer de mama mastectomizadas. 
  • Cruz Roja Espa帽ola (documentaci贸n de confidencialidad). 
  • 70 mujeres mastectomizadas.
Por otro lado, las gracias a los profesores Manuel Pab贸n y Jos茅 Antonio Ponce, por aportar las pautas y herramientas necesarias para la realizaci贸n del estudio, y por los consejos y la resoluci贸n de las dudas planteadas con paciencia y amabilidad.

SEMINARIOS ESTAD脥STICA Y TIC. 脷LTIMO SEMINARIO.


Despu茅s de tantas horas, d铆as y semanas esforz谩ndonos muy duramente, tanto mis compa帽eras como yo, estamos super orgullosas del trabajo tan bien realizado que hemos conseguido.
A pesar de las equivocaciones, de los nervios al pensar que no conseguir铆amos llegar a la n suficiente, de horas intentando averiguar c贸mo extraer los resultados, ha resultado ser un aprendizaje que nunca olvidaremos. 
Este trabajo estudi贸 la calidad de vida de mujeres mastectomizadas. Apostamos por un tema que al principio nos dio pudor, ya que no sab铆amos c贸mo iban a reaccionar dichas mujeres a la citaci贸n del cuestionario d贸nde contestar铆an preguntas sobre sus limitaciones, sobre su capacidad por realizar actividades profesionales y dom茅sticas, entre otras. Sin embargo, el 90% de mujeres reaccion贸 con total naturalidad y nos prest贸 todo su apoyo
Quisimos indagar sobre el estado civil mayoritario, el nivel educativo, la situaci贸n econ贸mica tras la operaci贸n, adem谩s del porcentaje de mujeres con antecedentes de HTA, DM o malignidades previas.
  • Formulamos dos hip贸tesis nulas y dos hip贸tesis de investigaci贸n:

Hip贸tesis nula
    1. No existe relaci贸n entre el tipo de mastectom铆a y la calidad de vida.
    2. No existe relaci贸n entre el tipo de tratamiento y la calidad de vida.
  • ¿Qu茅 tipo de estudio es?
    • DESCRIPTIVO
    • OBSERVACIONAL
    • TRANSVERSAL
  • ¿Qu茅 caracter铆sticas tiene la poblaci贸n de estudio?
Se trata de mujeres mastectomizadas intervenidas de una mama por extracci贸n de un ganglio centinela o por extirpaci贸n total de la mama. Procedentes de las localidades de Sevilla, Dos Hermanas, Carmona, Los Palacios y Villafranca y 脡cija. El rango de edad de estas mujeres es de 36 a 86 a帽os. 
  • Obtenci贸n de datos
Este estudio descriptivo de corte transversal se ha llevado a cabo mediante el reparto de un cuestionario (SF-36v.2) compuesto de dos partes: una en la que se recogen los antecedentes personales del paciente y otra sobre la salud tanto f铆sica como mental de las mujeres del estudio.

Para el an谩lisis estad铆stico de los datos se utiliz贸 el programa inform谩tico Epi Info 7. Tras la obtenci贸n de dichos datos, se procedi贸 a introducir la informaci贸n en el cuestionario creado previamente en Epi Info. En cuanto al an谩lisis de los datos, se procedi贸 a recodificar el cuestionario, asign谩ndole a cada variable un valor num茅rico entre ‘‘0’’ y ‘‘100’’, siendo ‘‘0’’ el peor estado de salud y ‘‘100’’ el mejor estado de la salud.
Tras la recodificaci贸n, para obtener la media de la salud f铆sica se realiz贸 una ecuaci贸n en la cual se sumaron todas las variables que componen los 4 primeros dominios (pertenecientes a la salud f铆sica) y se dividi贸 entre el n煤mero de variables, en este caso, 21. Por otra parte, para el c谩lculo de la media de la salud mental, se llev贸 a cabo el mismo procedimiento mencionado con anterioridad, con la excepci贸n de que, en este caso, se dividi贸 el sumatorio de las variables componentes de los 4 煤ltimos dominios (pertenecientes a la salud mental) entre 11. Una vez obtenidas las medias, dentro del apartado “Estad铆sticas”, se seleccion贸 la opci贸n “Medias”. En “Medias de” se escogi贸 la media creada anteriormente (Salud Mental o Salud F铆sica). Se realizaron tabulaciones cruzadas por el valor de una variable (Ejemplo: Quimioterapia). Se obtuvo, por tanto, el T-Test, 21 donde se va a decidir si se acepta o se rechaza la Hip贸tesis Nula dependiendo de los valores de la Media, Desviaci贸n T铆pica, t-value y Pr>|t|.


  • Resultados:
Centr谩ndonos en la primera hip贸tesis nula planteada, que afirma que no existe relaci贸n entre el tipo de mastectom铆a y la calidad de vida de las mujeres mastectomizadas, se debe destacar que existen distintos tipos de mastectom铆a. 

En primer lugar, se relaciona la salud f铆sica con el hecho de haberse sometido a mastectom铆a parcial. Se obtiene una p-Value de 0,0291; por lo que se rechaza la hip贸tesis nula (H0)
  • Desde el punto de vista mental, se obtiene una p-Value de 0,5630; por lo que se acepta la hip贸tesis nula (H0)
  • Conclusi贸n: El hecho de haberse sometido a una mastectom铆a parcial influye en la calidad de vida de las mujeres desde el punto de vista f铆sico, pero no desde el punto de vista mental. 
En segundo lugar, se estudia la relaci贸n entre la calidad de vida y el haberse sometido a una mastectom铆a total. 
  • Desde el punto de vista f铆sico, se obtiene una p-Value de 0,1435; por lo que se acepta la hip贸tesis nula (H0). 
  • Por otro lado, respecto al punto de vista mental, se obtuvo una p-Value de 0,9724; por lo que se acepta la hip贸tesis nula (H0). 
  • Conclusi贸n: La calidad de vida de las mujeres no se ve influenciada por la mastectom铆a total. 
En tercer lugar, se relaciona la calidad de vida con la mastectom铆a izquierda. 
  • Cuando se compara el componente f铆sico se obtiene una p-Value de 0,0755; por lo que se acepta la hip贸tesis nula (H0). 
  • Cuando se compara el componente mental se obtiene una p-Value de 0,5045; por lo que se acepta la hip贸tesis nula (H0). 
  • Conclusi贸n: La mastectom铆a izquierda no influye en la calidad de vida de los sujetos de estudio. 
En cuarto lugar, se pone en relaci贸n la mastectom铆a derecha con la calidad de vida de las mujeres. 
  • Respecto al 谩mbito f铆sico, se obtiene una p-Value de 0,1928; acept谩ndose la hip贸tesis nula (H0). 
  • Respecto al 谩mbito mental, la p-Value es de 0,1826; por lo que se acepta la hip贸tesis nula (H0). 
  • Conclusi贸n: La mastectom铆a derecha no influye en la calidad de vida de las mujeres mastectomizadas. 

En quinto lugar, relacionamos el hecho de haberse sometido a una mastectom铆a bilateral con la posterior calidad de vida de las mujeres. 
  • Cuando se pone en relaci贸n el componente f铆sico, el p-Value es de 0,6759, aceptando as铆 la hip贸tesis nula.
  • Cuando se relaciona el componente mental, la p-Value es de 0,3857, por lo que se acepta la hip贸tesis nula de nuevo. Sin embargo debemos mencionar la presencia de un sesgo en esta relaci贸n de variables, ya que tan solo 5 mujeres tienen una mastectom铆a bilateral frente a 46 pacientes, las cuales no han sido mastectomizadas de ambas mamas, en relaci贸n con el componente f铆sico. 
  • En el caso de la quimioterapia, se ha comparado la salud f铆sica de las mujeres que se sometieron a este tratamiento frente a las que no lo hicieron. Como 64 resultado se obtiene una p-Value de 0,7627; al ser 茅sta mayor que 0,05 se acepta la hip贸tesis nula (H0)
  • Respecto a la salud mental, se obtiene una p-Value de 0,4181 por lo que, al igual que en el caso anterior, se acepta la hip贸tesis nula
  • Conclusi贸n: La quimioterapia no influye en la calidad de vida de las mujeres mastectomizadas, tanto desde el punto de vista f铆sico como mental. 
  • En cuanto a la radioterapia, se compar贸 tanto la salud f铆sica como la mental en mujeres que se hab铆an sometido a este tratamiento y en aquellas que no lo hab铆an hecho. 
  • Al relacionar el componente de la salud f铆sica con el tratamiento de radioterapia, se obtiene una p-Value de 0,7339; por lo que se acepta la hip贸tesis nula (H0)
  • Respecto al componente de salud mental, la p-Value es de 0,6345; por lo que se acepta la hip贸tesis nula (H0). 
  • Conclusi贸n: La calidad de vida desde el 谩mbito f铆sico y mental no se ve influenciada por el tratamiento de radioterapia. 

SESIONES TE脫RICAS ESTAD脥STICA Y TIC: SEMANA 13.

¡¡Hola a todos!! ❤
Esta semana hemos dado el TEMA 12 CORRELACI脫N Y CONCORDANCIA. 

¿Qu茅 es la regresi贸n?
Es la predicci贸n de una medida bas谩ndonos en el conocimiento de otra. Nuestro objetivo ser谩 intentar reconocer si hay relaci贸n entre las variables, de qu茅 tipo, y si es posible predecir el valor de una de ellas en funci贸n de la otra.
Dichas observaciones pueden ser representadas en un diagrama de dispersi贸n (“scatterplot”).

En cuanto al modelo de regresi贸n utilizado, tratamos el modelo de regresi贸n lineal simple, que es el que se usa para 1 variable explicativa. Se trata de estudiar la asociaci贸n lineal entre dos variables cuantitativas. Se relacionan 煤nicamente una variable independiente con otra dependiente.

y=1+0
Siendo:

尾₁= pendiente de la recta. Expresa la cantidad de cambio que se produce en la variable dependiente por unidad de cambio de la variable independiente.

尾₀= punto de intersecci贸n con el eje de coordenadas. Expresa cu谩l es el valor de la variable dependiente cuando la independiente vale cero.


¿Qu茅 modelos lineales existen?


Modelos lineales deterministas: La variable independiente determine el valor de la variable dependiente. Entonces para cada valor de la variable independiente s贸lo habr铆a un valor de la dependiente

Modelos lineales probabil铆sticos: Para cada valor de la variable independiente existe una distribuci贸n de probabilidad de valores de la dependiente, con una probabilidad entre 0 y 1.

La recta por determinar es aqu茅lla con la menor distancia de cada punto a ella.

An谩lisis de correlaci贸n




El an谩lisis de correlaci贸n se utiliza con el prop贸sito de disponer de un indicador cuantitativo que permite sintetizar el grado de la asociaci贸n entre variables.
  • Coeficiente de Correlaci贸n r de Pearson (r), (R x y): Es un coeficiente que mide el grado de la relaci贸n de dependencia que existe entre las variables (x, y), cuyos valores van desde –1, correspondiente a una correlaci贸n negativa perfecta, hasta 1, correspondiente a una correlaci贸n positiva perfecta. Si el resultado es de 1 o -1, la variable es totalmente determinante. Tambi茅n indica cuan cerca est谩n los puntos de la recta.
Teniendo una nube de puntos, ¿c贸mo elegir la recta que mejor se ajuste a esos puntos?: mediante el m茅todo de los m铆nimos cuadrados. Se trata de la recta que hace m铆nimo el cuadrado de la suma de las distancias verticales desde ella hasta cada uno de los puntos de la nube.

  • Coeficiente de Correlaci贸n por Rango de o rho de Spearman: Es una medida de asociaci贸n que requiere que ambas variables en estudio sean medidas por lo menos en una escala ordinal.


¡¡Y hasta aqu铆 el 煤ltimo tema de la asignatura!! Si ten茅is alguna duda, no dud茅is en preguntadme. 

馃拑馃挓 

SESIONES TE脫RICAS ESTAD脥STICA Y TIC: SEMANA 12.

¡Hola mis queridos lectores! Ya va quedando menos 馃憦馃憦.
Esta semana hemos dado TEMA 11: PRUEBAS NO PARAM脡TRICAS M脕S UTILIZADAS EN ENFERMER脥A. La prueba de Chi Cuadrado. Correcci贸n de Yates. Prueba exacta de Fisher. Prueba de McNemar.


Pruebas no param茅tricas: An谩lisis bivariado de variables cualitativas: Test de hip贸tesis Chi-cuadrado

Se utiliza para comparar dos variables cualitativas (dependiente e independiente)

Tablas de contingencia. Frecuencias absolutas

Se emplean para registrar y analizar la asociaci贸n entre dos o m谩s variables de naturaleza cualitativa (nominales u ordinales).

Pregunta de investigaci贸n: ¿Existe asociaci贸n entre el sexo y el consumo de tabaco?
Hip贸tesis:
    • Ho=No existe asociaci贸n entre el sexo y el consumo de tabaco 
    • H1=Existe asociaci贸n entre el sexo y el consumo de tabaco
Prueba chi-cuadrado

La prueba o estad铆stico Chi cuadrado se utiliza para comprobar si la diferencia en los datos que observamos:
  • Es debida al azar. Aceptamos la Ho 
  • Es debida a algo m谩s, por ejemplo una asociaci贸n entre las variables que estudiamos. Aceptamos la H1.
Condiciones para aplicar la Chi cuadrado
  • Las observaciones deben ser independientes
  • Utilizar en variables cualitativas
  • M谩s de 50 casos 
  • Las frecuencias te贸ricas o esperadas en cada casilla de clasificaci贸n no deben ser inferiores a 5.
  • Si no se cumplen los requisitos: Se usan pruebas param茅tricas 
    • Utilizar el estad铆stico de Fisher 
    • Correcci贸n de continuidad de Yates
F贸rmula

饾憢2 = ∑  (饾憮饾憻饾憭饾憪饾憿饾憭饾憶饾憪饾憱饾憥饾憼 饾憸饾憦饾憼饾憭饾憻饾懀饾憥饾憫饾憥饾憼饾憮饾憻饾憭饾憪饾憿饾憭饾憶饾憪饾憱饾憥饾憼 饾憭饾憼饾憹饾憭饾憻饾憥饾憫饾憥饾憼)2 / 饾憮饾憻饾憭饾憪饾憿饾憭饾憶饾憪饾憱饾憥饾憼 饾憭饾憼饾憹饾憭饾憻饾憥饾憫饾憥饾憼


¡Y hasta aqu铆 el tema 11 chicos!

Seguid trabajando, y no olvid茅is que...



5/30/2018

SESIONES TE脫RICAS ESTAD脥STICA Y TIC: SEMANA 11.

¡Buenas mis queridos lectores! 馃挭
Parece mentira que esta semana hayamos dado el TEMA 10: ESTIMACI脫N Y/O SIGNIFICACI脫N ESTAD脥STICA. 


¿Qu茅 es la significaci贸n estad铆stica?
  • Es una de las dos formas de inferencia estad铆stica (el resto est谩n explicadas en el anterior post). 
  • Permite contrastar hip贸tesis y relacionarlo con el m茅todo cient铆fico 
  • Se parte de la hip贸tesis nula, frente a la hip贸tesis alternativa 
  • Permite calcular el nivel de significaci贸n 
  • Nos permite tomar decisiones, cuantificando el error
Hip贸tesis estad铆stica 
  • Es una creencia sobre los par谩metros de una o m谩s poblaciones 
  • Es una proposici贸n sobre la distribuci贸n de probabilidad de una variable 
  • Siempre son proposiciones sobre la poblaci贸n, no sobre la muestra 
  • Son conjeturas que se hacen antes de empezar el muestreo 
  • Pretenden comprobar si las diferencias encontradas en la muestra del estudio se pueden generalizar a la poblaci贸n 
  • Para ello se construye un modelo te贸rico en el que se formula una hip贸tesis:
    • Hip贸tesis nula (H0 ): Contempla la no existencia de diferencias entre los par谩metros que se comparan 
    • Hip贸tesis alternativa (H1 ): Contempla la existencia de diferencias entre los par谩metros que se comparan
  • Mediante el contraste de hip贸tesis, explicado en el anterior post, procedemos a determinar si aceptamos o rechazamos la hip贸tesis nula:
    • Si p>0,05: en este caso no podemos rechazar la hip贸tesis nula (no podemos decir que sea cierta, sino que no podemos rechazarla) 
    • Si p<0,05: en este caso rechazamos la hip贸tesis nula, por lo que debemos aceptar la hip贸tesis la hip贸tesis alternativa.
Tipos de errores en test de hip贸tesis


TIPOS DE ANALISIS ESTADISTICOS SEG脷N EL TIPO DE VARIABLES IMPLICADAS EN EL ESTUDIO




¡Y hasta aqu铆 el tema chicos! Espero que teng谩is un buen d铆a. 馃挍

SESIONES TE脫RICAS ESTAD脥STICA Y TIC: SEMANA 10.

¡Buenas a todos!
Esta semana hemos dado el TEMA 9: INTRODUCCI脫N A LA INFERENCIA ESTAD脥STICA. INTERVALOS DE CONFIANZA Y CONTRASTE DE HIP脫TESIS

Este tema es necesario para entender los pr贸ximos, por lo que si ten茅is cualquier duda, ¡no dud茅is en preguntadme!

¿A qu茅 se le llama inferencia estad铆stica?

Al conjunto de procedimientos estad铆sticos que permiten pasar de lo particular, la muestra, a lo general, la poblaci贸n, le denominamos inferencia estad铆stica 

Existen dos formas de inferencia estad铆stica: 

  • ESTIMACI脫N del valor en la poblaci贸n (Par谩metro) a partir de un valor de la muestra (Estimador). Puede ser: 
    • Puntual: Consiste en considerar al valor del estad铆stico muestral como una estimaci贸n del par谩metro poblacional.
    • Por intervalos: Consiste en calcular dos valores entre los cuales se encuentra el par谩metro poblacional que queremos estimar con una probabilidad determinada, habitualmente el 95% 
  • CONTRASTE DE HIP脫TESIS, a partir de valores de la muestra, se concluye si hay diferencias entre ellos en la poblaci贸n. Pueden ser:
    • M茅todos param茅tricos: T-Student, Anova, Fisher y Pearson.
    • M茅todos no param茅tricos: U-Mann Whitney, K-w y tablas de contingencia.           

¿Qu茅 es el error est谩ndar?

·        El error est谩ndar de cualquier estimador mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tama帽o que pudi茅semos tomar de una poblaci贸n.
  • Error est谩ndar para una media: s/√¯n 
  • Error est谩ndar para una proporci贸n: √¯p(1-p)/n
Teorema central del l铆mite:
  • Para estimadores que pueden ser expresados como suma de valores muestrales, la distribuci贸n de sus valores sigue una distribuci贸n normal con media de la de la poblaci贸n y desviaci贸n t铆pica igual al error est谩ndar del estimador de que se trate.
  • Si sigue una distribuci贸n normal, sigue los principios b谩sicos de 茅sta: 
    • ± 1S 68,26% de las observaciones 
    • ± 2S 95,45% de las observaciones 
    • ± 1,95S 95% de las observaciones 
    • ± 3S 99,73% de las observaciones 
    • ± 2,58S 99% de las observaciones

¿Qu茅 son los intervalos de confianza?
  • Son un medio de conocer el par谩metro en una poblaci贸n midiendo el error que tiene que ver con el azar (error aleatorio) 
  • Se trata de un par de n煤meros tales que, con un nivel de confianza determinados, podamos asegurar que el valor del par谩metro es mayor o menor que ambos n煤meros. 
  • Se calcula considerando que el estimador muestral sigue una distribuci贸n normal, como establece la teor铆a central del l铆mite 
  • Mientras mayor sea la confianza que queramos otorgar al intervalo, 茅ste ser谩 m谩s amplio, es decir el extremo inferior y el superior del intervalo estar谩s m谩s distanciados y, por tanto, el intervalo ser谩 menos preciso.
Contrastes de hip贸tesis
  • Sirven para controlar los errores aleatorios
  • El m茅todo es el siguiente:
    1. Establecemos a priori una hip贸tesis acerca del valor del par谩metro 
    2. Realizamos la recogida de datos
    3. Analizamos la coherencia de entre la hip贸tesis previa y los datos obtenidos
  • Por tanto, son herramientas estad铆sticas para responder a preguntas de investigaci贸n: permite cuantificar la compatibilidad entre una hip贸tesis previamente establecida y los resultados obtenidos 

Errores de hip贸tesis

  • El error 伪 es la probabilidad de equivocarnos al rechazar la hip贸tesis nula 
  • El error 伪 m谩s peque帽o al que podemos rechazar H0 es el error p Habitualmente rechazamos H0 para un nivel 伪 m谩ximo del 5% (p<0.05).
Y aqu铆 termina el tema, chicos. Espero que os haya quedado claro con la explicaci贸n. 
¡Hasta la pr贸xima!





5/02/2018

SESIONES TE脫RICAS ESTAD脥STICA Y TIC: SEMANA 9.

¡Buenas mis queridos lectores!馃樆
¿Qu茅 tal va vuestra semana? Espero que bien.
Esta semana hemos dado el TEMA 8: TEOR脥A DE MUESTRAS.

¿Qu茅 es un muestreo?
Un muestreo es un m茅todo tal que al escoger un grupo peque帽o de una poblaci贸n podamos tener un grado de probabilidad de que ese peque帽o grupo posea las caracter铆sticas de la poblaci贸n que estamos estudiando

Tipos de muestreo
  • MUESTREO NO PROBABIL脥STICO: No sigue el proceso aleatorio. No puede considerarse que la muestra sea representativa de una poblaci贸n.
      • Por conveniencia: En el que el investigador decide, seg煤n sus objetivos, los elementos que integrar谩n la muestra, considerando las unidades “t铆picas” de la poblaci贸n que desea conocer.
      • Por cuotas: En el que el investigador selecciona la muestra considerando algunos fen贸menos o variables a estudiar, como: Sexo, raza, religi贸n, etc.
      • Accidental: Consiste en utilizar para el estudio las personas disponibles en un momento dado, seg煤n lo que interesa estudiar. De las tres es la m谩s deficiente.
  • MUESTREO PROBABIL脥STICO: Sigue el proceso aleatorio. Todos y cada uno de los ELEMENTOS tienen una probabilidad calculable y, por lo tanto, conocida, de ser elegidos para la muestra. 
    • Conglomerados: Se usa cuando no se dispone de una lista detallada y enumerada de cada una de las unidades que conforman el universo y resulta muy complejo elaborarla. En la selecci贸n de la muestra en lugar de escogerse cada unidad se toman los subgrupos o conjuntos de unidades “conglomerados”.
    • Estratificado: Se caracteriza por la subdivisi贸n de la poblaci贸n en subgrupos o estratos, debido a que las variables principales que deben someterse a estudio presentan cierta variabilidad o distribuci贸n conocida que puede afectar a los resultados.
    • Aleatorio sistem谩tico: Similar al aleatorio simple, en donde cada unidad del universo tiene la misma probabilidad de ser seleccionada.
    • Aleatorio simple: Se caracteriza porque cada unidad tiene la probabilidad equitativa de ser incluida en la muestra: 
        • De sorteo o rifa: Desventaja de este m茅todo es que no puede usarse cuando el universo es grande. 
        • Tabla de n煤meros aleatorios: m谩s econ贸mico y requiere menor tiempo.
Tama帽o de la muestra

Podemos calcular el tama帽o de la muestra:
  • Para estimar la media de una poblaci贸n:  
  • Para estimar una proporci贸n: 


Y esto es todo chicos. ¡Qu茅 pas茅is una buena semana! 馃憢馃挅


SESIONES TE脫RICAS ESTAD脥STICA Y TIC: SEMANA 8.

¡Buenas a todos! 馃憖馃憢
Esta semana hemos dado el TEMA 7: TEOR脥A DE LA PROBABILIDAD
El concepto de probabilidad es muy frecuente para comunicarnos y entendernos.
Se expresa mediante un n煤mero entre 0 y 1 (o en porcentajes).
En los casos de probabilidad no existe la certeza de que ocurran los hechos, existe una esperanza dimensionada y razonable, de que el hecho anunciado se vea confirmado.
Existen tres tipos de probabilidades:

  • PROBABILIDAD SUBJETIVA O PERSONAL脥STICA: Mide la confianza que el individuo tiene sobre la certeza de una proposici贸n determinada. Este concepto de probabilidades ha dado lugar al enfoque de an谩lisis de datos estad铆sticos llamado “Estad铆stica Bayesiana”.
  • PROBABILIDAD CL脕SICA O A PRIORI: Data del siglo XVIII, desarrollada para resolver problemas relacionados con los juegos de azar.  Las probabilidades se calculan con un razonamiento abstracto.
    • LEY DE LOS GRANDES N脷MEROS:  La probabilidad a priori de que salga un n煤mero en el dado es P(A)= 1/6 = 0,166 = 16,6%

  • PROBABILIDAD RELATIVA O “A POSTERIORI”: Si el n de determinaciones (repeticiones de un experimento aleatorio) es grande, podemos esperar que la probabilidad observada se acerque a la probabilidad te贸rica.

EVENTOS O SUCESOS.



Cuando se realiza un experimento aleatorio diversos resultados son posibles. El conjunto de todos los resultados posibles se llama espacio muestral (S). Se llama suceso o evento a un subconjunto de dichos resultados.


  • Se llama evento complementario de un suceso A, al formado por los elementos que no est谩n en A y se denota Ac.

  • Se llama evento uni贸n de A y B, al formado por los resultados experimentales que est谩n en A o en B (incluyendo todos los que est谩n en ambos).

  • Se llama evento intersecci贸n de A y B, al formado por los elementos que est谩n en A y B.


PROPIEDADES LAS PROBABILIDADES




REGLAS B脕SICAS: TEOR脥A DE LA PROBABILIDAD.

  • Las probabilidades siempre oscilan entre 0 y 1. 
  • La probabilidad de un suceso contrario es igual a 1 menos la probabilidad del suceso 
P(A´) = 1 - P(A)

  • La probabilidad de un suceso imposible es 0. 
  • La uni贸n de A y B es: P (AuB) = P(A) + P(B) - P(AnB) 
  • La probabilidad condicionada de un suceso A a otro B se expresa: P(A/B) = P(A I B) / P(B) Si P(B) =/= 0
TEOREMA DE BAYES.
Expresa la probabilidad condicional de un evento aleatorio A dado B en t茅rminos de la distribuci贸n de probabilidad condicional del evento B dado A y la distribuci贸n de probabilidad marginal de s贸lo A.


DISTRIBUCI脫N BINOMIAL
Es un modelo matem谩tico de distribuci贸n te贸rica de (la normal es con variables continuas) variables discretas.
DISTRIBUCI脫N DE POISSON
Tambi茅n se llama la distribuci贸n de probabilidad de casos raros
  • La distribuci贸n de Poisson se utiliza en situaciones donde los sucesos son impredecibles o de ocurrencia aleatoria. En otras palabras no se sabe el total de posibles resultados. 
  • Permite determinar la probabilidad de ocurrencia de un suceso con resultado discreto. 
  • Es muy 煤til cuando la muestra o segmento n es grande y la probabilidad de 茅xitos p es peque帽a. 

DISTRIBUCIONES NORMALES


Captura


Extrapolando aparecen los principios b谩sicos de las distribuciones normales y podemos tipificar valores de una normal:


– ± 1S 68,26% de las observaciones


– ± 2S 95,45% de las observaciones


– ± 1,95S 95% de las observaciones


– ± 3S 99,73% de las observaciones


– ± 2,58S 99% de las observaciones

La tipificaci贸n de la valores se puede realizar s铆 … 

  • Trabajamos con una variables continuas que: 

– Sigue una distribuci贸n normal (TLC)


– Y tiene m谩s de 100 unidades (LGN)


  • La tipificaci贸n nos permite conocer si otro valor corresponde o no a esa distribuci贸n de frecuencia.
Captura


Sabemos por la forma de la curva que…
  • Media +/- 1 desviaci贸n t铆pica: 68% 
  • Media +/- 2 desviaci贸n t铆pica: 95% 
  • Media +/- 3 desviaci贸n t铆pica: 99% 
Y hasta aqu铆 el tema 7. Espero que se haya entendido. ¡Hasta pronto!

SESIONES TE脫RICAS ESTAD脥STICA Y TIC: SEMANA 7.

¡Buenas a todos mis queridos lectores! 馃挍
Siento mucho haber estado tan desaparecida. Han sido semanas intensas, pero.. ¡ya estoy de vuelta!
La semana 7 dimos el TEMA 6: REPRESENTACI脫N GR脕FICA DE LA INFORMACI脫N: Representaci贸n variables cualitativas y cuantitativas discretas. Representaci贸n de variables cuantitativas continuas. Errores en las representaciones.

Las REPRESENTACIONES GR脕FICAS M脕S EMPLEADAS son:

VARIABLES CUALITATIVAS:

  • Gr谩fico de sectores (dicot贸micas o policot贸micas con pocas categor铆as)

  • Gr谩fico de barras (policot贸micas)

  • Pictogramas (policot贸micas)


VARIABLES CUANTITATIVAS:

  • Gr谩fico de barras (s贸lo para variables discretas con bajo rango de valores) 


  • Histogramas (variables continuas) 


  • Pol铆gonos de frecuencia (variables continuas) 

  • Gr谩fico de tronco y hojas (variables continuas) 



DATOS BIDIMENSIONALES Y MULTIDIMENSIONALES:

  • Tendencias temporales

  • Nubes de puntos (scatter plot)



  • Otros gr谩ficos multidimensionales (diagramas de estrellas…): Cada v茅rtice representa una variable.


3/18/2018

SESIONES TE脫RICAS ESTAD脥STICA Y TIC: SEMANA 6.

¡Buenas a todos!
Esta semana hemos dado el TEMA 5: ESTAD脥STICOS UNIVARIABLES: MEDIDAS RESUMEN PARA VARIABLES CUANTITATIVAS.
Adem谩s de las tablas de frecuencia dadas la semana pasada (explicadas en el 煤ltimo post), podemos resumir una serie de observaciones mediante “estad铆sticos”: “Funci贸n de los datos observados”.
Encontramos tres grandes tipos de medidas de estad铆stica:

  • Medidas de tendencia central: dan idea de los valores alrededor de los cuales el resto de los datos tienen tendencia a agruparse. Se encuentra:
    • Media aritm茅tica: Se calcula para variables cuantitativas y se trata del centro geom茅trico o de gravedad de nuestros datos. Es la suma de todos valores de la variable observada entre el total de observaciones. La f贸rmula es:


Cuando los datos son agrupados, para calcular la media utilizamos como valor de referencia de cada intervalo su marca de clase. 
    • Mediana: Es el valor de la observaci贸n tal que un 50% de los datos es menor y otro 50% es mayor. 
Si el n煤mero de observaciones es impar:
Si el n煤mero de observaciones es par  corresponde a la media entre los dos valores centrales, es decir, la media entre la observaci贸n n/2 y la observaci贸n (n/2)+1

    • Moda: Es el valor con mayor frecuencia. Si hay m谩s de una se dice que la muestra es bimodal (dos modas) o multimodal (m谩s de dos) Se puede calcular para cualquier tipo de variable – Si los datos est谩n agrupados, se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor (hi /ci ).
  • Medidas de posici贸n: dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.
    • Cuantiles: Los cuantiles m谩s usuales son los percentiles, los deciles y los cuartiles, seg煤n dividan la muestra ordenada en 100, 10 贸 4 partes, respectivamente. 
      • Percentiles: Dividen la muestra ordenada en 100 partes. El percentil “i” (Pi ), es aqu茅l valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que 茅l y el (100-i)% restante son mayores.
      • Deciles. Dividen la muestra ordenada en 10 partes. El decil “i” (Di ), es aqu茅l valor que, ordenadas las observaciones en forma creciente, el i/10% de ellas son menores que 茅l y el (100-i)/10% restante son mayores.
      • Cuartiles. Dividen la muestra ordenada en 4 partes.
  • Medidas de dispersi贸n o variabilidad: dan informaci贸n acerca de la heterogeneidad de nuestras observaciones.
    • Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra 
    • Desviaci贸n media: Media aritm茅tica de las distancias de cada observaci贸n con respecto a la media de la muestra.
    • Desviaci贸n t铆pica: Cuantifica el error que cometemos si representamos una muestra 煤nicamente por su media.
    Resultado de imagen de desviacion tipica formula

    • Varianza: expresa la misma informaci贸n en valores cuadr谩ticos.

    • Recorrido intercuart铆lico: Diferencia entre el tercer y el primer cuartil. |Q3 -Q1|
    • Coeficiente de variaci贸n: es una medida de dispersi贸n relativa (adimensional) ya que todas las dem谩s se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series num茅ricas con independencia de las unidades de medidas.

Por otro lado, existe lo que se llama distribuci贸n normal, distribuci贸n de Gauss o distribuci贸n gaussiana,y es una de las distribuciones de probabilidad de variable continua que con m谩s frecuencia aparece en fen贸menos reales. La gr谩fica de su funci贸n de densidad tiene una forma acampanada y es sim茅trica respecto de los valores posici贸n central (media, mediana y moda, que coinciden en estas distribuciones).

Esta curva se conoce como campana de Gauss.

Tambi茅n pueden ser asim茅tricas positiva (hacia la derecha) y negativa (hacia la izquierda).

G1 < 0: Asimetr铆a a la izquierda

G1 = 0: Simetr铆a

G1 > 0: Asimetr铆a a la derecha

Por otro lado, se encuentran las curtosis, que sirve para medir el grado de concentraci贸n de los valores que toma en torno a su media. Existen tres tipos:
  • Distribuci贸n mesoc煤rtica: Presenta un grado de concentraci贸n medio alrededor de los valores centrales de la variable (el mismo que presenta una distribuci贸n normal). 


  • Distribuci贸n leptoc煤rtica: Presenta un elevado grado de concentraci贸n alrededor de los valores centrales de la variable. 


 
  • Distribuci贸n platic煤rtica: Presenta un reducido grado de concentraci贸n alrededor de los valores centrales de la variable 
 

G2 < 0: Platic煤rtica

G2 = 0: Mesoc煤rtica

G2 > 0: Leptoc煤rtica

Y hasta aqu铆 todo por hoy, espero que os haya gustado.
¡Hasta la pr贸xima!

3/13/2018

SEMINARIOS ESTAD脥STICA Y TIC. SEMINARIO 3.

¡Buenas mis queridos lectores!
Esta semana hemos tenido el seminario 3, el cual, ha sido bastante interesante y 煤til ya que nos han ense帽ado a utilizar el programa Epi Info. 
Y os preguntareis, ¿Qu茅 es Epi Info? 
Se trata de un programa de software gratis del dominio p煤blico desarrollado por los Centros para el Control y la Prevenci贸n de Enfermedades de los Estados Unidos (CDC). 
Epi Info nos permite realizar 3 acciones b谩sicas que nos servir谩n para el desarrollo del trabajo de investigaci贸n 

  • Creaci贸n de formularios, cuestionarios y estructura de bases de datos. 
  • Grabaci贸n de datos en un cuestionario o formulario previamente creado. 
  • An谩lisis de los datos grabados en un formulario o de los datos importados a trav茅s de un fichero de datos confeccionado en otras aplicaciones.

En este seminario aprendimos a manejar las dos primeras acciones. 
Para finalizar el seminario, pusimos en pr谩ctica lo aprendido en el seminario, avanzando de esta manera el trabajo de investigaci贸n.