"Si puedes curar, cura. Si no puedes curar, alivia. Si no puedes aliviar, consuela.'' : 2018

5/31/2018

REFLEXIÓN FINAL

OBJETIVO💪

El objetivo de los seminarios de la asignatura de Estadística y TIC's, ha sido proporcionarnos la información necesaria para poder realizar el trabajo de investigación.

ESTRATEGIAS DE APRENDIZAJE💬

En cuanto a las estrategias de aprendizaje, hemos podido realizar búsquedas bibliográficas de manera eficaz para la realización del marco teórico. Por otro lado, gracias al programa de Epi Info hemos podido elaborar los dos cuestionarios utilizados, uno acerca de los antecedentes personales y otro sobre salud física/mental; hemos podido introducir la información de los cuestionarios recogidos; recodificar, agrupar las variables de salud física y mental y por último, calcular las medias.

¿CON QUÉ HE APRENDIDO?💫

Recursos materiales:

Equipo informático: Portátil con conexión a internet, concretamente haciendo uso del navegador Google Chrome.
Windows 10.
Programa informático de estadísticas: Epi Info.
Microsoft Word y Power Point.

Recursos humanos:

Las cinco investigadoras del trabajo.
Asociaciones contra el cáncer de mama: Asociación Española Contra el Cáncer (AECC), concretamente en la sede de Carmona y la Asociación AMAMA, con sede en Sevilla.
Pacientes con cáncer de mama mastectomizadas.
Cruz Roja Española (documentación de confidencialidad).
70 mujeres mastectomizadas.

Por otro lado, las gracias a los profesores Manuel Pabón y José Antonio Ponce, por aportar las pautas y herramientas necesarias para la realización del estudio, y por los consejos y la resolución de las dudas planteadas con paciencia y amabilidad.

SEMINARIOS ESTADÍSTICA Y TIC. ÚLTIMO SEMINARIO.

Después de tantas horas, días y semanas esforzándonos muy duramente, tanto mis compañeras como yo, estamos super orgullosas del trabajo tan bien realizado que hemos conseguido.

A pesar de las equivocaciones, de los nervios al pensar que no conseguiríamos llegar a la n suficiente, de horas intentando averiguar cómo extraer los resultados, ha resultado ser un aprendizaje que nunca olvidaremos.

Este trabajo estudió la calidad de vida de mujeres mastectomizadas. Apostamos por un tema que al principio nos dio pudor, ya que no sabíamos cómo iban a reaccionar dichas mujeres a la citación del cuestionario dónde contestarían preguntas sobre sus limitaciones, sobre su capacidad por realizar actividades profesionales y domésticas, entre otras. Sin embargo, el 90% de mujeres reaccionó con total naturalidad y nos prestó todo su apoyo

Quisimos indagar sobre el estado civil mayoritario, el nivel educativo, la situación económica tras la operación, además del porcentaje de mujeres con antecedentes de HTA, DM o malignidades previas.

Formulamos dos hipótesis nulas y dos hipótesis de investigación:

Hipótesis nula

No existe relación entre el tipo de mastectomía y la calidad de vida.
No existe relación entre el tipo de tratamiento y la calidad de vida.

¿Qué tipo de estudio es?

DESCRIPTIVO
OBSERVACIONAL
TRANSVERSAL

¿Qué características tiene la población de estudio?

Se trata de mujeres mastectomizadas intervenidas de una mama por extracción de un ganglio centinela o por extirpación total de la mama. Procedentes de las localidades de Sevilla, Dos Hermanas, Carmona, Los Palacios y Villafranca y Écija. El rango de edad de estas mujeres es de 36 a 86 años.

Obtención de datos

Este estudio descriptivo de corte transversal se ha llevado a cabo mediante el reparto de un cuestionario (SF-36v.2) compuesto de dos partes: una en la que se recogen los antecedentes personales del paciente y otra sobre la salud tanto física como mental de las mujeres del estudio.

Para el análisis estadístico de los datos se utilizó el programa informático Epi Info 7. Tras la obtención de dichos datos, se procedió a introducir la información en el cuestionario creado previamente en Epi Info. En cuanto al análisis de los datos, se procedió a recodificar el cuestionario, asignándole a cada variable un valor numérico entre ‘‘0’’ y ‘‘100’’, siendo ‘‘0’’ el peor estado de salud y ‘‘100’’ el mejor estado de la salud.

Tras la recodificación, para obtener la media de la salud física se realizó una ecuación en la cual se sumaron todas las variables que componen los 4 primeros dominios (pertenecientes a la salud física) y se dividió entre el número de variables, en este caso, 21. Por otra parte, para el cálculo de la media de la salud mental, se llevó a cabo el mismo procedimiento mencionado con anterioridad, con la excepción de que, en este caso, se dividió el sumatorio de las variables componentes de los 4 últimos dominios (pertenecientes a la salud mental) entre 11. Una vez obtenidas las medias, dentro del apartado “Estadísticas”, se seleccionó la opción “Medias”. En “Medias de” se escogió la media creada anteriormente (Salud Mental o Salud Física). Se realizaron tabulaciones cruzadas por el valor de una variable (Ejemplo: Quimioterapia). Se obtuvo, por tanto, el T-Test, 21 donde se va a decidir si se acepta o se rechaza la Hipótesis Nula dependiendo de los valores de la Media, Desviación Típica, t-value y Pr>|t|.

Resultados:

Centrándonos en la primera hipótesis nula planteada, que afirma que no existe relación entre el tipo de mastectomía y la calidad de vida de las mujeres mastectomizadas, se debe destacar que existen distintos tipos de mastectomía.

En primer lugar, se relaciona la salud física con el hecho de haberse sometido a mastectomía parcial. Se obtiene una p-Value de 0,0291; por lo que se rechaza la hipótesis nula (H0).

Desde el punto de vista mental, se obtiene una p-Value de 0,5630; por lo que se acepta la hipótesis nula (H0).
Conclusión: El hecho de haberse sometido a una mastectomía parcial influye en la calidad de vida de las mujeres desde el punto de vista físico, pero no desde el punto de vista mental.

En segundo lugar, se estudia la relación entre la calidad de vida y el haberse sometido a una mastectomía total.

Desde el punto de vista físico, se obtiene una p-Value de 0,1435; por lo que se acepta la hipótesis nula (H0).
Por otro lado, respecto al punto de vista mental, se obtuvo una p-Value de 0,9724; por lo que se acepta la hipótesis nula (H0).
Conclusión: La calidad de vida de las mujeres no se ve influenciada por la mastectomía total.

En tercer lugar, se relaciona la calidad de vida con la mastectomía izquierda.

Cuando se compara el componente físico se obtiene una p-Value de 0,0755; por lo que se acepta la hipótesis nula (H0).
Cuando se compara el componente mental se obtiene una p-Value de 0,5045; por lo que se acepta la hipótesis nula (H0).
Conclusión: La mastectomía izquierda no influye en la calidad de vida de los sujetos de estudio.

En cuarto lugar, se pone en relación la mastectomía derecha con la calidad de vida de las mujeres.

Respecto al ámbito físico, se obtiene una p-Value de 0,1928; aceptándose la hipótesis nula (H0).
Respecto al ámbito mental, la p-Value es de 0,1826; por lo que se acepta la hipótesis nula (H0).
Conclusión: La mastectomía derecha no influye en la calidad de vida de las mujeres mastectomizadas.

En quinto lugar, relacionamos el hecho de haberse sometido a una mastectomía bilateral con la posterior calidad de vida de las mujeres.

Cuando se pone en relación el componente físico, el p-Value es de 0,6759, aceptando así la hipótesis nula.
Cuando se relaciona el componente mental, la p-Value es de 0,3857, por lo que se acepta la hipótesis nula de nuevo. Sin embargo debemos mencionar la presencia de un sesgo en esta relación de variables, ya que tan solo 5 mujeres tienen una mastectomía bilateral frente a 46 pacientes, las cuales no han sido mastectomizadas de ambas mamas, en relación con el componente físico.

En el caso de la quimioterapia, se ha comparado la salud física de las mujeres que se sometieron a este tratamiento frente a las que no lo hicieron. Como 64 resultado se obtiene una p-Value de 0,7627; al ser ésta mayor que 0,05 se acepta la hipótesis nula (H0).
Respecto a la salud mental, se obtiene una p-Value de 0,4181 por lo que, al igual que en el caso anterior, se acepta la hipótesis nula.
Conclusión: La quimioterapia no influye en la calidad de vida de las mujeres mastectomizadas, tanto desde el punto de vista físico como mental.

En cuanto a la radioterapia, se comparó tanto la salud física como la mental en mujeres que se habían sometido a este tratamiento y en aquellas que no lo habían hecho.
Al relacionar el componente de la salud física con el tratamiento de radioterapia, se obtiene una p-Value de 0,7339; por lo que se acepta la hipótesis nula (H0).
Respecto al componente de salud mental, la p-Value es de 0,6345; por lo que se acepta la hipótesis nula (H0).
Conclusión: La calidad de vida desde el ámbito físico y mental no se ve influenciada por el tratamiento de radioterapia.

SESIONES TEÓRICAS ESTADÍSTICA Y TIC: SEMANA 13.

¡¡Hola a todos!! ❤
Esta semana hemos dado el TEMA 12 CORRELACIÓN Y CONCORDANCIA.

¿Qué es la regresión?

Es la predicción de una medida basándonos en el conocimiento de otra. Nuestro objetivo será intentar reconocer si hay relación entre las variables, de qué tipo, y si es posible predecir el valor de una de ellas en función de la otra.

Dichas observaciones pueden ser representadas en un diagrama de dispersión (“scatterplot”).

En cuanto al modelo de regresión utilizado, tratamos el modelo de regresión lineal simple, que es el que se usa para 1 variable explicativa. Se trata de estudiar la asociación lineal entre dos variables cuantitativas. Se relacionan únicamente una variable independiente con otra dependiente.

y=β1+β0

Siendo:

β₁= pendiente de la recta. Expresa la cantidad de cambio que se produce en la variable dependiente por unidad de cambio de la variable independiente.

β₀= punto de intersección con el eje de coordenadas. Expresa cuál es el valor de la variable dependiente cuando la independiente vale cero.

¿Qué modelos lineales existen?

Modelos lineales deterministas: La variable independiente determine el valor de la variable dependiente. Entonces para cada valor de la variable independiente sólo habría un valor de la dependiente

Modelos lineales probabilísticos: Para cada valor de la variable independiente existe una distribución de probabilidad de valores de la dependiente, con una probabilidad entre 0 y 1.

La recta por determinar es aquélla con la menor distancia de cada punto a ella.

Análisis de correlación

El análisis de correlación se utiliza con el propósito de disponer de un indicador cuantitativo que permite sintetizar el grado de la asociación entre variables.

Coeficiente de Correlación r de Pearson (r), (R x y): Es un coeficiente que mide el grado de la relación de dependencia que existe entre las variables (x, y), cuyos valores van desde –1, correspondiente a una correlación negativa perfecta, hasta 1, correspondiente a una correlación positiva perfecta. Si el resultado es de 1 o -1, la variable es totalmente determinante. También indica cuan cerca están los puntos de la recta.

Teniendo una nube de puntos, ¿cómo elegir la recta que mejor se ajuste a esos puntos?: mediante el método de los mínimos cuadrados. Se trata de la recta que hace mínimo el cuadrado de la suma de las distancias verticales desde ella hasta cada uno de los puntos de la nube.

Coeficiente de Correlación por Rango de o rho de Spearman: Es una medida de asociación que requiere que ambas variables en estudio sean medidas por lo menos en una escala ordinal.

¡¡Y hasta aquí el último tema de la asignatura!! Si tenéis alguna duda, no dudéis en preguntadme.

💃💟

SESIONES TEÓRICAS ESTADÍSTICA Y TIC: SEMANA 12.

¡Hola mis queridos lectores! Ya va quedando menos 👏👏.

Esta semana hemos dado TEMA 11: PRUEBAS NO PARAMÉTRICAS MÁS UTILIZADAS EN ENFERMERÍA. La prueba de Chi Cuadrado. Corrección de Yates. Prueba exacta de Fisher. Prueba de McNemar.

Pruebas no paramétricas: Análisis bivariado de variables cualitativas: Test de hipótesis Chi-cuadrado

Se utiliza para comparar dos variables cualitativas (dependiente e independiente)

Tablas de contingencia. Frecuencias absolutas

Se emplean para registrar y analizar la asociación entre dos o más variables de naturaleza cualitativa (nominales u ordinales).

Pregunta de investigación: ¿Existe asociación entre el sexo y el consumo de tabaco?

Hipótesis:

Ho=No existe asociación entre el sexo y el consumo de tabaco
H1=Existe asociación entre el sexo y el consumo de tabaco

Prueba chi-cuadrado

La prueba o estadístico Chi cuadrado se utiliza para comprobar si la diferencia en los datos que observamos:

Es debida al azar. Aceptamos la Ho
Es debida a algo más, por ejemplo una asociación entre las variables que estudiamos. Aceptamos la H1.

Condiciones para aplicar la Chi cuadrado

Las observaciones deben ser independientes.
Utilizar en variables cualitativas
Más de 50 casos
Las frecuencias teóricas o esperadas en cada casilla de clasificación no deben ser inferiores a 5.
Si no se cumplen los requisitos: Se usan pruebas paramétricas

Utilizar el estadístico de Fisher
Corrección de continuidad de Yates

Fórmula

𝑋2 = ∑ (𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎𝑠 − 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠)2 / 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎𝑠 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎𝑠

¡Y hasta aquí el tema 11 chicos!

Seguid trabajando, y no olvidéis que...

5/30/2018

SESIONES TEÓRICAS ESTADÍSTICA Y TIC: SEMANA 11.

¡Buenas mis queridos lectores! 💪
Parece mentira que esta semana hayamos dado el TEMA 10: ESTIMACIÓN Y/O SIGNIFICACIÓN ESTADÍSTICA.

¿Qué es la significación estadística?

Es una de las dos formas de inferencia estadística (el resto están explicadas en el anterior post).
Permite contrastar hipótesis y relacionarlo con el método científico
Se parte de la hipótesis nula, frente a la hipótesis alternativa
Permite calcular el nivel de significación
Nos permite tomar decisiones, cuantificando el error

Hipótesis estadística

Es una creencia sobre los parámetros de una o más poblaciones
Es una proposición sobre la distribución de probabilidad de una variable
Siempre son proposiciones sobre la población, no sobre la muestra
Son conjeturas que se hacen antes de empezar el muestreo
Pretenden comprobar si las diferencias encontradas en la muestra del estudio se pueden generalizar a la población
Para ello se construye un modelo teórico en el que se formula una hipótesis:

Hipótesis nula (H0 ): Contempla la no existencia de diferencias entre los parámetros que se comparan
Hipótesis alternativa (H1 ): Contempla la existencia de diferencias entre los parámetros que se comparan

Mediante el contraste de hipótesis, explicado en el anterior post, procedemos a determinar si aceptamos o rechazamos la hipótesis nula:

Si p>0,05: en este caso no podemos rechazar la hipótesis nula (no podemos decir que sea cierta, sino que no podemos rechazarla)
Si p<0,05: en este caso rechazamos la hipótesis nula, por lo que debemos aceptar la hipótesis la hipótesis alternativa.

Tipos de errores en test de hipótesis

TIPOS DE ANALISIS ESTADISTICOS SEGÚN EL TIPO DE VARIABLES IMPLICADAS EN EL ESTUDIO

¡Y hasta aquí el tema chicos! Espero que tengáis un buen día. 💛

SESIONES TEÓRICAS ESTADÍSTICA Y TIC: SEMANA 10.

¡Buenas a todos!

Esta semana hemos dado el TEMA 9: INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. INTERVALOS DE CONFIANZA Y CONTRASTE DE HIPÓTESIS

Este tema es necesario para entender los próximos, por lo que si tenéis cualquier duda, ¡no dudéis en preguntadme!

¿A qué se le llama inferencia estadística?

Al conjunto de procedimientos estadísticos que permiten pasar de lo particular, la muestra, a lo general, la población, le denominamos inferencia estadística

Existen dos formas de inferencia estadística:

ESTIMACIÓN del valor en la población (Parámetro) a partir de un valor de la muestra (Estimador). Puede ser:

Puntual: Consiste en considerar al valor del estadístico muestral como una estimación del parámetro poblacional.
Por intervalos: Consiste en calcular dos valores entre los cuales se encuentra el parámetro poblacional que queremos estimar con una probabilidad determinada, habitualmente el 95%

CONTRASTE DE HIPÓTESIS, a partir de valores de la muestra, se concluye si hay diferencias entre ellos en la población. Pueden ser:

Métodos paramétricos: T-Student, Anova, Fisher y Pearson.
Métodos no paramétricos: U-Mann Whitney, K-w y tablas de contingencia.

¿Qué es el error estándar?

· El error estándar de cualquier estimador mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.

Error estándar para una media: s/√¯n

Error estándar para una proporción: √¯p(1-p)/n

Teorema central del límite:

Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la de la población y desviación típica igual al error estándar del estimador de que se trate.

Si sigue una distribución normal, sigue los principios básicos de ésta:

± 1S 68,26% de las observaciones
± 2S 95,45% de las observaciones
± 1,95S 95% de las observaciones
± 3S 99,73% de las observaciones
± 2,58S 99% de las observaciones

¿Qué son los intervalos de confianza?

Son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio)
Se trata de un par de números tales que, con un nivel de confianza determinados, podamos asegurar que el valor del parámetro es mayor o menor que ambos números.
Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite
Mientras mayor sea la confianza que queramos otorgar al intervalo, éste será más amplio, es decir el extremo inferior y el superior del intervalo estarás más distanciados y, por tanto, el intervalo será menos preciso.

Contrastes de hipótesis

Sirven para controlar los errores aleatorios
El método es el siguiente:

Establecemos a priori una hipótesis acerca del valor del parámetro
Realizamos la recogida de datos
Analizamos la coherencia de entre la hipótesis previa y los datos obtenidos

Por tanto, son herramientas estadísticas para responder a preguntas de investigación: permite cuantificar la compatibilidad entre una hipótesis previamente establecida y los resultados obtenidos

Errores de hipótesis

El error α es la probabilidad de equivocarnos al rechazar la hipótesis nula
El error α más pequeño al que podemos rechazar H0 es el error p Habitualmente rechazamos H0 para un nivel α máximo del 5% (p<0.05).

Y aquí termina el tema, chicos. Espero que os haya quedado claro con la explicación.

¡Hasta la próxima!

5/02/2018

SESIONES TEÓRICAS ESTADÍSTICA Y TIC: SEMANA 9.

¡Buenas mis queridos lectores!😻
¿Qué tal va vuestra semana? Espero que bien.
Esta semana hemos dado el TEMA 8: TEORÍA DE MUESTRAS.

¿Qué es un muestreo?
Un muestreo es un método tal que al escoger un grupo pequeño de una población podamos tener un grado de probabilidad de que ese pequeño grupo posea las características de la población que estamos estudiando

Tipos de muestreo

MUESTREO NO PROBABILÍSTICO: No sigue el proceso aleatorio. No puede considerarse que la muestra sea representativa de una población.

Por conveniencia: En el que el investigador decide, según sus objetivos, los elementos que integrarán la muestra, considerando las unidades “típicas” de la población que desea conocer.
Por cuotas: En el que el investigador selecciona la muestra considerando algunos fenómenos o variables a estudiar, como: Sexo, raza, religión, etc.
Accidental: Consiste en utilizar para el estudio las personas disponibles en un momento dado, según lo que interesa estudiar. De las tres es la más deficiente.

MUESTREO PROBABILÍSTICO: Sigue el proceso aleatorio. Todos y cada uno de los ELEMENTOS tienen una probabilidad calculable y, por lo tanto, conocida, de ser elegidos para la muestra.

Conglomerados: Se usa cuando no se dispone de una lista detallada y enumerada de cada una de las unidades que conforman el universo y resulta muy complejo elaborarla. En la selección de la muestra en lugar de escogerse cada unidad se toman los subgrupos o conjuntos de unidades “conglomerados”.
Estratificado: Se caracteriza por la subdivisión de la población en subgrupos o estratos, debido a que las variables principales que deben someterse a estudio presentan cierta variabilidad o distribución conocida que puede afectar a los resultados.
Aleatorio sistemático: Similar al aleatorio simple, en donde cada unidad del universo tiene la misma probabilidad de ser seleccionada.
Aleatorio simple: Se caracteriza porque cada unidad tiene la probabilidad equitativa de ser incluida en la muestra:

De sorteo o rifa: Desventaja de este método es que no puede usarse cuando el universo es grande.
Tabla de números aleatorios: más económico y requiere menor tiempo.

Tamaño de la muestra

Podemos calcular el tamaño de la muestra:

Para estimar la media de una población:

Para estimar una proporción:

Y esto es todo chicos. ¡Qué paséis una buena semana! 👋💖

SESIONES TEÓRICAS ESTADÍSTICA Y TIC: SEMANA 8.

¡Buenas a todos! 👀👋
Esta semana hemos dado el TEMA 7: TEORÍA DE LA PROBABILIDAD
El concepto de probabilidad es muy frecuente para comunicarnos y entendernos.
Se expresa mediante un número entre 0 y 1 (o en porcentajes).
En los casos de probabilidad no existe la certeza de que ocurran los hechos, existe una esperanza dimensionada y razonable, de que el hecho anunciado se vea confirmado.
Existen tres tipos de probabilidades:

PROBABILIDAD SUBJETIVA O PERSONALÍSTICA: Mide la confianza que el individuo tiene sobre la certeza de una proposición determinada. Este concepto de probabilidades ha dado lugar al enfoque de análisis de datos estadísticos llamado “Estadística Bayesiana”.

PROBABILIDAD CLÁSICA O A PRIORI: Data del siglo XVIII, desarrollada para resolver problemas relacionados con los juegos de azar. Las probabilidades se calculan con un razonamiento abstracto.

LEY DE LOS GRANDES NÚMEROS: La probabilidad a priori de que salga un número en el dado es P(A)= 1/6 = 0,166 = 16,6%

PROBABILIDAD RELATIVA O “A POSTERIORI”: Si el n de determinaciones (repeticiones de un experimento aleatorio) es grande, podemos esperar que la probabilidad observada se acerque a la probabilidad teórica.

EVENTOS O SUCESOS.

Cuando se realiza un experimento aleatorio diversos resultados son posibles. El conjunto de todos los resultados posibles se llama espacio muestral (S). Se llama suceso o evento a un subconjunto de dichos resultados.

Se llama evento complementario de un suceso A, al formado por los elementos que no están en A y se denota Ac.

Se llama evento unión de A y B, al formado por los resultados experimentales que están en A o en B (incluyendo todos los que están en ambos).

Se llama evento intersección de A y B, al formado por los elementos que están en A y B.

PROPIEDADES LAS PROBABILIDADES

REGLAS BÁSICAS: TEORÍA DE LA PROBABILIDAD.

Las probabilidades siempre oscilan entre 0 y 1.
La probabilidad de un suceso contrario es igual a 1 menos la probabilidad del suceso

P(A´) = 1 - P(A)

La probabilidad de un suceso imposible es 0.
La unión de A y B es: P (AuB) = P(A) + P(B) - P(AnB)
La probabilidad condicionada de un suceso A a otro B se expresa: P(A/B) = P(A I B) / P(B) Si P(B) =/= 0

TEOREMA DE BAYES.

Expresa la probabilidad condicional de un evento aleatorio A dado B en términos de la distribución de probabilidad condicional del evento B dado A y la distribución de probabilidad marginal de sólo A.

DISTRIBUCIÓN BINOMIAL

Es un modelo matemático de distribución teórica de (la normal es con variables continuas) variables discretas.

DISTRIBUCIÓN DE POISSON

También se llama la distribución de probabilidad de casos raros

La distribución de Poisson se utiliza en situaciones donde los sucesos son impredecibles o de ocurrencia aleatoria. En otras palabras no se sabe el total de posibles resultados.
Permite determinar la probabilidad de ocurrencia de un suceso con resultado discreto.
Es muy útil cuando la muestra o segmento n es grande y la probabilidad de éxitos p es pequeña.

DISTRIBUCIONES NORMALES

Extrapolando aparecen los principios básicos de las distribuciones normales y podemos tipificar valores de una normal:

– ± 1S 68,26% de las observaciones

– ± 2S 95,45% de las observaciones

– ± 1,95S 95% de las observaciones

– ± 3S 99,73% de las observaciones

– ± 2,58S 99% de las observaciones

La tipificación de la valores se puede realizar sí …

Trabajamos con una variables continuas que:

– Sigue una distribución normal (TLC)

– Y tiene más de 100 unidades (LGN)

La tipificación nos permite conocer si otro valor corresponde o no a esa distribución de frecuencia.

Sabemos por la forma de la curva que…

Media +/- 1 desviación típica: 68%

Media +/- 2 desviación típica: 95%

Media +/- 3 desviación típica: 99%

Y hasta aquí el tema 7. Espero que se haya entendido. ¡Hasta pronto!

SESIONES TEÓRICAS ESTADÍSTICA Y TIC: SEMANA 7.

¡Buenas a todos mis queridos lectores! 💛
Siento mucho haber estado tan desaparecida. Han sido semanas intensas, pero.. ¡ya estoy de vuelta!
La semana 7 dimos el TEMA 6: REPRESENTACIÓN GRÁFICA DE LA INFORMACIÓN: Representación variables cualitativas y cuantitativas discretas. Representación de variables cuantitativas continuas. Errores en las representaciones.

Las REPRESENTACIONES GRÁFICAS MÁS EMPLEADAS son:

VARIABLES CUALITATIVAS:

Gráfico de sectores (dicotómicas o policotómicas con pocas categorías)

Gráfico de barras (policotómicas)

Pictogramas (policotómicas)

VARIABLES CUANTITATIVAS:

Gráfico de barras (sólo para variables discretas con bajo rango de valores)

Histogramas (variables continuas)

Polígonos de frecuencia (variables continuas)

Gráfico de tronco y hojas (variables continuas)

DATOS BIDIMENSIONALES Y MULTIDIMENSIONALES:

Tendencias temporales

Nubes de puntos (scatter plot)

Otros gráficos multidimensionales (diagramas de estrellas…): Cada vértice representa una variable.

3/18/2018

SESIONES TEÓRICAS ESTADÍSTICA Y TIC: SEMANA 6.

¡Buenas a todos!

Esta semana hemos dado el TEMA 5: ESTADÍSTICOS UNIVARIABLES: MEDIDAS RESUMEN PARA VARIABLES CUANTITATIVAS.

Además de las tablas de frecuencia dadas la semana pasada (explicadas en el último post), podemos resumir una serie de observaciones mediante “estadísticos”: “Función de los datos observados”.

Encontramos tres grandes tipos de medidas de estadística:

Medidas de tendencia central: dan idea de los valores alrededor de los cuales el resto de los datos tienen tendencia a agruparse. Se encuentra:

Media aritmética: Se calcula para variables cuantitativas y se trata del centro geométrico o de gravedad de nuestros datos. Es la suma de todos valores de la variable observada entre el total de observaciones. La fórmula es:

Cuando los datos son agrupados, para calcular la media utilizamos como valor de referencia de cada intervalo su marca de clase.

Mediana: Es el valor de la observación tal que un 50% de los datos es menor y otro 50% es mayor.

Si el número de observaciones es impar:

Si el número de observaciones es par corresponde a la media entre los dos valores centrales, es decir, la media entre la observación n/2 y la observación (n/2)+1

Moda: Es el valor con mayor frecuencia. Si hay más de una se dice que la muestra es bimodal (dos modas) o multimodal (más de dos) Se puede calcular para cualquier tipo de variable – Si los datos están agrupados, se habla de clase modal y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor (hi /ci ).

Medidas de posición: dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.

Cuantiles: Los cuantiles más usuales son los percentiles, los deciles y los cuartiles, según dividan la muestra ordenada en 100, 10 ó 4 partes, respectivamente.

Percentiles: Dividen la muestra ordenada en 100 partes. El percentil “i” (Pi ), es aquél valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i)% restante son mayores.

Deciles. Dividen la muestra ordenada en 10 partes. El decil “i” (Di ), es aquél valor que, ordenadas las observaciones en forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante son mayores.
Cuartiles. Dividen la muestra ordenada en 4 partes.

Medidas de dispersión o variabilidad: dan información acerca de la heterogeneidad de nuestras observaciones.

Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra

Desviación media: Media aritmética de las distancias de cada observación con respecto a la media de la muestra.

Desviación típica: Cuantifica el error que cometemos si representamos una muestra únicamente por su media.

Resultado de imagen de desviacion tipica formula

Varianza: expresa la misma información en valores cuadráticos.

Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil. |Q3 -Q1|
Coeficiente de variación: es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas.

Por otro lado, existe lo que se llama distribución normal, distribución de Gauss o distribución gaussiana,y es una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales. La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de los valores posición central (media, mediana y moda, que coinciden en estas distribuciones).

Esta curva se conoce como campana de Gauss.

También pueden ser asimétricas positiva (hacia la derecha) y negativa (hacia la izquierda).

G1 < 0: Asimetría a la izquierda

G1 = 0: Simetría

G1 > 0: Asimetría a la derecha

Por otro lado, se encuentran las curtosis, que sirve para medir el grado de concentración de los valores que toma en torno a su media. Existen tres tipos:

Distribución mesocúrtica: Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal).

Distribución leptocúrtica: Presenta un elevado grado de concentración alrededor de los valores centrales de la variable.

Distribución platicúrtica: Presenta un reducido grado de concentración alrededor de los valores centrales de la variable

G2 < 0: Platicúrtica

G2 = 0: Mesocúrtica

G2 > 0: Leptocúrtica

Y hasta aquí todo por hoy, espero que os haya gustado.

¡Hasta la próxima!

3/13/2018

SEMINARIOS ESTADÍSTICA Y TIC. SEMINARIO 3.

¡Buenas mis queridos lectores!

Esta semana hemos tenido el seminario 3, el cual, ha sido bastante interesante y útil ya que nos han enseñado a utilizar el programa Epi Info.

Y os preguntareis, ¿Qué es Epi Info?

Se trata de un programa de software gratis del dominio público desarrollado por los Centros para el Control y la Prevención de Enfermedades de los Estados Unidos (CDC).

Epi Info nos permite realizar 3 acciones básicas que nos servirán para el desarrollo del trabajo de investigación

Creación de formularios, cuestionarios y estructura de bases de datos.
Grabación de datos en un cuestionario o formulario previamente creado.
Análisis de los datos grabados en un formulario o de los datos importados a través de un fichero de datos confeccionado en otras aplicaciones.

En este seminario aprendimos a manejar las dos primeras acciones.

Para finalizar el seminario, pusimos en práctica lo aprendido en el seminario, avanzando de esta manera el trabajo de investigación.