KATTERINE ROA ALDANA
VI SEMESTRE SALUD OCUPACIONAL
SEDE URI MADRID
ID 136260
PREGUNTAS GENERADORAS #1
1. ¿Qué medida de tendencia central elegir?
existen tres medidas las mas conocidas y manejadas:
- MEDIA ARITMETICA: es la sumatoria de todos los datos dividida por el total tambien llamado promedio
- MEDIANA: se ordenan los datos de menor a mayor, cuando el vaalor es impar ese es el resultado y cuando es par se suman luego se divide en dos.
- MODA: es el valor que mas se repite en un conjunto de datos
2. ¿Qué ventajas tienen las medidas de tendencia central?
- nos ayuda a facilitar el concepto de donde esta el mayor o menor porcentaje de lo que necesitamos que arroje una encuesta para haci determinar conclusiones y soluciones
- facilita el orden de ideas de una poblacion ya sea su estatura, edad, sexo, etc,.....
3. ¿Qué desventajas tienen las medidas de tendencia central?
- como lo es todo en matematicas deben ser datos exactos para un buen procedimiento y haci mismo un resultado veridico
PREGUNTAS GENERADORAS #2
- como se interpretan los resultadosal aplicar diferntes formulas para el calculo dispersion, asimetria y apuntamiento?
- Los estadísticos de tendencia central o posición nos indican donde se sitúa un grupo de puntuaciones. Los de variabilidad o dispersión nos indican si esas puntuaciones o valores están próximas entre sí o si por el contrario están o muy dispersas.
- Una medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene restando el valor más bajo de un conjunto de observaciones del valor más alto. Es fácil de calcular y sus unidades son las mismas que las de la variable, aunque posee varios inconvenientes:
- No utiliza todas las observaciones (sólo dos de ellas);
- Se puede ver muy afectada por alguna observación extrema;
- El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso nunca disminuye.
2. para que se utilizan las medidas de dispersion?
Una medida de dispersión puede utilizarse para evaluar la confiabilidad de dos o más promedios.
Varias medidas de dispersión:
- Amplitud de Variación: Tal intervalo especial se utiliza ampliamente en las aplicaciones del control estadístico de procesos.
AMPLITUD DE VARIACIÓN = VALOR MÁS GRANDE - VALOR MÁS PEQUEÑO
- Desviación media: Es la media aritmética de los valores absolutos de las desviaciones con respecto a la media aritmética.
DESVIACIÓN MEDIA DM =
n
Donde:
X valor de cada observación
X media aritmética de los valores
n número de observaciones de la muestra
/ / valor absoluto
No se consideran los signos de las desviaciones respecto de la media dado que las desviaciones positivas y negativas se compensarían exactamente y la desviación media siempre sería cero. Cero es un dato estadístico inútil.
Dos ventajas:
- Utiliza en su cálculo todos los valores de la muestra.
- Fácil de comprender pues es el promedio en que los valores se desvían con respecto a la media.
- El uso de valores absolutos
3. que es desviacion?
- Variancia y Desviación Estándar: se basan en las desviaciones al cuadrado con respecto a la media.
La Variancia Poblacional para datos no agrupados o para datos no tabulados en una distribución de frecuencias se calcula como:
" ( X - )2
2 =
N
Donde:
2 símbolo de variancia poblacional
X valor de una observación de población
N número total de observaciones en la citada población
media aritmética de la población
La variancia es difícil de interpretar a causa de las unidades.
La Desviación Estándar Poblacional es el promedio de las desviaciones respecto de la media, se presenta en las mismas unidades que los datos. Fórmula:
( X - )2
=
N
( X - X )2
Variancia Muestral s2 =
n - 1
Donde:
X valor de las observaciones en la muestra
X media de la muestra
N número total de observaciones de la muestra
Puede demostrarse que:
( X - X )2 = X2 - ( X)2/ n
Fórmula operativa de la variancia muestral:
X2 - ( X)2/ n
s2 =
n - 1
La Desviación Estándar Muestral se utiliza como un estimador, es la raíz cuadrada de la variancia muestral:
X2 - ( X)2/ n
s =
n - 1
- Amplitud de Variación: se resta el límite inferior de la clase más pequeña del límite superior de la clase mayor.
- Desviación estándar: para datos no agrupados. Fórmula: fX2 - ( fX)2/ n s = n - 1 Donde: S desviación estándar muestral X punto medio de la clase f frecuencia de clase n número total de observaciones en la muestra Para encontrar la desviación de los datos agrupados en una distribución de frecuencias se produce: Paso 1. Cada frecuencia de clase se multiplica por su punto medio. Paso 2. Se calcula fX2, esto podría explicarse como fX. X. Paso 3. Se suman las columnas fX y fX2..
- Dispersión Relativa: Karl Pearson (1857-1936) desarrolló una medida relativa denominada coeficiente de variación(CV). Es una medida útil cuando:
- Los datos están en unidades diferentes(como U$S y días de asistencia).
- Los datos están en la mismas unidades, pero las medias muy distantes (ingresos de superiores e ingresos de empleados).
- Coeficiente de variación: es la razón (cociente) de la desviación estándar a la media aritmética, expresada como un porcentaje:
2. Como determinar los limites de confianza en una muestra?
INTERVALOS DE CONFIANZA
Estimación puntual y por intervalo
Las medias o desviaciones estándar calculadas de una muestra se denominan ESTADÍSTICOS, podrían ser consideradas como un punto estimado de la media y desviación estándar real de población o de los PARAMETROS.
¿Qué pasa si no deseamos una estimación puntual como media basada en una muestra, qué otra cosa podríamos obtener como margen, algún tipo de error?
“Un Intervalo de Confianza”
ESTIMADOR PUNTUAL: Utiliza un número único o valor para localizar una estimación del parámetro.
ESTIMADOR POR INTERVALO DE CONFIANZA: Denota un rango dentro del cual se puede encontrar el parámetro y el nivel de confianza que el intervalo contiene al parámetro.
LIMITES DE CONFIANZA: Son los límites del intervalo de confianza inferior (LIC) y superior (LSC), se determinan sumando y restando a la media de la muestra un cierto número Z (dependiendo del nivel o coeficiente de confianza) de errores estándar de la media .
INTERPRETACIÓN DEL INTERVALO DE CONFIANZA: Tener un 95% de confianza en que la media poblacional real y desconocida se encuentra entre los valores LIC y LSC.
NIVEL DE SIGNIFICANCIA = 1- INTERVALO DE CONFIANZA = ERROR TIPO 1 = ALFA
¿Cómo obtenemos un intervalo de confianza?
Estimación puntual + error de estimación
¿De dónde viene el error de estimación?
Desv. estándar X multiplicador de nivel de confianza deseado Za/2
Por Ejemplo:
Si la media de la muestra es 100 y la desviación estándar es 10, el intervalo de confianza al 95% donde se encuentra la media para una distribución normal es:
100 + (10) X 1.96 => (80.4, 119.6) 1.96 = Z0.025
El 95% de Nivel de Confianza significa que sólo tenemos un 5% de oportunidad de obtener un punto fuera de ese intervalo.
Esto es el 5% total, o 2.5% mayor o menor. Si vamos a la tabla Z veremos que para un área de 0.025, corresponde a una Z de 1.960.
C. I. Multiplicador Za/2
99 2.576
95 1.960
90 1.645
85 1.439
80 1.282
Para tamaños de muestra >30, o s conocida usar la distribución Normal
Para muestras de menor tamaño, o s desconocida usar la distribución t
El ancho del intervalo de confianza decrece con la raiz cuadrada del tamaño de la muestra.
Ejemplo:
Dadas las siguientes resistencias a la tensión: 28.7, 27.9, 29.2 y 26.5 psi
Estimar la media puntual
X media = 28.08 con S = 1.02
Estimar el intervalo de confianza para un nivel de confianza del 95% (t = 3.182 con n-1=3 grados de libertad)
Xmedia±3.182*S/√n = 28.08±3.182*1.02/2=(26.46, 29.70)
Ejercicios con Z y t:
1. El peso promedio de una muestra de 50 bultos de productos Xmedia = 652.58 Kgs., con S = 217.43 Kgs. Determinar el intervalo de confianza al NC del 95% y al 99% donde se encuentra la media del proceso (poblacional). Alfa = 1 - NC
2. Un intervalo de confianza del 90% para estimar la ganancia promedio del peso de ratones de laboratorio oscila entre 0.93 y 1.73 onzas. ¿Cuál es el valor de Z?.
3. 100 latas de 16 onzas de salsa de tomate tienen una media de Xmedia = 15.2 onzas con una S = 0.96 onzas. ¿A un nivel de confianza del 95%, las latas parecen estar llenas con 16 onzas?.
4. Una muestra de 16 soluciones tienen un peso promedio de 16.6 onzas con S = 3.63. Se rechaza la solución si el peso promedio de todo el lote no excede las 18 onzas. ¿Cuál es la decisión a un 90% de nivel de confianza?.
5. Las 20 cajas de producto pesaron 102 grs. Con S = 8.5 grs. ¿Cuál es el intervalo donde se encuentra la media y varianza del lote para un 90% de nivel de confianza?. Grados libertad=20 -1 =19
6. Una muestra de 25 productos tienen un peso promedio de 23.87 grs. Con una S = 9.56. ¿Cuál es la estimación del intervalo de confianza para la media y varianza a un nivel de confianza del 95 y del 98% del peso de productos del lote completo?.
7. Los pesos de 25 paquetes enviados a través de UPS tuvieron una media de 3.7 libras y una desviación estándar de 1.2 libras. Hallar el intervalo de confianza del 95% para estimar el peso promedio y la varianza de todos los paquetes. Los pesos de los paquetes se distribuyen normalmente.
Ejercicios con proporciones:
8. De 814 encuestados 562 contestaron en forma afirmativa. ¿Cuál es el intervalo de confianza para un 90% de nivel de confianza?
9. En una encuesta a 673 tiendas, 521 reportaron problemas de robo por los empleados ¿Se puede concluir con un 99% de nivel de confianza que el 78% se encuentra en el intervalo de confianza. ?
Uso de Minitab para Intervalos de confianza:
a. Para la media
Stat > Basic Statistics > 1-Sample Z, t
Variable -- Indicar la columna de los datos o Summarized Data
En caso de requerirse dar el valor de Sigma = dato
En Options:
Indicar el Confidence level -- 90, 95 o 99%
OK
b. Para una proporción
Stat > Basic Statistics > 1-Proportion
Seleccionar Summarized Data
Number of trials = n tamaño de la muestra
Number of events = D éxitos encontrados en la muestra
En Options:
Indicar el Confidence Interval -- 90, 95 o 99%
Seleccionar Use test and interval based in normal distribution
FORMULAS PARA ESTIMAR LOS INTERVALOS DE CONFIANZA:
Descripción | Intervalo de confianza |
Estimación de con sigma conocida, muestra grande n>30 | |
Estimación de con sigma desconocida, muestra grande n>30, se toma la desv. Est. de la muestra S | |
Estimación de un con muestras pequeñas, n < 30 y sigma desconocida | |
Estimación de la proporcion | |
Estimación de la proporción | |
| Tamaño de muestra |
Para estimar n en base a un error máximo | |
Para estimar n en base a un error máximo Si se especifica un intervalo total de error, el error máximo es la mitad del intervalo | Utilizar que es peor caso |
3. Que pruebas de hipotesis existen y como se aplican?
PRUEBA DE HIPÓTESIS
Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca de las hipótesis. La decisión consiste en rechazar o no una hipótesis en favor de la otra. Una hipótesis estadística se denota por “H” y son dos:
- Ho: hipótesis nula
- H1: hipótesis alternativa
Partes de una hipótesis
1. Hipótesis
- La hipótesis nula “Ho”
Se refiere siempre a un valor especifico del parámetro de la población, no a una estadística de muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por lo general hay un “no” en la hipótesis nula que indica que “no hay cambio” Podemos rechazar o aceptar Ho.
Por lo tanto la hipótesis nula es una afirmación que no se rechaza a menos que los datos muestrales proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro.
- La hipótesis alternativa “H1”Es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se acepta si los datos muestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación. El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro.
2. Nivel de significanciaProbabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota mediante la letra griega α, también es denominada como nivel de riesgo, este término es mas adecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera.
La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de rechazo (conocida como región crítica) y una región de no rechazo (aceptación). Si la estadística de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula. Estos valores no son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la región de no rechazo de la de rechazo.
Errores tipo I y IIError tipo l se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía ser aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa α
Un error tipo II, se denota con la letra griega β se presenta si la hipótesis nula es aceptada cuando de hecho es falsa y debía ser rechazada.
3. Estadístico de pruebaValor determinado a partir de la información muestral, que se utiliza para determinar si se rechaza la hipótesis nula., existen muchos estadísticos de prueba para nuestro caso utilizaremos los estadísticos z y t. La elección de uno de estos depende de la cantidad de muestras que se toman, si las muestras son iguales a 30 o mas se utiliza el estadístico z, en caso contrario se utiliza el estadístico t.
Tipos de prueba
4. Formular la regla de desiciónSe establece las condiciones específicas en la que se rechaza la hipótesis nula y las condiciones en que no se rechaza la hipótesis nula. La región de rechazo define la ubicación de todos los valores que son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la suposición de que la hipótesis nula es verdadera, es muy remota
Distribución muestral del valor estadístico z, con prueba de una cola a la derecha
Valor critico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no se rechaza la hipótesis nula.
5. Tomar una decisión.
En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba, se compara con el valor crítico y se toma la decisión de rechazar o no la hipótesis nula. Tenga presente que en una prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula cuando no debería haberse rechazado (error tipo I ). También existe la posibilidad de que la hipótesis nula se acepte cuando debería haberse rechazado ( error de tipo II ).
No hay comentarios:
Publicar un comentario