KATTERINE ROA ALDANA
ID 136260
JULIO ANDRES HERNADEZ
ID 162236
EDUARDO CASTIBLANCO RODRIGUEZ
VI SEMESTRE SALUD OCUPACIONAL
SEDE URI MADRID
PREGUNTAS GENERADORAS #1
1. ¿Qué medida de tendencia central elegir?
1. ¿Qué medida de tendencia central elegir?
existen tres medidas las mas conocidas y manejadas:
- MEDIA ARITMETICA: es la sumatoria de todos los datos dividida por el total tambien llamado promedio
- MEDIANA: se ordenan los datos de menor a mayor, cuando el vaalor es impar ese es el resultado y cuando es par se suman luego se divide en dos.
- MODA: es el valor que mas se repite en un conjunto de datos
2. ¿Qué ventajas tienen las medidas de tendencia central?
- nos ayuda a facilitar el concepto de donde esta el mayor o menor porcentaje de lo que necesitamos que arroje una encuesta para haci determinar conclusiones y soluciones
- facilita el orden de ideas de una poblacion ya sea su estatura, edad, sexo, etc,.....
3. ¿Qué desventajas tienen las medidas de tendencia central?
- como lo es todo en matematicas deben ser datos exactos para un buen procedimiento y haci mismo un resultado veridico
PREGUNTAS
GENERADORAS #2
- como se interpretan los resultadosal aplicar diferntes formulas para el calculo dispersion, asimetria y apuntamiento?
- Los estadísticos de tendencia central o posición nos indican donde se sitúa un grupo de puntuaciones. Los de variabilidad o dispersión nos indican si esas puntuaciones o valores están próximas entre sí o si por el contrario están o muy dispersas.
- Una medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene restando el valor más bajo de un conjunto de observaciones del valor más alto. Es fácil de calcular y sus unidades son las mismas que las de la variable, aunque posee varios inconvenientes:
- No utiliza todas las observaciones (sólo dos de ellas);
- Se puede ver muy afectada por alguna observación extrema;
- El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso nunca disminuye.
2. para que se utilizan las medidas de dispersion?
Una medida de dispersión puede utilizarse para evaluar
la confiabilidad de dos o más promedios.
Varias
medidas de dispersión:
- Amplitud de Variación: Tal intervalo especial se utiliza ampliamente en las aplicaciones del control estadístico de procesos.
AMPLITUD DE VARIACIÓN = VALOR MÁS GRANDE - VALOR MÁS PEQUEÑO
- Desviación media: Es la media aritmética de los valores absolutos de las desviaciones con respecto a la media aritmética.
/ X - X /
DESVIACIÓN MEDIA DM =
n
Donde:
X valor de cada observación
X media aritmética de los valores
n número de observaciones de la muestra
/ / valor absoluto
No se consideran los signos de las desviaciones
respecto de la media dado que las desviaciones positivas y negativas se
compensarían exactamente y la desviación media siempre sería cero. Cero es un dato
estadístico inútil.
Dos
ventajas:
- Utiliza en su cálculo todos los valores de la muestra.
- Fácil de comprender pues es el promedio en que los valores se desvían con respecto a la media.
Desventaja:
- El uso de valores absolutos
3. que es desviacion?
- Variancia y Desviación Estándar: se basan en las desviaciones al cuadrado con respecto a la media.
Variancia: la media aritmética de las desviaciones cuadráticas
con respecto al a media
La Variancia Poblacional para datos no
agrupados o para datos no tabulados en una distribución de frecuencias se
calcula como:
" ( X - )2
2 =
N
Donde:
2 símbolo de variancia poblacional
X valor de una observación de población
N número total de observaciones en la citada población
media aritmética de la población
La variancia es difícil de interpretar a causa
de las unidades.
La Desviación Estándar Poblacional es el
promedio de las desviaciones respecto de la media, se presenta en las mismas
unidades que los datos. Fórmula:
( X -
)2
=
N
( X - X )2
Variancia Muestral s2 =
n - 1
Donde:
X valor de las observaciones en la muestra
X media de la muestra
N número total de observaciones de la muestra
Puede demostrarse que:
( X - X )2 = X2 - (X)2/ n
Fórmula operativa de la variancia muestral:
X2 - (X)2/ n
s2 =
n - 1
La Desviación Estándar Muestral se utiliza como
un estimador, es la raíz cuadrada de la variancia muestral:
X2 - (X)2/ n
s =
n - 1
·
Medidas de dispersión para datos agrupados en
distribución de frecuencias:
- Amplitud de Variación: se resta el límite inferior de la clase más pequeña del límite superior de la clase mayor.
- Desviación estándar: para datos no agrupados. Fórmula:
fX2 - (fX)2/ n
s =
n - 1
Donde:
S desviación estándar muestral
X punto medio
de la clase
f frecuencia de
clase
n número total
de observaciones en la muestra
Para encontrar
la desviación de los datos agrupados en una distribución de frecuencias se
produce:
Paso 1. Cada frecuencia de clase se multiplica por su punto
medio.
Paso 2. Se calcula fX2, esto podría explicarse como fX. X.
Paso 3. Se suman las columnas fX y fX2..
- Dispersión Relativa:
Karl Pearson
(1857-1936) desarrolló una medida relativa denominada coeficiente de
variación(CV). Es
una medida útil cuando:
- Los datos están en unidades diferentes(como U$S y días de asistencia).
- Los datos están en la mismas unidades, pero las medias muy distantes (ingresos de superiores e ingresos de empleados).
- Coeficiente de variación: es la razón (cociente) de la desviación estándar a la media aritmética, expresada como un porcentaje:
s
CV = (100)
X
Karl Pearson
desarrolló tb una medida para evaluar el grado de orientación al sesgo,
denominada coeficiente de asimetría (CA):
3 ( media -
mediana)
CA =
Desviación
Estándar
PREGUNTAS
GENERADORAS #3
1. Que es
probabilidad?
La probabilidad
mide la frecuencia con la que se obtiene un resultado (o conjunto de
resultados) y luego al llevar a cabo un experimento aleatorio, del que se
conocen todos los resultados posibles, bajo condiciones suficientemente
estables. La teoria de la probabilidad se usa extensamente en áreas como la
estadistica, la fisica, la matematica, las ciencias y la filosofia para sacar
conclusiones sobre la probabilidad discreta de sucesos potenciales y la
mecánica subyacente discreta de sistemas complejos.
2. Como
determinar los limites de confianza en una muestra?
INTERVALOS DE CONFIANZA
Estimación puntual y por intervalo
Las medias o desviaciones estándar calculadas de una muestra se
denominan ESTADÍSTICOS, podrían ser consideradas como un punto estimado de la
media y desviación estándar real de población o de los PARAMETROS.
¿Qué pasa si no deseamos una estimación puntual como media basada en una
muestra, qué otra cosa podríamos obtener como margen, algún tipo de error?
“Un Intervalo de Confianza”
ESTIMADOR
PUNTUAL: Utiliza un número único o valor para localizar una estimación del
parámetro.
ESTIMADOR POR
INTERVALO DE CONFIANZA: Denota un rango dentro del cual se puede encontrar el
parámetro y el nivel de confianza que el intervalo contiene al parámetro.
LIMITES DE
CONFIANZA: Son los límites del intervalo de confianza inferior (LIC) y superior
(LSC), se determinan sumando y restando a la media de la muestra un cierto número Z (dependiendo del nivel o coeficiente de confianza) de
errores estándar de la media .
INTERPRETACIÓN
DEL INTERVALO DE CONFIANZA: Tener un 95% de confianza en que la media
poblacional real y desconocida se encuentra entre los valores LIC y LSC.
NIVEL DE
SIGNIFICANCIA = 1- INTERVALO DE CONFIANZA = ERROR TIPO 1 = ALFA
¿Cómo obtenemos
un intervalo de confianza?
Estimación puntual + error de
estimación
¿De dónde viene
el error de estimación?
Desv. estándar
X multiplicador de nivel de confianza deseado Za/2
Por Ejemplo:
Si la media de
la muestra es 100 y la desviación estándar es 10, el intervalo de confianza al
95% donde se encuentra la media para una distribución normal es:
100 + (10) X 1.96 => (80.4,
119.6) 1.96 = Z0.025
El 95% de Nivel
de Confianza significa que sólo tenemos un 5% de oportunidad de obtener un
punto fuera de ese intervalo.
Esto es el 5% total, o 2.5% mayor o menor. Si vamos a la
tabla Z veremos que para un área de 0.025, corresponde a una Z de
1.960.
C.
I. Multiplicador Za/2
99 2.576
95 1.960
90 1.645
85 1.439
80 1.282
Para tamaños de
muestra >30, o s conocida usar la distribución Normal
Para muestras
de menor tamaño, o s desconocida usar la distribución t
El ancho del
intervalo de confianza decrece con la raiz cuadrada del tamaño de la muestra.
Ejemplo:
Dadas las
siguientes resistencias a la tensión: 28.7, 27.9, 29.2 y 26.5 psi
Estimar la
media puntual
X media = 28.08 con S = 1.02
Estimar el
intervalo de confianza para un nivel de confianza del 95% (t = 3.182 con n-1=3
grados de libertad)
Xmedia±3.182*S/√n = 28.08±3.182*1.02/2=(26.46, 29.70)
Ejercicios con Z y t:
1. El peso
promedio de una muestra de 50 bultos de productos Xmedia = 652.58 Kgs., con S =
217.43 Kgs. Determinar el intervalo de confianza al NC del 95% y al 99%
donde se encuentra la media del proceso (poblacional). Alfa = 1 - NC
2. Un intervalo
de confianza del 90% para estimar la ganancia promedio del peso de ratones de
laboratorio oscila entre 0.93 y 1.73 onzas. ¿Cuál es el valor de Z?.
3. 100 latas de
16 onzas de salsa de tomate tienen una media de Xmedia = 15.2 onzas con una S =
0.96 onzas. ¿A un nivel de confianza
del 95%, las latas parecen estar llenas con 16 onzas?.
4. Una muestra
de 16 soluciones tienen un peso promedio de 16.6 onzas con S = 3.63. Se rechaza
la solución si el peso promedio de todo el lote no excede las 18 onzas. ¿Cuál
es la decisión a un 90% de nivel de confianza?.
5. Las 20 cajas
de producto pesaron 102 grs. Con S = 8.5 grs. ¿Cuál es el intervalo donde se
encuentra la media y varianza del lote para un 90% de nivel de confianza?.
Grados libertad=20 -1 =19
6. Una muestra
de 25 productos tienen un peso promedio de 23.87 grs. Con una S = 9.56. ¿Cuál
es la estimación del intervalo de confianza para la media y varianza a un nivel
de confianza del 95 y del 98% del peso de productos del lote completo?.
7. Los pesos de
25 paquetes enviados a través de UPS tuvieron una media de 3.7 libras y una
desviación estándar de 1.2 libras. Hallar el intervalo de confianza del 95%
para estimar el peso promedio y la
varianza de todos los paquetes. Los pesos de los paquetes se distribuyen
normalmente.
Ejercicios con proporciones:
8. De 814
encuestados 562 contestaron en forma afirmativa. ¿Cuál es el intervalo de
confianza para un 90% de nivel de confianza?
9. En una
encuesta a 673 tiendas, 521 reportaron problemas de robo por los empleados ¿Se
puede concluir con un 99% de nivel de confianza que el 78% se encuentra en el
intervalo de confianza. ?
Uso de Minitab para Intervalos de confianza:
a. Para la
media
Stat > Basic
Statistics > 1-Sample Z, t
Variable --
Indicar la columna de los datos o Summarized Data
En caso de
requerirse dar el valor de Sigma = dato
En Options:
Indicar el
Confidence level -- 90, 95 o 99%
OK
b. Para una
proporción
Stat > Basic
Statistics > 1-Proportion
Seleccionar
Summarized Data
Number of
trials = n tamaño de la muestra
Number of
events = D éxitos encontrados en la muestra
En Options:
Indicar el Confidence Interval -- 90, 95
o 99%
Seleccionar Use test and interval based in normal
distribution
FORMULAS PARA
ESTIMAR LOS INTERVALOS DE CONFIANZA:
Descripción
|
Intervalo
de confianza
|
Estimación
de con sigma conocida, muestra grande n>30
|
|
Estimación
de con sigma desconocida, muestra grande n>30, se toma la desv. Est.
de la muestra S
|
|
Estimación de
un con muestras pequeñas, n < 30 y sigma
desconocida
|
|
Estimación de la proporcion
|
|
Estimación de la proporción
|
|
|
Tamaño de muestra
|
Para estimar
n en base a un error máximo
|
|
Para estimar
n en base a un error máximo
Si se
especifica un intervalo total de error, el error máximo es la mitad del
intervalo
|
Utilizar que
es peor caso
|
3. Que pruebas de hipotesis existen y como se
aplican?
PRUEBA DE HIPÓTESIS
Una
prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal
contraste involucra la toma de decisión acerca de las hipótesis. La decisión
consiste en rechazar o no una hipótesis en favor de la otra. Una hipótesis
estadística se denota por “H” y son dos:
- Ho: hipótesis nula
- H1: hipótesis alternativa
Partes de una hipótesis
1. Hipótesis
- La hipótesis nula “Ho”
Se
refiere siempre a un valor especifico del parámetro de la población, no a una
estadística de muestra. La letra H significa hipótesis y el subíndice cero no
hay diferencia. Por lo general hay un “no” en la hipótesis nula que indica que
“no hay cambio” Podemos rechazar o aceptar Ho.
Por
lo tanto la hipótesis nula es una afirmación que no se rechaza a menos que los
datos muestrales proporcionen evidencia convincente de que es falsa. El
planteamiento de la hipótesis nula siempre contiene un signo de igualdad con
respecto al valor especificado del parámetro.
- La hipótesis alternativa “H1”
Es
cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se
acepta si los datos muestrales proporcionan evidencia suficiente de que la
hipótesis nula es falsa. Se le conoce también como la hipótesis de
investigación. El planteamiento de la hipótesis alternativa nunca contiene un
signo de igualdad con respecto al valor especificado del parámetro.
2.
Nivel de significancia
Probabilidad
de rechazar la hipótesis nula cuando es verdadera. Se le denota mediante la
letra griega α, también es
denominada como nivel de riesgo, este término es mas adecuado ya que se corre
el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera.
La
distribución de muestreo de la estadística de prueba se divide en dos regiones,
una región de rechazo (conocida como región crítica)
y una región de no rechazo (aceptación). Si la estadística de prueba cae
dentro de la región de aceptación, no se puede rechazar la hipótesis nula.
Estos valores no son tan improbables de presentarse si la hipótesis nula es
falsa. El valor crítico separa la región de no rechazo de la de rechazo.
Errores tipo I y II
Error
tipo l se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y
debía ser aceptada. La probabilidad de cometer un error tipo I se denomina con
la letra alfa α
Un
error tipo II, se denota con la letra griega β se presenta si la hipótesis nula es
aceptada cuando de hecho es falsa y debía ser rechazada.
3.
Estadístico de prueba
Valor
determinado a partir de la información muestral, que se utiliza para determinar
si se rechaza la hipótesis nula., existen muchos estadísticos de prueba para
nuestro caso utilizaremos los estadísticos z y t. La elección de uno de estos
depende de la cantidad de muestras que se toman, si las muestras son iguales a
30 o mas se utiliza el estadístico z, en caso contrario se utiliza el
estadístico t.
Tipos
de prueba
4. Formular la regla de desición
Se
establece las condiciones específicas en la que se rechaza la hipótesis nula y
las condiciones en que no se rechaza la hipótesis nula. La región de rechazo
define la ubicación de todos los valores que son tan grandes o tan pequeños,
que la probabilidad de que se presenten bajo la suposición de que la hipótesis
nula es verdadera, es muy remota
Distribución
muestral del valor estadístico z, con prueba de una cola a la derecha
Valor
critico: Es el punto de división entre la región en la que se rechaza la
hipótesis nula y la región en la que no se rechaza la hipótesis nula.
5. Tomar una decisión.
En
este último paso de la prueba de hipótesis, se calcula el estadístico de
prueba, se compara con el valor crítico y se toma la decisión de rechazar o no
la hipótesis nula. Tenga presente que en una prueba de hipótesis solo se puede
tomar una de dos decisiones: aceptar o rechazar la hipótesis nula. Debe
subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula
cuando no debería haberse rechazado (error tipo I ). También existe la
posibilidad de que la hipótesis nula se acepte cuando debería haberse rechazado
( error de tipo II ).
No hay comentarios:
Publicar un comentario