FUNDACIÓN UNIVERSITARIA MINUTO DE DIOS

FUNDACIÓN UNIVERSITARIA MINUTO DE DIOS

CERES REGIONAL MADRID

jueves, 20 de septiembre de 2012

GUIA 03 MEDIDAS DE DISPERSION, ASIMETRIA Y APUNTAMIENTO

MEDIDA DE DISPERASION Este nuevo tipo de medidas es útil para saber más o menos el nivel de concentración de los datos. Así pues, se puede interpretar como una forma de valorar la fiabilidad de decir que la mayoría se agrupan en torno a un valor. Cuanta mayor sea la dispersión mayor será la aleatoriedad del experimento. -Rango: es la diferencia entre el elemento de mayor valor y el de menor valor. -Rango Intercuartílico: es la diferencia entre el primer y el tercer cuartiles. -Varianza: se define como la suma de las distancias al cuadrado entre cada elemento y la media aritmética, dividida cada una ellas entre el numero de elementos: s^2 = ∑([xi - x‾]^2) desde “1″ hasta “N” / N. Desviación Típica: se define como la raíz cuadrada de la varianza. Posee las mismas unidades que los elementos y por tanto es la que se les puede sumar. Se define como: s = [s^2]^1/2. En general, en distribuciones de datos normales o gaussianas, el intervalo (x‾ – 2 s, x‾ + 2 s) contiene el 95% de los elementos. Conociendo todo esto, es interesante introducir el llamado Coeficiente de Pearson para dispersiones, que se define como: cp = s / x‾. Fctor “k”: k = (xi – x‾) / s(x). Básicamente es una medida que da una idea de lo alejado que está un elemento de la media aritmética, es por eso que al valor del elemento “xi” se le resta el de la media de los elementos “x”, y después se divide entre la desviación típica de los “xi”. Si la distancia de un elemento a la media es menor que la desviación típica, diremos que está poco disperso, en caso contrario diremos que está bastante disperso. La Desigualdad de Tchebychev: f(xi//|xi – x‾| > k s) < 1 / k^2. Es otro dato importante en las medidas de dispersión, pues implica que cuando un elemento está alejado k s veces de la media su frecuencia será menor que la inversa del cuadrado de “k”. -Momentos Característicos de la Distribución de Datos: Se define como el momento de orden r-ésimo respecto a un valor “c” en una distribución de datos a la expresión: mr(c) = (x – c)^r‾. Es decir, la media de las distancias de los elementos a “c” elevadas a “r”. Así pues, el momento de primer orden respecto a “0″ es la media, y el momento de segundo orden respecto a la media es la varianza. MEDIDAS DE ASIMETRÍA: La asimetría, como su propio nombre nos indica, nos da una idea de hacia qué lado de la media están más agrupados los datos, y en general usaremos dos coeficientes, siendo uno de ellos mucho más fiable que el otro. -Coeficiente de Pearson: se define como el cociente de la distancia de la media a la moda, dividido entre la desviación típica. Si es positivo hablamos de asimetría positiva, y análogamente trataremos los valores negativos: Ap = (x‾ – Md) / s. Tiene el fallo de que no considerar la posibilidad de que haya más de una moda. -Coeficiente de Fisher: se define como el momento de tercer orden respecto a la media dividido entre el cubo de la desviación típica: Af = m3(x‾) / s^3. que en última instancia es: ∑(fi(xi – x‾)^3) desde “1″ hasta “K” / s^3. MEDIDAS DE APUNTAMIENTO En última instancia, el apuntamiento nos da una idea de lo importante que es la media en una distribución (si los datos se amontonan ciertamente en torno a ella o no). El factor curtosis, que es el que nos ayudará a determinar esta característica, se define como: g = m4(x‾) / s^4. Si “g” es igual a 3, la distribución será normal o gaussiana. Si “g” es menor que 3, la distribución será leptocúrtica, y si “g” es mayor que 3 la distribución será platicártela.

No hay comentarios:

Publicar un comentario