lunes, 26 de mayo de 2008

GRÁFICOS

MEDIDAS DE DISPERSIÓN II

Medidas de dispersión

Parámetros estadísticos que miden cómo de diseminados se encuentran los datos de una distribución. Los más utilizados se refieren al grado de lejanía de los datos respecto a la media y son la desviación media, la varianza, la desviación típica y el coeficiente de variación.
La desviación media, D.m., es un promedio de los valores absolutos de las desviaciones, xi - ÷, de cada elemento, xi, de la distribución respecto a su media, ÷:





Por ejemplo, en la distribución 4, 6, 6, 7, 9, 11, 13, cuya media es 8, la desviación media es:





La varianza, V, es el promedio de los cuadrados de las desviaciones, (xi - ÷)2, de cada elemento, xi, respecto a la media, ÷:





La fórmula anterior es equivalente a esta otra:



que resulta más cómoda de aplicar, sobre todo cuando la media, ÷, no es un número entero.


En la distribución 4, 6, 6, 7, 9, 11, 13, de media 8, la varianza es:



Aplicando la segunda fórmula se obtiene, obviamente, el mismo resultado:


La desviación típica o desviación estándar
es la raíz cuadrada de la varianza:



La razón de ser de este parámetro es conseguir que la medida de dispersión se exprese en las mismas unidades que los datos a los que se refiere. Por ejemplo, en una distribución de estaturas en la que los datos están dados en centímetros (cm), la media viene dada en centímetros, pero la varianza en centímetros cuadrados (cm2). Para evitar este inconveniente se calcula su raíz cuadrada, obteniéndose así la desviación típica en centímetros.
El par de parámetros formado por la media y la desviación típica (÷, ó) aporta una información suficientemente buena sobre la forma de la distribución.
El coeficiente de variación, C.V., es el cociente entre la desviación típica y la media de la distribución:


Este parámetro sirve para relativizar el valor de la desviación típica y así poder comparar la dispersión de dos poblaciones estadísticas con gamas de valores muy discretas. Por ejemplo, si en una compañía mexicana los salarios de los empleados tienen una media ÷1 = 7.000 pesos y una desviación típica ó1 = 500 pesos y en otra empresa española la media de los salarios es ÷2 = 200.000 pesetas y la desviación típica ó2 = 40.000 pesetas, para comparar la dispersión de salarios se recurre al coeficiente de variación:
C.V.1 = 500/7.000 = 0,07
C.V.2 = 40.000/200.000 = 0,2
Se aprecia así que en la primera compañía los salarios tienen menor dispersión que en la segunda.
Otras medidas de dispersión son el recorrido y el recorrido intercuartílico.
El recorrido es la diferencia entre los valores mayor y menor de la distribución. Indica, pues, la longitud del tramo en el que se hallan los datos. También se llama rango.

DISTRIBUCIÓN DE FRECUENCIAS

Distribución de Frecuencias:
Tabla de datos, referentes a una variable en cuestión, en la que se exponen varias categorías de la misma, junto con sus frecuencias o número de veces que se repite en la muestra (puede expresarse también en porcentaje). La tabla puede tener diferentes formatos y es llamada tabla de frecuencias. Cuando se comparan la frecuencia de dos variables, se compone una tabla de contingencia, en la cual una variable ocupa las filas y la otra las columnas.
Ejemplo de una tabla de frecuencias simple de la variable COMA, en sus categorías: Ausente y Presente. (SPSS).

Gráfico de barra

Si se unen los puntos medios de la base superior de los rectángulos se obtiene el polígono de frecuencias.
Gráfico de pastel

MEDIDAS DE DISPERSIÓN

Medidas de variabilidad o dispersión

Los estadísticos de tendencia central o posición nos indican donde se sitúa un grupo de puntuaciones. Los de variabilidad o dispersión nos indican si esas puntuaciones o valores están próximas entre sí o si por el contrario están o muy dispersas.
Una medida razonable de la variabilidad podría ser la amplitud o rango, que se obtiene restando el valor más bajo de un conjunto de observaciones del valor más alto. Es fácil de calcular y sus unidades son las mismas que las de la variable, aunque posee varios inconvenientes:
No utiliza todas las observaciones (sólo dos de ellas);
Se puede ver muy afectada por alguna observación extrema;
El rango aumenta con el número de observaciones, o bien se queda igual. En cualquier caso nunca disminuye.