Distribuciones empíricas de frecuencias bivariadas, bidimensionales o conjuntas
Enviado por Rolando Martínez Marrero
METODOLOGÍA PARA EL ESTUDIO Y USO
RESUMEN
El presente trabajo tiene características peculiares, pues en él se abordan contenidos fundamentales de la Estadística Descriptiva, como son: Las distribuciones empíricas de frecuencias bivariadas, teniendo en cuenta que los datos son cuantitativos, la notación para las variables y las observaciones para las mismas, su clasificación de acuerdo a los tipos de variables que para datos cuantitativos pueden presentarse, en primer lugar las dos variables son discretas o discontiuas, en segundo lugar, las dos variables son continuas, y por último, un sistema mixto formado por una variable aleatoria discreta y la otra continua.
Los contenidos abordados, incluyen, ademas, las DEF relativas y absolutas marginales y su interpretación, la DEF absolutas acumuladas bivariadas, la DEF relativas acumulada bivarada. Tambien está desarrollado el estudio y la forma de resolver problemas de aplicación que conducen a la formación de DEF bivariadas, incluyendo el cálculo de las medidas de posición o tendencia central y de dispersión, la independencia estadística entre dos variables, la covarianza de dos variables y el coeficiente de correlacion lineal y sus propiedades.
Sin embargo, consideramos que por su importancia, lo más novedoso es el tratamiento y el procesamientom computacional que le hemos dado a todos estos contenidos de la Estadística Descriptiva, y en el cual usamos el paquete de programas estadístico profesional Statgraphics sobre Windows, y es así, debido a que en la bibliografía consultada no se utiliza ni se habla de tratar estos aspectos computacionalmente.
INTRODUCCIÓN
Para iniciar el tratamiento de estos aspectos, se hace necesario algunas consideraciones de los mismos.
Obtención de las distribuciones empíricas de frecuencias (absolutas y relativas) bivariadas o conjuntas y de las distribuciones empíricas de frecuencias (absolutas y relativas) marginales, usando el Statgwin.
Usando el Statgwin, y teniendo a disposición los datos originales obtenidos de forma simultánea sobre ambas variables discretas, podemos obtener fácilmente las distribuciones empíricas de frecuencias (absolutas y relativas) bivariadas o conjuntas y las distribuciones empíricas de frecuencias (absolutas y relativas) marginales de cada una de las variables. Para ello, lo primero que hay que hacer es confeccionar un fichero con las dos variables discretas que estamos analizando. A cada una de las variables de este fichero, le damos como valores, los valores de las observaciones o datos obtenidos simultáneamente sobre cada variable. Después se procesan los datos de este fichero usando el siguiente procedimiento: Se ejecuta el comando Descripción (en inglés, Describe), se toma la opción Datos Categóricos (en inglés, Categorical Data) y después se toma la opción Tabulación cruzada (en inglés, Crosstabulation). A continuación sale una caja de diálogo en la que tenemos que dar las variables con las cuales vamos a construir su distribución empírica de frecuencias. En Variable Fila (en inglés, Row Variable) damos el nombre de la variable cuyos valores distintos queremos que aparezcan en las filas de la tabla de frecuencias, y en Variable Columna (en inglés, Column Variable), damos el nombre de la variable cuyos valores distintos queremos que aparezcan en las columnas de la tabla de frecuencias.
Al procesar (clic en el botón Aceptar), salen en la pantalla dos ventanas y dos gráficos. En la segunda ventana aparece una tabla cruzada o tabla de doble entrada (en inglés, Crosstabulation), en la cual se muestran los siguientes elementos. En la primera columna de la tabla aparecen los valores distintos o diferentes de la variable X1, o sea, los valores de Y1, y en la primera fila de la tabla aparecen los valores distintos o diferentes de la variable X2, o sea, los valores de Y2. En cada celda de la tabla se muestran dos números. El primer número que aparece es el valor de la frecuencia absoluta bivariada o conjunta del par de valores de las variables Y1 y Y2 correspondiente a dicha celda, es decir, el número de veces que ocurren o aparecen juntos o simultáneamente el valor de Y1 y el valor de Y2 correspondiente a dicha celda.
Esta tabla que contiene los valores distintos o diferentes de las variables X1 y X2 y sus frecuencias absolutas bivariadas o conjuntas define lo que se conoce con el nombre de distribución empírica de frecuencias absolutas bivariadas de las variables X1 y X2.
El segundo número que aparece en cada celda (expresado en porcentaje o por ciento) es el porcentaje o por ciento (%) que representa la frecuencia absoluta bivariada o conjunta de esa celda con respecto al número total de observaciones (n), o sea, que el porcentaje en cada celda es igual a la frecuencia relativa expresada en porcentaje o por ciento (%). Estas frecuencias relativas bivariadas definen, junto con los pares de valores distintos de las variables X1 y X2, la distribución empírica de frecuencias relativas bivariadas de las variables X1 y X2.
En los márgenes derecho e inferior de esta tabla aparecen las distribuciones empíricas de frecuencias (absolutas y relativas) marginales de las variables X1 y X2 respectivamente.
A modo de resumen podemos decir que en la tabla que nos da el Statgwin, las frecuencias relativas bivariadas o conjuntas en cada celda y las frecuencias relativas marginales, siempre se muestran expresadas en por ciento o porcentajes (%). La frecuencia relativa de cada celda, expresada en porcentaje o por ciento (%), no es más que el por ciento que representa la frecuencia absoluta de dicha celda con respecto al número total de observaciones (n). El valor de n es igual a la suma de todas las frecuencias absolutas bivariadas o conjuntas, y es, además, igual a la suma de todas las frecuencias absolutas marginales de cada distribución marginal.
Página siguiente |