Prueba de independencia

INTRODUCCIÓN

Existe una variedad de procedimiento para el procesamiento y análisis estadístico de datos, una vez recogidos los datos, procesados y convertidos en información valiosa para el estudio que se realiza, pueden utilizarse varias técnicas que permitan sacar el máximo provecho de la información disponible, sin embargo, la utilización de técnicas de Estadística No Parametricas son poco utilizada, a pesar de la potencia y certeza de sus resultados, y que por lo general no se dispone de información suficiente sobre la población de la cual se extrajeron los datos que den soporte la realización de inferencia con base en la muestra observada.

En esta investigación se desarrollan algunas técnicas de análisis estadístico no paramétrico tales como la prueba de independencia, la corrección de Yates en tablas de contingencia de 2×2, las pruebas de homogeneidad y se hace un estudio sobre el análisis de varianza por medio de la tabla ANOVA, analizando la rutina general de este tipo de análisis, para terminar con comentarios sobre la importancia del software en este tipo de análisis.

Palabras Claves: Estadística No Paramétrica Prueba de Independencia Corrección de Yates Análisis de Varianza ANOVA Prueba de Homogeneidad

PRUEBA DE INDEPENDENCIA

Cuando cada individuo de la población a estudio se puede clasificar según dos criterios A y B, admitiendo el primero a posibilidades diferentes y b el segundo, la representación de las frecuencias observadas en forma de una matriz a x b recibe el nombre de Tabla de contingencia. Los datos se disponen de la forma

Para ver el gráfico seleccione la opción "Descargar" del menú superior

siendo nij el número de individuos que presentan simultáneamente la i-ésima modalidad del carácter A y la j-ésima del B.

La hipótesis nula a contrastar admite que ambos caracteres, A y B, se presentan de forma independiente en los individuos de la población de la cual se extrae la muestra; siendo la alternativa la dependencia estocástica entre ambos caracteres. La realización de esta prueba requiere el cálculo del estadístico

Para ver el gráfico seleccione la opción "Descargar" del menú superior

donde:

Para ver el gráfico seleccione la opción "Descargar" del menú superior

son las frecuencias absolutas marginales y

Para ver el gráfico seleccione la opción "Descargar" del menú superior

el tamaño muestral total.

El estadístico L se distribuye como una con (a – 1)(b – 1) grados de libertad. El contraste se realiza con un nivel de significación del 5%.

Ejemplo de Aplicación

Para estudiar la dependencia entre la práctica de algún deporte y la depresión, se seleccionó una muestra aleatoria simple de 100 jóvenes, con los siguientes resultados:

	Sin depresión	Con depresión
Deportista	38	9	47
No deportista	31	22	53
	69	31	100

L = (38 – 32,43)2/32,43 + (31 – 36,57)2/36,57 + (9 – 14,57)2/14,57 + (22 – 16,43)2/16,43

= 0,9567 + 0,8484 + 2,1293 + 1,8883 = 5,8227

El valor que alcanza el estadístico L es 5,8227. Buscando en la tabla teórica de Chi Cuadrado para 1 grado de libertad se aprecia Lt = 3,84146 < 5,8227 lo que permite rechazar la hipótesis de independencia de caracteres con un nivel de significación del 5%, admitiendo por tanto que la práctica deportiva disminuye el riesgo de depresión.

CORRECCIÓN DE YATES PARA TABLAS DE CONTINGENCIA DE 2X2

Un caso especial de pruebas de independencia es aquel que emplea una tabla de contingencia de 2×2. Si se utiliza una tabla cuádruple puede aplicarse una fórmula simplificada para calcular el Valor L, por χ2.

Supóngase que las frecuencias observadas en una tabla de contingencia de 2×2 sean a, b, c y d de la siguiente forma:

	A	B	Total
X	a	b	a + b
Y	c	d	c + d
Total	a + c	b + d	n

El valor χ2 puede calcularse entonces con la fórmula siguiente:

que tiene (2 – 1)(2 – 1) = 1 grado de libertad

Con frecuencia se aplica la Corrección de Continuidad de Yates, similar a la corrección de continuidad de la aproximación normal a la binomial, para mejorar la aproximación a la probabilidad exacta. El valor χ2 corregido se calcula a partir de la siguiente fórmula:

Ejemplo de Aplicación

En un estudio para determinar si existe relación entre el sexo y el propósito de elegir una carrera técnica se entrevistaron a 120 aspirantes a la universidad. Los resultados se observan en la siguiente tabla de contingencia:

Sexo	Aspira a Carrera Técnica		Total
Sexo	Si	No	Total
Masculino	40	30	70
Femenino	10	40	50
Total	50	50	120

Se aplicará la fórmula para encontrar χ2

χ2 = (120(40×40 – 10×30)2)/70x50x50x70 = 16,56

De la tabla teórica de Chi Cuadrado se tiene que para un grado de libertad el valor de χ2 que separa 0,1% superior es 10,828. Por lo tanto, la hipótesis según la cual existe independencia entre el sexo y el propósito de elegir una carrera técnica debe ser rechazada.

Si se tiene en cuanta la corrección por continuidad de Yates se obtiene:

χ2 = (120(|40×40 – 10×30| – 0,5(120))2)/70x50x50x70 = 15,06

Que es ligeramente inferior al valor antes obtenido, pero aun así, la hipótesis de independencia debe ser rechazada.

PRUEBA DE HOMOGENEIDAD

Se plantea el problema de la existencia de homogeneidad entre r poblaciones, para lo cual se realizan muestras independientes en cada una de ellas. Los datos muestrales vienen clasificados en s clases y sus frecuencias absolutas se presentan en forma de una matriz r x s:

Para ver el gráfico seleccione la opción "Descargar" del menú superior

siendo nij el número de observaciones en la i-ésima población pertenecientes a la j-ésima clase.

Se quiere contrastar la hipótesis nula de que las probabilidades asociadas a las s clases son iguales en las r poblaciones. El estadístico para este contraste es

Para ver el gráfico seleccione la opción "Descargar" del menú superior

donde

Para ver el gráfico seleccione la opción "Descargar" del menú superior

es el tamaño muestral para la i-ésima población,

Para ver el gráfico seleccione la opción "Descargar" del menú superior

es la frecuencia marginal de la j-ésima clase y

Para ver el gráfico seleccione la opción "Descargar" del menú superior

es el tamaño muestral total.

El estadístico L se distribuye como una con (r – 1)(s – 1) grados de libertad. El contraste se realiza con un nivel de significación del 5%.

Ejemplo de Aplicación

Un estudio sobre caries dental en niños de seis ciudades con diferentes cantidades de fluor en el suministro de agua, ha proporcionado los resultados siguientes:

Comunidad	Nº niños sin caries	Nº niños con caries
A	38	87	125
B	8	117	125
C	30	95	125
D	44	81	125
E	64	61	125
F	32	93	125
	216	534	750

L = (38 – 36)2/36 + (8 – 36)2/36 + (30 – 36)2/36 + (44 – 36)2/36 + (64 – 36)2/36 + (32 – 36)2/36 + (87 – 89)2/89 (117 – 89)2/89 + (95 – 89)2/89 + (81 – 89)2/89 + (61 – 89)2/89 + (93 – 89)2/89

L = 0,1111 + 21,7778 + 1,0000 + 1,7778 + 21,7778 + 0,4444 + 0,0449 + 8,8089 + 0,4045 + 0,7191 + 8,8089 + 0,1797

L = 65,85

Se quiere saber si la incidencia de caries infantil es igual en las seis poblaciones.

La propia tabla hace pensar que la incidencia de la enfermedad no es igual en todas las poblaciones; basta observar los datos correspondientes a las comunidades B y E. El contraste arroja un valor del estadístico L de 65,85, lo que lleva a rechazar la hipótesis de homogeneidad y aceptar que el diferente contenido de fluor en el suministro del agua puede ser la causa de la disparidad en el número de niños con caries. El Lt esperado según la tabla de las distribución Chi Cuadrado es 11,0705 que es menor 65,85.

ANÁLISIS DE LA VARIANZA

Del mismo modo que el contraste χ2 generalizaba el contraste de dos proporciones, es necesario definir un nuevo contraste de hipótesis que sea aplicable en aquellas situaciones en las que el número de medias se quieren comparar sea superior a dos. Es por ello por lo que el Análisis de la Varianza, ANOVA surge como una generalización del contraste para dos medias de la t de Student, cuando el número de muestras a contrastar es mayor que dos.

Por ejemplo, supóngase que se tienen 3 muestras de diferentes tamaños que se suponen que provienen de tres poblaciones normales con la misma varianza:

Para ver el gráfico seleccione la opción "Descargar" del menú superior

Si se quiere realizar el contraste

Es decir que la muestras provienen de poblaciones independientes unas de las otras, se podría plantear como primer método el fijar una cantidad α próxima a cero y realizar los contrastes siguientes con α como nivel de significación:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

De modo que se aceptaría H1 y se rechazaría H0 sólo si alguna de las hipótesis alternativas H1', H1'' ó H1''' es aceptada y rechazada su correspondiente hipótesis nula. El error de tipo I para este contraste es:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Por ello el nivel de significación obtenido para este contraste sobre la igualdad de medias de tres muestras no es como hubiésemos esperado obtener inicialmente, sino. (1 – (1 – α)3) Por ejemplo, si se toma un nivel de significación α = 0,1 para cada uno de los contrastes de igualdad de dos medias, se obtendría que el nivel de significación (error de tipo I) para el contraste de las tres medias es de 1 – 0,93 = 0,27, lo que es una cantidad muy alta para lo que se acostumbra usar.

En consecuencia, no es adecuado realizar el contraste de igualdad de medias de varias muestras mediante una multitud de contrastes de igualdad de medias de dos muestras.

Una técnica que permite realizar el contraste de modo conveniente es la que expone en este trabajo y que se denomina Análisis de la Varianza.

ANOVA con un factor

Se denomina modelo factorial con un factor o ANOVA con un factor al modelo (lineal) en el que la variable analizada va a depender de un sólo factor de tal manera que las causas de su variabilidad son englobadas en una componente aleatoria que se denomina error experimental:

Para ver la fórmula seleccione la opción "Descargar" del menú superior

Considérese una variable sobre la que actúa un factor que puede presentarse bajo un determinado número de niveles, t. Por ejemplo se puede considerar un fármaco que se administra a t = 3 grupos de personas y se les realiza cierta medición del efecto causado:

	Resultado de la medición
Gripe (nivel 1)	5	3	2	5	4	3				n1 = 6
Apendicitis (nivel 2)	8	9	6	7	8	9	10	8	10	n2 = 8
Sanos (nivel 3)	2	3	2	1	2	3	2			n3 = 6

En este caso los factores que influyen en las observaciones son tres: el que la persona padezca la gripe, apendicitis, o que esté sana.

De modo general se pueden representar las t muestras (o niveles) del siguiente modo:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Donde por supuesto, los tamaños de cada muestra ni, no tienen por que ser iguales. En este caso se dice que se trata del modelo no equilibrado.

Observación

De ahora en adelante se asume que las siguientes condiciones son verificadas por las t muestras:

Las observaciones proceden de poblaciones normales;
Las t muestras son aleatorias e independientes. Además, dentro de cada nivel las observaciones son independientes entre sí.
En el modelo de un factor se supone que las observaciones del nivel i, xij, provienen de una variable Xij de forma que todas tienen la misma varianza; Hipótesis de Homocedasticidad:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

o lo que es lo mismo,

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

De este modo μi es el valor esperado para las observaciones del nivel i, y los errores eij son variables aleatorias independientes, con valor esperado nulo, y con el mismo grado de dispersión para todas las observaciones.

Otro modo de escribir lo mismo consiste en introducir una cantidad μ que sea el valor esperado para una persona cualquiera de la poblaciσn (sin tener en cuenta los diferentes niveles), y considerar los efectos αi introducidos por los niveles, de modo que

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Especificación del modelo

Con todo lo anterior, el modelo ANOVA de un factor puede escribirse como

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

y con la siguiente interpretación:

μ es una constante común a todos los niveles;

αi es el efecto producido por el i-ésimo nivel. Al sumarlos todos deben compensarse los efectos negativos con los positivos para que la media común a todos los niveles sea realmente μ. Esto implica en particular que los efectos, αi, de los niveles no son independientes;

eij es la parte de la variable Xij no explicada por μ ni αi, y que se distribuye del mismo modo (aunque independientemente) para cada observación, según la ley Gaussiana:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Ésta es la condición de homocedasticidad, y es fundamental en el análisis de la varianza.

Obsérvese que ahora se puede escribir el contraste de que los diferentes niveles no tienen influencia sobre la observación de la variable como

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

o bien

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Observación

Se utiliza el nombre de análisis de la varianza ya que el elemento básico del análisis estadístico será precisamente el estudio de la variabilidad. Teóricamente es posible dividir la variabilidad de la variable que se estudia en dos partes:

La originada por el factor en cuestión;

La producida por los restantes factores que entran en juego, conocidos o no, controlables o no, que se conocen con el nombre de error experimental.

Si mediante los contrastes estadísticos adecuados la variación producida por cierto factor es significativamente mayor que la producida por el error experimental se puede aceptar la hipótesis de que los distintos niveles del factor actúan de forma distinta.

Ejemplo: Considérese dos muestras tomadas en diferentes niveles de una variable, de forma que ambas tengan la misma varianza muestral (lo que indica que no se puede rechazar la igualdad de varianzas poblacionales) y medias muestrales bastante diferentes. Por ejemplo:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

La dispersión calculada al medir la de los dos niveles conjuntamente es mucho mayor que la de cada uno de ellos por separado. Por tanto puede deducirse que ambos niveles no tienen el mismo valor esperado.

Algo de notación relativa al modelo

A continuación se va a introducir alguna notación para escribir los términos que serán más importantes a la hora de realizar un contraste por el método ANOVA. En primer lugar se tiene:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Usando estos términos se va a desglosar la variación total de la muestra en variación total dentro de cada nivel (intravariación) más la variación entre los distintos niveles (intervariación).

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Donde:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Observación

En el cálculo del estadístico SCT intervienen N cantidades, ligadas por una relación:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

De este modo el número de grados de libertad de este estadístico es N – 1 Por razones análogas se tiene que el número de grados de libertad de SCD es N – t y el de SCE es t –1 Así introducimos los siguientes estadísticos:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Estos son los estadísticos que realmente interesan a la hora de realizar el contraste de igualdad de medias. Cuando la diferencia entre los efectos de los diferentes niveles sea muy baja, es de esperar que la cuasivarianza total sea próxima a la intravarianza, o lo que es lo mismo, que la intervarianza sea pequeña en relación con la intravarianza.

Figura: En la figura de superior no existe una evidencia significativa en contra de que las medias de los tres grupos de observaciones coinciden. En la figura inferior sí.

Para ver el gráfico seleccione la opción "Descargar" del menú superior

RUTINA GENERAL DE UN ANÁLISIS DE VARIANZA

Considérese el contraste

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Y suponiendo que se está en las condiciones del modelo factorial de un factor. Si H0 es cierta se puede demostrar que el siguiente estadístico se distribuye como una de Snedecor:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Luego si al calcular Fexp obtenemos que donde es un nivel de significación dado, deberemos de rechazar la hipótesis nula (ya que si H0 fuese cierta, era de esperar que fuese pequeño en relación con ).

Método reducido para el análisis de un factor

En este apartado se va a resumir lo más importante de lo visto hasta ahora, indicando la forma más sencilla de realizar el contraste. En primer lugar se calculan los siguientes estadísticos a partir de la tabla de las observaciones en cada nivel:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Entonces las siguientes cantidades admiten una expresión muy sencilla:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Se calcula

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Y dado el nivel de significación α buscamos en una tabla de la distribución F de Snedecor el valor

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Se rechaza H0 si Fexp>Fteo, como se aprecia en la Figura

Figura: Región crítica en un contraste ANOVA.

Para ver el gráfico seleccione la opción "Descargar" del menú superior

Ejemplo: Se aplican 4 tratamientos distintos a 4 grupos de 5 pacientes, obteniéndose los resultados de la tabla que se adjunta. Queremos saber si se puede concluir que todos los tratamientos tienen el mismo efecto. Para ello vamos a suponer que estamos en condiciones de aplicar el modelo de un factor

Figura: Se rechaza la hipótesis de que los tratamientos tienen el mismo efecto en los tres grupos.

Para ver el gráfico seleccione la opción "Descargar" del menú superior

En conclusión, Fexp>Fteo, como se observa en la Figura por tanto se ha de rechazar la igualdad de efectos de los tratamientos.

En la Figura se representan las observaciones de cada nivel de tratamiento mediante una curva normal cuyos parámetros se han estimado puntualmente a partir de las observaciones. Obsérvese que las diferencias más importantes se encuentran entre Los tratamientos 2 y 4. Esto motiva los contrastes de comparaciones múltiples (dos a dos), para que, en el caso en que la igualdad de medias sea rechazada, se pueda establecer qué niveles tuvieron mayor influencia en esta decisión.

Figura: Las diferencias más importantes se encuentran entre los niveles 2 y 4.

Para ver el gráfico seleccione la opción "Descargar" del menú superior

Análisis de los resultados del ANOVA: Comparaciones múltiples

Una vez contrastado el que existen diferencias significativas mediante el análisis de la varianza, interesa conocer que niveles del factor son los que han influido más para que se de este resultado. Como ilustración, en el último ejemplo se ve claramente que los tratamientos segundo y cuarto dan resultados muy diferentes, y probablemente de hay venga el que se haya rechazado la igualdad de todos los efectos.

El método más utilizado consiste en realizar todas las comparaciones por parejas:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

lo que corresponde a los ya conocidos contrastes de la t de Student, que tienen en este caso como estadístico experimental a (de nuevo suponiendo la homocedasticidad en todas las muestras):

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Ya que la intravarianza ŜD, es un estimador de con N – t grados de libertad.

ANOVA de Varios Factores

Se ha estudiado el modelo ANOVA de un factor, también denominado modelo de efecto fijo. Existen otros modelos denominados ANOVA de varios factores que no se van a estudiar aquí, pero que van a ser enunciados brevemente.

Como ilustración se puede escribir el modelo ANOVA de dos factores con interacción en el cual se tiene

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Si se supone que no hay interacción entre ambos factores, es decir, cada factor actúa independientemente del otro, se tiene el modelo de efectos aditivos:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

En ambos casos se supone que las cantidades son independientes para todos los niveles i1 e i2 y todos los individuos jdentro de esos niveles, estando equidistribuidos y con la misma varianza según una ley Gaussiana:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

Consideraciones sobre las hipótesis subyacentes en el modelo factorial

Para aplicar el modelo de un factor se ha hecho, entre otras, las siguientes suposiciones:

Las observaciones de cada muestra han de ser independientes y también la de las muestras entre sí. Para ello se puede aplicar cualquiera de los contrastes no paramétricos de aleatoriedad. En principio esta aleatoriedad es algo que es bastante razonable admitir si la metodología para elegir los datos (muestreo) ha sido realizada siguiendo técnicas adecuadas.
Los datos han de ser normales en cada una de las muestras. Esto es algo que debería ser contrastado previamente antes de utilizar el ANOVA de un factor mediante, por ejemplo, el test de ajuste a la distribución normal mediante el estadístico χ2 que ya conocemos, o bien el test de d'Agostino.
Las varianzas de cada muestra son todas iguales, es decir:

Para ver las fórmulas seleccione la opción "Descargar" del menú superior

IMPORTANCIA DEL SOFTWARE EN EL ANÁLISIS DE DATOS

Una de las áreas más afectadas por esta revolución es la Metodología de Investigación, la Estadística y el procesamiento de datos En esta área tiene una importancia notable todo lo relativo a tecnología de los instrumentos y a los programas informáticos específicos para el procesamiento y análisis de los datos. El crecimiento de la producción relativa a estos aspectos es muy grande, y por otro lado, hay mucha instrumentación que no siendo específica de la investigación puede tener una utilidad importante en determinados estudios. Por todo ello incluimos a continuación una relación, en absoluto exhaustiva, de instrumentos y programas informáticos de gran peso en la investigación.

Software de Recolección de Datos

BEHAVE. Permite el registro y tratamiento de datos, ofrece posibilidades de representaciones gráficas y algunos análisis. Behavior Research Methods & Instruments, 9, 452-455, 1977.

BOSS. Facilita el registro de duraciones en tiempo real, frecuencia y secuencia. University of Washington, USA, 1975.

CODEX. Un sistema de registro y almacenamiento de datos que permite trabajar con distintos tipos de datos (Secuencias de eventos, secuencias de estados, secuencias mixtas de estados y eventos, secuencias de intervalos y formatos de campo) ya sea en una situación natural o una situación grabada en soporte magnético (audio o video). Permite trabajar con el flujo de conducta verbal recogido. Exporta los datos a los programas SDIS-GSQ para análisis secuencial, OBSERVER 3.0, y THEME. (Hernández Mendo, 1996b, Hernández Mendo, Anguera & Bermúdez-Rivera, 2000) ( http://www.efdeportes.com/soft.htm )

DATACHRONO. Un sistema portátil de registro y almacenamiento de datos diseñado en Argentina. Jiménez y cols. (1987).

DATAMYTE. Uno de los registros y almacenamiento más conocido con sus más de dos décadas de historia y sucesivas versiones. Electro/General Corporation, Minnesota, USA.

DART. Sistema de registro en tiempo real controlado por computador. Behavioural Psychotherapy, 10, 40-47, 1982.

DCRII. Diseñado para registrar las conductas de recién nacidos y sus cuidadores. Behavior Research Methods & Instruments, 9, 442-446, 1977.

MEL. Micro Experimental Laboratory para diseño y presentación de estímulos diseñado por Pascal. de W. Scheneider (1988). Micro Experimental Laboratory. Behavior Research Methods, Instruments & Computers, 20(2), 206-217.

OBSERVER 3.0. Es un programa orientado hacia el registro de datos en computadores compatibles y que realiza algunos análisis de retardo. Tiene una aplicación adecuada para el sistema CAMERA (Observer's Video Tape Analysis System). Disponible a través de ProGAMMA.

OS3. Registrador de eventos y tiempo de fácil movilidad. Observational Systems Seattle, Washington, USA.

POMS. Versión informática en Turbo Pascal para windows de la escala de estados de humor) realizada por Hernández Mendo y Ramos (1995a) y Hernández Mendo y Ramos (1996a). ( http://www.efdeportes.com/soft.htm )

PROCODER. Sistema para el control de la codificación y análisis de datos cuando se realiza directamente desde vídeo.

REJILLA. Versión informática del ejercicio Grid o rejilla con números realizada en Turbo Pascal para windows por Hernández Mendo, y Ramos, R. (1995b, 1995c) Permite la evaluación y el entrenamiento de la atención amplia-externa y estrecha-externa. ( http://www.efdeportes.com/soft.htm )

PRACS. Permite el registro continuo y análisis de datos de un mismo sujeto facilita la realización de un histograma sobre las frecuencias y duraciones. Errasti, J.M. y Rifá, H. (1990), Departamento de Psicología, Universidad de Oviedo.

TRANSCRIPTOR. Programa para codificación de eventos desde video o audio en tiempo real. Permite registro de producción verbal. Realiza un primer análisis de frecuencias y de medidas primarias. Hernández Mendo, A; Ramos, R.; Peralbo, M.; Risso, A. (1993) y Peralbo, M.; Risso, A.; Hernández, A.; Ramos, R. (1991), Hernández Mendo y Ramos (1996). ( http://www.efdeportes.com/soft.htm )

Software de Análisis

ASR. Uno de los programas más completos para análisis secuencial de retardo; permite recodificaciones y análisis para diseños complejos. Es una versión optimizada del paquete ANSEC de V. Quera, Dpto. de Metodología de las Ciencias del Comportamiento, Universidad de Barcelona.

BMDP. Paquete estadístico de gran potencia para análisis de datos. La versión antigua está bajo entorno de MD-DOS aunque existe una actualización en windows que llama a la antigua versión

CONTIME. Análisis de secuencias en tiempo continuo. W. Gardner, publicado en Multivariate Behavioral Research, 25, 205-206, 1990.

ELAG. Análisis de retardo, facilita recodificaciones, incluye subprogramas para computar fiabilidad (kappa). R. Bakeman, publicado en Behavior Research Methods & Instrumentation, 15, 530-535, 1983.

HYPERCARD. Programa multimedia desarrollado por Apple Computer en 1987 para su uso en computadores Macintosh. El programa es un constructor de software que incluye un amplio conjunto de herramientas (de dibujo, animación, tratamiento de textos, cálculo, base de datos, etc.) que facilita la construcción y administración de test informatizados. Goodman (1987). Permite la utilización de programas generados en distintos lenguajes (Pascal, C, Fortran, etc.). No requiere grandes conocimientos de informática para su uso.

ILOG. Análisis log-lineal para datos categóricos. R. Bakeman y B.F. Robinson publicado en libro-software por LEA, 1994.

LAGS. Programa pionero de análisis de retardo. Sackett et al., publicado en Behavioral Research Methods & Instrumentation, 11,366-378, 1979.

LISREL. Programa que permite realizar análisis de ecuaciones estructurales para falsación de modelos causales.

MADAP. Paquete de programas que incluye una diversidad de tratamientos y análisis de datos. Incorpora una adaptación de ANSEC. Kinapple, publicado en Behavioral Research Methods, Instruments & Computers, 19, 335-337, 1987.

SAMPLE-TEST. Son dos programas que permiten hacer pruebas de orden, homogeneidad y estacionaridad markovianos. Sample construye matrices de transición desde muestras de datos y TEST realiza análisis desde la salida de SAMPLE. Arundale, publicado en Behavioral Method, Instruments & Computers, 16, 335-336, 1984.

SAP. Permite la realización de análisis de retardo y añade el cómputo de kappa como medida de patrones de interacción Wampold, Roll y East, University of Utah, Salt Lake City, Utah, USA.

SATS. Realiza análisis de retardo y otros índices secuenciales con datos de eventos, diseñado para su aplicación en el análisis de transcripciones verbales. P.J. Yoder y J.P. Tap, publicado en Behavior Research Methods, Instruments & Computers, 22, 339-343, 1990.

SBA. Realiza análisis sobre la base de estadísticos de la teoría de la información, modelos log-lineales y técnica de retardo. Schlundt, publicado en Behavior Research Methods & Instruments, 14, 351-352, 1982.

SEQANA. Realiza análisis de tipo markoviano, analizando estructuras K-gramm (secuencias de dos, tres, cuatro, etc. elementos). D. Kazantzidou y F.Welk (1990), producido por Unisolo, Braunschweig, Alemania.

SDIS-GSQ. Son dos programas comprendidos en un mismo paquete. SDIS es un analizador sintáctico de ficheros de datos escritos en un lenguaje propuesto como estándar para el intercambio de datos secuenciales entre investigadores. Los datos son depurados mediante SDIS y transformados en formato máquina sobre el que GSQ realiza pruebas de orden y retardo, permite realizar todo tipo de codificaciones y trabajar con datos concurrentes, así como la agregación o división de datos de acuerdo con variables incluidas en el registro. Ofrece los principales estadísticos de utilización en análisis secuenciales; también se puede computar la fiabilidad mediante kappa. R. Bakeman y V. Quera, publicado en un libro con software incluido por Cambridge University Press, en prensa.

SPAD. Paquete estadístico de gran potencia.

SPSS/PC. Paquete estadístico de gran potencia y de relativo fácil uso, permite realizar todo tipo de análisis estadístico desde estadística descriptiva hasta análisis multivariante como análisis factorial, análisis de varianza ANOVA y MANOVA, análisis de clusters, análisis de correspondencias, etc.

STARTGRAPHICS. Paquete estadístico de gran potencia y fácil uso.

SYSTAT 5.0. Programa de análisis estadístico y gráficos interactivos. AddLink Software

BIBLIOGRAFÍA

BioMates (2003) Procesamiento de Estadístico de Datos Médicos. [Documento en Línea] disponible en: http://es.geocities.com/riotorto/nopa/nopa.htm, [Consulta: 2004, abril 22]

Chao, Lincoln (1999) Estadística para las Ciencias Administrativas. México. Mc Graw-Hill, Tercera Edición

García, A. Navarro, H. y R. Vélez (1995) Estadística II. Madrid UNED

Siegel Sidnay y John Castellan N. Estadística No Paramétrica; Aplicada a las ciencias de la conducta. México. Editorial Trillas

Universidad de Málaga (s/f) Bioestadística; Métodos y Aplicaciones. Malaga – España. Facultad de Medicina. Universidad de Málaga. [Documento en línea] Disponible en: http://ftp.medprev.uma.es/libro/html.htm, [Consulta: 2004, abril 22]

Hernández Mendo, Antonio y Raúl Ramos Pollán (2001) ¿Qué es la informática aplicada a las ciencias del deporte? [Documento en línea] disponible en: http://www.efdeportes.com/efd33a/informa2.htm, Revista Digital – Buenos Aires – Año 6 – N° 33 – Marzo de 2001, [Consulta: 2004, abril 23]

Realizado por:

Lic. José Pérez Leal

Profesor de Estadística Aplicada a la Educación y de Probabilidad y Estadística Inferencia – UPEL – Maracay – Venezuela