Por: Luis Alejandro Montenegro
En el marco de la investigación cuantitativa, en muchos casos una de las dificultades que enfrenta un tesista o investigador es la elección de la prueba estadística adecuada para dar respuesta a su hipótesis de trabajo o preguntas de investigación. En general las bases conceptuales estadísticas no están del todo claras o simplemente no se recuerdan claramente (hace mucho tiempo vi eso, pero no me recuerdo) lo cual dificulta su correcta aplicación.
En este breve escrito sugiero tomar en cuanta algunos aspectos esenciales que ayuden a la elección de la prueba estadística correcta, tales como: 1) alcance de la investigación 2) pregunta de investigación (que da lugar al planteamiento de hipótesis), 3) cantidad y calidad de los datos obtenidos 4) las variables del estudio.
En primer lugar, se debe tomar en cuenta la naturaleza o alcance de nuestra investigación, si es de carácter exploratoria, descriptiva, correlacional o explicativa (Sampieri, 2006). Una vez que se tiene claridad sobre el alcance de nuestra investigación debemos poner atención a la pregunta de investigación pues de ésta se desprenden las hipótesis que deseamos contrastar, las pruebas de hipótesis dan respuesta a la pregunta de investigación. Una pregunta de investigación bien formulada orienta de manera importante en la definición de las variables del estudio (operacionalización).
El otro elemento importante que debemos tomar en cuenta es la cantidad y calidad de los datos obtenidos. En cuanto a la cantidad debemos saber que para pruebas estadísticas paramétricas, se recomienda que el número de observaciones debe ser al menos 30 (n>30) y contar con los supuestos de normalidad. En caso de que no se cumplan estos supuestos se deben aplicar pruebas no paramétricas. El tamaño muestral debe ser representativo de la población que estamos estudiando y es recomendable éste no sea a criterio o juicio del investigador, esto aplica solo para cuando se requiere hacer inferencias sobre la población.
En cuanto a la calidad de los datos supone el cumplimiento de los siguientes aspectos: validez de los datos, eliminación de posibles sesgos en la recolección, tamaño muestral acorde al alcance de la investigación (que sea representativo) y por último, pero no menos importante, la aleatoriedad en la recolección de estos. Por último, las variables que se definieron para la recolección de los datos en el cuadro de operacionalización, son un factor fundamental para poder aplicar las pruebas de hipótesis correctas.
Ejemplo: se desea conocer si existe alguna relación entre el peso corporal y el consumo de licor en un grupo de hombres en una comunidad. La hipótesis que deseamos comprobar, por ejemplo, es que los hombres que ingieren mayor cantidad de licor tienen mayor peso corporal que los aquellos que no ingieren licor. Las variables que debemos usar para la recolección de los datos deben ser continuas y no categóricas, puesto que la variable consumo de licor si tiene categorías de respuesta tales como: a) Bebo mucho b) Bebo poco c) Bebo muy poco d) No bebo, estaría dando pie a la subjetividad de la respuesta por parte encuestado y no se podría cuantificar la cantidad de licor exacta que ingiere para poder relacionarlo con su peso corporal.
Es decir, el diseño de las variables es sumamente importante medir lo que se necesita en un contraste de hipótesis estadístico. En muchos casos el investigador desea probar una hipótesis pero sus variables no cumplen con las condiciones mínimas para hacer la prueba y es demasiado tarde cuando se dan cuenta de ésto. En consecuencia, sugiero siempre hacer un buen diseño metodológico, una correcta definición de preguntas de investigación y variables.