miércoles, 4 de junio de 2014

ERRORES COMUNES EN LA APLICACIÓN DE LA ESTADÍSTICA A LA INVESTIGACIÓN

ERRORES COMUNES EN LA APLICACIÓN DE LA ESTADÍSTICA A LA INVESTIGACIÓN
Ing. Luis Manfredo Reyes

Cuando se aplica la estadística a conjuntos de datos, tanto para la parte descriptiva como para la inferencial, se cometen algunos errores que se han ido prolongando a lo largo de los años. Incluso los expertos en el tema caen en ellos. Se pretende discutir cada uno de ellos en el presente documento.



1. LA RELIGION DEL 95% DE CONFIANZA
Trabajar con 95% de confianza en loa procesos de análisis es algo que ha sido adoptado tan severamente por la mayoría de investigadores, que casi alcanza el nivel de religión. Debido a que en estadística inferencial la única forma de tener 100% de confianza sería estudiar la población entera, se recurre al uso de muestras para el estudio, porque casi siempre no es posible efectuar un estudio de la población completa.

Pero cuando se trabaja con muestras, existe una incertidumbre en los resultados, debido a que DE UNA MISMA POBLACIÓN SE PUEDEN EXTRER MUCHAS MUESTRAS. La forma de medir el grado de certeza que se tiene con los resultados, es con una probabilidad de éxito llamada Nivel de Confianza, en contraposición a una probabilidad de fracaso llamada Nivel de Significancia.

No está claro en la historia el porqué se adoptó el 95% de confianza. Algunos autores indican que el primero en utilizar éste dato fue Ronald Fisher (el inventor del diseño experimental).

En cierta ocasión, un grupo de tesistas me solicitó asesoría para su trabajo de graduación, y debido a los resultados obtenidos, decidimos trabajar con 99% de confianza. En el exámen de graduación, uno de los presentes dijo que "éste trabajo no sirve, porque no fue trabajado al 95% de confianza". Sin embargo, una de las tesistas le respondió que "99% de confianza es mejor que 95%, por eso se utiilizó".

También hay que aclarar que: 95% es un buen nivel de confianza, pero no existe ningun motivo de peso estadístico para utilizarlo en una investigación, ni mucho menos otorgarle el nivel de "sagrado".

En resumen, se puede decir que EL INVESTIGADOR TIENE DERECHO DE ESCOGER CUALQUIER NIVEL DE CONFIANZA QUE DESEE. Pero somos obligados a trabajar con 95%.

2. LA DESGRACIA DE LA NO SIGNIFICANCIA
Al realizar una prueba de hipótesis, se calcula un estadístico de prueba (Z, t, Chi cuadrado, F) y se contrasta contra uno obtenido de una tabla. Si el valor absoluto del calculado es mayor que el valor absoluto del tabulado, se rechaza la hipótesis nula, en caso contrario se acepta la hipótesis.

Una experiencia que he tenido muchas veces,  es que cuando se acepta la hipótesis, el investigador (especialmente tesista), solicita apoyo para "manosear" los datos, a efecto de lograr la significancia.

Esto es un error, el investigador debe ser neutral. No hay obligación ni de aceptar ni de rechazar la hipótesis, pero en caso de aceptarla, se deben tener los argumentos técnicos para explicar lo sucedido.

También es común que en algunas universidades o facultades, se descalifican  trabajos en los que no se rechaza la hipótesis nula. Esto es otro error.

3. EL COEFICIENTE DE VARIACIÓN ELEVADO
Otra costumbre que se ha incrustado en el ámbito de la investigación es que, cuando el coeficiente de variación obtenido en un experimento es alto (mayor del "sagrado" 20%), se concluye que "el experimento fue mal manejado".

Error!!!!

En un diseño experimental, el coeficiente de variación únicamente indica el grado de control que se ha tenido sobre el error experimental.

Si el coeficiente de variación sale alto, la explicación más razonable es que HAY FACTORES QUE NO FUERON CORRECTAMENTE CONTROLADOS.
Claro que ésto incluye la posibilidad del mal manejo, pero no es esa la única explicación.

Conozco casos de experimentos que hay sido manejados muy cuidadosamente, y aún así se han obtenido coeficientes de variación elevados.Esto se debe a variaciones muy grandes en los datos dentro de los mismos tratamientos

Y conozco otros experimentos que han sido casi dejados en el abandono, y al final se han tenido coeficientes de variación bajos.

Por otro lado, el uso del 20% como límite es producto de otra costumbre. NO HAY JUSTIFICACIÓN ESTADÍSTICA PARA SU USO. Depende del fenómeno en estudio. En ciertos casos se podría bajar y en otros subir.


No hay comentarios:

Publicar un comentario