Asociación, causalidad, estadística y sexología
La cadena televisiva Channel 4 ha realizado una encuesta entre mil británicos sobre algunas cuestiones de su sexualidad. El trabajo está disponible a través de la web y su visualización a base de gráficos interactivos está muy bien lograda. Desde la página de Sexperience 1000 elegiremos una de las preguntas en la encuesta, relacionadas con datos demográficos, preferencias, frecuencia o filias y las combinaremos con otros parámetros, variables, que nos permitirán filtrar los resultados. Por ejemplo, podremos saber si los varones que escuchan música pop tienen su primera relación sexual antes que las mujeres del mismo grupo, o si la marca del coche se asocia con un número de enfermedades de transmisión sexual.
Un interesante juego de datos combinado con gráficos atractivos y un tema que siempre tiene tirón. ¿Pero qué podemos deducir de los datos?
Para poder responder a la pregunta, primero tendremos que saber qué tipo de datos tenemos sobre la mesa. Porque no vale lo mismo lo que nos cuente alguien sobre cómo el paracetamol que el perfil farmacodinámico de ese fármaco obtenido por muestras seriadas dentro de un ensayo aleatorizado. Así pues existen diferentes niveles de "valor de los datos" y en función del valor que tengan los datos así será el valor que tenga nuestro estudio de los mismos. Es lo que llamamos Calidad de la Evidencia o Niveles de Evidencia y que podemos medir con diferentes escalas con nombres tan terroríficos como CTFPHC, OCEBM o GRADE.
Por lo tanto el tipo de datos que tengamos va a condicionar el tipo de estudio que podamos hacer. Así, si tenemos datos que hemos obtenido en una encuesta por la calle (como es el caso) sólo podremos hacer un estudio transversal, también llamado de prevalencia. ¿Y es malo un estudio transversal?
Todos los tipos de estudios tienen sus limitaciones y sus ventajas. Los estudios de transversales son baratos y rápidos de hacer, nos dan capacidad para obtener una muestra de buena calidad, nos sirven para estimar prevalencias y estudiar múltiples variables resultado (enfermedad-exposición). Pero a su vez son un tipo de estudio que los investigadores sólo utilizan para hacer planteamientos iniciales y para identificar frecuencias poblacionales de enfermedades que no sean raras o de curso muy rápido. Y es que el mayor problema que tienen los estudios de prevalencia es que no nos permiten establecer causalidad (decir que esto produce aquello).
Y es que para que admitamos una relación de causalidad tienen que cumplirse varios aspectos que sólo pueden comprobarse cuando tenemos datos de tipo longitudinal (a lo largo del tiempo). Se les conoce como Criterios de Causalidad de Bradford-Hill en honor a un epidemiólogo inglés que además de redactarlos los utilizó para ser el primero en demostrar que el tabaco produce cáncer de pulmón. Son carne de pregunta MIR desde hace años y si queréis conocerlos más a fondo podéis pasaros por el análisis que hice en "Hoy he aprendido que..."
En definitiva, los estudios que generan más ruido son habitualmente los estudios de prevalencia financiados con fondos privados de partes interesadas. Porque es muy fácil manipular los datos obtenidos de un muestreo transversal para que "digan" lo que nos interesa ante un público sin conocimientos estadísticos. Así podremos vender ideas como que quienes compran una determinada marca tienen más éxito en el trabajo o que comprar un coche te llevará a la felicidad. Pero sólo hace falta un poco de lógica y una lista con los Criterios de Bradford-Hill para sonrojar a más de un publicista ingenioso.
Este tema ya lo hemos comentado también al hablar de las gráficas de Hans Rosling, aunque quedó tapado por la Falacia Ecológica.
Deja un comentario