CARTA #4: correlación no implica causalidad...pero sí un Nobel
🍫 Come chocolate, llegarás lejos🏅 #DíaEuropeodelaEstadística
🎼 Lista de reproducción de Spotify de la newsletter
«Up to 1889 men of science had thought only in terms of causation, in future they were to admit another working category, that of correlation, and thus open to quantitative analysis wide fields of medical, psychological and sociological research»
Karl Pearson (1930)
✉️ LA MISIVA: un premio Nobel a la falacia estadística más famosa
Como seguramente sabrás, durante los últimos 14 días se han entregado los premios Nobel, galardones que no cuentan con un premio en matemáticas (tampoco en estadística), y quizás por eso los flamantes galardonados en Economía sean los que más cerca hemos sentido tras el concedido a John F. Nash. El premio lo recibieron David Card (Universidad de California) por «sus contribuciones empíricas en la economía del trabajo», y a Joshua D. Angrits (MIT) y Guido W. Imbens (Stanford) por «sus contribuciones metodológicas en el análisis de las relaciones causales», según la nota de prensa de la academia.
Si sigues a matemáticos/as y estadísticos/as en redes, nos habrás escuchado hasta la saciedad el eslogan «correlación no implica causalidad». Y es precisamente este mantra el que une a los tres galardonados, por aportar herramientas que nos ayudan a determinar los casos en los que SÍ la implica. Y es que determinar la causa o efecto de una actuación ha sido uno de los grandes retos de campos como la economía. ¿Invertir más en servicios públicos disminuye la desigualdad? ¿Un aumento del salario mínimo aumenta el desempleo?
¿Hay realmente un mecanismo causal que nos diga que X implica Y?
Empecemos por el principio.
📊 ¿A qué llamamos correlación en estadística?

Te presento al primo de Charles Darwin, Francis Galton: estadístico, psicólogo, geógrafo y eugenésico (Galton acuñó el término). También fue el primero en proponer métodos de clasificación de huellas dactilares, inventó el silbato de ultrasonidos y se le atribuye el primer mapa meteorológico. Galton mostró una especial fascinación por «el origen de las especies» de su primo. Mientras que Darwin se centraba en los «mejor adaptados» , Galton hacía enfásis en los que él llamaba «mediocres». Para Galton, el Pérez Reverte de la época, las sociedades modernas estaban fomentando esa mediocridad, interfiriendo en la selección natural e impidiendo que los mediocres se extinguieran (ver [1]). Según Stigler (1997), era tal su obsesión que estudió el talento en sagas familiares de la ciencia y el arte, como los Bernoulli o los Bach, concluyendo que el talento se diluía.
En 1886 Galton publicó Regression towards Mediocrity in Hereditary Stature, el artículo que cambiaría la estadística moderna, haciendo el primer uso conocido de la recta de regresión y de la correlación estadística. En dicho artículo Galton analizaba la estatura de 205 hijos y sus padres, observando que «lo extremo» se disipaba: había una «regresión a la mediocridad» (mediocridad entendida como media), hijos de progenitores altos eran más bajitos en media, y al revés. Apoyado en el método de mínimos cuadrados, Galton propuso estimar una variable Y a partir de otra X a través de una recta (regresión lineal). Con este método no solo observó que las estaturas «regresaban» a un parámetro medio sino que lo hacían con un factor constante de 2/3: si los padres se desviaban +3 por encima de la media, sus hijos se desviaban (2/3) * 3 = +2 por encima (y sus nietos (2/3) * (2/3) * 3 = +1.333, «regresando» a la media).
Aunque su uso esté hoy totalmente extendido, dicha recta de regresión solo debía usarse bajo ciertas hipótesis en los datos, y la principal de ellas es que la relación que haya entre las dos variables sea lineal (afín si somos rigurosos con el álgebra - gracias, Mike). De entre todas las rectas posibles que se podrían ajustar a los datos, Galton encontró la mejor de las rectas (menor error) pero...¿y si el modelo a ajustar no es una recta? ¿Y si la mejor recta posible sigue ajustando mal?
Galton fue el primero en fantasear con el concepto de co-relación, aunque fueron K. Pearson y G. U. Yule quienes definieron formalmente e interpretaron lo que hoy conocemos como CORRELACIÓN LINEAL: un valor que nos permite evaluar si la relación entre dos variables es modelizable mediante una recta. Este coeficiente fue un antes y un después ya que proporcionaba una escala en cuánto a la fortaleza de dicha linealidad: al ser siempre un valor entre -1 y 1, cuánto más se alejase del 0, más fuerte sería (valores cercanos a los extremos implica una fuerte asociación de las variables en torno a una recta). Dicho valor es muy útil en estadística PERO solo nos habla de relación lineal, así que durante los años posteriores Pearson y Yule se dedicaron a estudiar el concepto de correlación en un sentido amplio de dependencia o asociación (lineal o no, causal o no).

Según Pearson, esta correlación o asociación debía ocupar el rol central de la ciencia que antaño había ocupado la causalidad (mal interpretada). Como reseña J. Aldrich en su memorable crónica de la correlación, era tal su obsesion que para su tercera edición del famoso «The Grammar of Science» (ver [2]), Pearson añadió una nueva sección titulada «The Category of Association, as replacing Causation»:
«It is this conception of correlation between two occurrences embracing all relationshisp from absolute independence to complete dependence, which is the wider category by which we have to replace the old idea of causation»
Karl Pearson, 1910, The Grammar of Science.
Pearson también fue muy crítico con la interpretación de la correlación (association) como un indicio de causalidad, vaticinando (Pearson and Elderton, 1923) que «las correlaciones tan altas, cuando se interpretan como relaciones causales o semicausales, son demasiado propensas a ser maliciosas», acuñando el término «correlaciones espurias», aquellas sin relación causal evidente. Veamos un ejemplo sencillo: helados y bronceado. Imagínate analizar la relación entre la venta de helados en verano y el bronceado de la piel. Existe una obvia asociación entre las variables, ya que ambas tienen el mismo patrón de crecimiento: ambas variables están correladas. ¿Pero eso implica que existe una relación causal?
¿Comer helados te broncea? ¿Ponerte moreno te aumenta el apetito de helados? Salvo que comas helados de zanahoria, no parece: la relación entre ambas viene motivada por la relación Verano —> Helado y Verano —> Bronceado.
Hablemos del elefante en la habitación: hablemos de causalidad.
🔙 ¿Cómo se define la causalidad?
Una de las grandes dificultades para definir la causalidad es que excede los límites matemáticos. Como nos muestran los ejemplos de Spurious Correlations es muy sencillo encontrar con una correlación estadística muy elevada.

¿Cuál es la diferencia matemática entre la fuerte asociación del consumo de margarina y divorcios, y la que pudiera haber entre el aumento de inversión pública y la disminución de la desigualdad? He ahí la cuestión: ninguna. La diferencia radica en que no hay ningún razonamiento formal plausible de que comer margarina provoque divorcios.
¿Cómo definir entonces la causalidad?
Uno de los más mencionados al respecto es Hans Reichenbach (filósofo pero también físico), que en 1956 estableció su Reichenbach’s Common Cause Principle (RCCP): si dos variables son estadísticamente dependientes, entonces (a) X causa Y, (b) Y causa X, o (c) existe una tercera variable Z, una causa común, que causa tanto X como Y. En opinión del tecnólogo agroalimentario y filósofo científico, Óscar Teixidó Durán, este principio de causa común es «parcialmente cierto, ya que Reichenbach habla de cómo detectamos la causalidad». Para Óscar «la causalidad es una interacción entre eventos o sucesos, no entre cosas, y se caracteriza por ser una interacción unidireccional y asimétrica». Dichas cadenas de causalidad «tampoco tienen porque ser infinitas, dado que hay leyes estocásticas y espontáneas, no tiene porqué existir una cadena causal recursiva ni una que lleve a un motor inmóvil inicial e inmaterial (Dios)».
El debate de qué es la causalidad no solo ha dado quebraderos de cabeza a los filósofos sino que juega también un papel central en ciencias como la medicina, la farmacología o la psicología. Para Alicia Franco, psicóloga, psicómetra, y divulgadora en Twitter y Twitch, «la causalidad impregna la psicología a dos grandes niveles: (1) entre variables ya medidas y (2) en la propia forma de medir variables psicológicas». ¿Cómo estudiar en psicología si una terapia (A) causa bienestar (B)? «Podemos buscar dos grupos de personas y medir su bienestar inicial. A un grupo le doy una terapia A y a otro no (grupo control). Después de un tiempo, vuelvo a medir el bienestar: si el bienestar tuvo un aumento significativamente mayor en el grupo experimental (el que recibió terapia) respecto al grupo control, podemos decir que la terapia “causa” bienestar (A causa B)».
El segundo punto al que se refiere Alicia es sobre cómo medimos lo que medimos. «En Psicología tenemos un grandísimo reto: nuestras variables no son observables directamente (son latentes). Por ejemplo, no puedo observar la inteligencia de alguien, solo las consecuencias de esta sobre sus conductas observables. Los modelos que más usamos en Psicología asumen que es ese constructo latente el que “causa” las conductas que sí podemos observar. Pero asegurar que se da esa relación causal “constructo —> conductas” sigue siendo una tarea pendiente»
Una de las definiciones más aceptadas dentro de la inferencia causal es la del filósofo Judea Pearl: X es una causa de Y si Y escucha a X y decide su valor en función de lo que escucha (ver [3-4]). Esta definición intervencionista lleva implícita tres conceptos: una asociación (correlación no implica causalidad, pero sin correlación no puede existir), un orden temporal (X precede a Y) y la ausencia de una correlación espuria (si cambio X, Y responderá de forma correspondiente).
Es en esos «cambios» para comprobar si Y escucha donde las contribuciones de los premiados han supuesto una auténtica revolución en el uso de experimentos naturales en la economía y las ciencias sociales. ¿En qué se diferencia la inferencia asociativa de la causal? ¿Cómo saber si X causa Y?
🏅Un premio Nobel para la inferencia causal
- ¿Era mejor estar con Teresa o quedarse solo?
- No hay forma de probar qué decisión es mejor, porque no hay base para la comparación […] ¿Y qué puede valer la vida si el primer ensayo de la vida es la vida misma?
La insoportable levedad del ser (Milan Kundera)
Este diálogo bien podría servir para definir el principal problema a resolver en la inferencia causal. Imaginemos el proceso de encender una bombilla 💡
Hay una correlación (asociación) evidente entre la luz y accionar el interruptor, el interruptor debe encenderse antes para que la bombilla funcione (orden temporal) y la física nos dice que es plausible que un interruptor ponga en un funcionamiento un circuito que acabe encendiendo la bombilla (no es espuria). ¿Es el interruptor la causa de que la bombilla se encienda? Alguien podría pensar que no, argumentando que además de un interruptor, necesitamos un sistema eléctrico, una toma de corriente, una planta de generación eléctrica, etc.
¿Cómo saber si X causa Y? Lo que propone la inferencia causal (en concreto la jerarquía causal ver-hacer-imaginar de Pearl) es considerar un universo paralelo, un universo contrafáctico, en el que todo sea igual salvo…que X esta vez no existe. ¿Qué sucedería en un universo paralelo en el que todo fuese igual salvo que el interruptor está apagado? La luz no se encendería, ergo el interruptor es la causa directa y última del encendido (pueden existir múltiples causas).
¿Por qué ha sido tan importante el trabajo de los premiados? En el ejemplo anterior es muy sencillo generar un universo imaginario en el que todo permanece igual salvo el interruptor. Pero en campos como la política o la economía, como en el diálogo de Kundera, no siempre es posible (ni ético) generar esa comparación paralela. En 2012 F. H. Messerli publicó «Chocolate Consumption, Cognitive Function, and Nobel Laureates» en el que muestra una asociación fuerte entre el consumo de chocolate y el número de premios Nobel por habitante de distintos países.
¿Basta esta asociación (correlación de 0.79) para establecer una relación causal? Siguiendo el ejemplo de la bombilla, para poder determinar dicha relación tendríamos que atiborrar a Portugal a chocolate, esperar unas décadas, y ver si el número de premios Nobel aumenta significativamente. Este universo paralelo no nos permitiría calibrar un efecto causal individual (no podemos rebobinar la vida de una persona que no ganó el Nobel, ahogarle en chocolate, y ver qué sucedería) pero si lo que Miguel Hernán llama en su libro «Causal Inference: What If» el efecto causal agregado: el promedio de los efectos causales en una población de individuos. ¿Es factible realizar este experimento? ¿Es ético?
En muchos casos la respuesta será no, ya que como indicaban Ignacio Jurado y Sebastián Lavezzolo en un artículo del pasado 13 de octubre, «a diferencia de lo que sucede en un laboratorio en las ciencias naturales, la capacidad de intervenir en la realidad de los economistas, los politólogos o los sociólogos para poner a prueba determinadas hipótesis es bastante limitada». Por ejemplo, a la hora de determinar una causalidad entre el sistema electoral de un país y sus índices de participación, Jurado y Lavezzolo explican que no es un trabajo sencillo, «tampoco podemos llamar a Pedro Sánchez por teléfono para pedirle que aplique un sistema electoral en determinadas Comunidades Autónomas y no en otras para que así podamos estudiar sus diferencias». La principal contribución metodológica de los premiados fue demostrar que, aunque no fuese factible generarlos ad hoc, si que era posible encontrar ejemplos naturales, ejemplos casi experimentales con los que poder trabajar. «Lo que sí podemos hacer es aprovecharnos de todas aquellas circunstancias en donde de forma natural […], un accidente histórico o un evento inesperado ha cambiado determinados factores en algunas áreas» permaneciendo invariables en otras.
El objetivo de dichos experimentos naturales lo explicaba perfectamente Kiko Llaneras en su última newsletter, a la cual os recomiendo encarecidamente estar suscrito. «La idea esencial de los premiados fue el experimento natural. Para entenderla, es útil dar un paso atrás y pensar cómo se resolverían todas las preguntas causales: la solución sería tener universos contrafácticos. ¿Quieres averiguar el efecto de vacunar a una persona? Bastaría generar dos universos idénticos, en uno vacunarla y en el otro no. Como hacer eso es imposible, los científicos usan un plan B, que son los experimentos con grupo de control».
En el caso de David Card se hace explícito en el premio sus contribuciones a la economía del trabajo, y en particular, el experimento natural que llevo a cabo junto con Alan Kruger en un artículo de 1993. En dicho artículo se analizaba la subida del salario mínimo de 4.25$ a 5.05$ por hora en New Jersey, preguntándose si la subida del salario mínimo acarreaba un aumento del desempleo como postulaban la mayoría de economistas. Para ello estudiaron 410 restaurantes de comida rápida, antes y después de la subida, pero también en la vecina Pennsylvania, donde dicha subida no se había producido (su universo contrafactual). Su conclusión fue un contraejemplo al mantra predominante: no se observaba un efecto causal entre el aumento del salario mínimo y el aumento del desempleo (en ese caso concreto).
Un trabajo similar fue el de Joshua D. Angrist, con su artículo «Lifetime Earnings and the Vietnam Era Draft Lottery: Evidence from Social Security Administrative Records», en el que analizaba el efecto en el salario provocado por ser llamado al frente. No podían obligar a nadie a retroceder en el tiempo e ir la guerra, y tampoco era ético obligarles por el mero hecho de experimentar que les sucedía, así que comparó los ingresos entre los jóvenes que fueron elegidos (y obligados) al azar en el famoso sorteo de la guerra de Vietnam (Draft de 1969 y siguientes), y los que se libraron. La historia de dicho sorteo ya te la conté aquí en un hilo 🧶
Gracias a su trabajo, la investigación en ramas como la economía o la socióloga se acercó a lo experimental de forma rigurosa, dejando a un lado intuiciones y prejuicios. Un trabajo que les ha valido un Nobel.
📰🧠 DATOS ESTOCÁSTICOS
Tan solo el 6 % del total de premiados en la historia de los Nobel han sido mujeres (solo 1 de los 13 premios de este año).
Aunque los Nobel no tienen categoría en matemáticas sí lo han ganado en otras categorías matemáticos como Nash o Echegaray.
La semana pasada también se conoció el Premio Planeta 2021, un premio literario que concede la editorial Planeta cuyo/a ganador/a recibe una dotación de 1 millón de euros (frente a los 980 000 euros de los Nobel). Su «ganadora» fue Carmen Mola, que en realidad no se llamaba Carmen sino Jorge-Agustín-Antonio, tres guionistas que se hicieron pasar por una autora falsa.
📚 BIBLIOTECA (ADEMÁS DE LA ENLAZADA)
[1] Ensayo (eugenésico :/) sobre el talento heredado según F. Galton de 1865 [ENSAYO EN PDF]
[2] Libro «The Grammar of Science» (3ª edición) de K. Pearson en 1910.
[3] Libro «Causal Inference in Statistics: A Primer» de J. Pearl, M. Glymour y N. P. Jewell en 2016.
[4] Artículo científico «Causal inference in statistics: An overview» de J. Pearl en 2009 [ARTÍCULO EN PDF]
💡 PARA AMPLIAR
Curso gratuito «Causal Diagrams: Draw Your Assumptions Before Your Conclusions» de Miguel Hernán, epidemiólogo, bioestadístico en Harvard y especializado en inferencia causal.
Artículo científico «Thinking Clearly About Correlations and Causation: Graphical Causal Models for Observational Data» de J. M. Rohrer en 2018 [ARTÍCULO EN PDF]
📦 PAQUETERÍA
Paquetes dagitty y ggdag para el análisis y generación de diagramas causales.
🙏AGRADECIMIENTOS: a Óscar y Alicia por colaborar, y al grandioso Mike por su revisión.
Hasta aquí. Gracias por leer y por estar.
¿Me ayudas a que llegue a más gente reenviando esta newsletter y compartiéndole en tus redes sociales?
Viendo lo que declaraba Pearson en The Grammar of Science, me estoy haciendo la idea de que por la decada de 1910 estaba de moda una visión radical de la causalidad. Bertrand Russell, en 1912, decía algo como que la de la causa es una noción absoleta y, además, que parece sobrevivir porque, tal y como ocurre con la monarquía, la gente erroneamente asume que no hace daño.
Aquí el artículo de Russell: https://www.jstor.org/stable/4543833#metadata_info_tab_contents
y aquí unos comentarios sobre el mismo, casi 70 años después: https://www.jstor.org/stable/40231124#metadata_info_tab_contents