Cuidado con las convergencias sorprendentes y sospechosas
Imaginemos el siguiente diálogo:
Oliver: … Y vemos así que donar a la ópera es la mejor manera de promover las artes.
Eleanor: De acuerdo, pero a mí me interesa principalmente promover el bienestar humano.
Oliver: ¡Oh! Pues yo creo que donar a la ópera también es la mejor manera de promover el bienestar humano.
En general, lo que es mejor para una cosa no suele ser lo mejor para otra, por lo que la afirmación de Oliver de que las donaciones a la ópera son lo mejor para las artes y para el bienestar humano es sorprendente. Podemos sospechar un sesgo: que la afirmación de Oliver de que la ópera es lo mejor para el bienestar humano está motivada principalmente por su entusiasmo por la ópera y su deseo de encontrar razones a favor, y no por una búsqueda más fría y objetiva de lo que es realmente lo mejor para el bienestar humano.
El resto de este ensayo trata de establecer mejor lo que pasa (y lo que falla) en casos como este. Está dividido en tres partes. La primera examina la “estadística” de la convergencia: ¿en qué circunstancias es sorprendente que un objeto se considere mejor a la luz de dos consideraciones diferentes? La segunda examina con más detenimiento la afirmación de que hay un sesgo involucrado: cómo puede fundamentarse y cómo debe tenerse en cuenta. La tercera retoma el ejemplo anterior y analiza la prevalencia de este tipo de error “dentro” del altruismo eficaz y lo que se puede hacer para evitarlo.
Imaginemos dos consideraciones, X e Y, y un campo de objetos a considerar. Para cada objeto, podemos puntuarlo por lo bien que funciona a las luces de las consideraciones de X e Y. A continuación, podemos representar cada objeto en un diagrama de dispersión, asignando cada eje a una consideración concreta. ¿Qué aspecto podría tener?
En un extremo, las dos consideraciones no tienen ninguna relación, por lo que el diagrama de dispersión no muestra ninguna asociación. Saber lo bien que le va a un objeto a la luz de una consideración no dice nada sobre cómo le va a la luz de otra, y la probabilidad de que el objeto que obtiene la puntuación más alta en la consideración X también obtenga la puntuación más alta en la consideración Y es bajísima. Llamemos a esto convergencia nula.
En el otro extremo, las consideraciones están perfectamente correlacionadas y el gráfico de “dispersión” no tiene dispersión, sino una línea recta. Sabiendo lo bien que le va a un objeto según la consideración X nos dice exactamente lo bien que le va según la consideración Y, y el objeto que obtiene la puntuación más alta según la consideración X es con toda seguridad el que obtendrá la puntuación más alta según la consideración Y. Llamemos a esto convergencia fuerte.
En la mayoría de los casos, la relación entre dos consideraciones se ubicará entre estos extremos: llamemos a esto convergencia débil. Un ejemplo es que exista un sentido general de aptitud física, por lo que la velocidad a la que se puede correr y la distancia a la que se puede lanzar están algo correlacionadas. Otro ejemplo sería la inteligencia: las distintas capacidades mentales (discriminación de tonos, memoria de trabajo, vocabulario, etc.) están correlacionadas en cierta medida entre sí.
Más relevante para el altruismo eficaz: también parece haber una convergencia débil entre diferentes teorías morales y diferentes áreas de trabajo. Lo que (digamos) el kantismo juzga positivamente tiende a ser juzgado positivamente por el utilitarismo: aunque hay excepciones bien discutidas a esta regla, ambos suelen estar de acuerdo en que (entre otros muchos ejemplos) la agresión, el robo y la mentira son malos, mientras que la amabilidad, la caridad y la integridad son buenos.a A grandes rasgos, lo que es bueno para (digamos) la pobreza global es generalmente bueno para el futuro lejano, y lo mismo vale para dos áreas de trabajo cualesquiera dentro del altruismo eficaz.b
En casos de convergencia débil, los puntos formarán algún tipo de dispersión elíptica, y saber qué puntuación tiene un objeto en X nos dice algo sobre qué puntuación tiene en Y. Si sabemos que algo tiene la puntuación más alta en X, nuestra expectativa de su puntuación en Y debería moverse hacia arriba, y la probabilidad de que también tenga la puntuación más alta en Y debería aumentar. Sin embargo, la probabilidad absoluta de que sea lo mejor para X y también lo mejor para Y sigue siendo baja, por dos razones principales:
Compensaciones: Aunque las consideraciones X e Y tienen por lo general una correlación positiva, puede haber una correlación negativa en el extremo de la cola, debido a los intentos de optimizar para X o Y a un costo desproporcionado para Y o X. Aunque en la población general correr y lanzar estarán positivamente correlacionados, los atletas de élite pueden optimizar su entrenamiento para una u otra actividad y, por esta razón, los que se especializan en lanzar y los que se especializan en correr divergen. De forma parecida, podemos pensar que hay margen para un mecanismo similar de optimización cuando lo que está en juego es la selección de causas o de organizaciones benéficas.
Azar: (c.f.) Incluso en los casos en los que no hay compensaciones, mientras las dos consideraciones sean en cierto grado independientes, las fluctuaciones aleatorias normalmente garantizarán que lo mejor según la consideración X no será lo mejor según la consideración Y. Que X e Y solo converjan débilmente implica que hay otros factores importantes para Y además de X. Para el único objeto que es el mejor para X, habrá muchos más que no lo serán (aunque sean muy buenos), y de este gran número de objetos es probable que uno sea lo suficientemente bueno en estos otros factores para acabar siendo el mejor para Y en términos generales. Podemos confirmar este punto observando la mayoría de los pares de variables correlacionadas: quienes tienen un coeficiente intelectual más alto que la media tienden a ser más ricos, pero las personas extremadamente inteligentes no son también extremadamente ricas (y viceversa); servir rápido es bueno para el tenis, pero los mejores servidores del mundo no son también los mejores jugadores (y viceversa); etcétera. En términos visuales, la mayoría de los diagramas de dispersión se abomban en una elipse en lugar de afilarse en un punto.
Las siguientes características hacen que sea más probable que un único objeto obtenga la máxima puntuación en dos consideraciones:
En la mayoría de los casos (incluidos los relevantes para el altruismo eficaz), hay una gran población de objetos, convergencia débil y (a pesar de las distribuciones de cola pesada a menudo involucradas) es poco común que una cosa sea la mejor desde la perspectiva de dos consideraciones débilmente convergentes.
En el caso de que no tengamos nada para juzgar lo que es bueno para Y salvo saber lo que es bueno para X, nuestra mejor estimación de lo que es mejor para Y es lo que es mejor para X. Así, la ópera es la mejor conjetura de lo que es bueno para el bienestar humano, si la única información es que es mejor para las artes. En este caso, cabe esperar con muy alta probabilidad que nuestra mejor conjetura sea incorrecta. Aunque es más probable que cualquier alternativa similar en este ámbito reducido (“¿donaciones a la ópera o donaciones al Factor X?”), su probabilidad absoluta en relación con el resto del espacio de las hipótesis es muy baja (“¿donaciones a la ópera, u otra cosa?”).
Por supuesto, normalmente disponemos de más información. ¿Por qué no buscar directamente qué es bueno para el bienestar humano, en lugar de buscar qué es bueno para las artes? A menudo, buscar Y directamente en lugar de un indicador indirecto débilmente convergente dará mejores resultados: si uno quiere seleccionar un equipo de relevos, seleccionar en función de la velocidad de carrera en lugar de la distancia de lanzamiento parece una mejor estrategia. Así, descubrir que una intervención concreta (por ejemplo, Against Malaria Foundation) ocupa el primer lugar cuando se busca qué es bueno para el bienestar humano proporciona evidencia mucho más sólida de que es mejor para el bienestar humano que descubrir que la ópera ocupa el primer lugar cuando se busca qué es bueno para una consideración débilmente convergente.c
Eleanor podría sospechar que la afirmación de Oliver a favor de la ópera está motivada por un sesgo. La probabilidad de que la ópera sea lo mejor tanto para las artes como para el bienestar humano es baja, incluso teniendo en cuenta su débil convergencia. La probabilidad de que el sesgo y la cognición motivada hayan distorsionado el juicio de Oliver es mayor, especialmente si Oliver tiene compromisos previos con la ópera. Tres preguntas: 1) ¿Afecta esto cómo Eleanor debe considerar los argumentos de Oliver? 2) ¿Debería Eleanor seguir hablando con Oliver y, si lo hace, debería sugerirle que está siendo sesgado? 3) ¿Hay algo que Eleanor pueda hacer para asegurarse de no cometer un error similar?
Supongamos que Eleanor tiene razón en que Oliver está siendo sesgado. ¿Y qué? Eso no implica que Oliver esté equivocado ni que los argumentos que ofrece en su apoyo no sean sólidos: podría estar sesgado y tener razón. Sería un caso de falacia genética (o quizá ad hominem) argumentar lo contrario. Sin embargo, esto no es todo: las “falacias” informales suelen ser herramientas epistémicas valiosas; no solo deberíamos prestar atención al contenido de los argumentos ofrecidos, sino también a “metadatos” de la argumentación como las cualidades del argumentador.d
Veamos un ejemplo. Supongamos que no estás seguro de que Dios exista. Una simpática apologista cristiana local te presenta las razones por las que (en su opinión) la balanza de la razón favorece claramente al teísmo frente al ateísmo. No sería prudente juzgar los argumentos únicamente “por sus méritos”: por diversas razones, es probable que la apologista cristiana haya sesgado las pruebas que presenta a favor del teísmo; la impresión que dará de dónde está el equilibrio de la razón no coincidirá mucho con dónde está realmente. Aunque sus argumentos te parezcan persuasivos, deberías descartarlos al menos en parte a la luz de lo que sabes de tu interlocutora.
En algunos casos, puede ser razonable descartar “de plano” las fuentes por su sesgo sin entrar en el fondo de la cuestión: podemos pensar que el valor probatorio de las razones que ofrecen, muy atenuado por el sesgo previsto, no merece la pena por los riesgos de error sistemático si nos equivocamos en el grado de sesgo presente (que, por supuesto, es muy difícil de estimar); alternativamente, puede que sea una mejor selección de nuestros limitados recursos epistémicos ignorar a los partidarios e intentar encontrar fuentes imparciales que nos proporcionen un mejor panorama de la balanza de la razón.
Entonces: ¿debería Eleanor dejar de hablar con Oliver sobre este tema? A menudo, no. En primer lugar (o quizá en un lugar anterior), existe la posibilidad de que se equivoque al decir que Oliver está siendo sesgado, y seguir hablando le permitiría averiguarlo. En segundo lugar, puede haber razones tácticas: tal vez quiera persuadir a terceros que presencian la conversación. En tercer lugar, puede suponer que seguir discutiendo es la mejor forma de persuadir a Oliver, a pesar del sesgo que lo mueve. En cuarto lugar, aún puede beneficiar a Eleanor: aunque el sesgo puede debilitar la fuerza de las razones que ofrece Oliver, estas podrían aún proporcionarle información valiosa. Si uno se empeña demasiado en descartar totalmente lo que dice la gente basándose en evaluaciones de posibles sesgos (que suelen estar parcialmente influidas por determinaciones de nivel objeto sobre diversas cuestiones), uno corre el riesgo de atrincherarse en las propias creencias.
Otra cuestión relacionada es si es prudente que Eleanor acuse a Oliver de tener un sesgo. Hay algunas dificultades. Los sesgos abundan, por lo que resulta fácil hacer acusaciones cruzadas: (“Creo que estás sesgado a favor de la ópera debido a tu compromiso previo”/“Bueno, yo creo que estás predispuesta en contra de la ópera debido a tu concepción reduccionista e insuficientemente holística del bien”). Pueden derivar hacia lo personalmente desagradable (“Te preocupas por el cambio climático solamente porque te acuestas con un ecologista”) o lo pasivo-agresivo (“Me empieza a preocupar que la gente que no está de acuerdo conmigo ofrezca argumentos realmente malos como cortina de humo para ocultar sus evidentes prejuicios”). También puede resultar difícil lograr avances en la discusión. Oliver puede afirmar que su compromiso tuvo lugar después de su determinación de buena fe de que la ópera era realmente lo mejor para el bienestar humano y las artes. Muchas de estas afirmaciones son erróneas (quizá la mayoría lo sean), pero puede ser difícil saber (o demostrar) cuáles.e
Puede que Eleanor quiera mantener una “vigilancia interna” para evitar cometer un error similar al de Oliver. Una pista es la sorprendente falta de propagación de las creencias: cambiamos de opinión sobre ciertos asuntos y, sin embargo, nuestras creencias sobre asuntos estrechamente relacionados se mantienen sorprendentemente inalteradas. En la mayoría de los casos en los que alguien se convence de (por ejemplo) el altruismo eficaz, predecimos que esto debería propagarse y producir cambios profundos en las opiniones de esta persona sobre dónde es mejor donar dinero o cuál es la mejor carrera profesional que puede seguir. Si Eleanor descubre que en su caso esto no sucede, que en su caso el hecho de estar convencida de la importancia del futuro lejano no se propaga para cambiar su carrera profesional o sus donaciones, sino que se manifiesta en una proliferación de razones secundarias que apoyan su comportamiento anterior, debería sospechar de esta sorprendente convergencia entre lo que pensaba que era mejor entonces y lo que es mejor ahora a la luz de consideraciones muy diferentes.
Pocos altruistas eficaces defienden seriamente la ópera como una causa prioritaria dentro de la comunidad. Sin embargo, el problema general de respaldar la convergencia sorprendente y sospechosa sigue siendo frecuente. He aquí algunos ejemplos provocativos:
Todos comparten características similares: uno tiene compromisos previos con una determinada acción o área de trabajo. Uno se percata de una nueva consideración que influye considerablemente en estos compromisos. Sin embargo, los compromisos no cambian y, en su lugar, surgen argumentos auxiliares para luchar por la retaguardia en defensa de esos compromisos previos: en lugar de ajustar los compromisos a la luz de la nueva consideración, se intenta poner la consideración al servicio de los compromisos.
Naturalmente, que algunos intenten justificarse no excluye que otros sean razonables, y la presencia de patrones sospechosos de creencia no los vuelve injustificados. Uno puede (por ejemplo) focalizarse en la pobreza global negando los argumentos a favor del futuro lejano (favoreciendo una perspectiva centrada en las personas afectadas, entre muchas otras posibilidades) o afirmando que hay consideraciones aún más fuertes a favor de la pobreza global (tal vez un énfasis en la incertidumbre moral y el desacuerdo entre pares y, por lo tanto, juzgando que la consideración decisiva es el consenso moral mucho más amplio en torno a combatir las enfermedades tropicales por sobre (por ejemplo) investigar el riesgo asociado a la IA).
Además, en el caso de las afirmaciones más débiles, la convergencia es mucho menos sorprendente. Si alguien dijera en nombre del veganismo: “Es lo mejor para el bienestar animal, pero también es generalmente mejor para el medio ambiente y la salud personal que las dietas carnívoras. Es cierto que es peor desde el punto de vista del gusto; no obstante, es claramente superior cuando se consideran todos los aspectos”, esto parece mucho menos sospechoso (y también mucho más cierto) que la afirmación de que es lo mejor de acuerdo con todas estas métricas. Sería sorprendente que la dieta óptima para la salud personal no incluyera al menos algunos productos de origen animal.
Dejando a un lado las advertencias, sin embargo, estas líneas de argumentación son sospechosas, y un examen más detenido agrava las sospechas. En resumen, primero se señalan algunos beneficios que el compromiso anterior tiene a la luz de la nueva consideración (por ejemplo, que promover el bienestar animal fomenta el antiespecismo, lo que probablemente hará que la trayectoria del futuro lejano vaya mejor), y en segundo lugar se menciona cuán especulativo sería hacer búsquedas basadas en la nueva consideración (por ejemplo, que es muy difícil averiguar qué podemos hacer para beneficiar el futuro lejano).f
El hecho de que el argumento tienda a concluir aquí sugiere la existencia de una interrupción motivada, porque aunque los beneficios de nivel objeto de (digamos) la pobreza global no son especulativos, sus presuntos beneficios de flujo en el futuro lejano sí lo son. Sin embargo, nadie se toma el trabajo de mostrar que esto es menos especulativo que los esfuerzos por trabajar “directamente” en el futuro lejano.g Del mismo modo, incluso si es cierto que la mejor manera de hacer que el futuro lejano vaya mejor es promover un indicador indirecto, ¿cuál de todos? Tampoco se toma nadie el trabajo de explicar por qué (por ejemplo) el bienestar animal es el indicador indirecto más confiable entre los competidores.h Como punto en contra adicional, es sospechoso que quienes mantienen que la pobreza global es el mejor indicador indirecto tengan casi exclusivamente compromisos previos con causas relacionadas con la pobreza global, o mutatis mutandis el bienestar animal, etcétera.
Tenemos al menos una idea rudimentaria de qué características de las intervenciones de (por ejemplo) bienestar animal las hacen valiosas para el futuro lejano. Si este fuera (supuestamente) el principal valor de las intervenciones de bienestar animal, debido a la importancia abrumadora del futuro lejano, parecería sensato intentar elegir intervenciones que maximizaran estas características. Así que llegamos a una recursión: dentro de las intervenciones de bienestar animal, se esperaría que los beneficios “de nivel objeto” y “de futuro lejano” solo convergieran débilmente. Sin embargo (sorprendente y sospechosamente) las intervenciones de bienestar animal recomendadas desde la perspectiva del futuro lejano suelen ser las mismas que las recomendaciones “de nivel objeto”.
Si Oliver estuviera sesgado, ciertamente no sería el único. La mayoría de nosotros somos (nos guste o no) al menos algo parciales, y nuestras convicciones están en parte motivadas por razones extra-epistémicas: ya sean intereses creados, mantener ciertas relaciones, afiliaciones de grupo, etc. En pos de estos fines defendemos nuestras creencias frente a todas las consideraciones que se esgrimen en su contra. Pocas creencias son infalibles desde la perspectiva de cualquier opinión razonable, y pocas recetas políticas son panaceas. Sin embargo, todas las nuestras lo son.
No es de extrañar que surjan los mismos problemas en el altruismo eficaz: un caso particular de “fingir que realmente se intenta” es “fingir que realmente se toman en serio los argumentos”.i Estos problemas parecen prevalecer en toda la comunidad del altruismo eficaz: que no se me ocurrieran buenos ejemplos para áreas de trabajo meta o de futuro lejano se explica probablemente por un sesgo de mi parte o por un efecto de selección: si estas cosas fueran menos esotéricas, fallarían más a menudo.j
No hay una solución “interna” fácil, pero repito mis recomendaciones a Eleanor: por regla general, mantener el diálogo, presumir la buena fe, considerar los méritos del argumento y escuchar a los demás parece una estrategia mejor, incluso si pensamos que el sesgo es endémico. También merece la pena subrayar que la amplia (aunque débil) convergencia entre áreas de trabajo es un terreno común fértil, y un área prometedora para el intercambio moral. Aunque es poco probable que lo mejor desde el punto de vista de un área de trabajo sea lo mejor desde el punto de vista de otra, es bastante probable que sea bastante bueno. Por lo tanto, la mayoría de las actividades de los altruistas eficaces en un campo concreto deberían contar con una amplia aprobación y apoyo por parte de los que trabajan en otros.
Yo también soy un pecador. En el pasado, ofrecí exactamente el mismo tipo de argumentos sospechosos en nombre de la pobreza global. También estoy bastante seguro de que mi decisión de continuar una carrera en medicina tampoco se ajusta a los méritos, aunque puede que acabe siendo un beneficiario de la suerte moral. Me resisto a acusar a individuos concretos de cometer los errores que identifico aquí. Pero, en la medida en que los lectores puedan pensar que lo que digo se aplica a ellos, les pido a que lo piensen de nuevo.
Gracias a Stefan Schubert, Carl Shulman, Amanda Askell, Owen Cotton-Barratt y Pablo Stafforini por sus extensos comentarios y consejos. Su amable ayuda no debe interpretarse como aprobación del contenido ni como responsabilidad por posibles errores.