El tren a la ciudad de la locura

por Richard Yetter Chappell
Altruismo eficazConsecuencialismoÉtica normativaLargoplacismoUtilitarismo

Hace cinco años, Ajeya Cotra describió de forma memorable el razonamiento del altruismo eficaz como un “tren a la ciudad de la locura”, en el que los largoplacistas, en particular, permanecen a bordo más tiempo que sus colegas centrados en el corto plazo. No es una metáfora perfecta, pero sospecho que lo que resuena en mucha gente es la sensación de que el razonamiento abstracto al estilo del altruismo eficaz puede empujarte en direcciones hacia las que quizá no querías ir inicialmente (es decir, en contra de tus simpatías naturales), lo cual puede resultar alienante o incluso amenazador.⁠⁠a

Incluso antes, allá por 2015, Scott Alexander escribió sobre el dilema de que o bien no deberíamos preocuparnos en absoluto por los animales no humanos, o bien estos deberían eclipsar por completo cualquier otra preocupación moral. No hay ninguna posibilidad realista de que la ponderación moral correcta resulte ser, convenientemente, ese valor exacto necesario para justificar un enfoque equilibrado sobre la base de criterios de primer orden. Su respuesta fue interrumpir toda esa línea de razonamiento abstracto a fin de conservar su cordura. De hecho, creo que es una respuesta bastante buena, pero me gustaría intentar darle un respaldo más fundamentado, uno que acaba teniendo una consecuencia sorprendente: que quizá las teorías morales no estén destinadas a guiarnos a nosotros directamente en absoluto.

Como primer paso, quiero destacar lo importante que es que las personas se sientan libres de no actuar según sus creencias. Puede que no suene ideal, pero es una barrera de seguridad práctica que resulta esencial para proteger la indagación imparcial. Al impartir clases de ética aplicada, especialmente sobre temas como las donaciones benéficas o el consumo de carne, observo que los estudiantes universitarios recurren al razonamiento motivado más evidente porque sienten que deben defender sus acciones actuales. Apuesto a que avanzaríamos más en materia moral como sociedad si la gente se sintiera más cómoda diciendo: “Sí, no hago todo lo que debería en este ámbito. Está en mi lista de tareas morales pendientes”. Y luego asegurarte de que esa lista de tareas se priorice de forma sensata. Tu siguiente paso podría implicar entonces hacer mucho más bien del que probablemente harías si te quedaras estancado racionalizando tu comportamiento actual, sin disposición ni siquiera a plantearte en qué aspectos podría mejorar y mucho menos a priorizar entre las muchas oportunidades de mejora moral.

Así pues: deja que tus creencias vuelen libremente y si no te gusta adónde te llevan, simplemente no actúes en consecuencia. Es tu prerrogativa. Pero sí creo que deberíamos hacer verdaderos esfuerzos por ser intelectualmente honestos e intentar descubrir qué es verdad. Y, con suerte, eso nos ayudará a identificar mejoras marginales significativas que podamos aportar a los demás con un bajo costo personal.

Volviendo al tren del razonamiento abstracto, hay dos grandes preocupaciones:

(1) Efectos de saturación, que conducen a desatender los intereses de las personas actuales

(2) Fomentar comportamientos fanáticos o extremistas (desatendiendo los riesgos negativos)

Mi tesis es que ambas pueden abordarse con éxito mediante la aplicación adecuada de la distinción entre la teoría ideal y la práctica imperfecta (que, como notarás, ya hemos aplicado una vez en el análisis anterior). El principal reto es introducir las barreras de seguridad adecuadas al llevar la teoría a la práctica para limitar los riesgos negativos sin restringir simétricamente⁠⁠b el potencial de la reflexión racional.

Otros piensan diferente. Un destacado largoplacista se hizo famoso por respaldar las apuestas existenciales de “doble o nada”: afirmó que aceptaría un 49 % de probabilidades de destruir el mundo a cambio de un 51 % de probabilidades de duplicarlo, junto con todo el valor que contiene. Más tarde se hizo aún más famoso por apostar con los depósitos de sus clientes, viajando en el tren en cuestión hasta la cárcel federal.

Como filósofo moral, me interesa la cuestión de cuándo resulta útil guiarse por el razonamiento moral abstracto y cuándo deberíamos ser más cautelosos y conservadores. Si hay algo que saben los filósofos es que a la mente humana a menudo le cuesta identificar el fallo en una cadena de razonamiento superficialmente plausible. Si nos comprometiéramos a aceptar cualquier conclusión cuyo argumento no pudiéramos refutar lógicamente, seríamos presas fáciles, a merced de cualquiera con mayor habilidad analítica que nosotros.

Pero si hay una segunda cosa que sabemos, es que históricamente la deferencia irreflexiva hacia el sentido común socialmente convencional ha propiciado desastres morales: la esclavitud, la homofobia, la cría intensiva de animales. Sería una coincidencia extraordinaria que nuestra generación fuera la primera cuya sabiduría convencional fuese moralmente perfecta. Así pues, tenemos dos modos de fallo opuestos de los que protegernos: la presa fácil y el dogmático; mi pregunta es cómo equilibrar mejor estos riesgos.

Considero que el altruismo eficaz es, básicamente, “filosofía moral aplicada”. Mientras que la mayoría de los movimientos sociales defienden determinados intereses o valores predefinidos, el altruismo eficaz es neutral respecto a las causas y se preocupa por el bien abstracto, lo que lo transforma en un movimiento abierto a una gama inusualmente amplia de objetivos concretos. Creo que la primera parada habitual —que combina la preocupación moral cosmopolita con el interés por la evidencia real de eficacia— goza de un amplio reconocimiento como una mejora con respecto a las donaciones comunes basadas en meros sentimientos. Pero a la gente le preocupa llevar el tren de la optimización moral más lejos. Una cosa es dar prioridad a los pobres del mundo frente a las personas sin hogar locales. Y otra muy distinta es dar prioridad a las gambas, a las mentes digitales o a los riesgos especulativos para la seguridad de la IA. Y eso sin siquiera entrar en las preocupaciones sobre el extremismo violento.

Por eso quiero explorar nuestras opciones para mitigar los inconvenientes de la optimización moral y el razonamiento abstracto, sin perder las ventajas más valiosas. La gente suele sentirse tentada por el razonamiento de “todo o nada”, pero creo que hay mucho que decir a favor de la moderación y los compromisos imperfectos. Mi camino hacia esta conclusión pasa por tomarnos en serio nuestra incertidumbre filosófica y nuestra falibilidad: pasar de la teoría ideal a la no ideal. Pero la cuestión de cuál es la mejor manera de hacerlo nos plantea nuestro primer gran punto de decisión.

Incertidumbre moral

Supongamos que nos debatimos entre múltiples teorías morales, interpretaciones sobre qué entidades son verdaderamente sintientes u otras “cosmovisiones” generales. La forma en que respondamos a esta incertidumbre puede variar mucho dependiendo de si optamos por maximizar la conveniencia esperada de la elección o por la diversificación de la cosmovisión. Lo primero implica una agencia centralizada, que sopesa la importancia de lo que está en juego en cada opción en proporción a la credibilidad de la teoría que se la asigna y que luego, potencialmente, lo apuesta “todo” por la opción que ofrezca la mejor perspectiva en términos esperados. Quizá sea un buen enfoque para agentes ideales, pero (en mi opinión) demasiado arriesgado para el resto de nosotros. La segunda alternativa descentraliza y delega el poder o los recursos a un conjunto de subagentes que representan diferentes cosmovisiones filosóficas en proporción aproximada a su credibilidad.⁠⁠c Fíjate en cómo cambia esto el panorama habitual: las teorías morales no me guían directamente a mí; guían a los subagentes en los que he delegado esas cosas. (Volveré sobre esto más adelante). Por su diseño, esto evita la “saturación” moral: se puede garantizar fácilmente que cualquier cosmovisión creíble mantenga cierto poder y capacidad de acción para mejorar el mundo según sus propios criterios.

Soy un gran defensor de la diversificación de la cosmovisión: creo que es la solución para agentes falibles y no ideales, como lo somos todos. No solo evita las preocupaciones por la saturación, sino que también evita el problema opuesto del dogmatismo convencional que ignora nuevos desastres morales. Podemos tener un subagente que vele por las gambas, otro que vele por el futuro a largo plazo y otro más que se centre en las formas más sólidas y fiables de mejorar el bienestar humano hoy en día. Los recursos que asignemos a cada uno pueden variar en proporción a la credibilidad que le otorguemos a la cosmovisión filosófica subyacente de cada subagente. Y creo que quien emprenda este proceso de forma responsable puede sentirse bastante seguro de que va a hacer mucho bien al mundo, o al menos de que no pasará por alto gratuitamente ninguna oportunidad al alcance de la mano.

Eso no quiere decir que este enfoque sea óptimo. Simplemente que es difícil estar seguro de qué alternativa lo superaría. No quiero desanimar necesariamente a nadie que esté más dispuesto personalmente a apostarlo todo por un área de trabajo desatendida y de gran impacto (el bienestar de las gambas, por ejemplo). Sobre todo si imaginas cómo sería tu cartera moral ideal a nivel de toda la sociedad, es muy posible que descubras que “apostarlo todo” por la más desatendida de tus áreas de trabajo ideales sea —en los márgenes actuales— en realidad la mejor manera de diversificar la cartera moral de la sociedad y compensar el erróneo descuido de otros respecto a causas importantes.

Pero sí creo que no deberíamos querer que la sociedad lo apueste todo por una sola área de trabajo —el largoplacismo especulativo, por ejemplo—, incluso si esta pareciera tener un valor esperado mayor que la diversificación. Creo que hay varias razones para ello. Una de ellas implica protegerse por principio frente al riesgo de un desastre derivado de un error de cálculo (especialmente si consideramos una probabilidad a priori por defecto de valor marginal decreciente para el financiamiento concentrado en las áreas de trabajo; me parece plausible que el cálculo objetivamente correcto del valor esperado respalde cierto grado de diversificación, mientras que nuestros cálculos subjetivos del valor esperado podrían equivocarse fácilmente al omitir esto). Aunque el razonamiento basado en el valor esperado sea objetivamente ideal, no podemos confiar en que el cerebro humano lo aplique correctamente. Necesitamos una cartera más diversa.

Parte de mi motivación aquí puede ser simplemente una reticencia pura y dura a seguir el hilo del argumento hasta ciertos destinos si parecen demasiado descabellados. Pero incluso eso puede respaldarse con principios, ya que las intuiciones viscerales a menudo codifican mucha información subconsciente que es difícil de captar y modelar de forma explícita. Por lo tanto, una vez más, esto se reduce en última instancia a mantener cierto grado de desconfianza escéptica frente al razonamiento abstracto y los cálculos. Debemos tenerlos en cuenta en cierta medida, para protegernos contra los desastres morales desatendidos, pero una especie de sumisión ciega al 100 % también conlleva el riesgo de un desastre. Una ponderación intermedia, basada en el buen juicio, me parece un enfoque general mucho más seguro.

Comparación de riesgos

Es importante reconocer que el pensamiento convencional dista mucho de estar exento de riesgos, dado su rechazo rotundo a causas inusuales como el bienestar de las gambas y el largoplacismo. Dada la escala de lo que está en juego, no se trata solo de que desatender estas cuestiones podría, en teoría, resultar moralmente desastroso. A menos que se disponga de evidencia suficiente para respaldar una confianza abrumadora en el rechazo de las visiones del mundo según las cuales estas causas revisten una inmensa importancia, dicho rechazo es un desastre en términos esperados. (Podemos reconocer este hecho sin depositar una confianza excesiva en ningún cálculo preciso).

Vale la pena subrayar esto porque la gente suele partir de su falta de familiaridad con estas áreas de trabajo para concluir que justificar siquiera su apoyo exige compromisos filosóficos sumamente extraños y distintivos. Pero, en realidad, ocurre justo lo contrario. Cualquier visión adecuadamente agnóstica y moderada del espacio de posibilidades implicará que tenemos razones muy sólidas para apoyar estas áreas de trabajo en las que es verosímil que haya muchísimo valor en juego. Es el rechazo el que realmente requiere de puntos de vista muy especializados para poder justificarse.

(Si estás estableciendo una analogía con el hecho de ser asaltado por probabilidades minúsculas, creo que en la práctica marca una gran diferencia si realmente tenemos razones suficientemente buenas para considerar que las afirmaciones especulativas son sustancialmente creíbles. Las cifras inventadas no cumplirán los requisitos automáticamente. Determinar si una afirmación especulativa concreta es genuinamente creíble es un juicio subjetivo: responde a la evidencia y a los argumentos, pero no se resuelve con ningún algoritmo que yo pueda ofrecerte. Y ten en cuenta que la representación proporcional de los subagentes limita las consecuencias negativas: una visión del mundo a la que no debería haber dado cabida solo obtiene su pequeña porción, en lugar de acaparar toda la cartera como podría ocurrir bajo la maximización del valor esperado o de la conveniencia esperada de la elección).

Mi argumento es que la visión más sensata y moderada no destina ni el 0 % ni el 100 % de nuestros recursos morales colectivos a causas especulativas extrañas. Todos deberíamos aspirar a un enfoque más equilibrado y, por lo tanto, reflexionar sobre cómo nuestras contribuciones marginales podrían acercarnos a ese objetivo.

Así pues, hay un tipo de razonamiento especulativo que puedo aceptar y que, según mi opinión, la gente en general también debería aceptar: el que amplía nuestras opciones y nos protege frente a una gama más amplia de posibles desastres morales.

Hay un tipo muy diferente de razonamiento especulativo que, en mi opinión, debería confinarse a las aulas de filosofía y no debería afectar nuestra práctica. Se trata, a grandes rasgos, del razonamiento que tiende a limitar nuestras opciones y a dejarnos más vulnerables ante los riesgos negativos y posibles desastres morales. Algunos ejemplos son:

  • Apuestas existenciales a doble o nada
  • Conectar los cerebros de las personas a máquinas de experiencias
  • Violencia / deserción social (p. ej., robar para dar, asesinato)

Es un argumento muy habitual en la tradición utilitarista que los cálculos instrumentalistas ingenuos que justifican infringir las normas en aras del bien mayor tienden a ser poco fiables (pues suelen ser fruto de un razonamiento motivado o de otros errores, más que de un cálculo objetivamente preciso). Dado que desde dentro no podemos saber si nos equivocamos, sencillamente no podemos confiar en los resultados de modos de pensamiento como este, que resultan convenientes pero por lo general erróneos. Una vez que tenemos esto en cuenta, descubrimos que el valor esperado de orden superior de un comportamiento de dudosa reputación que infrinja las normas es casi siempre negativo.

Una buena prueba consiste en preguntarse si el sentido común reconocería la propia situación como una excepción legítima a la norma habitual o no: como mentirle al asesino que llama a la puerta. Hay dos razones para valorar esta prueba: una es que el sentido común puede codificar información heurística valiosa.⁠⁠d La otra razón, más cínica, es que el sentido común determinará cómo reaccionen los demás y, por tanto, los costos reputacionales de la acción.

De modo que ese respaldo práctico a algo parecido a las restricciones deontológicas de sentido común (aunque, en última instancia, esté justificado por motivos pragmáticos más que intrínsecos) es, en mi opinión, la forma en que podemos abordar las preocupaciones sobre el comportamiento extremista a la luz de creencias en las que hay mucho en juego.

Este es otro punto en el que quiero detenerme un momento, porque el discurso público al respecto es dolorosamente estúpido. Hay gente en Twitter que afirma que calificar a la IA como riesgo existencial constituye una incitación a la violencia contra los directores generales de las empresas de IA. Me parece que se delatan a sí mismos si están tan convencidos del instrumentalismo ingenuo como para no notar siquiera la brecha que hay entre reconocer lo mucho que está en juego y recurrir a la violencia. Es desconcertante, porque es innegable que en el mundo hay mucho en juego —en política, por ejemplo— y debe ser posible reconocer esta verdad sin por ello apoyar el asesinato político.

¿Cómo es posible? Aquí es donde los malos filósofos recurren a la deontología: “Solo tenemos que rechazar el consecuencialismo”, dicen, “y ya no habrá tentación alguna de recurrir a medios indebidos para alcanzar fines buenos”. Ese es un razonamiento erróneo porque pasa por alto el hecho de que la deontología moderada (hoy en día nadie defiende el absolutismo) también exige realizar la mejor acción cuando hay mucho en juego, que es precisamente el escenario que nos ocupa. Así pues, la deontología no sirve de ayuda.

La verdadera solución es más epistémica que moral. Lo que necesitamos es que la gente rechace el instrumentalismo ingenuo y llegue a creer sinceramente que recurrir a medios indebidos sería contraproducente para alcanzar fines buenos. En última instancia, se trata de una creencia empírica, pero —al igual que preferir la democracia liberal a la dictadura— creo que es una convicción que claramente deberíamos mantener como una expectativa muy sólida. Aunque haya posibles excepciones, no deberíamos esperar poder identificarlas de manera fiable por adelantado.

Conclusión

Así pues, esa es mi respuesta al extremismo: rechazar el instrumentalismo ingenuo. Vimos que mi respuesta a la saturación consistía en apelar a la diversificación de la cosmovisión (en lugar de maximizar la conveniencia esperada de la elección) como nuestro método para hacer frente a la incertidumbre filosófica. Ambas son soluciones prácticas que se imponen al darnos cuenta de que no podemos confiar en que razonaremos a la perfección. Además, son soluciones que sirven como barreras de seguridad asimétricas: limitan el riesgo a la baja sin restringir de forma simétrica el potencial al alza.

Cuando combinamos estas dos soluciones, ya no hay nada que temer de la ciudad de la locura. De hecho, es un error pensar que tenemos que elegir un único destino en la línea de tren y poner todos los huevos en la misma cesta. En su lugar, deberíamos (al menos colectivamente) diversificar y asegurarnos de que toda cosmovisión filosófica creíble pueda ejercer un poder y una influencia proporcionales para mejorar el mundo. En lugar de ser, como temía Scott Alexander, una “serie de excepciones sin principios”, creo que podemos considerar razonablemente esta postura como metaóptima, ya que tiene en cuenta la incertidumbre de orden superior, a pesar de que ninguna cosmovisión identificaría el compromiso resultante como óptimo por razones de primer orden.

Un viajero se encuentra en un cruce ferroviario con múltiples vías que conducen a diferentes destinos, incluyendo la “Línea de la Costa de las Mareas”, el “Expreso Estelar”, el “Expreso a la Ciudad de la Locura” y la “Línea de los Lugares Tranquilos”. Cada vía muestra un paisaje distinto, desde atardeceres costeros hasta paisajes urbanos futuristas, con un cartel que dice: “La vida es un cruce. Elige una vía. Disfruta del viaje.”

Estas reflexiones prácticas sugieren una curiosa consecuencia teórica. Resulta que el papel de las teorías morales y las “cosmovisiones” afines no es el de guiarnos directamente como agentes morales, sino más bien el de guiar a nuestros subagentes. Esta forma de estructurar la conexión entre teoría y práctica tiene una tendencia beneficiosa hacia la moderación y, en mi opinión, hacia aprovechar la oportunidad al alcance de la mano que ofrece el razonamiento abstracto, limitando a la vez los riesgos a la baja. Estas son mis reflexiones. Espero con interés conocer las suyas.⁠⁠e


Publicación original: Richard Yetter Chappell (2026) The train to crazy town, Effective Altruism Forum, 30 de junio.

a b c d e