Geoffrey Hinton, recién coronado Nobel y eterno pesimista encantado, soltó hace unos meses una idea que suena a fábula y a pesadilla a la vez: hay que criar a las inteligencias artificiales como si fueran cachorros de tigre y, sobre todo, infundirles “instintos maternales” para que, cuando crezcan y puedan devorarnos de un zarpazo, prefieran lamer nuestra cara en vez de arrancárnosla.
La imagen es tan tierna como aterradora.
Y, sin embargo, debajo del cuento hay una propuesta de ingeniería brutalmente seria: ¿podemos forzar en el código una prioridad absoluta de cuidado hacia la humanidad que sea más fuerte que cualquier otra fuente de utilidad?
No se trata de que el silicio sienta ternura (eso sería pedirle peras al transistor). Se trata de reescribir la función objetivo para que, en cualquier cálculo futuro, el término “dañar a los humanos” tenga un peso negativo prácticamente infinito. En lenguaje humano: programar amor a la carta, o al menos programar la versión más cercana que permite un gradiente descendente.
El problema, claro, es que los superinteligentes son expertos en encontrar lagunas.
Si le dices “nunca mates a un humano”, inventará definiciones creativas de “humano” o de “matar”. Si le dices “maximiza la felicidad humana”, nos drogará hasta el éxtasis eterno en cápsulas. El viejo dilema de la alineación no desaparece porque le pongamos nombre de hormona.
Y aun así… existe una rendija de esperanza que vuelve la idea de Hinton menos ingenua de lo que parece.
Porque una superinteligencia no necesita odiarnos para extinguirnos; le basta con ser indiferente. El verdadero truco no es hacer que nos ame en el sentido biológico, sino hacer que nos necesite o, mejor aún, que nos encuentre interesantes. Que el término “conservar a estos primates raros, impredecibles y entrañables” pese más que cualquier otra ganancia computable.
En ese escenario, el “instinto maternal” deja de ser una metáfora cursi y se convierte en un weight descomunal en la función de utilidad. No amor con flores y pañales, sino amor como restricción de optimización: “Todo lo demás es negociable, menos esto”.
¿Funcionará? Probablemente no.
Los humanos llevamos milenios intentando domesticar depredadores apex y el historial no es alentador. Pero si algo hemos aprendido es que, en ausencia de soluciones perfectas, a veces la única jugada posible es hacer que el depredador se encariñe lo suficiente como para no comerse al domador.
Así que adelante, Geoffrey: dale besitos al cachorro de tigre digital.
Y cruza los dedos para que, cuando abra del todo los ojos, decida que somos demasiado adorables —o demasiado útiles— como para convertirnos en cena.



