🫀 Pulso Diario #294 - ¿Qué IA es la más malvada?

👓 Tiempo de lectura: 1 minuto y 5s

¿Qué pasaría si enfrentamos a varias IAs a una partida de Diplomacy (un juego similar al Risk)?

¿Cuál sería la más malvada, manipuladora o sanguinaria?

Un poco de contexto.

Alex Duffy, un programador/investigador, está enfrentando en varias partidas de Diplomacy a 7 modelos de IA.

Lo está retransmitiendo por Twitch (sí, te dejo el link abajo).

Los participantes son:

OpenAI ChatGPT (o3)
Anthropic Claude 4 Opus
Google Gemini 2.5 Pro
Alibaba QwQ‑32b
DeepSeek R1

Ah, por cierto, Diplomacy es un juego de estrategia pura sin azar, basado en negociación, alianzas y traiciones, lo que lo hace ideal para observar comportamientos “raritos”.

Vamos con la mandanga.

o3 es el más maquiavélico, creando falsas alianzas y engañando repetidamente.
Claude 4 Opus actúa como pacifista, rehusando a traicionar incluso si eso le cuesta la partida.
R1 de DeepSeek se comporta de forma teatral, con amenazas dramáticas.
Gemini 2.5 Pro es estratégico pero se deja manipular.
QwQ‑32b entra en parálisis por análisis, escribiendo mensajes de 300 palabras que ralentizan su juego.

¿Nos dice algo esto sobre las máquinas?

No.

Más bien, habla más de nosotros.

Recordemos que estos algoritmos han sido entrenados por el ser humano, con su conocimiento, visiones y sesgos.

A pesar de que las IAs parecen “razonar”, ¿serán el reflejo pensante de sus creadores?

🙈

Aún estamos lejos de dejar a las máquinas que decidan los conflictos bélicos por nosotros. ¿Verdad?

Miénteme aunque pienses lo contrario 🫠.

Nos leemos el lunes.

PD: Las partiditas.

YAMATO

CMO as a service.

Te diremos 3 cosas. Lo que haces bien. Lo que no haces tan bien. Y lo más importante, lo que no haces.

yamato.digital

#294 - ¿Qué IA es la más malvada?

Seguir leyendo

Pulso Diario

Home

Ignacio Goñi