¿Qué sucede cuando los modelos de IA modernos intentan jugar Super Mario Bros.? ¡Los resultados son más sorprendentes de lo que imaginas!

Buenas noticias: en el futuro, la IA no solo se apoderará de tu trabajo, sino que también está avanzando en el mundo de los videojuegos. Los investigadores han estado experimentando con *Super Mario* para ver qué tan bien manejan los modelos de IA los desafíos de plataformas rápidas. En este caso, a nadie le importa realmente el hecho de que no se pueda decir "ningún animal resultó dañado durante este experimento", ya que la empatía por los Goombas tiende a ser bastante baja. Los resultados revelaron diferencias sorprendentes en la forma en que la IA toma decisiones en tiempo real. Aquí tienes todo lo que necesitas saber sobre las últimas novedades en IA.
IA vs. Mario
Los investigadores pusieron a prueba a los modelos de IA modernos en *Super Mario Bros.*, haciéndolos saltar, esquivar y sobrevivir al caos clásico de las plataformas. ¿La idea? Ver si estas mentes digitales pueden reaccionar en tiempo real o si terminan pensando demasiado hasta caer en una tumba pixelada. Sorprendentemente, Claude 3.7 dominó, logrando saltos precisos y esquivas inteligentes, mientras que GPT-4o y Gemini 1.5 Pro tropezaron con su propia lógica.
Claude-3.7 was tested on Pokemon Red, but what about more real-time games like Super Mario ? We threw AI gaming agents into LIVE Super Mario games and found Claude-3.7 outperformed other models with simple heuristics. Claude-3.5 is also strong, but less capable of... pic.twitter.com/bqZVblwqX3
— Hao AI Lab (@haoailab) February 28, 2025
¿Por qué algunas IAs tuvieron tantos problemas? Todo se reduce a velocidad versus estrategia. Mientras que Claude reaccionó rápidamente y se adaptó, GPT-4o intentó "pensar" cada movimiento, desperdiciando milisegundos preciosos. Esta sobreanálisis termina pareciendo que Mario tiene una crisis existencial antes de correr directamente hacia un Goomba. En los juegos de Mario, la duda equivale a la muerte, y ninguna cantidad de poder de procesamiento puede arreglar eso. ¿Significa esto que las IAs más antiguas son mejores? Bueno, Henry Ford dijo: "Si le hubiera preguntado a la gente qué quería, me habrían dicho caballos más rápidos".
Los reflejos rápidos vencen al pensamiento inteligente
Uno pensaría que una IA capaz de escribir ensayos y resolver problemas matemáticos no tendría problemas para saltar sobre unos Koopas. Error. Mientras que modelos como GPT-4o y Gemini son excelentes con la lógica, fueron aplastados por las exigencias rápidas de Mario. Así que, en el futuro, si te atreves a abrir otro supermercado llamado Super Mario, un robot Claude 3.7 con pensamiento rápido saldrá corriendo a perseguirte, mientras que un robot GPT-4o, más inteligente y racional, te demandará hasta la última consecuencia en los tribunales. Qué hermoso futuro nos espera.
Entonces, como la IA ni siquiera puede jugar el juego más simple, ¿estamos a salvo? Lo adivinaste… no. El problema es que la IA está evolucionando a un ritmo acelerado gracias al aprendizaje automático, lo que básicamente significa que le estamos proporcionando información y haciéndola más rápida e inteligente que nosotros. De hecho, los puntos de referencia más avanzados han demostrado que la IA supera el 100% del rendimiento humano en comprensión lectora, comprensión del lenguaje y reconocimiento de voz – y esto ya era cierto en 2018.
Piensa en esto: cuando los humanos salieron de África por primera vez hace miles de años, nuestras mandíbulas se hicieron más pequeñas porque los alimentos eran más blandos. Pero nuestras muelas del juicio se quedaron, a pesar de que ya no había espacio para ellas, lo que llevó a que te las tuvieran que extraer con mucho dolor. ¿Realmente crees que un robot impulsado por IA no eliminaría las muelas del juicio en un segundo después de analizar su inutilidad? Tampoco sé qué tiene que ver esto con Mario, solo lo pensé. Y ahora tú también.
¿Debería la IA priorizar los reflejos rápidos sobre el pensamiento profundo, o la estrategia siempre gana al final? ¡Cuéntanos en los comentarios!
El artículo original fue escrito por Leon Degen.