O modelo de IA mais caro do Google parece ter atravessado um marco importante: vencer um videogame de 29 anos.
Ontem à noite, o CEO do Google, Sundar Pichai, postou triunfantemente em X, “Que acabamento! Gemini 2.5 Pro acabou de completar o Pokémon Blue!”
Para ficar claro, o Gêmeos toca Pokemon LiveStre Dream foi criado por (em suas próprias palavras) “um engenheiro de software de 30 anos não afiliado ao Google”, que passa por Joel Z. Mas os executivos do Google estão aplaudindo o esforço.
Por exemplo, Logan Kilpatrick, o líder do produto para o Google AI Studio, publicou no mês passado que Gemini estava “fazendo um grande progresso ao completar o Pokémon” e “ganhou seu 5º emblema (o próximo melhor modelo tem apenas 3 até agora, embora com um chicote de agente diferente)”, liderando o Pichai para brincar, “Estamos trabalhando em API, Poke Diferente de Pokénson
Por que Pokémon? Em fevereiro, o Antrópico destacou o progresso que seus modelos de IA de Claude estavam fazendo em “Pokémon Red”, escrevendo que o “Treinamento de pensamento e agente de Claude” oferece “um grande impulso” em tarefas “mais inesperadas”, como jogar um jogo clássico. (“Pokémon Red” e “Blue” são versões diferentes de um título de Gameboy lançadas pela primeira vez em 1996 e vinculadas à franquia Pokémon de longa duração). Há até um Claude toca Pokemon Twitch Channel que Joel Z citou como uma inspiração.
Apesar de seu progresso, Claude ainda não parece ter derrotado “Pokémon Red”. Isso significa que Gemini é objetivamente melhor no jogo? Em sua página Twitch, Joel Z pediu aos espectadores: “Por favor, não considere isso uma referência para o quão bem um LLM pode jogar Pokemon. Você não pode realmente fazer comparações diretas – Gêmeos e Claude têm ferramentas diferentes e receber informações diferentes.”
E ambos os modelos de IA precisam de ajuda para jogar o jogo – é aí que entram os aproveitados dos agentes mencionados, fornecendo aos modelos que as capturas de tela do jogo se sobrepuseram a informações adicionais, permitindo que o modelo decida como responder (que pode envolver chamadas de agentes especializados) e pressionar o botão que corresponde às instruções da IA.
Evento do TechCrunch
Berkeley, CA.
|
5 de junho
Reserve agora
Joel Z reconheceu que havia outras “intervenções de desenvolvimento” para ajudar Gemini a concluir o jogo, mas insistiu que não está trapaceando.
“Minhas intervenções melhoram as habilidades gerais de tomada de decisão e raciocínio de Gêmeos”, diz ele. “Eu não dou dicas específicas – não há explosões ou instruções diretas para desafios específicos como o Monte.
Além disso, ele disse: “Gêmeos interpreta Pokémon ainda está sendo desenvolvido ativamente, e a estrutura continua a evoluir”.