O agente da AI do Anthropic Claude está jogando Pokémon e simplesmente não consigo pegar ‘todos

No mês passado, a startup de IA de US $ 61,5 bilhões, antropia, criou uma transmissão ao vivo em Twitch. As transmissões ao vivo dos jogos não são novidade em Twitch, mas esta é um pouco diferente: Claude, modelo de IA do Anthropic, está tentando vencer Pokémon vermelho.

Nós somos agora um mês depoisAssim, e A transmissão ao vivo ainda está indo. No entanto, Claude tem não progrediu Muito. E, nesse ritmo, o agente de IA da Antrópico pode nunca ser o melhor, como ninguém nunca foi.

Segundo Antrópico, quando primeiro lançado O projeto “Claude Plays Pokémon”, versões anteriores de seu agente de IA Claude falhou em algumas tarefas muito básicas. Por exemplo, de acordo com o Antrópico, Claude 3.5 tentaria fugir de quase todas as batalhas em junho de 2024.

Veja também:

Em 2024, Pokémania está evoluindo

Alguns meses e algumas versões de Claude mais tarde, o Anthrópico disse que houve uma mudança forte. Em fevereiro de 2025, o Anthropic deu a Claude 3,7 sonetos um giro em jogar Pokémon.

“Em poucas horas, Claude derrotou Brock. Dias depois, parou Misty”, disse Anthrópico. “O progresso que os modelos mais antigos tinham pouca esperança de alcançar”.

Velocidade de luz mashable

A Anthrópica disse que Claude 3,7 sonetos poderia planejar com antecedência, lembrar os objetivos e aprender com seus erros, diferentemente das versões anteriores do agente da IA. Também criou uma base de conhecimento, viu a tela e o botão simulado pressiona.

No entanto, o Progress Claude 3,7 soneto originalmente feito no jogo parece ter parado.

Por exemplo, os espectadores de transmissão ao vivo assistido Como a cláusula 3.7 levou 78 horas Para passar pelo Monte no jogo. No Reddit, jogadores estimado que normalmente levaria uma criança apenas algumas horas para avançar no mesmo estágio.

Veja também:

Prática com o aplicativo Claude AI: é agradável de usar, mas vasculhado

Claude pode ser visto em círculos, tropeçando nos mesmos caminhos e frequentemente batendo nas paredes enquanto tenta se contornar.

A transmissão ao vivo é envolvente, especialmente porque uma caixa de texto estabelece o “pensamento” de Claude enquanto o agente da IA ​​tenta descobrir o que se move para fazer a seguir.

De acordo com engenheiros antrópicos em uma entrevista com ARS TechnicaClaude tem mais facilidade com aspectos do jogo que envolvem texto, como batalhas de Pokémon. No entanto, ele luta com os aspectos mais visuais do jogo, como se mover de cidade em cidade no mapa.

Claude 3,7 Sonnet foi muito mais longe no jogo do que os modelos anteriores de Claude, então houve progresso. No entanto, para aqueles que avisam que a IA em breve poderá dominar o mundo, ainda não estamos nem perto disso. Claude ainda tem 151 Pokémon para pegar.

Veja também