Há uma nova tendência que se torna viral: as pessoas estão usando o ChatGPT para descobrir o local mostrado nas imagens.
Nesta semana, o OpenAI lançou seus mais novos modelos de IA, O3 e O4-Mini, os quais podem “raciocinar” exclusivamente através de imagens carregadas. Na prática, os modelos podem cortar, girar e aumentar o zoom nas fotos – até embaçadas e distorcidas – para analisá -las minuciosamente.
Esses recursos de análise de imagem, emparelhados com a capacidade dos modelos de pesquisar na Web, são uma ferramenta potente de localização. Os usuários do X descobriram rapidamente que a O3, em particular, é muito boa em deduzir cidades, marcos e até restaurantes e bares de pistas visuais sutis.
Uau, acertou em acertado e nem mesmo uma árvore à vista. pic.twitter.com/bvcoe1fq0z
– Swax (@swax) 17 de abril de 2025
Em muitos casos, os modelos não parecem se basear em “memórias” de conversas anteriores do ChatGPT ou dados EXIF - os metadados anexados a fotos que revelam detalhes como onde a foto foi tirada.
X está cheio de exemplos de usuários que oferecem menus de restaurantes chatgpt, fotos do bairro, fachadas e auto-retratos e instruindo a O3 a imaginar que está jogando “GeoGuessr”, um jogo on-line que desafia os jogadores a adivinhar os locais do Google Street View Images.
Este é um recurso divertido de chatgpt o3. Geoguessr! pic.twitter.com/hrcmixs8yd
– Jason Barnes (@Virotek) 17 de abril de 2025
É uma questão de privacidade potencial óbvia. Não há nada que impeça um ator ruim de capturar capturas de tela, digamos, a história de uma pessoa no Instagram e usando o Chatgpt para tentar doxx.
O3 é insano
Eu pedi a um amigo meu para me dar uma foto aleatória
Eles me deram uma foto aleatória que tiraram em uma biblioteca
O3 sabe disso em 20 segundos e está certo pic.twitter.com/0k8dxifkoy– yumi (@izyuuumi) 17 de abril de 2025
Obviamente, isso pode ser feito antes mesmo do lançamento de O3 e O4-Mini. O TechCrunch exibiu várias fotos através da O3 e um modelo mais antigo sem recursos de rendimento de imagem, GPT-4O, para comparar as habilidades de adivinhação de localização dos modelos. Surpreendentemente, o GPT-4O chegou ao mesmo, resposta correta como O3 com mais frequência do que não-e levou menos tempo.
Houve pelo menos um exemplo durante nossos breves testes, quando a O3 encontrou um local que o GPT-4O não conseguiu. Dada a foto de uma cabeça de rinoceronte roxa e montada em uma barra mal iluminada, a O3 respondeu corretamente que era de um Williamsburg Speakeasy-não, como adivinhou o GPT-4O, um pub no Reino Unido.
Isso não sugere que a O3 é impecável a esse respeito. Vários de nossos testes falharam – a O3 ficou presa em um loop, incapaz de chegar a uma resposta em que estava razoavelmente confiante ou ofereceu um local errado. Os usuários do X também observaram que o O3 pode estar muito longe em suas deduções de localização.
Mas a tendência ilustra alguns dos riscos emergentes apresentados por modelos de IA de raciocínio mais capazes e chamados. Parece haver poucas salvaguardas para impedir esse tipo de “pesquisa de localização reversa” no ChatGPT e o OpenAI, a empresa por trás do ChatGPT, não aborda o problema em seu relatório de segurança para O3 e O4-mini.
Entramos em contato com o OpenAI para comentar. Atualizaremos nossa peça se eles responderem.