OpenAI lança GPT-5 com capacidade de raciocínio "quase humana"

— Inteligência Artificial A OpenAI anunciou oficialmente o GPT-5 em 25 de março de 2026, em um evento transmitido para 12 milhões de espectadores...

Tecnologia — Inteligência Artificial

A OpenAI anunciou oficialmente o GPT-5 em 25 de março de 2026, em um evento transmitido para 12 milhões de espectadores simultâneos. O novo modelo, segundo a empresa, alcança "capacidade de raciocínio quase humana" em testes padronizados — uma afirmação audaciosa que, pelos benchmarks divulgados, tem respaldo parcial.

O que o GPT-5 faz de diferente

A principal inovação é a janela de contexto de 1 milhão de tokens — equivalente a aproximadamente 750 mil palavras, ou três romances de tamanho médio. Na prática, isso significa que o modelo pode processar documentos inteiros, bases de código completas ou transcrições de horas de reuniões sem perder informação. O GPT-4 trabalhava com 128 mil tokens; o salto é de 8 vezes.

Em raciocínio lógico, o GPT-5 acertou 89,2% das questões do exame da Ordem dos Advogados dos EUA (Bar Exam), contra 76% do GPT-4. Em matemática avançada (competição AIME), obteve 87,4% — desempenho que o colocaria entre os 2% melhores estudantes de graduação. Em programação, resolveu 91% dos problemas do Codeforces Div. 2, classificação que equivale a um programador sênior.

"O GPT-5 não pensa. Mas faz algo tão convincentemente similar que a distinção pode ser acadêmica."

O que não mudou

Alucinações — respostas factualmente incorretas apresentadas com confiança — continuam presentes, embora em frequência menor (12% contra 21% no GPT-4, segundo análise independente da Universidade de Stanford). O modelo continua sem acesso a informações em tempo real na versão base (embora a versão com browsing busque na web). E o custo subiu: o ChatGPT Plus permanece em US$ 20/mês, mas o novo plano Pro — necessário para acesso irrestrito ao GPT-5 — custa US$ 200/mês.

Reações do mercado e da comunidade científica

As ações da Microsoft (investidora principal da OpenAI) subiram 4,2% no dia do anúncio. O Google apresentou, 48 horas depois, uma atualização do Gemini 2.0 com benchmarks comparáveis. A Anthropic publicou um comunicado dizendo que "benchmarks não capturam o que importa: segurança, honestidade e utilidade real". A corrida armamentista da IA ganhou mais um capítulo.

Para o usuário comum, a pergunta prática é: vale a pena? Se você usa IA para trabalho — redação, programação, análise de dados, pesquisa —, a diferença entre GPT-4 e GPT-5 é perceptível em tarefas complexas. Se usa para conversas casuais e consultas simples, o ganho marginal não justifica o custo adicional. Como sempre em tecnologia: a melhor ferramenta é a que resolve o seu problema, não a que tem o número maior no nome.

Redação Xaplin