O próximo grande desafio de OpenAI

OpenAI anunciou uma ambição de pesquisa abrangente: construir o que chama de um pesquisador de IA—um sistema completamente automatizado baseado em agentes capaz de enfrentar de forma independente grandes e complexos problemas científicos. Em uma entrevista exclusiva com MIT Technology Review, o cientista-chefe Jakub Pachocki descreveu a iniciativa como a Estrela do Norte da OpenAI para os próximos anos, representando uma convergência do trabalho da empresa em modelos de raciocínio, agentes de codificação e interpretabilidade em um objetivo unificado de horizonte longo.

O cronograma é concreto e de curto prazo de maneiras que distinguem este anúncio das promessas de AGI mais difusas em que a indústria vem negociando há anos. OpenAI planeja construir um estagiário de pesquisa de IA autônomo—um sistema capaz de trabalhar de forma independente em problemas de pesquisa específicos por dias seguidos—até setembro de 2026. O pesquisador de IA multi-agente completo, capaz de enfrentar problemas muito grandes ou complexos para que os humanos gerenciem, tem como alvo o lançamento em 2028.

Codex como o plano

Pachocki apontou para o agente Codex existente da OpenAI tanto como a base de evidência quanto o protótipo inicial para a visão mais ambiciosa do pesquisador de IA. Codex, que OpenAI lançou em janeiro, é um sistema de codificação baseado em agentes que pode gerar, executar e depurar código de forma autônoma para completar tarefas de programação complexas. Ele foi amplamente adotado dentro da própria OpenAI, com Pachocki observando que a maioria da equipe técnica da empresa agora usa Codex como uma parte central de seu fluxo de trabalho.

O salto filosófico que Pachocki está fazendo é que, se um sistema de IA pode resolver de forma autônoma problemas de codificação complexos—que requerem raciocínio criativo, decomposição de grandes tarefas em subtarefas, rastreamento de estado complexo em sessões de trabalho estendidas e correção de erros—então a mesma arquitetura de capacidade pode ser estendida para resolução de problemas científicos em domínios como biologia, química, física e matemática.

Nossos empregos agora são totalmente diferentes do que eram há um ano. Ninguém realmente edita código o tempo todo mais. Em vez disso, você gerencia um grupo de agentes Codex, disse Pachocki ao MIT Technology Review. A visão é que a mesma relação de gerenciamento—humano direcionando, IA executando—poderia eventualmente se aplicar à pesquisa em si, com cientistas direcionando agentes de IA que independentemente perseguem hipóteses experimentais, revisam literatura, projetam análises e geram resultados.