O agente Operator da OpenAI recebe um impulso com um novo modelo de IA

2025-05-24 08:51:03

A OpenAI atualizou o modelo de IA que alimenta o Operator da versão personalizada anterior do GPT-4o para um modelo baseado no o3, um dos mais recentes da série de modelos de "raciocínio" da OpenAI. O Operator o3 foi ajustado com dados adicionais de segurança para uso em computador e incluiu conjuntos de dados de segurança projetados para ensinar ao modelo os limites de decisão.

A OpenAI atualizou o Operador no ChatGPT com um novo modelo de Agente de Utilização de Computador (CUA) baseado numa versão do OpenAI o3. Com o novo modelo, o Operador tornou-se mais persistente e mais preciso ao interagir com o navegador, melhorando a taxa de sucesso geral das tarefas. Também fornece respostas melhor estruturadas que são mais claras e completas.

De acordo com a OpenAI, o novo modelo CUA apresentou um desempenho mais forte em relação à indústria, alcançando SOTA no OSWorld e no WebArena. Também mostrou um desempenho relativo mais forte em comparação com a versão anterior, tanto em benchmarks estabelecidos como em avaliações de preferência humana.

A OpenAI substitui o modelo baseado em GPT‑4o por uma versão baseada em o3

OpenAI sugere uma grande atualização para o Agente Operador ChatGPT pic.twitter.com/iGPQp9butD

— SabatAge (@sabatage) 22 de maio de 2025

A OpenAI substituiu o modelo existente baseado no GPT‑4o para o Operador por uma versão baseada no OpenAI o3, embora a versão da API permaneça baseada no 4o. A empresa de IA também afirmou que o Operador o3 utiliza a mesma abordagem de segurança em múltiplas camadas usada para a versão 4o.

No entanto, em comparação com outros modelos da família o3, o o3 Operator foi ajustado com dados adicionais de segurança para uso em computadores, incluindo conjuntos de dados de segurança projetados para ensinar ao modelo limites de decisão sobre confirmações e recusas.

A OpenAI lançou um relatório técnico mostrando o desempenho do operador o3 em avaliações de segurança específicas. Comparado ao modelo de operador GPT-4o, o operador o3 tinha menos probabilidade de recusar-se a realizar atividades "ilícitas" e a pesquisar dados pessoais sensíveis, sendo também menos suscetível a uma forma de ataque de IA conhecida como "injeção de prompts."

“o3 Operator utiliza a mesma abordagem de segurança em múltiplas camadas que usamos para a versão 4o do Operator… Embora o o3 Operator herde as capacidades de codificação do o3, não tem acesso nativo a um ambiente de codificação ou Terminal.”

–OpenAI

A empresa de IA também divulgou que o novo modelo baseado em o3 passou por avaliações de segurança padrão, e o Operator continuou disponível como uma pré-visualização de pesquisa para usuários do ChatGPT Pro em todo o mundo. No entanto, este modelo aprimorado estava disponível apenas no Operator no ChatGPT.

Knoop suspeita que executar o modelo o3 da OpenAI pode ser mais caro do que o esperado

Na semana passada, a Arc Prize Foundation, que mantém e administra o ARC-AGI, atualizou os seus custos aproximados de computação para o3. A organização estimou originalmente que a configuração de melhor desempenho do o3 que testou, o3 high, custava cerca de $3K para resolver um único problema de ARC-AGI. No entanto, a Fundação agora acredita que o custo pode ser 10 vezes superior ao estimado anteriormente, possivelmente cerca de $30K por tarefa.

Além disso, embora a OpenAI ainda não tenha definido o preço do o3 ou o tenha lançado completamente, um dos co-fundadores da Arc Prize Foundation, Mike Knoop, acredita que o preço do modelo o1-pro é um proxy razoável e uma comparação mais próxima do verdadeiro custo do o3. No entanto, ele acrescentou que o o3 continuaria a ser rotulado como uma prévia no quadro de líderes para refletir a incerteza até que o preço oficial fosse anunciado.

De acordo com a Arc Prize Foundation, um preço elevado para o3 high não estaria fora de questão, dada a quantidade de recursos computacionais que o modelo aparentemente utiliza. o3 high usou 172x mais computação do que o3 low, a configuração de menor computação do o3, para enfrentar o ARC-AGI.

Rumores têm circulado desde o início de março sobre os planos dispendiosos que a OpenAI estava a considerar introduzir para clientes empresariais. A informação reportou que a empresa pode cobrar até 20.000$ por mês por "agentes" de IA especializados, como agentes de desenvolvimento de software.

No entanto, enquanto alguns argumentaram que até mesmo os modelos mais caros da OpenAI custariam muito menos do que um contratado ou funcionário humano típico exigiria, o pesquisador de IA Toby Ord apontou que os modelos podem não ser tão eficientes. Por exemplo, o o3 high precisou de 1.024 tentativas em cada tarefa no ARC-AGI para alcançar sua melhor pontuação.

KEY Difference Wire: a ferramenta secreta que os projetos de criptomoedas usam para garantir cobertura na mídia

AGENT-8.33%

Ver original

O conteúdo é apenas para referência, não uma solicitação ou oferta. Nenhum aconselhamento fiscal, de investimento ou jurídico é fornecido. Consulte a isenção de responsabilidade para obter mais informações sobre riscos.

Recompensa
curtir
Comentário
Compartilhar

Comentário

0/400

Sem comentários

Tema
#PI#
287810 Postagens
#BTC#
259071 Postagens
#ETH#
169034 Postagens
4#GateioInto11#
81850 Postagens
5#ContentStar#
67869 Postagens
6#GT#
67443 Postagens
7#DOGE#
61669 Postagens
8#BOME#
61270 Postagens
9#MAGA#
52359 Postagens
10#SLERF#
50547 Postagens

Marcar

sitemap