OpenAI lança o GPT-4.5 e afirma que é seu maior e melhor modelo de chat até agora

A OpenAI lançou o GPT-4.5, uma nova versão de seu principal modelo de linguagem de grande escala. A empresa afirma que este é o seu maior e melhor modelo para conversas gerais até o momento. “É realmente um avanço para nós”, diz Mia Glaese, cientista de pesquisa da OpenAI.

Desde o lançamento de seus chamados modelos de raciocínio, o o1 e o o3, a OpenAI tem impulsionado duas linhas de produtos. O GPT-4.5 faz parte da linha não focada em raciocínio – o que o colega de Glaese, Nick Ryder, também cientista de pesquisa, chama de “um novo capítulo na série clássica do GPT”.

As pessoas que possuem uma assinatura do ChatGPT Pro por US$ 200 ao mês podem testar o GPT-4.5 a partir de hoje. A OpenAI afirma que começará a disponibilizá-lo para outros usuários na próxima semana.

A cada novo lançamento de seus modelos GPT, a OpenAI tem demonstrado que maior significa melhor. No entanto, há muitas discussões sobre como essa abordagem está chegando a um limite – incluindo comentários do ex-cientista-chefe da OpenAI, Ilya Sutskever. As declarações da empresa sobre o GPT-4.5 parecem uma provocação aos críticos.

Todos os modelos de linguagem de grande escala capturam padrões entre os bilhões de documentos nos quais são treinados. Modelos menores aprendem sintaxe e fatos básicos. Modelos maiores conseguem identificar padrões mais específicos, como pistas emocionais – por exemplo, quando as palavras de um falante indicam hostilidade, explica Ryder: “Todos esses padrões sutis presentes em uma conversa humana são os detalhes que modelos cada vez maiores começam a captar.”

“Ele tem a capacidade de engajar conversas mais calorosas, intuitivas, naturais e fluidas”, diz Glaese. “E acreditamos que ele compreende melhor o que os usuários querem dizer, especialmente quando suas expectativas são mais implícitas, resultando em respostas mais nuançadas e bem pensadas.”

Fazendo-o funcionar de maneira eficiente

“Já sabemos como o motor funciona neste ponto, e agora trata-se realmente de afiná-lo”, afirma Ryder. “Este é, principalmente, um exercício de ampliação da capacidade computacional, expansão dos dados, busca por métodos de treinamento mais eficientes e, então, avanço para novos limites.”

A OpenAI não revela exatamente o tamanho do seu novo modelo. Mas afirma que o salto em escala do GPT-4o para o GPT-4.5 é comparável ao avanço do GPT-3.5 para o GPT-4o. Especialistas estimam que o GPT-4 pode ter até 1,8 trilhão de parâmetros – os valores ajustados durante o treinamento de um modelo.

O GPT-4.5 foi treinado com técnicas similares às de seu antecessor, o GPT-4o, incluindo ajustes finos conduzidos por humanos e aprendizado por reforço com feedback humano.

“A chave para criar sistemas inteligentes é uma receita que seguimos há muitos anos: encontrar paradigmas escaláveis onde possamos investir cada vez mais recursos para obter sistemas mais inteligentes”, diz Ryder.

Diferentemente dos modelos de raciocínio, como o o1 e o o3, que elaboram respostas passo a passo, a maioria dos modelos de linguagem de grande escala, incluindo o GPT-4.5, gera a primeira resposta que surge. No entanto, o GPT-4.5 é mais generalista. Testado no SimpleQA – um tipo de quiz de conhecimento geral desenvolvido pela OpenAI no ano passado, com perguntas que abrangem desde ciência e tecnologia até programas de TV e videogames – o GPT-4.5 obteve 62,5% de acertos, comparado a 38,6% do GPT-4o e 15% do o3-mini.

Além disso, a OpenAI afirma que o GPT-4.5 responde com muito menos respostas inventadas (conhecidas como alucinações). No mesmo teste, o GPT-4.5 inventou respostas em 37,1% das vezes, comparado a 59,8% para o GPT-4o e 80,3% para o o3-mini.

No entanto, o SimpleQA é apenas um dos benchmarks. Em outros testes, incluindo o MMLU – uma métrica mais comum para comparar modelos de linguagem de grande escala –, o GPT-4.5 superou os modelos anteriores da OpenAI por uma margem menor. E, em benchmarks padrão de ciência e matemática, o GPT-4.5 teve um desempenho pior que o o3-mini.

Mini Banner - Assine a MIT Technology Review

Despertando o charme

O grande diferencial do GPT-4.5 parece estar em suas habilidades conversacionais. Testadores humanos contratados pela OpenAI disseram que preferiram o GPT-4.5 ao GPT-4o para perguntas cotidianas, consultas profissionais e tarefas criativas, como a criação de poemas. (Ryder também afirma que ele é excelente na arte ASCII clássica da internet.)

Por exemplo, se você disser que está passando por um momento difícil, o GPT-4.5 pode oferecer algumas palavras de apoio antes de dizer: “Quer conversar sobre o que aconteceu ou só precisa de uma distração? Estou aqui de qualquer jeito.” O GPT-4o, por outro lado, tem mais dificuldade em interpretar sinais sociais e pode tentar resolver o problema mesmo sem ser solicitado, apresentando uma lista de tópicos para animar você.

Mesmo assim, após anos de domínio, a OpenAI enfrenta um público mais exigente. “O foco em inteligência emocional e criatividade é interessante para casos de uso específicos, como treinadores de escrita e assistentes de brainstorming”, diz Waseem Alshikh, cofundador e CTO da Writer, uma startup que desenvolve modelos de linguagem para clientes corporativos.

“Mas o GPT-4.5 parece apenas uma nova camada de tinta em um carro velho”, afirma ele. “Adicionar mais poder computacional e dados pode fazer com que o modelo soe mais natural, mas isso não é uma revolução.”

“O esforço não compensa quando se considera o custo energético e o fato de que a maioria dos usuários não notará a diferença no uso diário”, continua Alshikh. “Eu preferiria vê-los focando em eficiência ou na resolução de problemas específicos, em vez de continuar ampliando o mesmo modelo.”

Sam Altman já afirmou que o GPT-4.5 será o último lançamento na linha clássica da OpenAI e que o GPT-5 será um híbrido, combinando um modelo de linguagem de grande escala com um modelo de raciocínio.

“O GPT-4.5 parece uma solução temporária da OpenAI enquanto eles preparam algo maior a portas fechadas”, diz Alshikh. “Até lá, isso parece apenas uma parada técnica.”

Claro, a OpenAI insiste que sua abordagem de superdimensionamento ainda tem muito a oferecer. “Pessoalmente, estou muito otimista em encontrar maneiras de superar esses gargalos e continuar expandindo”, afirma Ryder. “Acho que há algo extremamente profundo e empolgante na capacidade de identificar padrões em todo o conhecimento humano.”

O post OpenAI lança o GPT-4.5 e afirma que é seu maior e melhor modelo de chat até agora apareceu primeiro em MIT Technology Review – Brasil.

Mais Matérias

Pesquisar...