Pular para o conteúdo

ChatGPT completa 3 anos: da geração de texto ao navegador autônomo

Pessoa usando smartphone e laptop com gráfico colorido em mesa de madeira perto de janela iluminada

Lançado em 30 de novembro de 2022, o ChatGPT já chegou aos 3 anos de existência. Em um período relativamente curto, a inteligência artificial avançou de forma impressionante: saiu de um simples gerador de texto para uma ferramenta capaz até de assumir o controle de um navegador e executar tarefas no lugar do usuário.

Desde sua estreia, o ChatGPT mudou profundamente a maneira como pesquisamos, trabalhamos e até compramos pela internet. Ao mesmo tempo, o mercado se expandiu e hoje existem várias alternativas fortes. Ainda assim, depois de popularizar os grandes modelos de linguagem, o ChatGPT continua sendo a principal referência quando o assunto é inteligência artificial generativa.

30 de novembro de 2022: o lançamento de uma prévia

Quando a OpenAI apresentou o ChatGPT em novembro de 2022, o que chegou ao público não era uma versão definitiva, e sim uma prévia voltada a testes e à coleta de opiniões dos usuários. Mesmo assim, o impacto foi imediato.

Logo na primeira versão, a ferramenta virou fenômeno. Em janeiro de 2023, ela já teria ultrapassado a marca de 100 milhões de usuários, um ritmo de crescimento sem precedentes. Para efeito de comparação, o TikTok levou 9 meses para chegar ao mesmo patamar.

Desde então, o ChatGPT passou a simbolizar uma mudança de paradigma no uso da IA. Para muitas pessoas, ele foi o primeiro contato real com um assistente conversacional capaz de responder, redigir, resumir e explicar com naturalidade. Esse papel ajudou a transformar a ferramenta em porta de entrada para um público muito mais amplo, incluindo profissionais, estudantes e empresas.

As imagens e a voz

No início, o ChatGPT funcionava apenas com texto. Ainda assim, chamou atenção por conseguir conversar de maneira bastante natural com o usuário. Aos poucos, a OpenAI foi ampliando o produto para torná-lo mais completo e útil em diferentes contextos.

Um dos marcos mais importantes dessa evolução foi a chegada do GPT-4, que elevou o nível de inteligência do ChatGPT. Depois disso, em maio de 2024, a empresa lançou o GPT-4o, permitindo suporte nativo a imagens e áudio. Com esse modelo, o ChatGPT passou a analisar fotos e gráficos sem depender de um modelo intermediário.

O novo modo de voz também representou um salto importante. Com ele, o usuário podia conversar com a IA de forma muito fluida, quase como se estivesse falando com uma pessoa.

A OpenAI também fortaleceu o ChatGPT com a introdução dos chamados modelos de raciocínio. A proposta era criar IAs diferentes do GPT-4o, capazes de dedicar mais tempo à reflexão para resolver problemas mais complexos em áreas como ciência e programação. Mais tarde, com o GPT-5.1 lançado neste ano, o raciocínio passou a ser incorporado diretamente ao modelo principal de IA.

Modelos de raciocínio, multimodalidade e usos práticos do ChatGPT

Essa evolução não ficou restrita a demonstrações técnicas. Ao incorporar imagens, áudio e raciocínio mais avançado, o ChatGPT passou a ser útil em tarefas do dia a dia, como interpretar documentos, revisar códigos, explicar dados visuais e auxiliar em reuniões.

Na prática, isso aproximou a ferramenta de usos profissionais mais sofisticados. Ela deixou de ser vista apenas como um chatbot para respostas rápidas e passou a funcionar como um assistente multimodal, mais versátil e adaptado a diferentes rotinas de trabalho.

Os agentes mudam tudo

A OpenAI também vem tentando tornar o uso do ChatGPT mais simples por meio de uma tecnologia que escolhe automaticamente qual modelo usar, dependendo da dificuldade da pergunta feita. Assim, o sistema tenta equilibrar velocidade e qualidade de resposta sem exigir tanta intervenção do usuário.

Outro momento viral da empresa aconteceu em março de 2025, quando ela integrou a geração de imagens ao modelo principal. A OpenAI já oferecia o DALL-E, seu gerador de imagens, mas o modelo lançado naquele mês era claramente mais avançado.

Hoje, a empresa também disponibiliza agentes de IA capazes de assumir o controle de um navegador ou de um programa em nome do usuário, realizando tarefas na web de forma autônoma. Para desenvolvedores, a OpenAI oferece o Codex, que auxilia na criação de software como se fosse um colaborador virtual. Já para o público em geral, existe um modo agente que executa ações na internet sozinho para economizar tempo.

Esses agentes ampliam bastante o alcance da plataforma, porque reduzem o número de etapas manuais em tarefas repetitivas. Em vez de apenas responder perguntas, a IA começa a agir: preencher formulários, navegar por páginas, reunir informações e concluir fluxos de trabalho simples. Essa transição de “assistente” para “executor” é uma das mudanças mais importantes na história recente do ChatGPT.

Sora, Atlas: novas aplicações chegaram

Se a OpenAI se tornou um dos grandes nomes da tecnologia graças ao ChatGPT, hoje ela também oferece outras aplicações para o grande público. Neste ano, além de lançar o Sora 2, versão aprimorada do seu gerador de vídeos, a empresa apresentou também um aplicativo Sora para celular.

Esse aplicativo permite usar o novo modelo para criar vídeos, mas vai além disso: ele também funciona como uma espécie de rede social dedicada à produção de vídeos com inteligência artificial.

Além disso, a OpenAI já oferece seu próprio navegador, o Atlas, que compete diretamente com o Google Chrome. A principal característica dele é a integração nativa do ChatGPT e do modo agente. Dessa forma, a IA pode assumir o controle do navegador para executar ações e poupar tempo do usuário.

Novos usos de vídeo e navegação com IA

A expansão para vídeo e navegação mostra que a OpenAI está apostando em uma presença cada vez maior no cotidiano digital. Em vez de se limitar à conversa em texto, a empresa quer ocupar diferentes pontos da experiência online: criar conteúdo, pesquisar, automatizar tarefas e até navegar junto com o usuário.

Isso também evidencia uma estratégia mais ampla de ecossistema. Quanto mais produtos a empresa oferece, mais o ChatGPT deixa de ser uma ferramenta isolada e passa a funcionar como o centro de uma plataforma de IA completa.

Mudança de estrutura e concorrência com o Google

No momento do lançamento do ChatGPT, a estrutura da OpenAI era bastante incomum. A organização tinha uma divisão sem fins lucrativos que controlava uma divisão com fins lucrativos, apoiada por investidores como a Microsoft. As decisões ficavam concentradas na parte sem fins lucrativos, e os ganhos dos investidores eram limitados.

Com o tempo, porém, a criadora do ChatGPT percebeu que ainda precisaria de aportes gigantescos para seguir desenvolvendo sua IA, pagar por centros de dados e competir com as maiores empresas de tecnologia. Por isso, neste ano, a OpenAI adotou uma estrutura mais próxima da de uma empresa tradicional, abandonando o modelo de lucros limitados e transformando a divisão sem fins lucrativos em acionista.

Além disso, no momento em que este artigo é escrito, a disputa entre OpenAI e Google nunca esteve tão intensa. A empresa de Mountain View lançou recentemente o Gemini 3, que agora é visto como o melhor modelo de inteligência artificial do mercado.

Essa concorrência tende a acelerar ainda mais a evolução do setor. Para o usuário final, isso significa atualizações mais frequentes, recursos mais ambiciosos e uma corrida contínua por modelos mais rápidos, mais precisos e mais capazes de lidar com tarefas reais.

A competição também influencia a forma como empresas e profissionais escolhem suas ferramentas. Com alternativas cada vez mais próximas em qualidade, fatores como integração com outros serviços, custo, segurança e facilidade de uso passam a pesar tanto quanto o desempenho bruto do modelo.

Comentários

Ainda não há comentários. Seja o primeiro!

Deixar um comentário