Gartner prevê que, até 2030, realizar inferências em um LLM com 1 trilhão de parâmetros terá redução de custos de mais de 90% em relação a 2025 aos provedores de IA Generativa

AGÊNCIA DE COMUNICAÇÃO Conteúdo de responsabilidade da empresa 6 de abril de 2026

Grandes Modelos de Linguagem (LLMs) em 2030 serão até 100 vezes eficientes em termos de custo do que os primeiros modelos de tamanho semelhante desenvolvidos em 2022

SÃO PAULO, 6 de abril de 2026 /PRNewswire/ — Até 2030, realizar inferências em um LLM com um trilhão de parâmetros terá redução de custos de mais de 90% em relação a 2025 aos provedores de IA Generativa, de acordo com o Gartner, Inc., empresa de insights de negócios e tecnologia.

Os tokens de IA são as unidades de dados que os modelos de IA Generativa processam. Para os fins desta análise, um token corresponde a 3,5 bytes de dados, ou aproximadamente 4 caracteres.

“Essas melhorias de custo serão impulsionadas por uma combinação de avanços na eficiência de semicondutores e infraestrutura, inovações no design de modelos, maior utilização dos chips, aumento do uso de silício especializado para inferência e aplicação de dispositivos de borda (edge) para casos de uso específicos”, afirma Will Sommer, Diretor Analista Sênior do Gartner.

Como resultado dessas tendências, o Gartner prevê que os LLMs em 2030 serão até 100 vezes mais eficientes em termos de custo do que os primeiros modelos de tamanho similar desenvolvidos em 2022.

Os resultados projetados são divididos em dois conjuntos de cenários de semicondutores:

Cenários de ponta (frontier): o processamento do modelo é baseado em uma representação de chips de ponta.
Cenários de combinação legada (legacy blend): o processamento do modelo é baseado em uma combinação representativa de semicondutores disponíveis, referenciada às previsões do Gartner.

Os custos modelados nos cenários de previsão de “combinação” são consideravelmente mais elevados do que nos cenários de “ponta”, devido à menor capacidade computacional.

Previsões do Gartner para cenários de custo de inferência em GenAI

Tópicos como esse e outros relacionados a dados e Inteligência Artificial, incluindo agentes de IA, governança, liderança, ciência de dados e arquitetura de dados, serão destaque durante a Conferência Gartner Data & Analytics, que será realizada nos dias 28 e 29 de abril em São Paulo (SP).

Queda nos custos dos tokens não democratizará a inteligência de ponta

No entanto, a queda nos custos por tokens dos provedores de GenAI não será totalmente repassada aos clientes corporativos. Além disso, a inteligência de ponta exigirá significativamente mais tokens do que as aplicações convencionais atuais. Os modelos agênticos, por exemplo, exigem de 5 a 30 vezes mais tokens por tarefa do que um chatbot de GenAI padrão e podem executar muito mais tarefas do que um humano usando IA Generativa.

Embora a redução dos custos unitários dos tokens possibilite recursos de GenAI mais avançados, essas melhorias impulsionarão uma demanda desproporcionalmente maior por tokens. Como o consumo de tokens cresce mais rápido do que a queda de seus custos, espera-se que os custos gerais de inferência aumentem.

“Os Chief Product Officers (CPOs) não devem confundir a deflação de tokens básicos com a democratização do raciocínio de ponta”, diz Sommer. “À medida que a inteligência comoditizada se aproxima de um custo próximo de zero, a capacidade computacional e os sistemas necessários para suportar o raciocínio avançado permanecem escassos. Os CPOs que mascararem ineficiências arquitetônicas com tokens baratos hoje descobrirão que a escalabilidade agêntica será difícil de alcançar amanhã.”

O valor será gerado pelas plataformas capazes de orquestrar cargas de trabalho em um portfólio diversificado de modelos. Tarefas rotineiras e de alta frequência devem ser direcionadas para modelos de linguagem pequenos e específicos de domínio, que apresentam melhor desempenho do que soluções genéricas por uma fração do custo quando alinhados a fluxos de trabalho especializados. A inferência dispendiosa de modelos de ponta deve ser rigidamente controlada e reservada exclusivamente para tarefas de raciocínio complexas e de alta margem de lucro.

Clientes do Gartner podem ler mais em Navigating the Commoditization Trap as Token Costs Fall by Over 90% Through 2030 e Frontier Scale Models Threaten Software Margins and Solvency .

Gartner é a autoridade mundial em IA
O Gartner é o parceiro indispensável para executivos C-Level e fornecedores de tecnologia à medida que implementam estratégias de IA para alcançar suas prioridades de missão crítica. A independência e a objetividade dos insights do Gartner proporcionam aos clientes a confiança necessária para tomar decisões bem fundamentadas e desbloquear todo o potencial da IA. Clientes C-Level estão usando a ferramenta de IA do Gartner AskGartner para definir como aproveitar a IA em seus negócios. Com mais de 2.500 especialistas em negócios e tecnologia, 6.000 insights escritos, além de mais de 1.000 casos de uso e estudos de caso de IA, o Gartner é a autoridade mundial em IA. Mais informações podem ser encontradas aqui.

Sobre a Conferência Gartner Data & Analytics
Os analistas do Gartner fornecerão análises adicionais sobre tendências de Data e Analytics nas Conferências Gartner Data & Analytics, que acontecerão em 28 e 29 de abril em São Paulo (Brasil), 11 a 13 de maio em Londres (Reino Unido), 19 a 21 de maio em Tóquio (Japão), 16 e 17 de junho em Sydney (Austrália) e 21 e 22 de setembro em Mumbai (Índia). Acompanhe as notícias e atualizações da conferência no X e LinkedIn usando #GartnerDA.

Sobre o Gartner for High Tech Leaders and Providers
O Gartner for High Tech Leaders and Providers equipa líderes de tecnologia e suas equipes com melhores práticas baseadas em funções, insights da indústria e visões estratégicas sobre tendências emergentes e mudanças de mercado para que alcancem suas prioridades de missão crítica e construam as organizações de sucesso do amanhã. Para informações adicionais, acesse: www.gartner.com/en/industries/high-tech. Acompanhe as notícias e atualizações do Gartner for High Tech no X e no LinkedIn usando #GartnerHT.

Sobre o Gartner
O Gartner, Inc. fornece insights objetivos e acionáveis que impulsionam decisões mais inteligentes e um melhor desempenho para as prioridades de missão crítica das empresas. Para saber mais, visite www.gartner.com.

Foto – https://mma.prnewswire.com/media/2950770/Gartner_Token.jpg

View original content to download multimedia:https://www.prnewswire.com/br/comunicados-para-a-imprensa/gartner-preve-que-ate-2030-realizar-inferencias-em-um-llm-com-1-trilhao-de-parametros-tera-reducao-de-custos-de-mais-de-90-em-relacao-a-2025-aos-provedores-de-ia-generativa-302735052.html

FONTE Gartner

Tópicos Relacionados: Notícias de Feiras Comerciais, Eventos Futuros, Publicação / Serviços de Informação, Computador/Eletrônica, Inteligência Artificial, Semicondutores

A OESP não é(são) responsável(is) por erros, incorreções, atrasos ou quaisquer decisões tomadas por seus clientes com base nos Conteúdos ora disponibilizados, bem como tais Conteúdos não representam a opinião da OESP e são de inteira responsabilidade da PR Newswire Ltda

Encontrou algum erro? Entre em contato

Compartilhe

NAvegue pelos canais

Gartner prevê que, até 2030, realizar inferências em um LLM com 1 trilhão de parâmetros terá redução de custos de mais de 90% em relação a 2025 aos provedores de IA Generativa

AGÊNCIA DE COMUNICAÇÃO Conteúdo de responsabilidade da empresa 6 de abril de 2026

Agrishow: Volkswagen Caminhões foca no agronegócio com novo portfólio

Cap Cana na República Dominicana adquire vilas luxuosas com licença para relaxar: o Margaritaville Island Reserve Cap Cana será lançado em outubro

Xinhua Silk Road: Seraphim apresenta nova série de módulos PV na SNEC PV POWER EXPO 2023.

ATUALIZAMOS NOSSA POLÍTICA DE COOKIES