A guerra dos chips de IA: Nvidia, AMD e o novo mercado bilionário

Ilustração de servidores de IA e chips representando crescimento da AMD em data centers

Subtítulo: A inteligência artificial transformou GPUs, aceleradores, memória e data centers em infraestrutura estratégica. O resultado é uma corrida bilionária que envolve Nvidia, AMD, Intel, hyperscalers e fabricantes de chips sob medida.

Durante décadas, o chip mais importante do computador comum foi a CPU, o processador central. Mas a explosão da inteligência artificial mudou o eixo da indústria. Hoje, os modelos de IA que escrevem textos, geram imagens, analisam documentos, programam, recomendam vídeos e automatizam tarefas dependem de uma base física enorme: GPUs, aceleradores, memória de alta largura de banda, redes ultrarrápidas, servidores e data centers.

Por isso muita gente passou a chamar os chips de IA de “petróleo” da nova economia digital. A comparação não é perfeita, mas ajuda: sem energia computacional, os modelos não treinam, não respondem em escala e não viram produto. A diferença é que esse “petróleo” não sai do chão. Ele precisa ser projetado por empresas como Nvidia, AMD, Intel, Google, Amazon, Broadcom e Qualcomm, fabricado por foundries como TSMC, empacotado com memória avançada e instalado em data centers que consomem energia em escala industrial.

O tamanho da corrida já aparece nos números. A SIA informou que as vendas globais de semicondutores chegaram a US$ 298,5 bilhões no primeiro trimestre de 2026 e seguem no caminho de alcançar US$ 1 trilhão no ano. A Gartner é ainda mais agressiva: projeta receita global de semicondutores de US$ 1,32 trilhão em 2026, com semicondutores de IA respondendo por cerca de 30% desse total.

Antes de tudo: o que são GPU, acelerador, data center e inferência?

GPU é a unidade de processamento gráfico. Ela nasceu para renderizar imagens e jogos, mas se tornou essencial para IA porque consegue fazer muitas contas em paralelo. Modelos de linguagem, visão computacional e sistemas generativos dependem justamente de bilhões ou trilhões de operações matemáticas repetidas.

Acelerador é qualquer chip especializado em acelerar uma tarefa específica. Uma GPU pode ser um acelerador de IA, mas nem todo acelerador é uma GPU. TPUs do Google, Trainium da Amazon, Gaudi da Intel, chips customizados da Broadcom e NPUs também entram nessa categoria.

Data center é uma instalação cheia de servidores, armazenamento, rede, energia elétrica, refrigeração e segurança. No caso da IA, não basta colocar muitos computadores em uma sala: é preciso conectar milhares de chips com baixa latência, alimentar racks que consomem muita energia e remover calor de forma eficiente.

Inferência é o momento em que um modelo já treinado responde a uma solicitação. Quando você pergunta algo a um chatbot, gera uma imagem ou pede resumo de um PDF, o sistema está fazendo inferência. O treinamento cria o modelo; a inferência coloca esse modelo para trabalhar milhões de vezes por dia.

O domínio atual da Nvidia

A Nvidia é a empresa que melhor converteu a explosão da IA em receita. No trimestre encerrado em 26 de abril de 2026, a companhia reportou US$ 81,6 bilhões em receita, alta de 85% em relação ao ano anterior. O dado mais importante está dentro desse número: a receita de data center foi de US$ 75,2 bilhões, alta de 92% ano a ano.

Esse domínio não veio apenas do chip. A Nvidia tem um pacote completo: GPUs poderosas, sistemas em rack, redes de alta velocidade, bibliotecas de software, CUDA, ferramentas para desenvolvedores e integração com grandes nuvens. Para quem treina ou roda modelos de IA em larga escala, comprar Nvidia muitas vezes significa comprar um ecossistema pronto.

Relatório da OCDE sobre infraestrutura de IA cita estimativas de que a Nvidia tem mais de 80% do mercado de GPUs usadas em IA. Esse número ajuda a explicar por que a empresa virou referência da corrida. Ela não vende só placas: vende a base computacional que sustenta boa parte dos laboratórios de IA e dos serviços em nuvem.

O desafio para os concorrentes é que competir com a Nvidia exige mais do que lançar uma GPU rápida. É preciso entregar disponibilidade, software estável, suporte a frameworks como PyTorch e TensorFlow, redes, servidores completos, documentação e confiança para cargas de trabalho críticas.

A estratégia da AMD para competir

A AMD entrou na disputa com uma combinação de CPUs EPYC para servidores, aceleradores Instinct e a plataforma de software ROCm. O objetivo não é apenas vender uma placa alternativa, mas oferecer uma pilha de infraestrutura aberta o suficiente para atrair hyperscalers, nuvens e empresas que querem reduzir dependência da Nvidia.

Os números mostram avanço. No primeiro trimestre de 2026, a AMD reportou US$ 10,253 bilhões em receita total. O segmento de data center chegou a US$ 5,8 bilhões, alta de 57% ano a ano, impulsionado por processadores EPYC e pela expansão dos aceleradores Instinct.

O movimento mais simbólico veio com a Meta. Em fevereiro de 2026, AMD e Meta anunciaram um acordo para implantar até 6 gigawatts de GPUs AMD Instinct ao longo de múltiplas gerações. O primeiro gigawatt deve começar a ser atendido no segundo semestre de 2026, com uma GPU customizada baseada na arquitetura MI450 e integrada à plataforma AMD Helios.

Essa é a aposta da AMD: competir no nível do rack, não só no nível do chip. A plataforma Helios combina GPUs Instinct, CPUs EPYC, rede Pensando e software ROCm em uma arquitetura pensada para data centers de IA. Se funcionar em escala, a AMD pode virar a principal segunda fonte para empresas que não querem depender de um único fornecedor.

Intel e outros fabricantes: a disputa não é só GPU contra GPU

A Intel vive uma situação diferente. A empresa ainda é muito forte em CPUs de servidor, mas não conseguiu transformar seus aceleradores Gaudi em uma ameaça equivalente à Nvidia. Mesmo assim, a IA pode beneficiar a Intel em várias camadas: Xeon como CPU hospedeira, networking, foundry, empacotamento avançado e novos aceleradores focados em inferência.

No primeiro trimestre de 2026, a Intel reportou US$ 13,6 bilhões em receita total, com US$ 5,1 bilhões no segmento Data Center and AI, alta de 22% ano a ano. A própria empresa destacou que a próxima onda de IA deve aproximar inteligência do usuário final, saindo de modelos fundacionais para inferência e sistemas agentes.

Em 2025, a Intel anunciou o Crescent Island, uma GPU de data center otimizada para inferência, com 160 GB de LPDDR5X e foco em servidores empresariais refrigerados a ar. A amostragem para clientes está prevista para o segundo semestre de 2026. É uma estratégia mais pragmática: em vez de tentar bater a Nvidia no topo do treinamento, atacar cargas de inferência onde custo, memória e energia importam muito.

Além de Intel, há uma corrida forte por chips próprios. Google tem TPUs, Amazon tem Trainium e Inferentia, Meta desenvolve MTIA, e Broadcom virou peça central em ASICs customizados para grandes clientes. A Qualcomm também anunciou os aceleradores AI200 e AI250 para inferência em data centers, com disponibilidade esperada em 2026 e 2027.

Esse grupo não necessariamente substitui a Nvidia em todos os lugares. Mas ele pressiona preço, cria alternativas para workloads específicos e mostra que a guerra dos chips de IA está migrando para uma disputa entre ecossistemas.

Por que data centers precisam de tantos chips?

IA moderna escala de duas formas: modelos maiores e mais usuários. Treinar um modelo grande exige milhares de aceleradores trabalhando juntos por semanas ou meses. Depois do treinamento, a inferência também consome muito: cada resposta de chatbot, cada imagem gerada e cada agente automatizado usa ciclos de processamento.

O problema é que não basta ter um chip rápido isolado. Em IA de larga escala, milhares de aceleradores precisam trocar dados o tempo todo. Isso exige redes de alta velocidade, memória rápida, CPUs para coordenar o sistema, armazenamento, refrigeração líquida em muitos casos e energia elétrica confiável.

É por isso que o mercado fala em “AI factories”, ou fábricas de IA. O data center deixa de ser apenas um prédio com servidores e vira uma linha de produção de tokens, embeddings, imagens, vídeos, código e decisões automatizadas.

A IDC estima que os gastos globais com infraestrutura de IA chegaram a US$ 318 bilhões em 2025 e devem alcançar US$ 487 bilhões em 2026, alta de cerca de 53%. Segundo a empresa, servidores representaram 97,6% dos gastos de IA no quarto trimestre de 2025, o que mostra como a corrida ainda está concentrada em computação pesada.

Como isso afeta placas de vídeo, servidores e computadores?

O impacto chega ao consumidor por vários caminhos. O primeiro é a competição por capacidade de fabricação. GPUs de IA usam processos avançados, empacotamento sofisticado e memória especial, como HBM. Quando hyperscalers compram volumes gigantescos, a cadeia de suprimentos prioriza data centers, onde as margens são maiores.

O segundo impacto está na memória. A Gartner prevê que, em 2026, a receita de memória cresça fortemente com “memflation”, ou inflação de memória. A TrendForce também aponta que fornecedores estão deslocando capacidade para HBM e aplicações de servidor, enquanto os preços de DRAM convencional e NAND Flash sobem no segundo trimestre de 2026.

Isso não significa que uma placa gamer usa exatamente a mesma memória de um acelerador de IA. Uma GPU de data center pode usar HBM, enquanto placas de vídeo comuns usam GDDR. Mas todas disputam investimento, wafers, substratos, encapsulamento, contratos de memória e prioridade fabril. O efeito final aparece em preços, disponibilidade e ciclos de lançamento mais caros.

Servidores também ficam mais caros porque o chip de IA é apenas uma parte da conta. Um cluster precisa de CPUs, placas de rede, switches, SSDs, memória, racks, fontes, refrigeração, energia e manutenção. O custo da IA não está apenas no modelo; está em toda a infraestrutura que mantém o modelo vivo.

Impacto para empresas, desenvolvedores e usuários comuns

Para empresas, a guerra dos chips define custo e velocidade de adoção. Quem tem acesso a GPUs ou aceleradores baratos consegue treinar modelos, ajustar sistemas internos e rodar inferência com menor latência. Quem depende apenas de nuvem pública pode enfrentar custo variável alto e filas por capacidade em períodos de pico.

Para desenvolvedores, a principal mudança é a necessidade de pensar em eficiência. Em 2023, muita gente queria apenas “usar o maior modelo possível”. Em 2026, a pergunta é mais prática: qual modelo entrega o resultado necessário com o menor custo por resposta? Isso favorece quantização, modelos menores, inferência local, uso de APIs especializadas e escolha cuidadosa entre GPU, CPU, NPU, TPU ou ASIC.

Para usuários comuns, o impacto aparece de forma indireta. Serviços de IA podem ficar melhores e mais rápidos, mas também podem cobrar mais quando o custo de computação sobe. PCs com NPUs ganham importância para tarefas locais, como transcrição, busca sem internet e recursos de produtividade. Ao mesmo tempo, placas de vídeo e memória podem sofrer pressão de preço quando a demanda de data centers aperta a cadeia.

Tendências para 2026 e 2027

A primeira tendência é a migração de parte da disputa para a inferência. Treinamento continuará importante, mas a conta diária de rodar modelos para milhões de usuários tende a pesar cada vez mais. Isso abre espaço para chips mais eficientes, mesmo que não sejam os campeões absolutos em treinamento.

A segunda tendência é o crescimento dos ASICs customizados. Grandes nuvens têm escala para justificar chips próprios. Google, Amazon, Meta e outros querem reduzir custo por token, controlar melhor a cadeia e evitar dependência total de GPUs genéricas.

A terceira tendência é a guerra de racks completos. Nvidia, AMD e novos concorrentes não estão vendendo apenas chips soltos. Eles querem vender sistemas integrados com GPU, CPU, rede, memória, software e refrigeração. A vantagem competitiva passa a ser o desempenho do data center inteiro.

A quarta tendência é a pressão energética. Acordos medidos em gigawatts, como AMD-Meta e Amazon-Anthropic, mostram que a IA virou também uma disputa por eletricidade, terrenos, refrigeração, licenciamento e rede de transmissão.

A quinta tendência é a segmentação. Nvidia deve continuar forte no topo de treinamento e em ecossistemas completos. AMD tende a ganhar espaço como segunda fonte em grandes clientes. Intel pode capturar valor em CPUs, foundry, empacotamento e inferência empresarial. Google, Amazon, Broadcom, Qualcomm e outros devem crescer em nichos onde custo e eficiência importam mais que compatibilidade ampla.

Quem pode liderar esse mercado?

No curto prazo, a Nvidia segue como líder clara. Ela combina hardware, software, escala, relacionamento com nuvens e uma base enorme de desenvolvedores. Essa vantagem não desaparece rapidamente.

No médio prazo, porém, a liderança pode ficar menos absoluta. A AMD tem chance real de crescer em data centers se entregar Helios, MI450 e ROCm com estabilidade em escala. A Intel pode não liderar GPUs de IA, mas pode continuar essencial como fornecedora de CPUs, plataformas e capacidade de fabricação. Os chips próprios de hyperscalers devem capturar parte da inferência, especialmente em workloads previsíveis e enormes.

A guerra dos chips de IA, portanto, não terá um único vencedor simples. A Nvidia lidera a corrida principal, mas o mercado está ficando grande demais para uma empresa dominar todas as camadas. Quem vencerá não será apenas quem tiver o chip mais rápido, mas quem conseguir entregar computação suficiente, barata, eficiente, programável e disponível na hora em que a IA precisar responder.

Fontes consultadas

Espectro do Hardware é o perfil editorial do Jan Hardware, focado em hardware, inteligência artificial, segurança digital e guias de compra para o mercado brasileiro. O conteúdo prioriza análise técnica, contexto prático e recomendações transparentes para quem monta, atualiza ou usa PCs em 2026.

Publicar comentário