O calcanhar de Aquiles da IA: a crise de abastecimento e o colossal consumo de eletricidade dos chips NVIDIA Blackwell
Atrasos na produção dos superchips Blackwell da NVIDIA e os brutais requisitos elétricos de seus racks ameaçam frear os planos dos hiperescaladores de nuvem.

O calcanhar de Aquiles da IA: a crise de abastecimento e o colossal consumo de eletricidade dos chips NVIDIA Blackwell
A indústria da inteligência artificial corre o risco de sofrer uma desaceleração imprevista. Apesar do entusiasmo em torno dos novos superchips NVIDIA Blackwell B200, prometidos como o motor que impulsionará o treinamento dos próximos LLMs em escala de fronteira, a realidade da cadeia de fornecimento e a física da eletricidade estão impondo limites severos.
Os problemas de fabricação e a enorme demanda por energia elétrica tornaram-se o calcanhar de Aquiles dos hiperescaladores de nuvem.
Problemas de design e fabricação em 3nm
Os primeiros modelos da Blackwell sofreram falhas no processo de empacotamento avançado conhecido como CoWoS-L (Chip-on-Wafer-on-Substrate com interconexão de silício local) na TSMC. Esta complexa rede de chips adjacentes interconectados em nível de mícron apresentou falhas de desempenho e rachaduras devido à expansão térmica diferencial.
Arquitectura Blackwell B200:
[Dos dies de GPU masivos] ➔ Unidos por interconexión ultra-rápida (10 TB/s)
⬇
Genera calor masivo ➔ Requiere refrigeración líquida (Direct-to-Chip)
⬇
Consumo de rack de 72 GPUs ➔ 120kW (Consumo promedio de 100 hogares)
A NVIDIA foi forçada a redesenhar o revestimento de silício da GPU para mitigar problemas de aquecimento, que atrasaram entregas em grande escala. As empresas que esperavam implementar clusters massivos no primeiro trimestre de 2026 tiveram os seus planos adiados por vários meses.
O desafio de capacitar data centers
Além do gargalo fabril, os data centers enfrentam o limite da rede elétrica. Um único rack com a arquitetura Blackwell NVL72 (que inclui 72 GPUs interconectadas) consome aproximadamente 120 quilowatts de energia.
Este número é astronômico. Para colocar em escala, alimentar uma única sala de servidores equipada com esses chips requer mais energia do que estações inteiras de transformação elétrica em áreas residenciais têm disponível. A necessidade de incorporar refrigeração líquida de circuito fechado direto no chip está exigindo que os data centers reestruturem seus pipelines e infraestrutura, aumentando substancialmente os custos operacionais e a disponibilidade de tempo de computação.


