HBM vs. DRAM: Porque Dependem os Grandes Modelos de IA Destas Tecnologias?

30 de Junho de 2026: O Bitcoin negoceia numa faixa estreita próxima dos 60 000 $, enquanto o Ethereum mantém-se estável em torno dos 1 600 $. Após uma correção prolongada ao longo de Junho, os investidores de curto prazo continuam a dominar o mercado cripto. Contudo, à medida que os ativos digitais entram num período de "tempo morto", outro setor está a viver um crescimento explosivo sem precedentes—memória de semicondutores.

O relatório de Primavera de 2026 da World Semiconductor Trade Statistics (WSTS) aumentou drasticamente as expectativas de crescimento do setor: o mercado global de semicondutores poderá ultrapassar 1,51 biliões $ em 2026, um aumento de 90 % face ao ano anterior. Os chips de memória deverão crescer 250 %, atingindo 800 mil milhões $. Pela primeira vez, a produção de memória irá superar a das foundries de wafers, tornando-se o principal motor de crescimento nos semicondutores.

No centro desta revolução da memória está o HBM (High Bandwidth Memory). O mercado de HBM deverá crescer 58 % em 2026, alcançando 54,6 mil milhões $ e representando quase 40 % do mercado DRAM. O que distingue o HBM do DRAM? Porque dependem tanto os modelos de IA do HBM?

HBM vs. DRAM: Mesma Origem, Caminhos Divergentes

O HBM e o DRAM partilham o mesmo meio fundamental de armazenamento—memória dinâmica de acesso aleatório. No entanto, as abordagens tecnológicas, os designs arquitetónicos e os cenários de aplicação divergem de forma significativa.

O DRAM tradicional segue uma estratégia de "expansão horizontal". Representado pelo DDR4 e DDR5, o DRAM convencional utiliza uma arquitetura plana. As melhorias de desempenho resultam de avanços no processo (por exemplo, da tecnologia de 20 nm para 2 nm) e de otimizações arquitetónicas (como o aumento da largura de prefetch no DDR5). A lógica central consiste em reduzir continuamente o tamanho do transistor e aumentar a frequência num plano bidimensional. Porém, esta abordagem está a atingir os seus limites físicos—processos abaixo de 2 nm enfrentam desafios como o tunelamento quântico, e uma miniaturização adicional já não consegue satisfazer a procura exponencial de largura de banda de memória por parte da IA.

O HBM adota uma abordagem de "empilhamento vertical" para ultrapassar estes limites. O HBM utiliza uma estrutura tridimensional, recorrendo à tecnologia Through-Silicon Via (TSV) para empilhar verticalmente vários dies de DRAM, formando uma estrutura semelhante a um cubo. São perfurados milhares de pequenos orifícios nos chips de DRAM, ligando as camadas através de elétrodos verticais. Na base encontra-se a unidade de controlo lógico do DRAM, que gere o timing e o controlo do stack. Este design em "torre" permite ao HBM alcançar uma densidade de largura de banda extremamente elevada num espaço físico compacto.

A diferença geracional entre ambos é evidente nos principais indicadores de desempenho:

Largura de banda: O DRAM tradicional (por exemplo, DDR5) oferece 50–100 GB/s, enquanto um único stack de HBM3E pode atingir 1,2 TB/s. O HBM4 de próxima geração deverá ultrapassar os 2,0 TB/s. O HBM proporciona mais de 10 vezes a largura de banda do DRAM convencional.

Eficiência energética: O HBM pode operar abaixo de 5 pJ/bit, comparando com 10–15 pJ/bit do DRAM tradicional. Em centros de dados com milhares de GPUs em simultâneo, esta diferença traduz-se em dezenas de milhões de dólares em custos anuais de eletricidade.

Latência: O DRAM plano mantém uma latência em torno de 10 ns, enquanto o aumento das camadas no HBM eleva a latência para cerca de 100 ns. Contudo, no treino e inferência de IA, o throughput é muito mais relevante do que a latência de acesso individual—a capacidade de processar rapidamente parâmetros massivos é mais crítica do que a velocidade de acessos isolados.

Custo: A produção de HBM é muito mais dispendiosa do que a de DRAM tradicional. Embora o custo por Gb do HBM4 seja 30 % inferior ao do HBM3, continua a ser 3–5 vezes superior ao do DDR5 com a mesma capacidade. O HBM consome 4–5 vezes o volume de wafer do DDR5, e a tecnologia TSV reduz significativamente a densidade de bits face ao DDR. Por exemplo, o DDR4 D1z da SK Hynix apresenta uma densidade de bits de 0,296 Gb/mm², 85 % superior ao HBM3 (0,16 Gb/mm²). A área adicional necessária para os TSV e o empilhamento/packaging complexo é a principal razão para os elevados custos do HBM.

Em resumo: O DRAM tradicional procura "adequação acessível", enquanto o HBM persegue a "largura de banda máxima"—uma batalha entre abordagens tecnológicas orientadas pelo custo e pela largura de banda.

A Crise da Memory Wall: Porque Precisam os Modelos de IA do HBM

A dependência da IA pelo HBM resulta de um gargalo fundamental conhecido como "Memory Wall".

Nos últimos 20 anos, o poder computacional das GPUs aumentou 60 000 vezes, enquanto a largura de banda do DRAM cresceu apenas 100 vezes. A velocidade de processamento ultrapassou a velocidade de fornecimento de dados—como um carro de corrida superpotente com uma linha de combustível ainda presa às especificações de há duas décadas. A GPU é o motor; o HBM é o sistema de injeção de combustível. Se o fornecimento não acompanhar, até o motor mais potente ficará a rodar em vazio.

Os grandes modelos de linguagem amplificam esta contradição. Os modelos de IA não se limitam a recuperar informação estática—mantêm continuamente um "estado de trabalho" que inclui janelas de contexto, cache KV, ativações intermédias e decisões de routing. Estes elementos têm de ser acedidos em tempo real, com latência ultra-baixa e disponibilidade constante. Durante o processamento completo da sequência de tokens, o modelo acede e atualiza o contexto de forma contínua—um ligeiro aumento na latência da memória pode reduzir o throughput, atrasar respostas ou obrigar os operadores a adicionar hardware.

Fase de treino: Modelos com biliões de parâmetros iteram repetidamente sobre datasets massivos, com cada forward e backward pass a envolver leituras e atualizações de enormes volumes de parâmetros. A largura de banda em TB/s do HBM é decisiva para encurtar os tempos de treino.

Fase de inferência: À medida que proliferam modelos multimodais e agentes de IA, o número de chamadas de tokens dispara. O gargalo na inferência não é "quão rápido se calcula", mas "quão rápido se alimenta com dados". No final da estrada da largura de banda está o HBM.

A nível sistémico, a IA assenta numa arquitetura de memória em camadas: o HBM alimenta os aceleradores com dados, o DRAM armazena o estado em tempo real e a memória de conversação, e os SSD baseados em NAND proporcionam armazenamento persistente para datasets, embeddings, índices de recuperação, logs e checkpoints. O HBM está mais próximo do núcleo computacional, encarregando-se das tarefas de fornecimento de dados mais frequentes e urgentes—um papel que nenhum outro meio de armazenamento consegue substituir.

Por isso, todos os aceleradores de IA líderes para treino e inferência generativa utilizam HBM. O HBM não é um "acessório opcional" para a IA—é o "balão de oxigénio" que determina a velocidade a que a IA pode avançar.

Desequilíbrio Oferta-Demanda: Anos de Escassez Estrutural

A procura de HBM é rígida, mas a oferta está "bloqueada".

Lado da procura: O investimento global em infraestruturas de IA atingirá 450 mil milhões $ em 2026, com o poder de computação de inferência a superar 70 % pela primeira vez, impulsionando fortemente a procura de GPUs, HBM e chips de rede de alta velocidade. O crescimento da procura de HBM em 2026 é principalmente motivado por upgrades de capacidade dos ASIC de IA, com a capacidade de HBM por chip de IA a saltar de 96 GB/192 GB para 216 GB/288 GB. A plataforma Rubin da NVIDIA mantém a capacidade de HBM por GPU nos níveis anteriores, mas o aumento das entregas eleva a procura global. Os nove maiores fornecedores de cloud do mundo deverão gastar cerca de 830 mil milhões $ em 2026, um aumento de 79 % face ao ano anterior.

Lado da oferta: Apesar de Samsung, SK Hynix e Micron alocarem 70 % da nova capacidade ajustável ao HBM, o défice de oferta permanece nos 50–60 %. No primeiro trimestre de 2026, toda a capacidade de HBM dos três grandes está vendida. A SemiAnalysis reporta que a oferta de DRAM em 2026 será 7 % inferior à procura, o HBM terá um défice de 6 %, e a lacuna ampliará para 9 % em 2027.

Crucialmente, a oferta é rígida. Mesmo que os três principais fabricantes decidam expandir agora, restrições físicas como processos TSV, yields de packaging avançado e prazos de entrega de equipamentos significam que a nova capacidade só estará operacional em 2028–2029, no mínimo. Os bancos de investimento internacionais concordam, de forma geral, que a escassez estrutural de HBM durará pelo menos até 2028. O CEO da NVIDIA, Jensen Huang, é ainda mais direto: as escassez globais de HBM "não são uma flutuação de mercado de curto prazo, mas um dilema estrutural da indústria que persistirá durante anos."

Preços: Samsung e SK Hynix aumentaram os preços de fornecimento de HBM3E para 2026 em quase 20 %. Os preços iniciais de contratos para HBM4 de 12 camadas deverão incluir um prémio superior a 10 % face aos contratos de HBM3E de 12 camadas em 2025.

Panorama de Mercado: Quem Lidera a Revolução da Memória?

O mercado de HBM é altamente concentrado. Os analistas prevêem que a SK Hynix detenha cerca de 52 % de quota de mercado em entregas em 2026, a Samsung cerca de 39 %, a Micron cerca de 8 %, com os fabricantes chineses a manterem uma quota mínima. Em termos de vendas, a receita de HBM da SK Hynix poderá atingir 5,95 mil milhões $ em 2026, garantindo firmemente o topo global.

No primeiro trimestre de 2026, a quota de mercado global de HBM da SK Hynix ronda os 51,4 %. A TrendForce prevê que a quota anual de HBM se mantenha em torno dos 50 %; a Counterpoint estima que a quota de HBM4 atinja os 54 %.

As margens brutas dos três grandes fabricantes ultrapassaram os 70 % e até os 80 %. A distribuição de lucros do HBM forma uma "pirâmide"—quanto mais próximo do núcleo técnico e do gargalo, maior a quota.

Entretanto, surge uma tendência interessante: a rentabilidade do DRAM generalista está a superar estruturalmente a do HBM. No primeiro trimestre de 2026, a diferença de margem operacional entre DRAM generalista e HBM ultrapassou os 15 pontos percentuais. As estimativas de mercado mostram que alocar capacidade ao DRAM generalista gera mais do dobro da receita por wafer face ao HBM, com quase o triplo da margem bruta. É por isso que a SK Hynix pondera transferir alguns recursos de volta para o DRAM generalista—confirmando, ironicamente, que todo o mercado de memória está a viver um boom generalizado.

Perspetiva de Investimento: Oportunidades no Superciclo do HBM

A escassez estrutural do HBM e a subida dos preços oferecem aos investidores uma lógica clara de setor.

Os fabricantes de memória são os beneficiários diretos. SK Hynix (KRX), Samsung Electronics (KRX) e Micron (NASDAQ) aproveitam o domínio técnico e a capacidade escassa para capturar a maioria dos lucros excedentes do setor. A Morgan Stanley, prevendo uma subida de 62 % nos preços médios do DRAM até 2026, aumentou as previsões de lucros dos fabricantes de memória em 56–63 %.

Os intervenientes da cadeia de abastecimento upstream também beneficiam. A expansão em larga escala por parte dos líderes de memória impulsiona diretamente a procura de equipamentos de semicondutores, como gravação, deposição de filmes finos, testes, transmitindo prosperidade do upstream para o midstream. As necessidades de packaging avançado do HBM estão igualmente a acelerar a industrialização de tecnologias de packaging 2,5D, como o CoWoS.

Os fabricantes de chips de IA são os principais motores da procura de HBM. Empresas líderes de chips de IA como NVIDIA (NASDAQ) e Broadcom (NASDAQ) estão a expandir a aquisição de HBM. O GPU Rubin Ultra da NVIDIA contará com capacidade de HBM até 1 TB por chip.

Gate Stock Trading: Acesso Único ao Investimento Global em Memória e IA

Para investidores que pretendam participar neste superciclo da memória, o Gate Stock oferece um ponto de entrada conveniente.

O Gate Stock disponibiliza agora um sistema de negociação 24/7 abrangendo os mercados dos EUA, Hong Kong e Coreia, suportando mais de 10 000 ações e ETF dos EUA, mais de 1 500 ações de Hong Kong e 1 000 ações coreanas—totalizando mais de 12 500 ativos de ações e ETF a nível mundial. As listagens incluem líderes globais como Apple, NVIDIA, Microsoft, Tencent Holdings, Xiaomi Group, Samsung Electronics e SK Hynix.

Os utilizadores podem investir em ações globais através da conta unificada da Gate, utilizando USDT, com negociação de ações fracionadas a partir de apenas 0,01 ações, e usufruir de distribuição de dividendos. A plataforma suporta também operações societárias como splits e consolidações de ações, com cobertura total em app e web.

O Gate Stock expandiu-se além dos horários tradicionais de pré-market, regular e after-hours, para suportar negociação noturna e ao fim de semana, ultrapassando as restrições convencionais de tempo dos mercados de valores mobiliários. Os serviços de transferência intercorretora estão a caminho, aumentando ainda mais a flexibilidade e conveniência na gestão de ativos de ações.

Método de negociação: Após financiar uma conta unificada na plataforma Gate, os utilizadores podem selecionar as ações-alvo no módulo de negociação de ações e comprá-las ou vendê-las denominadas em USDT. A plataforma oferece cotações em tempo real, ferramentas de análise técnica e tipos de ordem (mercado, limite, etc.), com uma experiência consistente com a negociação de ativos cripto.

Conclusão

A diferença entre HBM e DRAM reside fundamentalmente nas abordagens tecnológicas "prioridade à largura de banda" versus "prioridade ao custo". À medida que o poder computacional da IA continua a expandir-se, o empilhamento 3D e a tecnologia TSV do HBM ultrapassaram a "memory wall", tornando-o um componente central insubstituível para o treino e inferência de grandes modelos.

Em 2026, o mercado global de semicondutores ultrapassará 1,51 biliões $, os chips de memória crescerão 250 %, e o mercado de HBM subirá 58 % até 54,6 mil milhões $. O défice de oferta chega aos 50–60 %, e toda a capacidade dos três grandes fabricantes está vendida. Isto não é uma flutuação cíclica típica—é uma transformação estrutural impulsionada por investimento de capital de longo prazo em infraestruturas de IA.

Para investidores, fabricantes de memória, fornecedores de equipamentos/materiais e fabricantes de chips de IA, todos têm uma lógica clara de setor a seu favor. O serviço de negociação 24/7 de ações dos EUA, Hong Kong e Coreia do Gate Stock oferece aos investidores globais uma ferramenta flexível e eficiente para participar neste superciclo da memória. Num clima atual de medo extremo de mercado (Índice de Medo 14–16), o desfasamento entre os fundamentos do setor e o sentimento de mercado pode criar as oportunidades estruturais mais interessantes.

FAQ

Q1: Qual é a diferença fundamental entre HBM e DRAM?

A principal diferença está na arquitetura. O DRAM tradicional utiliza um design plano, melhorando o desempenho através de upgrades de processo. O HBM emprega empilhamento 3D, usando TSV para empilhar verticalmente vários dies de DRAM e criar caminhos de dados ultra-largos. O HBM3E oferece até 1,2 TB/s de largura de banda—mais de 10 vezes a do DDR5—mas custa 3–5 vezes mais para a mesma capacidade.

Q2: Porque precisam os modelos de IA do HBM?

O treino e a inferência de grandes modelos exigem leitura/escrita rápida de enormes volumes de parâmetros. O crescimento da largura de banda do DRAM ficou muito atrás do poder computacional (60 000x vs. 100x em 20 anos), criando um gargalo conhecido como "memory wall". A largura de banda em TB/s do HBM alimenta continuamente as GPUs com dados, evitando ciclos de computação ociosos. Todos os aceleradores de IA líderes utilizam HBM.

Q3: Quem são os principais intervenientes no mercado de HBM?

O mercado de HBM é altamente concentrado. Prevê-se que a SK Hynix detenha cerca de 52 % de quota de entregas em 2026, a Samsung cerca de 39 % e a Micron cerca de 8 %. A SK Hynix lidera em vendas, com receitas de HBM estimadas em 5,95 mil milhões $ em 2026. Toda a capacidade de HBM dos três grandes está vendida, com alguns clientes a garantir fornecimento até 2028.

Q4: Quanto tempo irá durar a escassez de HBM?

Os bancos de investimento internacionais acreditam, de forma geral, que a escassez de HBM persistirá pelo menos até 2028. A procura é impulsionada pelo investimento em infraestruturas de IA, enquanto a oferta é limitada por processos TSV, yields de packaging e prazos de entrega de equipamentos. Mesmo que a expansão comece agora, a nova capacidade só estará disponível em 2028–2029. Jensen Huang considera isto um "dilema estrutural de indústria de vários anos".

Q5: Como posso investir em ações relacionadas com HBM no Gate?

O Gate Stock oferece negociação 24/7 para ações dos EUA, Hong Kong e Coreia, abrangendo mais de 12 500 ações e ETF. Os utilizadores podem investir globalmente através de uma conta unificada usando USDT, a partir de 0,01 ações. As listagens relacionadas com HBM incluem fabricantes de memória como SK Hynix (KRX), Samsung Electronics (KRX), Micron (NASDAQ) e fabricantes de chips de IA como NVIDIA (NASDAQ).

The content herein does not constitute any offer, solicitation, or recommendation. You should always seek independent professional advice before making any investment decisions. Please note that Gate may restrict or prohibit the use of all or a portion of the Services from Restricted Locations. For more information, please read the User Agreement

HBM vs. DRAM: Porque Dependem os Grandes Modelos de IA Destas Tecnologias?

HBM vs. DRAM: Mesma Origem, Caminhos Divergentes

A Crise da Memory Wall: Porque Precisam os Modelos de IA do HBM

Desequilíbrio Oferta-Demanda: Anos de Escassez Estrutural

Panorama de Mercado: Quem Lidera a Revolução da Memória?

Perspetiva de Investimento: Oportunidades no Superciclo do HBM

Gate Stock Trading: Acesso Único ao Investimento Global em Memória e IA

Conclusão

FAQ

Flash

Irão atrasa cronograma das negociações nucleares, reinício condicionado à retirada de Israel do Líbano

Boeing e Sindicato dos Engenheiros iniciam negociações contratuais a 1 de julho

Receita de negociação dos bancos dos EUA aumentou 5,6% no primeiro trimestre, relata OCC

Anthropic Lança Claude Sonnet 5 com Capacidades de Agente Melhoradas, com o Preço de 2 Dólares por Milhão de Tokens de Entrada

Decisor político do BCE, Dolenc, sinaliza que manutenção das taxas em julho pode ser adequada em meio à incerteza no Médio Oriente.

Dexe aproxima-se do máximo histórico: porque voltou a governação DAO ao centro das atenções?

Os lucros não realizados das baleias de Ethereum tornam-se negativos pela primeira vez desde 2019: estará o fundo do mercado a aproximar-se?

História: Porque Rebranding para DATA Foundation? Dados de Treino para IA Emergentes como a Nova Fronteira