30 de Junho de 2026: O Bitcoin negoceia numa faixa estreita próxima dos 60 000 $, enquanto o Ethereum mantém-se estável em torno dos 1 600 $. Após uma correção prolongada ao longo de Junho, os investidores de curto prazo continuam a dominar o mercado cripto. Contudo, à medida que os ativos digitais entram num período de "tempo morto", outro setor está a viver um crescimento explosivo sem precedentes—memória de semicondutores.
O relatório de Primavera de 2026 da World Semiconductor Trade Statistics (WSTS) aumentou drasticamente as expectativas de crescimento do setor: o mercado global de semicondutores poderá ultrapassar 1,51 biliões $ em 2026, um aumento de 90 % face ao ano anterior. Os chips de memória deverão crescer 250 %, atingindo 800 mil milhões $. Pela primeira vez, a produção de memória irá superar a das foundries de wafers, tornando-se o principal motor de crescimento nos semicondutores.
No centro desta revolução da memória está o HBM (High Bandwidth Memory). O mercado de HBM deverá crescer 58 % em 2026, alcançando 54,6 mil milhões $ e representando quase 40 % do mercado DRAM. O que distingue o HBM do DRAM? Porque dependem tanto os modelos de IA do HBM?
HBM vs. DRAM: Mesma Origem, Caminhos Divergentes
O HBM e o DRAM partilham o mesmo meio fundamental de armazenamento—memória dinâmica de acesso aleatório. No entanto, as abordagens tecnológicas, os designs arquitetónicos e os cenários de aplicação divergem de forma significativa.
O DRAM tradicional segue uma estratégia de "expansão horizontal". Representado pelo DDR4 e DDR5, o DRAM convencional utiliza uma arquitetura plana. As melhorias de desempenho resultam de avanços no processo (por exemplo, da tecnologia de 20 nm para 2 nm) e de otimizações arquitetónicas (como o aumento da largura de prefetch no DDR5). A lógica central consiste em reduzir continuamente o tamanho do transistor e aumentar a frequência num plano bidimensional. Porém, esta abordagem está a atingir os seus limites físicos—processos abaixo de 2 nm enfrentam desafios como o tunelamento quântico, e uma miniaturização adicional já não consegue satisfazer a procura exponencial de largura de banda de memória por parte da IA.
O HBM adota uma abordagem de "empilhamento vertical" para ultrapassar estes limites. O HBM utiliza uma estrutura tridimensional, recorrendo à tecnologia Through-Silicon Via (TSV) para empilhar verticalmente vários dies de DRAM, formando uma estrutura semelhante a um cubo. São perfurados milhares de pequenos orifícios nos chips de DRAM, ligando as camadas através de elétrodos verticais. Na base encontra-se a unidade de controlo lógico do DRAM, que gere o timing e o controlo do stack. Este design em "torre" permite ao HBM alcançar uma densidade de largura de banda extremamente elevada num espaço físico compacto.
A diferença geracional entre ambos é evidente nos principais indicadores de desempenho:
Largura de banda: O DRAM tradicional (por exemplo, DDR5) oferece 50–100 GB/s, enquanto um único stack de HBM3E pode atingir 1,2 TB/s. O HBM4 de próxima geração deverá ultrapassar os 2,0 TB/s. O HBM proporciona mais de 10 vezes a largura de banda do DRAM convencional.
Eficiência energética: O HBM pode operar abaixo de 5 pJ/bit, comparando com 10–15 pJ/bit do DRAM tradicional. Em centros de dados com milhares de GPUs em simultâneo, esta diferença traduz-se em dezenas de milhões de dólares em custos anuais de eletricidade.
Latência: O DRAM plano mantém uma latência em torno de 10 ns, enquanto o aumento das camadas no HBM eleva a latência para cerca de 100 ns. Contudo, no treino e inferência de IA, o throughput é muito mais relevante do que a latência de acesso individual—a capacidade de processar rapidamente parâmetros massivos é mais crítica do que a velocidade de acessos isolados.
Custo: A produção de HBM é muito mais dispendiosa do que a de DRAM tradicional. Embora o custo por Gb do HBM4 seja 30 % inferior ao do HBM3, continua a ser 3–5 vezes superior ao do DDR5 com a mesma capacidade. O HBM consome 4–5 vezes o volume de wafer do DDR5, e a tecnologia TSV reduz significativamente a densidade de bits face ao DDR. Por exemplo, o DDR4 D1z da SK Hynix apresenta uma densidade de bits de 0,296 Gb/mm², 85 % superior ao HBM3 (0,16 Gb/mm²). A área adicional necessária para os TSV e o empilhamento/packaging complexo é a principal razão para os elevados custos do HBM.
Em resumo: O DRAM tradicional procura "adequação acessível", enquanto o HBM persegue a "largura de banda máxima"—uma batalha entre abordagens tecnológicas orientadas pelo custo e pela largura de banda.
A Crise da Memory Wall: Porque Precisam os Modelos de IA do HBM
A dependência da IA pelo HBM resulta de um gargalo fundamental conhecido como "Memory Wall".
Nos últimos 20 anos, o poder computacional das GPUs aumentou 60 000 vezes, enquanto a largura de banda do DRAM cresceu apenas 100 vezes. A velocidade de processamento ultrapassou a velocidade de fornecimento de dados—como um carro de corrida superpotente com uma linha de combustível ainda presa às especificações de há duas décadas. A GPU é o motor; o HBM é o sistema de injeção de combustível. Se o fornecimento não acompanhar, até o motor mais potente ficará a rodar em vazio.
Os grandes modelos de linguagem amplificam esta contradição. Os modelos de IA não se limitam a recuperar informação estática—mantêm continuamente um "estado de trabalho" que inclui janelas de contexto, cache KV, ativações intermédias e decisões de routing. Estes elementos têm de ser acedidos em tempo real, com latência ultra-baixa e disponibilidade constante. Durante o processamento completo da sequência de tokens, o modelo acede e atualiza o contexto de forma contínua—um ligeiro aumento na latência da memória pode reduzir o throughput, atrasar respostas ou obrigar os operadores a adicionar hardware.
Fase de treino: Modelos com biliões de parâmetros iteram repetidamente sobre datasets massivos, com cada forward e backward pass a envolver leituras e atualizações de enormes volumes de parâmetros. A largura de banda em TB/s do HBM é decisiva para encurtar os tempos de treino.
Fase de inferência: À medida que proliferam modelos multimodais e agentes de IA, o número de chamadas de tokens dispara. O gargalo na inferência não é "quão rápido se calcula", mas "quão rápido se alimenta com dados". No final da estrada da largura de banda está o HBM.
A nível sistémico, a IA assenta numa arquitetura de memória em camadas: o HBM alimenta os aceleradores com dados, o DRAM armazena o estado em tempo real e a memória de conversação, e os SSD baseados em NAND proporcionam armazenamento persistente para datasets, embeddings, índices de recuperação, logs e checkpoints. O HBM está mais próximo do núcleo computacional, encarregando-se das tarefas de fornecimento de dados mais frequentes e urgentes—um papel que nenhum outro meio de armazenamento consegue substituir.
Por isso, todos os aceleradores de IA líderes para treino e inferência generativa utilizam HBM. O HBM não é um "acessório opcional" para a IA—é o "balão de oxigénio" que determina a velocidade a que a IA pode avançar.
Desequilíbrio Oferta-Demanda: Anos de Escassez Estrutural
A procura de HBM é rígida, mas a oferta está "bloqueada".
Lado da procura: O investimento global em infraestruturas de IA atingirá 450 mil milhões $ em 2026, com o poder de computação de inferência a superar 70 % pela primeira vez, impulsionando fortemente a procura de GPUs, HBM e chips de rede de alta velocidade. O crescimento da procura de HBM em 2026 é principalmente motivado por upgrades de capacidade dos ASIC de IA, com a capacidade de HBM por chip de IA a saltar de 96 GB/192 GB para 216 GB/288 GB. A plataforma Rubin da NVIDIA mantém a capacidade de HBM por GPU nos níveis anteriores, mas o aumento das entregas eleva a procura global. Os nove maiores fornecedores de cloud do mundo deverão gastar cerca de 830 mil milhões $ em 2026, um aumento de 79 % face ao ano anterior.
Lado da oferta: Apesar de Samsung, SK Hynix e Micron alocarem 70 % da nova capacidade ajustável ao HBM, o défice de oferta permanece nos 50–60 %. No primeiro trimestre de 2026, toda a capacidade de HBM dos três grandes está vendida. A SemiAnalysis reporta que a oferta de DRAM em 2026 será 7 % inferior à procura, o HBM terá um défice de 6 %, e a lacuna ampliará para 9 % em 2027.
Crucialmente, a oferta é rígida. Mesmo que os três principais fabricantes decidam expandir agora, restrições físicas como processos TSV, yields de packaging avançado e prazos de entrega de equipamentos significam que a nova capacidade só estará operacional em 2028–2029, no mínimo. Os bancos de investimento internacionais concordam, de forma geral, que a escassez estrutural de HBM durará pelo menos até 2028. O CEO da NVIDIA, Jensen Huang, é ainda mais direto: as escassez globais de HBM "não são uma flutuação de mercado de curto prazo, mas um dilema estrutural da indústria que persistirá durante anos."
Preços: Samsung e SK Hynix aumentaram os preços de fornecimento de HBM3E para 2026 em quase 20 %. Os preços iniciais de contratos para HBM4 de 12 camadas deverão incluir um prémio superior a 10 % face aos contratos de HBM3E de 12 camadas em 2025.
Panorama de Mercado: Quem Lidera a Revolução da Memória?
O mercado de HBM é altamente concentrado. Os analistas prevêem que a SK Hynix detenha cerca de 52 % de quota de mercado em entregas em 2026, a Samsung cerca de 39 %, a Micron cerca de 8 %, com os fabricantes chineses a manterem uma quota mínima. Em termos de vendas, a receita de HBM da SK Hynix poderá atingir 5,95 mil milhões $ em 2026, garantindo firmemente o topo global.
No primeiro trimestre de 2026, a quota de mercado global de HBM da SK Hynix ronda os 51,4 %. A TrendForce prevê que a quota anual de HBM se mantenha em torno dos 50 %; a Counterpoint estima que a quota de HBM4 atinja os 54 %.
As margens brutas dos três grandes fabricantes ultrapassaram os 70 % e até os 80 %. A distribuição de lucros do HBM forma uma "pirâmide"—quanto mais próximo do núcleo técnico e do gargalo, maior a quota.
Entretanto, surge uma tendência interessante: a rentabilidade do DRAM generalista está a superar estruturalmente a do HBM. No primeiro trimestre de 2026, a diferença de margem operacional entre DRAM generalista e HBM ultrapassou os 15 pontos percentuais. As estimativas de mercado mostram que alocar capacidade ao DRAM generalista gera mais do dobro da receita por wafer face ao HBM, com quase o triplo da margem bruta. É por isso que a SK Hynix pondera transferir alguns recursos de volta para o DRAM generalista—confirmando, ironicamente, que todo o mercado de memória está a viver um boom generalizado.
Perspetiva de Investimento: Oportunidades no Superciclo do HBM
A escassez estrutural do HBM e a subida dos preços oferecem aos investidores uma lógica clara de setor.
Os fabricantes de memória são os beneficiários diretos. SK Hynix (KRX), Samsung Electronics (KRX) e Micron (NASDAQ) aproveitam o domínio técnico e a capacidade escassa para capturar a maioria dos lucros excedentes do setor. A Morgan Stanley, prevendo uma subida de 62 % nos preços médios do DRAM até 2026, aumentou as previsões de lucros dos fabricantes de memória em 56–63 %.
Os intervenientes da cadeia de abastecimento upstream também beneficiam. A expansão em larga escala por parte dos líderes de memória impulsiona diretamente a procura de equipamentos de semicondutores, como gravação, deposição de filmes finos, testes, transmitindo prosperidade do upstream para o midstream. As necessidades de packaging avançado do HBM estão igualmente a acelerar a industrialização de tecnologias de packaging 2,5D, como o CoWoS.
Os fabricantes de chips de IA são os principais motores da procura de HBM. Empresas líderes de chips de IA como NVIDIA (NASDAQ) e Broadcom (NASDAQ) estão a expandir a aquisição de HBM. O GPU Rubin Ultra da NVIDIA contará com capacidade de HBM até 1 TB por chip.
Gate Stock Trading: Acesso Único ao Investimento Global em Memória e IA
Para investidores que pretendam participar neste superciclo da memória, o Gate Stock oferece um ponto de entrada conveniente.
O Gate Stock disponibiliza agora um sistema de negociação 24/7 abrangendo os mercados dos EUA, Hong Kong e Coreia, suportando mais de 10 000 ações e ETF dos EUA, mais de 1 500 ações de Hong Kong e 1 000 ações coreanas—totalizando mais de 12 500 ativos de ações e ETF a nível mundial. As listagens incluem líderes globais como Apple, NVIDIA, Microsoft, Tencent Holdings, Xiaomi Group, Samsung Electronics e SK Hynix.
Os utilizadores podem investir em ações globais através da conta unificada da Gate, utilizando USDT, com negociação de ações fracionadas a partir de apenas 0,01 ações, e usufruir de distribuição de dividendos. A plataforma suporta também operações societárias como splits e consolidações de ações, com cobertura total em app e web.
O Gate Stock expandiu-se além dos horários tradicionais de pré-market, regular e after-hours, para suportar negociação noturna e ao fim de semana, ultrapassando as restrições convencionais de tempo dos mercados de valores mobiliários. Os serviços de transferência intercorretora estão a caminho, aumentando ainda mais a flexibilidade e conveniência na gestão de ativos de ações.
Método de negociação: Após financiar uma conta unificada na plataforma Gate, os utilizadores podem selecionar as ações-alvo no módulo de negociação de ações e comprá-las ou vendê-las denominadas em USDT. A plataforma oferece cotações em tempo real, ferramentas de análise técnica e tipos de ordem (mercado, limite, etc.), com uma experiência consistente com a negociação de ativos cripto.
Conclusão
A diferença entre HBM e DRAM reside fundamentalmente nas abordagens tecnológicas "prioridade à largura de banda" versus "prioridade ao custo". À medida que o poder computacional da IA continua a expandir-se, o empilhamento 3D e a tecnologia TSV do HBM ultrapassaram a "memory wall", tornando-o um componente central insubstituível para o treino e inferência de grandes modelos.
Em 2026, o mercado global de semicondutores ultrapassará 1,51 biliões $, os chips de memória crescerão 250 %, e o mercado de HBM subirá 58 % até 54,6 mil milhões $. O défice de oferta chega aos 50–60 %, e toda a capacidade dos três grandes fabricantes está vendida. Isto não é uma flutuação cíclica típica—é uma transformação estrutural impulsionada por investimento de capital de longo prazo em infraestruturas de IA.
Para investidores, fabricantes de memória, fornecedores de equipamentos/materiais e fabricantes de chips de IA, todos têm uma lógica clara de setor a seu favor. O serviço de negociação 24/7 de ações dos EUA, Hong Kong e Coreia do Gate Stock oferece aos investidores globais uma ferramenta flexível e eficiente para participar neste superciclo da memória. Num clima atual de medo extremo de mercado (Índice de Medo 14–16), o desfasamento entre os fundamentos do setor e o sentimento de mercado pode criar as oportunidades estruturais mais interessantes.
FAQ
Q1: Qual é a diferença fundamental entre HBM e DRAM?
A principal diferença está na arquitetura. O DRAM tradicional utiliza um design plano, melhorando o desempenho através de upgrades de processo. O HBM emprega empilhamento 3D, usando TSV para empilhar verticalmente vários dies de DRAM e criar caminhos de dados ultra-largos. O HBM3E oferece até 1,2 TB/s de largura de banda—mais de 10 vezes a do DDR5—mas custa 3–5 vezes mais para a mesma capacidade.
Q2: Porque precisam os modelos de IA do HBM?
O treino e a inferência de grandes modelos exigem leitura/escrita rápida de enormes volumes de parâmetros. O crescimento da largura de banda do DRAM ficou muito atrás do poder computacional (60 000x vs. 100x em 20 anos), criando um gargalo conhecido como "memory wall". A largura de banda em TB/s do HBM alimenta continuamente as GPUs com dados, evitando ciclos de computação ociosos. Todos os aceleradores de IA líderes utilizam HBM.
Q3: Quem são os principais intervenientes no mercado de HBM?
O mercado de HBM é altamente concentrado. Prevê-se que a SK Hynix detenha cerca de 52 % de quota de entregas em 2026, a Samsung cerca de 39 % e a Micron cerca de 8 %. A SK Hynix lidera em vendas, com receitas de HBM estimadas em 5,95 mil milhões $ em 2026. Toda a capacidade de HBM dos três grandes está vendida, com alguns clientes a garantir fornecimento até 2028.
Q4: Quanto tempo irá durar a escassez de HBM?
Os bancos de investimento internacionais acreditam, de forma geral, que a escassez de HBM persistirá pelo menos até 2028. A procura é impulsionada pelo investimento em infraestruturas de IA, enquanto a oferta é limitada por processos TSV, yields de packaging e prazos de entrega de equipamentos. Mesmo que a expansão comece agora, a nova capacidade só estará disponível em 2028–2029. Jensen Huang considera isto um "dilema estrutural de indústria de vários anos".
Q5: Como posso investir em ações relacionadas com HBM no Gate?
O Gate Stock oferece negociação 24/7 para ações dos EUA, Hong Kong e Coreia, abrangendo mais de 12 500 ações e ETF. Os utilizadores podem investir globalmente através de uma conta unificada usando USDT, a partir de 0,01 ações. As listagens relacionadas com HBM incluem fabricantes de memória como SK Hynix (KRX), Samsung Electronics (KRX), Micron (NASDAQ) e fabricantes de chips de IA como NVIDIA (NASDAQ).




