Resfriamento líquido DLC-2 reduz custos em data centers

  DLC-2 Supermicro: resfriamento líquido estratégico para eficiência em data centers Introdução O crescimento exponencial da inteligência artificial (IA), da computação de alto desempenho (HPC) e da nuvem corporativa está pressionando os data centers globais a revisarem sua arquitetura energética e de resfriamento. A densidade computacional por rack aumentou drasticamente, impulsionada por GPUs de última geração como a NVIDIA Blackwell e CPUs Intel Xeon 6. Nesse cenário, métodos tradicionais de resfriamento a ar começam a atingir limites físicos e econômicos. É nesse contexto que a Supermicro apresenta o DLC-2, sua solução de resfriamento líquido direto projetada para otimizar eficiência, reduzir custos e possibilitar a operação de data centers de IA com densidades sem precedentes. Segundo a empresa, o DLC-2 pode cortar até 40% do consumo de energia e diminuir o TCO em até 20%, transformando não apenas a operação técnica, mas também a estratégia financeira das organizações. A inação frente a essas mudanças acarreta riscos graves: desde custos crescentes com eletricidade e água até perda de competitividade frente a concorrentes que adotarem soluções mais eficientes. Ao longo deste artigo, analisaremos em profundidade o problema estratégico do resfriamento em data centers modernos, as consequências de não agir, os fundamentos técnicos do DLC-2, as práticas de implementação e as métricas para medir o sucesso dessa transição. O problema estratégico do resfriamento em data centers A indústria de data centers vive um dilema: suportar cargas cada vez mais intensivas em computação sem comprometer sustentabilidade e custos. A chegada de arquiteturas como NVIDIA HGX B200, que integra oito GPUs de alto desempenho em apenas 4U de rack, pressiona drasticamente os limites térmicos das instalações. O resfriamento a ar, tradicionalmente utilizado, enfrenta limitações claras. Ventiladores de alta velocidade consomem grande quantidade de energia e geram ruído significativo, frequentemente acima de 80 dB. Além disso, a necessidade de chillers de água gelada implica consumo adicional de energia elétrica e de recursos hídricos, agravando a pegada ambiental e elevando o custo operacional. Do ponto de vista estratégico, organizações que permanecem dependentes de sistemas de resfriamento a ar podem enfrentar gargalos de expansão, já que a infraestrutura não suportará novos racks otimizados para IA. Isso se traduz em barreiras para crescimento de negócios digitais, aumento de OPEX e dificuldade em alinhar operações com metas de ESG. Consequências da inação Ignorar a transição para tecnologias de resfriamento líquido implica não apenas custos mais altos, mas também riscos competitivos severos. A Supermicro estima que até 30% dos novos data centers em breve dependerão de soluções líquidas, criando uma diferença de eficiência entre adotantes e retardatários. Do ponto de vista econômico, continuar investindo em sistemas de refrigeração a ar pode significar até 40% de consumo energético adicional em comparação ao DLC-2. No longo prazo, essa diferença impacta diretamente o TCO, reduzindo margens e comprometendo investimentos em inovação. Além disso, há o risco de indisponibilidade operacional, já que racks de alta densidade podem simplesmente não funcionar em condições térmicas inadequadas. Outro ponto crítico é a sustentabilidade. Governos e investidores estão cada vez mais atentos ao uso de água e energia. Data centers que não reduzem sua pegada ambiental podem enfrentar barreiras regulatórias, perda de incentivos fiscais e danos reputacionais junto a clientes corporativos sensíveis a ESG. Fundamentos da solução DLC-2 O DLC-2 da Supermicro foi concebido como uma resposta arquitetônica aos desafios citados. Trata-se de uma solução de resfriamento líquido direto capaz de capturar até 98% do calor gerado em um rack de servidores. Essa eficiência deriva do uso de placas frias que cobrem não apenas CPUs e GPUs, mas também memória, switches PCIe e reguladores de tensão. O sistema suporta temperaturas de entrada de líquido de até 45 °C, o que elimina a necessidade de chillers de água gelada. Isso se traduz em até 40% de economia no consumo de água, além de reduzir investimentos em compressores e equipamentos auxiliares. Outro benefício direto é a diminuição do número e da velocidade dos ventiladores, levando a níveis de ruído em torno de 50 dB – comparável a uma conversa normal, contra ruídos agressivos de data centers refrigerados a ar. A arquitetura é complementada por uma Unidade de Distribuição de Refrigerante (CDU) com capacidade de remover até 250 kW de calor por rack, além de coletores de distribuição vertical (CDMs), que otimizam a circulação do líquido entre servidores. O resultado é uma solução modular, escalável e adaptada para suportar clusters inteiros de IA e HPC. Implementação estratégica em data centers corporativos A adoção do DLC-2 não deve ser vista apenas como substituição técnica de ventiladores por líquido refrigerante. Trata-se de uma transformação estratégica que impacta desde o design do data center até sua operação diária. Empresas que buscam implementar a solução devem considerar três aspectos fundamentais: planejamento térmico, integração de infraestrutura e governança operacional. Planejamento térmico e arquitetônico O primeiro passo é revisar a arquitetura física do data center. A possibilidade de operar com líquido a 45 °C de entrada significa que a infraestrutura pode ser instalada em regiões com variação climática mais ampla, sem depender de resfriadores caros. Essa flexibilidade reduz CAPEX inicial e amplia o leque de locais viáveis para novas instalações. Integração de servidores e racks O DLC-2 está alinhado a servidores otimizados, como os modelos Supermicro 4U com oito GPUs NVIDIA Blackwell e CPUs Intel Xeon 6. Isso exige que equipes de TI planejem a densidade computacional por rack com cuidado, aproveitando ao máximo o espaço físico liberado pela redução de equipamentos de refrigeração a ar. Governança e operação contínua Outro fator estratégico é o gerenciamento integrado via SuperCloud Composer, que permite orquestrar clusters refrigerados a líquido com visibilidade em nível de data center. Esse recurso garante não apenas eficiência operacional, mas também conformidade com políticas de segurança, auditoria e compliance ambiental. Melhores práticas avançadas A experiência prática mostra que a adoção bem-sucedida do resfriamento líquido depende de um conjunto de melhores práticas. O uso de torres de resfriamento híbridas, por exemplo, combina elementos de torres secas e de água, proporcionando eficiência adicional em locais com grande variação

Supermicro expande linha NVIDIA Blackwell com DLC-2

Supermicro NVIDIA Blackwell DLC-2: Eficiência e desempenho para fábricas de IA A evolução das infraestruturas de inteligência artificial (IA) está diretamente ligada à capacidade de entregar desempenho extremo com eficiência energética e flexibilidade de implementação. Em um cenário onde modelos de linguagem, visão computacional e workloads de larga escala demandam cada vez mais recursos, a Supermicro anunciou a expansão de seu portfólio NVIDIA Blackwell, introduzindo soluções que redefinem a operação de data centers e AI factories. Com destaque para o novo sistema 4U Direct Liquid Cooling (DLC-2) e o 8U air-cooled front I/O, a empresa busca atender desde instalações com infraestrutura de resfriamento líquido até ambientes tradicionais, sempre com foco em desempenho, economia de energia e facilidade de manutenção. Introdução: O contexto estratégico O avanço da IA generativa e de modelos de larga escala impõe desafios significativos às empresas que operam data centers de alto desempenho. Processar e treinar redes neurais profundas requer enorme poder computacional, resultando em consumo elevado de energia e complexidade térmica. Nesse cenário, soluções otimizadas para reduzir consumo, simplificar manutenção e maximizar throughput tornam-se não apenas desejáveis, mas essenciais. A Supermicro posiciona-se como um fornecedor estratégico ao oferecer sistemas prontos para os processadores NVIDIA HGX B200 e compatíveis com futuras gerações, como o B300. Ao mesmo tempo, introduz melhorias arquiteturais que resolvem gargalos comuns: gerenciamento de cabos, eficiência térmica, flexibilidade de configuração e manutenção direta pelo corredor frio (cold aisle). Problema estratégico: A escalabilidade da infraestrutura de IA O crescimento das aplicações de IA, especialmente em aprendizado profundo, impõe a necessidade de clusters com milhares de nós interligados por redes de altíssima velocidade. Além da capacidade de processamento, há a questão da dissipação térmica: GPUs modernas, como as da arquitetura Blackwell, operam com altíssima densidade de potência, tornando o gerenciamento térmico um fator crítico para a disponibilidade e a confiabilidade do sistema. A implementação ineficiente pode resultar em custos operacionais elevados, interrupções não planejadas e gargalos de rede e memória. Em ambientes de larga escala, até pequenas ineficiências multiplicam-se, impactando diretamente o TCO (Total Cost of Ownership) e a competitividade do negócio. Consequências da inação Ignorar a evolução das tecnologias de resfriamento e interconexão significa aceitar: Custos de energia desproporcionalmente altos devido à refrigeração ineficiente. Limitações de densidade computacional, reduzindo a escalabilidade do data center. Aumento do tempo de implantação e complexidade de manutenção. Risco de downtime devido a falhas térmicas e gargalos de interconexão. Esses fatores comprometem não apenas o desempenho técnico, mas também a capacidade de atender prazos e orçamentos em projetos de IA de missão crítica. Fundamentos da solução Supermicro NVIDIA Blackwell DLC-2 A arquitetura DLC-2 (Direct Liquid Cooling – 2ª geração) da Supermicro oferece um salto de eficiência no resfriamento de sistemas de alto desempenho. Com até 98% de captura de calor, a solução elimina a necessidade de chillers em muitos cenários ao operar com água quente a até 45°C, reduzindo também o consumo de água em até 40%. Essa abordagem não só melhora a eficiência térmica, mas também permite a operação de data centers em níveis de ruído tão baixos quanto 50dB, favorecendo ambientes onde o conforto acústico é relevante. Configurações front I/O: repensando o acesso e a manutenção O novo design com acesso frontal a NICs, DPUs, armazenamento e gerenciamento simplifica a instalação e manutenção no corredor frio, reduzindo a necessidade de intervenções no corredor quente e melhorando a organização do cabeamento. Isso é especialmente útil em ambientes de alta densidade, onde a gestão de cabos e o fluxo de ar são críticos. Implementação estratégica Para empresas que buscam implementar ou expandir AI factories, a escolha entre as opções 4U liquid-cooled e 8U air-cooled deve ser pautada pela infraestrutura existente e pela estratégia de longo prazo: 4U DLC-2 liquid-cooled: ideal para data centers já preparados para refrigeração líquida, buscando máxima densidade e economia de energia. 8U air-cooled: solução mais compacta e adequada para instalações sem infraestrutura de refrigeração líquida, mantendo alta performance. Ambos suportam 8 GPUs NVIDIA HGX B200 com interconexão via NVLink® de 5ª geração a 1.8TB/s e até 1.4TB de memória HBM3e, permitindo 15x mais performance em inferência e 3x em treinamento de LLMs em comparação à geração Hopper. Escalabilidade e rede Com até 8 NICs NVIDIA ConnectX®-7 de 400G e 2 DPUs NVIDIA BlueField®-3, os sistemas são projetados para clusters de milhares de nós. A compatibilidade com NVIDIA Quantum-2 InfiniBand e Spectrum™-X Ethernet garante máxima performance na comunicação entre nós, essencial para cargas de trabalho distribuídas. Melhores práticas avançadas Para maximizar os benefícios das novas soluções Supermicro: Adotar projeto de rede em malha de alta velocidade para reduzir latência em treinamento distribuído. Implementar monitoramento térmico contínuo para otimizar o uso da refrigeração líquida. Utilizar expansão de memória com 32 DIMMs para eliminar gargalos CPU-GPU. Padronizar a manutenção via acesso front I/O para reduzir downtime. Medição de sucesso O impacto da adoção das soluções pode ser medido por: Eficiência energética: redução do consumo de energia em até 40%. Capacidade de processamento: throughput de dados e tempos de treinamento. Disponibilidade: redução de falhas térmicas e interrupções. ROI: tempo para retorno do investimento considerando economia operacional. Conclusão A nova geração de sistemas Supermicro NVIDIA Blackwell DLC-2 representa um avanço significativo para organizações que operam em escala de AI factories. Ao combinar desempenho extremo, eficiência energética e manutenção simplificada, a empresa entrega ferramentas para enfrentar os desafios de uma era onde a IA é fator decisivo para a competitividade. O futuro aponta para arquiteturas ainda mais densas, integração crescente entre CPU e GPU e maior uso de refrigeração líquida em escala de data center. Adotar agora essas tecnologias posiciona as empresas na vanguarda dessa transformação.

Cart
Carrinho De Consulta ×
Loading....