Ascend 950PR deve trazer um ambiente no estilo CUDA para atrair a nuvem chinesa
A Huawei está preparando um novo acelerador de IA, o Ascend 950PR, com a proposta de se tornar uma alternativa mais atraente às soluções da Nvidia para os grandes provedores de nuvem da China. Segundo a Reuters, o apelo central do lançamento não está apenas na capacidade de computação, mas principalmente em uma compatibilidade muito mais forte com a ecossistema de desenvolvimento CUDA, já familiar para a maioria dos programadores.
No mercado chinês, a procura por alternativas à Nvidia continua elevada, sobretudo entre grandes empresas de nuvem. O acesso a aceleradores norte-americanos ficou mais difícil por causa de restrições regulatórias, o que tem levado o setor a duas saídas: alugar capacidade computacional no exterior ou recorrer a opções locais.
De acordo com a reportagem, desenvolvedores chineses de grande porte seguem preferindo hardware da Nvidia não só pelo desempenho bruto, mas também pela dependência prática de CUDA, considerado o principal padrão de software para treinamento e inferência em IA. As tentativas anteriores da Huawei de impulsionar o seu próprio stack, o CANN, não teriam gerado um efeito comparável; porém, com a chegada do CANN Next, a empresa teria se aproximado de forma significativa do modelo de programação já conhecido do universo Nvidia.
CANN Next: elementos semelhantes ao CUDA e foco no Ascend 950PR
A nova versão da plataforma de software passa a incorporar componentes que lembram o CUDA. A estratégia da Huawei, conforme descrito, não é substituir o CUDA diretamente, e sim permitir que desenvolvedores trabalhem dentro de uma lógica o mais parecida possível com a que já usam, enquanto a otimização de execução acontece por trás para a arquitetura Ascend.
Essa mudança, ainda conforme a Reuters, tornou o Ascend 950PR consideravelmente mais interessante para grandes clientes na China. Fontes da agência afirmam que ByteDance e Alibaba já planejam fazer pedidos do novo acelerador. Também é citado que a Huawei pretende fabricar 750 mil chips dessa série ao longo de um ano.
Nos dados técnicos divulgados, o Ascend 950PR é descrito com desempenho de até 1 PFLOPS FP8 e até 2 PFLOPS FP4. Também são mencionados um enlace interchip com 2 TB/s de largura de banda e uma memória própria HiBL 1.0 com 128 GB e 1,6 TB/s de largura de banda. A presença de uma subsistema de memória dedicada, como indicado, deve ajudar a Huawei a reduzir riscos ligados ao escalonamento da produção.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário