IBM apresenta chip inspirado no cérebro que faz IA com baixo consumo de energia


Embora não seja adequado para qualquer aplicação, o novo chip representa a integração de duas abordagens computacionais futurísticas.
[Imagem: IBM Research]


Computação na memória

A IBM apresentou sua mais recente versão de um chip inspirado no cérebro que, mais do que um novo tipo de processador, representa uma nova arquitetura de computação.

Além de uma arquitetura neuromórfica, o chip, batizado de NorthPole (Pólo Norte), combina computação com memória, processando os dados de forma eficiente com um consumo de energia mínimo ao dispensar o tráfego dos dados entre um chip que faz os cálculos e os chips onde os dados ficam armazenados.

Desde o seu início, a computação tem sido centrada no processador, com a memória separada da computação. No entanto, transportar grandes quantidades de dados entre memória e computação tem um preço alto em termos de consumo de energia, largura de banda e velocidade de processamento. Isto é particularmente evidente no caso de aplicações emergentes e avançadas de inteligência artificial (IA) em tempo real, como reconhecimento facial, detecção de objetos e monitoramento de comportamento, que exigem acesso rápido a grandes quantidades de dados.

Como resultado, as arquiteturas informáticas contemporâneas estão apresentando estrangulamentos físicos e de processamento e correm o risco de se tornarem econômica, técnica e ambientalmente insustentáveis, dados os crescentes custos de energia envolvidos - já existem centrais de dados que gastam tanta eletricidade quanto cidades inteiras.

Já o novo chip apresenta uma eficiência tal que ele não precisa de sistemas volumosos de refrigeração líquida para funcionar - ventiladores e dissipadores de calor são mais que suficientes.

O chip montado em um circuito compatível com os sistemas atuais de processamento.
[Imagem: IBM Research]


Computação neuromórfica

Inspirados na arquitetura neural do cérebro orgânico, Dharmendra Modha e seus colegas desenvolveram um chip baseado em uma arquitetura de inferência neural que coloca computação e memória no mesmo chip, unificando computação neuromórfica e computação na memória na mesma estrutura.

O NorthPole foi fabricado com um processo de nós de 12 nm e contém 22 bilhões de transistores em 800 milímetros quadrados. Ele possui 256 núcleos e pode realizar 2.048 operações por núcleo por ciclo com precisão de 8 bits, com potencial para dobrar e quadruplicar o número de operações com precisão de 4 e 2 bits, respectivamente. "É uma rede inteira em um chip," disse Modha.

Segundo a equipe, o NorthPole "reimagina a interação entre computação e memória" ao combinar computação inspirada no cérebro, ou computação neuromórfica, com a tecnologia de semicondutores tradicional - o NorthPole é a versão mais atual do TrueNorth, a primeira versão de processador neuromórfico que a IBM vem desenvolvendo há quase uma década.

Em comparação, a maioria das arquiteturas neuromórficas em desenvolvimento se baseia em outras famílias de componentes, genericamente conhecidos como "neurônios artificiais", "sinapses artificiais" etc - tecnicamente esses componentes são memoristores ou células de memória de mudança de fase, ou PCM (Phase-Change Memory). A própria IBM apresentou há poucas semanas uma outra arquitetura neuromórfica, um processador analógico para inteligência artificial construído com base em memórias PCM.

Baseado em tecnologia de 12 nm, o chip requer apenas dissipadores e exaustores comuns.
[Imagem: Modha et al. - 10.1126/science.adh1174]


Ganhos e limitações

O novo chip neuromórfico semicondutor superou em termos de desempenho, eficiência energética e eficiência as outras arquiteturas comparáveis, incluindo as baseados em processos tecnológicos mais avançados, com as GPUs de 4 nm - o NorthPole é construído com base na tecnologia de 12 nm.

E, como o NorthPole é um sistema digital, ele não está sujeito ao ruído do dispositivo e às tendências e aos desvios sistêmicos que ainda atrapalham os sistemas computacionais analógicos - também já existem tecnologias híbridas que juntam analógico e digital no mesmo chip.

A equipe demonstrou as capacidades do NorthPole testando-o na rede de classificação de imagens de referência ResNet50, onde ele alcançou uma métrica de energia de quadros por segundo (FPS) por watt 25 vezes maior, uma métrica espacial 5 vezes maior de FPS por transístor e uma métrica de tempo de latência 22 vezes menor, em comparação com as GPUs comuns de 12 nm e as CPUs de 14 nm.

Isso mostra que talvez a computação neuromórfica e a computação na memória possam ser viabilizadas com a tecnologia semicondutora padrão da indústria microeletrônica, não necessitando de avanços de hardware revolucionários, que poderão exigir a construção de novas fábricas para lidar com materiais fundamentalmente diferentes.

Contudo, o chip ainda não é adequado para todas as aplicações. "Não podemos executar o GPT-4 nele, mas poderíamos atender a muitos dos modelos de que as empresas precisam," disse Modha. "E, claro, o NorthPole serve apenas para inferência."

Bibliografia:

Artigo: Neural inference at the frontier of energy, space, and time
Autores: Dharmendra S. Modha, Filipp Akopyan, Alexander Andreopoulos, Rathinakumar Appuswamy, John V. Arthur, Andrew S. Cassidy, Pallab Datta, Michael V. DeBole, Steven K. Esser, Carlos Ortega Otero, Jun Sawada, Brian Taba, Arnon Amir, Deepika Bablani, Peter J. Carlson, Myron D. Flickner, Rajamohan Gandhasri, Guillaume J. Garreau, Megumi Ito, Jennifer L. Klamo, Jeffrey A. Kusnitz, Nathaniel J. McClatchey, Jeffrey L. McKinstry, Yutaka Nakamura, Tapan K. Nayak, William P. Risk, Kai Schleupen, Ben Shaw, Jay Sivagnaname, Daniel F. Smith, Ignacio Terrizzano, Takanori Ueda
Revista: Science
Vol.: 382, Issue 6668 pp. 329-335
DOI: 10.1126/science.adh1174

Fonte: https://www.inovacaotecnologica.com.br/noticias/noticia.php?artigo=ibm-apresenta-chip-inspirado-cerebro-faz-ia-baixo-consumo-energia&id=010150231020

Comentários