A sua próxima atualização de computador com Windows provavelmente virá com um novo tipo de processador. Ele é chamado de NPU e é o requisito mais importante para a próxima geração de computadores Windows da Microsoft — os PCs Copilot+.

Embora os novos processadores Snapdragon e os requisitos da Microsoft tenham colocado as NPUs em destaque, elas já existem há mais tempo do que você imagina. No entanto, esses novos processadores significam que você não precisa mais depender de servidores em nuvem para executar processos generativos.

Mas afinal, o que são NPUs? Como elas funcionam? Quais são seus benefícios e desvantagens? Vou explicar tudo neste artigo.

O que é uma NPU?

As NPUs (sigla para neural processing units) são chips dedicados à execução de operações complexas de IA. Elas processam múltiplos dados em paralelo e simulam os neurônios do cérebro. Esse método de computação é ideal para executar redes neurais e lidar com funções como processamento de linguagem natural, reconhecimento de imagens e tarefas generativas.

Como resultado, elas são mais rápidas do que GPUs e CPUs nesses e em outros casos de uso de IA.

As redes neurais são princípios de inteligência artificial que treinam computadores para aprender e processar dados de forma semelhante ao cérebro humano. Elas tentam recriar o funcionamento do cérebro usando nós interconectados em uma estrutura em camadas.

Como mencionado, as NPUs não são tão novas quanto o hype atual sugere. Antes do evento Microsoft Build, elas já estavam presentes em CPUs, GPUs, smartphones e servidores. Também eram conhecidas por diferentes nomes, como tensor cores, neural engines e DSPs (digital signal processors).

Por exemplo:

  • A Intel e a AMD integraram NPUs em seus CPUs flagship Meteor Lake e Phoenix.

  • As GPUs da série NVIDIA RTX possuem NPUs integradas (tensor cores) para recursos de IA como DLSS 3 e ray tracing.

  • A Qualcomm utiliza sua NPU Hexagon desde o chipset Snapdragon 855, em 2018.

  • A Apple introduziu seu primeiro neural engine no A11 Bionic, em 2017.

Como as NPUs evoluíram

As NPUs também evoluíram bastante em relação ao que eram antes. Essa evolução foi impulsionada principalmente pelo crescimento contínuo dos casos de uso de IA, especialmente da IA generativa.

As versões iniciais focavam em tarefas menos complexas, como identificação de objetos, que utilizavam redes neurais mais simples conhecidas como CNNs (convolutional neural networks). No entanto, o avanço da IA em vídeo e fotografia elevou o nível de exigência. Como resultado, foram desenvolvidas NPUs capazes de lidar com modelos de redes neurais mais avançados.

A IA generativa, que envolve o uso de IA para criar novos conteúdos, trouxe demandas ainda maiores de desempenho e potência.

A criação de novos conteúdos em texto, imagem, vídeo e áudio exige mais memória e maior transferência de dados, o que pode sobrecarregar a largura de banda limitada e aumentar o consumo de energia. As NPUs modernas resolvem esses problemas em dispositivos menores, pois estão integradas em grandes sistemas em chip (SoC).

O que são SoCs e por que são importantes?

O que muitas pessoas hoje chamam de CPU, na verdade, são sistemas em chip (system-on-a-chip ou SoC). Trata-se de circuitos integrados que incluem diferentes unidades de processamento, como CPUs, GPUs e TPMs. Esse design reduz significativamente o espaço, melhora a eficiência energética e aumenta o desempenho.

A CPU precisa delegar tarefas à GPU, TPU ou NPU quando o usuário executa determinadas operações. Se esses processadores estiverem separados, a CPU precisa transferir dados por distâncias relativamente longas na mesma placa, o que consome mais largura de banda e aumenta o uso de energia.

Isso faz com que laptops, tablets e smartphones aqueçam mais facilmente e sofram quedas de desempenho devido à limitação de espaço.

Por isso, muitos laptops gamers com GPUs dedicadas consomem mais energia e utilizam ventoinhas potentes para dissipar o calor. Integrar esses processadores em um único chip resolve esses problemas, permitindo dispositivos mais compactos, rápidos e eficientes.

NPUs vs. Processadores Tradicionais

Já estabelecemos que as NPUs são melhores para lidar com tarefas complexas de IA do que outros tipos de processadores. No entanto, isso não significa que possam substituí-los.

CPUs e GPUs continuam desempenhando papéis fundamentais. Com o avanço da IA, as NPUs devem ser vistas como processadores complementares. Elas garantem que recursos de IA não sobrecarreguem a GPU e a CPU, permitindo que esses componentes lidem com tarefas gerais e exigentes.

Por outro lado, as NPUs não são versáteis e não conseguem executar a maioria das operações para as quais CPUs e GPUs foram projetadas.

NPUs vs. CPUs

As CPUs (central processing units) são frequentemente consideradas o “cérebro” do computador. Elas são processadores de uso geral responsáveis por manipulação de dados, operações lógicas, tarefas de entrada e saída, parte do processamento gráfico e emulação.

Tarefas pesadas, como simulações e desenvolvimento, dependem principalmente da CPU. Elas também decidem quando delegar tarefas para a GPU ou NPU.

Embora consigam executar diversas funções, é mais eficiente delegar tarefas especializadas a outros processadores. CPUs não são otimizadas para processamento paralelo como as NPUs. Por isso, executar tarefas de IA ou machine learning diretamente na CPU pode causar lentidão significativa.

NPUs vs. GPUs

As GPUs foram projetadas para lidar com cálculos gráficos intensivos. Elas são essenciais para gamers, editores de vídeo e modeladores 3D.

A NVIDIA argumenta que GPUs também são eficazes para IA, devido ao grande número de núcleos e à capacidade de processamento paralelo. No entanto, suas capacidades de IA são geralmente voltadas para tarefas gráficas, como DLSS e HDR em transmissões ao vivo.

Essas tarefas são executadas principalmente em núcleos otimizados para IA, conhecidos como tensor cores. Ainda assim, NPUs dedicadas oferecem melhor desempenho em outros cenários, como processamento de informações em todo o sistema e aplicações generativas.

Windows e NPUs

O destaque atual das NPUs se deve, em grande parte, ao Microsoft Copilot+ PC. A empresa aposta fortemente na IA para transformar o Windows e a forma como as pessoas interagem com seus computadores.

Os novos PCs Copilot+ trazem recursos avançados de IA integrada e generativa, impulsionados por NPUs dedicadas. Dessa forma, GPUs e CPUs não ficam sobrecarregadas com essas novas funcionalidades.

O que é um Copilot+ PC?

Copilot+ PC é a nova categoria de computadores Windows da Microsoft. Dispositivos com essa marca vêm com recursos de IA que não funcionam em computadores comuns. Entre eles:

  • Cocreator no Paint, que ajuda a refinar desenhos

  • Restyle Image para edição avançada de imagens

  • Live Captions para transcrição e tradução em tempo real

  • Recall, que permite recuperar informações esquecidas em segundos

  • Windows Studio Effects para melhorar a experiência em chamadas de vídeo

Já vimos algumas prévias na versão mais recente do Windows 11, como a versão de teste do aplicativo Copilot e o Image Creator no Paint. No entanto, a Microsoft exige NPUs capazes de atingir 40 trilhões de operações por segundo (TOPS) para executar os principais recursos de IA do Copilot+.

Atualmente, apenas os novos processadores Snapdragon X conseguem atingir esse nível de desempenho. Esses chipsets são a base da afirmação da Microsoft de que os PCs Copilot+ são os dispositivos Windows “mais rápidos e inteligentes” já criados. Os processadores Snapdragon X não serão os únicos capazes de executar os recursos dos Copilot+ PCs. A AMD e a Intel já anunciaram novos SoCs capazes de ultrapassar 40 TOPS, como a próxima série AMD Ryzen AI 300 (Strix Point) e os processadores de nova geração Intel Lunar Lake.

Analisamos essa afirmação da Microsoft em detalhes e fornecemos mais insights em nossa comparação entre PCs Copilot+ e dispositivos Windows tradicionais.

Os novos PCs também enfrentaram alguns problemas de reputação devido às controvérsias em torno do recurso Recall, o que pode desencorajar alguns usuários a adotarem essa tecnologia.

Ainda assim, é justo reconhecer que os novos Copilot+ PCs oferecem desempenho e autonomia de bateria impressionantes. Eles também apresentam melhor performance quando operam apenas com bateria em comparação com outros computadores Windows.

Além dos novos recursos de IA, a Microsoft também introduziu uma nova camada de emulação, conhecida como Prism, que melhora o desempenho de aplicativos x64 e x86 em dispositivos ARM.
As NPUs permitem, principalmente, que processos de IA sejam executados localmente, sem a necessidade de utilizar servidores em nuvem. Esse é um dos principais motivos pelos quais a Microsoft exige processadores capazes de executar pelo menos 40 trilhões de operações por segundo.

Importante!
Você ainda precisa de uma conexão com a internet e de uma conta da Microsoft para usar recursos de IA generativa como Cocreator e Restyle Image. Os servidores da Microsoft irão analisar seus prompts antes de permitir que a NPU processe as solicitações.

Por exemplo, sempre que você pressiona o botão Copilot, inicia o Recall, ativa o Live Captions ou liga o Cocreator, o Windows direciona automaticamente esses processos para a NPU. Você também pode visualizar o uso da NPU em tempo real no Gerenciador de Tarefas, onde o gráfico mostra quando ela está em atividade.

As NPUs também lidam com outras funções de IA integradas, como upscaling gráfico (melhoria automática da qualidade de vídeos e imagens, especialmente em jogos).

Além disso, elas liberam recursos de processamento da GPU e da CPU ao assumir tarefas relacionadas à IA que antes eram executadas por esses componentes. Essas tarefas incluem, por exemplo, upscaling gráfico e reconhecimento de objetos. Como resultado, você perceberá melhorias significativas de desempenho.

Computadores com CPUs Intel Core Ultra e processadores AMD Phoenix já contam com NPUs integradas. No entanto, essas NPUs ainda não atingem o requisito de 40 TOPS exigido pela Microsoft para executar os recursos dos Copilot+ PCs. A Microsoft também exige NPUs dedicadas, o que significa que os tensor cores da NVIDIA não se qualificam.

Outros tipos de dispositivos que utilizam NPUs

Como mencionado, as NPUs não são exclusivas de computadores. Elas já fazem parte de diversos dispositivos inteligentes há anos.

Fabricantes de chips móveis como Qualcomm, Samsung, Apple e Huawei utilizam NPUs há bastante tempo para viabilizar recursos como assistentes de voz, reconhecimento facial, digitação preditiva, tradução e automação de tarefas.

As NPUs também estão presentes em dispositivos IoT, como Smart TVs que melhoram automaticamente a qualidade da imagem e gadgets como caixas de som com assistentes de IA integrados.

As NPUs são o único tipo de processador de IA?

Não. As NPUs são apenas um dos vários tipos de processadores desenvolvidos para lidar com tarefas complexas de IA. Empresas como NVIDIA, Google, Amazon, Qualcomm, IBM, AMD e Apple também desenvolvem diferentes tipos de processadores voltados para IA.

Grande parte desse hardware é destinada a aplicações em escala empresarial, sendo utilizada em áreas como robótica, veículos autônomos, segurança e vigilância, e computação em nuvem.

Perspectivas para chips de IA

De acordo com a Statista, o mercado de chips de IA foi avaliado em US$ 53,7 bilhões em 2023 e deve ultrapassar US$ 70 bilhões em 2024 e US$ 90 bilhões em 2025.

Atualmente, estamos vendo uma adoção massiva da IA em diversos setores, desde saúde até direito e negócios. No caso dos PCs, a nova direção da Microsoft está fortemente ligada à inteligência artificial, e sua exigência por NPUs indica que todos os computadores terão chips de IA daqui para frente.

NPUs: Olhando para o futuro

As NPUs estão tornando cada vez mais possível alcançar avanços impressionantes em machine learning e inteligência artificial. Agora, os usuários podem executar tarefas de IA generativa diretamente em seus dispositivos, sem depender de serviços em nuvem.

A exigência para PCs Copilot+ e futuras funcionalidades de IA também significa que você deve considerar computadores com NPUs na sua próxima compra.

No entanto, ainda não há garantias de que esses recursos serão incluídos gratuitamente no Windows ou se a Microsoft adotará um modelo de assinatura (Windows as a Service).

Ainda assim, há muito o que esperar. O esforço da Intel e da AMD para lançar PCs Copilot+ indica que os usuários terão computadores ainda mais potentes e eficientes.

As especulações sobre o Windows 12 também continuam, já que alguns especialistas acreditam que os Copilot+ PCs são uma preparação para esse novo sistema operacional.

FAQ

Quais são as principais diferenças entre NPUs, CPUs e GPUs?
Quais são os principais benefícios do uso de NPUs na computação?
As NPUs tornam as tarefas de IA mais rápidas, permitem que os usuários executem essas tarefas diretamente no dispositivo e reduzem a carga sobre GPUs e CPUs.
Como as NPUs vão mudar o mercado de computadores para o usuário comum?
O que torna os Copilot+ PCs únicos?