Nos últimos dois anos, as principais empresas de tecnologia têm apresentado ao público o conceito de computadores com inteligência artificial, conhecidos como PCs com IA no Brasil.Esses dispositivos são projetados para maximizar a utilização da inteligência artificial em um cenário onde as ias generativas estão se tornando cada vez mais populares. O desempenho desses sistemas é medido em TOPS.Mas o que exatamente essa sigla representa?
A sigla TOPS é uma terminologia comum na área da computação há bastante tempo, mas ainda é um conceito relativamente novo para muitos consumidores. Para esclarecer essa questão, conversamos com Yuri Daglian, engenheiro de aplicações da intel, que nos ajudou a entender melhor esse universo da IA.
NPU e Inteligência Artificial
Para começarmos do início: antes de falarmos sobre TOPS,precisamos entender como a IA opera nos novos PCs com IA. Esses computadores recebem esse nome devido à inclusão de um componente específico no processador chamado NPU (Unidade de Processamento Neural).
A CPU (Unidade Central de Processamento) funciona como o cérebro do computador; ela realiza cálculos lógicos e processa dados para apresentá-los em uma forma compreensível para nós. A CPU é composta por várias partes especializadas em diferentes funções; a NPU representa uma nova adição aos processadores fabricados por empresas como Intel, Qualcomm e AMD.
A principal função dessa NPU era permitir que os usuários realizassem tarefas relacionadas à IA generativa diretamente no computador — ou seja, nativamente.Isso elimina a necessidade de depender dos servidores da Microsoft para quem utiliza o Copilot ou dos servidores do Google para os adeptos do Gemini.

“A arquitetura da NPU foi desenvolvida desde sua concepção para redes neurais. Ela foi projetada visando alta performance com baixo consumo energético. Uma regra básica na computação afirma que aceleradores dedicados [NPUs], criados especificamente para tarefas [IAs], sempre terão maior desempenho e eficiência energética comparado às unidades gerais [CPUs]”, explica Yuri Daglian.
O Que São TOPS?
TOPS significa trilhões de Operações Por Segundo, sendo uma unidade utilizada para medir o desempenho na inferência das inteligências artificiais. Como mencionado pelo especialista da Intel, essa métrica indica que os TOPS podem realizar um número impressionante de operações em um curto espaço temporal.
Em termos simples: tanto os computadores quanto as inteligências artificiais operam através da matemática pura.Assim sendo quanto mais cálculos forem realizados pelo chip em menos tempo maior será seu desempenho percebido pelo usuário final.Portanto teoricamente quanto mais TOPS possui uma unidade de Processamento maior será sua capacidade relacionada à IA.

Mecanismo dos TOPS
Os TOPS executam operações matemáticas dentro das redes neurais — métodos baseados em aprendizado automático que ensinam ao computador como realizar determinadas tarefas imitando parcialmente as funções cerebrais humanas.
A rede neural mais simples conhecida se chama Perceptron — não confundir com Transformers! O Perceptron representa a forma mais elementar existente nas redes neurais e ajuda na compreensão do funcionamento das IAs modernas:

No diagrama acima XYZ representam números constantes enquanto W simboliza pesos atribuídos a esses valores numéricos; juntos eles geram saídas correspondentes às respostas esperadas durante processos computacionais.
Caso questionemos um ChatGPT sobre qual é 1+1 esses números serão somados ou multiplicados pelos pesos atribuídos até encontrarem resultados corretos através diversas combinações possíveis até chegar ao resultado correto!
Dessa maneira as redes neurais passam por treinamentos intensivos utilizando combinações massivas entre números/pesos repetindo processos até alcançar resultados desejáveis conforme explica Yuri Daglian “As operações realizadas pela NPU incluem multiplicações adições além disso quando necessário também envolve matrizes complexas” destaca ele!

Daglian menciona humoristicamente “computadores adoram calcular matrizes” pois essas contas tendem ser bem simplificadas permitindo assim escalas enormes envolvendo bilhões parâmetros resultando numa resposta final precisa! Essas operações estão contidas nos chamados “TOPs”.
Quando afirmamos estar treinando uma rede neural isso implica dizer desenvolvedores estão testando bilhões diferentes pesos num sistema tentativa-erro até obter respostas exatas ou satisfatórias.“Inteligência Artificial consiste puramente matemática não existe misticismo nem mágica envolvida apenas lógica matemática” conclui Daglian.
Qual Quantidade Ideal De TOPs?
Teoricamente quanto maior for quantidade disponível nas NPUs melhor será capacidade lidar certas cargas relacionadas Inteligência Artificial porém ainda não existe resposta definitiva ideal quantidade necessária pois depende muito tipo atividade realizada.

Yuri sugere talvez apenas cinco tops sejam suficientes executar funcionalidades básicas Microsoft Teams sem travamentos enquanto rodar aplicativos base SLM requer entre quinze vinte tops já rodar LLM pode exigir acima cem dependendo otimização!
“Para ter experiência interessante atualmente recomendaria pelo menos dez tops conseguir executar aplicações adequadamente futuro mirando quarenta tops” sugere ele!
Tops em CPUs E GPUs
Embora normalmente associemos Tops exclusivamente Unidades Processamento Neural também existem CPUs tradicionais placas vídeo dedicadas integradas utilizam esta métrica.Processadores Intel Core Ultra Série II exemplificam bem isso!
Essa geração notebooks apresenta implementação máxima cento vinte tops onde apenas quarenta oito pertencem npus cinco ficam CPU sessenta sete GPU integrada! CPUs GPUs sempre tiveram esses Tops visto utilizamos IAs filtros Google meet outros recursos há anos!
Geralmente placas vídeo hardware apresentam maiores quantidades especialmente modelos dedicados exemplo RTX5090 Nvidia possui incríveis três mil trezentos top enquanto recém lançada Arc B580 conta duzentos trinta três já considerável!
Contudo conforme explica Yuri essas placas não foram projetadas especificamente atender cargas trabalho semelhantes NPUs “GPUS otimizadas cálculos paralelos possuem muitos núcleos trabalhando simultaneamente enquanto CPUS seguem sequência realizando cada operação individualmente primeiro depois outra etc.” aponta especialista.
Apesar disso mesmo desempenhando função semelhante,YURI ressalta eficiência superior sempre estará presente nas NPUS consumindo menor energia durante execução dessas atividades!
Gostou deste conteúdo sobre Topps funcionamento Ias? Continue acompanhando nosso site TecMundo! E se você aprecia hardware informática confira nosso review GeForce RTX5080 Founders Edition .