Alessandro Cabelo
👤 SpeakerAppearances Over Time
Podcast Appearances
Eu sou Alessandro de Leofaria, Intel Innovator, co-fundador da Multicórticas, mas também sou conhecido como Cabelo. Eu, Cabelo sem Cabelo. E vamos em frente. Então, te apelidaram com o que está faltando, é isso? Isso. Eu comecei aos 11 anos de idade, trabalhar com computação, e eu era Black Power. Tinha aquela... Aham. E aí ficou Cabelo. Ah, o Cabelo vem da época. Nossa senhora, olha aí, que beleza.
Principalmente software, né, Pietro? Otimização de hardware, claro, inquestionavelmente, mas o software, a stack de software, otimização e ferramentas também, ela é um outro parceiro mandatório, né, Pietro? Exato. E aí, acho que uma das coisas que a gente fala bastante, e o Cabelo aqui pode falar como ninguém...
Então, é não só aumentar a construção dos data centers, mas também aproveitar os PCs para uso de IA. É muito importante isso que nós falamos. Em 1996, surgiu o Paint MMX, que quando eu conheci, foi ali que eu me apaixonei por computação heterogênea antes dela existir. Por quê? O MMX fazia rodar a instrução multimídia mais rápido, falando em alto nível, som, imagem, texto.
A computação heterogênea, pessoal, ela permite rodar um único software em qualquer hardware, explorando o máximo que aquele hardware pode dar. Faz de conta que nós somos o processador. Sem a computação heterogênea, eu chego para você e falo, navio de grande porte comercial. Qual a computação heterogênea?
Eu estou otimizando, eu sei que língua esse processador fala, então eu tenho uma única instrução, hipoteticamente, transatlântico. E além da computação heterogênea, nós temos a ferramenta OpenVINO, né, pessoal, que tudo isso é graças à Intel. Claro que eu posso usar a computação heterogênea pura, mas a Intel foi sensacional, onde ela criou o OpenVINO, que usa também o One API, e, tão importante quanto isso, eu faço um software de inteligência artificial com três linhas de código.
Mas não é só a facilidade de uso. É todo o desempenho computacional. Eu consigo fazer mais com menos. Eu exploro todo esse recurso. Para pedir uma receita de bolo para uma IA, eu não preciso de uma inteligência de bilhões de parâmetros que roda em nuvem com o chat de EPT, com o cloud. E consigo, com os computadores Intel, com o NPU, fazer com a mesma eficiência. Eu consigo resolver muitos problemas de inteligência artificial usando todas as tecnologias que nós falamos aqui.
ela pode ter o mesmo desempenho que uma IA de grande porte. Porque eu não vou fazer perguntas sobre astrofísica, eu vou fazer perguntas apenas sobre medicina, no exemplo hipotético. E com isso, um processador Intel com NPU é mais que o suficiente para rodar IA de 4, 7 bilhões de parâmetros verticalizada. Eu acho que nós temos que parar um pouco com a síndrome do vira-lata. Nós brasileiros estamos fazendo muitas coisas aqui, né, Pietro e Yuri, junto à Intel.
Trabalho como Intel Innovator, recebo todos os produtos Intel de 3 a 5 anos antes, em fase de protótipo. Em virtude dessa relação com a Intel, como Intel Innovator, um brasileiro, não foi um indiano, norte-americano, um russo, um chinês, um brasileiro proporcionou pela primeira vez a NPU funcionando numa distribuição Linux nativa. Quer dizer, não precisa instalar nada, você instala o Linux.
ele já está com a NPU funcionando. E isso é democratizar a inteligência artificial. Isso é um divisor de águas. Não estou aqui para fazer propaganda de mim mesmo, mas assim, eu sou engenheiro Linux, coloquei isso dentro do OpenSUSE. E hoje eu tenho a Multicortex, que é uma distribuição Linux otimizada para processadores Intel.
o Word da vida. Mas é isso, né? A questão do processamento, na ponta, você conseguir otimizar isso ao máximo. E aí também é a questão dos dados, como que a gente consegue ter essa confidencialidade. E aí a gente fala no Edge, né? Robótica, Edge. Eu vou dar um exemplo muito pragmático do quanto nós estamos vivendo um momento disruptivo. Vamos falar da robótica. Visão computacional, que a máquina tem que enxergar o que está acontecendo, como a Riosense, a câmera 3D que foi fabricada pela Intel, criada pela Intel.
e essa nova linha. Então, imagina o seguinte, eu tenho um robô usando todas essas tecnologias e eu quero conversar com o robô, falar para ele pegar uma bola verde que está ali no chão. Eu tenho todo o processo de visão computacional que pode ser usado pela CPU Intel. Porém, eu estou conversando no exemplo hipotético. Eu posso usar a GPU para trabalhar a OSR, a fala...
transformar a fala em texto para a IA processar e também transformar o texto da IA em som, em fala. Posso usar a GPU. E a NPU usar apenas para a LLM, que é a inteligência artificial em si. Então, a Intel hoje está proporcionando com muita facilidade você segregar as cargas de trabalho, de visão computacional, fazer a máquina enxergar na CPU, a parte de processamento de áudio de fala, interpretação de fala na GPU, a parte de LLM da inteligência artificial na NPU. E aí, não obrigatoriamente na sequência. Posso colocar a
falar na CPU e tudo isso com um único clique ou com uma única seleção em termos de... Não tem que fazer magia para as coisas funcionarem. E isso é graças à computação heterogênea e OpenVINO. Então, meus parabéns para a Intel. E por isso que nós estamos trabalhando na Multicórtex com todas as tecnologias fervorosamente animadas. Todo dia eu abro uma cerveja para comemorar a nova conquista.
Falei muito de Intel e vale a pena falar que a computação heterogênea é para qualquer hardware. Ponto final. Isso é um negócio muito bacana também. Você ter ali uma abstração do hardware. E isso também é uma coisa muito importante para falar que a Intel desenvolveu, não pensando só em Intel. E aí isso me remeteu a... Eu estou falando isso por causa da computação quântica. Pessoal, a IA hoje, de inteligente, não tem nada. É só uma super estatística.
Ele não sabe que é preto. Baseado estatisticamente em uma série de informações que ele foi treinado, ele deduz que ele não sabe que é preto. Exato. Então, é só uma super estatística. Mas o ponto interessante é que se é só uma super estatística, ela é passível de erro. E a computação quântica...
O que ela tem de excepcional? Uma análise combinatória. Conseguimos resolver no ano passado um problema de 2 bilhões de anos em 4 minutos. Eu não lembro agora se era milhões ou bilhões. O que importa é muito tempo em poucos minutos. Sim.
Se a gente pega esse poder da análise combinatória e colocamos dentro de uma super estatística, aí nós vamos para outro patamar de IA. E aí que fica tudo legal isso que nós estamos conversando aqui. Inclusive já brincamos bastante, é open source, eu criei uma distribuição direct, a primeira distribuição Linux para comparação quântica. Você pode testar tudo isso daí, circuitos quânticos em emuladores de software, usando até os aceleradores NPOs atuais.
E a gente não pode deixar de mencionar também o gargalo de Von Neumann, porque às vezes não é o processador, a GPU, o dispositivo fora da placa-mãe da CPU que está sobrecarregado. Nós temos um gargalo ali de comunicação entre a CPU e a GPU ou um outro dispositivo fora. E cada vez mais o mundo tecnológico, o mercado tecnológico está trabalhando para quê? Quanto mais próximos esses devices estiverem, mais informação trocam entre eles.
ter isso pro cliente final, né? Vamos dizer assim. E o legal, vocês falando tudo isso, eu não posso deixar de mencionar que há uns dois anos eu ganhei um prêmio Intel Innovator, que eu já trabalhava pra que a robótica e a computação na borda olhassem o acamado, se ele estivesse passando mal, se ele caísse da cama, nem todo mundo tem dinheiro pra pagar um cuidador, né? E na época eu ganhei esse prêmio. Mas olhando pro presente agora, vocês falando, nós temos a referência federada. O que que é isso? Duas IAs, uma IA no
precisa rodar obrigatoriamente num único computador. Se eu coloco dois computadores na borda, metade da inteligência roda no computador e metade na outra, que é chamada inferência federada, eu aumento mais o poder computacional ainda. E o que que acontece? Poxa, o acamado hoje pode ter um robô, se ele passar mal, chamar o pai, o parente, o robô pode pegar uma água pra essa pessoa que tá acamada. Então, assim, nós vamos vivenciar uma melhor qualidade de vida se toda essa tecnologia for usada a serviço da humanidade, no meu ponto de vista.