banner

Notícias

Mar 23, 2024

Luz

A capacidade do ChatGPT de produzir ensaios, e-mails e códigos sofisticados em resposta a algumas perguntas simples atraiu atenção internacional. Pesquisadores do MIT relataram um método que tem potencial para abrir caminho para programas de aprendizado de máquina muitas vezes mais capazes do que o responsável pelo ChatGPT. Além disso, a sua tecnologia poderá consumir menos energia do que os supercomputadores de última geração que alimentam os actuais modelos de aprendizagem automática.

A equipe relata a primeira demonstração experimental do novo sistema, que usa centenas de lasers em escala de mícron para realizar cálculos baseados no movimento da luz em vez dos elétrons. O novo sistema é 100 vezes mais eficiente em termos de energia do que os atuais computadores digitais de última geração para aprendizado de máquina e 25 vezes mais poderoso em densidade computacional.

Além disso, observam “substancialmente várias outras ordens de grandeza para melhorias futuras”. Isso, acrescentam os cientistas, “abre um caminho para processadores optoeletrônicos em grande escala para acelerar tarefas de aprendizado de máquina, desde data centers até dispositivos de ponta descentralizados”. No futuro, pequenos dispositivos como telefones celulares poderão executar programas que só podem ser computados em grandes data centers.

Modelos massivos de aprendizado de máquina que imitam o processamento de informações do cérebro são a base de redes neurais profundas (DNNs), como a que alimenta o ChatGPT. Enquanto o aprendizado de máquina está se expandindo, as tecnologias digitais que alimentam as DNNs atuais estão estagnando. Além disso, muitas vezes só são encontrados em centros de dados muito grandes devido às suas extremas necessidades energéticas. Isso está impulsionando a inovação na arquitetura da computação.

A disciplina da ciência de dados está evoluindo devido ao surgimento das redes neurais profundas (DNNs). Em resposta à expansão exponencial dessas DNNs, que está sobrecarregando as capacidades do hardware de computador tradicional, as redes neurais ópticas (ONNs) evoluíram recentemente para executar tarefas DNN em altas taxas de clock, em paralelo e com perda mínima de dados. A baixa eficiência de conversão eletro-óptica, o enorme espaço ocupado pelos dispositivos e a diafonia do canal contribuem para a baixa densidade computacional nas ONNs, enquanto a falta de não linearidade em linha causa atrasos significativos. Os pesquisadores mostraram experimentalmente um sistema ONN multiplexado espaço-temporal para resolver todos esses problemas de uma vez. Eles usam codificação de neurônios usando matrizes em escala micrométrica de lasers emissores de superfície de cavidade vertical (VCSELs), que são feitos em grandes quantidades e exibem excelente conversão eletro-óptica.

Pela primeira vez, os pesquisadores fornecem um projeto pequeno que aborda esses três problemas ao mesmo tempo. O sensoriamento remoto LiDAR moderno e a impressão a laser usam essa arquitetura, que é construída em matrizes de lasers emissores de superfície verticais (VCSELs). Estas medidas parecem constituir uma melhoria de duas ordens de grandeza num futuro próximo. O processador optoeletrônico oferece novas oportunidades para acelerar processos de aprendizado de máquina em infraestruturas centralizadas e distribuídas.

Confira aPapeleBlogue . Todo o crédito por esta pesquisa vai para os pesquisadores deste projeto. Além disso, não se esqueça de participarnosso SubReddit de 27k + ML,Canal de discórdia, eNoticiário por e-mail, onde compartilhamos as últimas notícias de pesquisa de IA, projetos interessantes de IA e muito mais.

Dhanshree Shenwai é Engenheiro de Ciência da Computação e tem uma boa experiência em empresas FinTech abrangendo domínios Financeiro, Cartões e Pagamentos e Bancário, com grande interesse em aplicações de IA. Ela está entusiasmada em explorar novas tecnologias e avanços no mundo em evolução de hoje, facilitando a vida de todos.

PapelBloguenosso SubReddit de 27k + MLCanal de discórdiaNoticiário por e-mail
COMPARTILHAR