Apple aposta na IA generativa com o OpenELM, um projeto de código aberto

OpenELM é conjunto de modelos para inteligência artificial generativa que pode ser implementado livremente em qualquer projeto

Por Emerson Alecrim

25/04/2024 às 14:36 • Atualizado há 1 semana

Inteligência artificial — Apple aposta na IA generativa com o OpenELM, um projeto de código aberto (Imagem: Vitor Pádua / Tecnoblog)

Resumo

A Apple lançou o OpenELM, composto por uma série de modelos de linguagem eficientes de código aberto. Eles variam de 270 milhões a 3 bilhões de parâmetros, permitindo uso em dispositivos com restrições de processamento ou energia.
O OpenELM é ideal para aparelhos portáteis, como celulares de baixo custo e dispositivos vestíveis, por ter menos parâmetros que os modelos de IA convencionais.
Os LLMs foram liberados no Hugging Face com uma “licença de código de amostra”, que permite modificações e uso comercial do código.
É importante que os usuários estejam atentos às condições da licença do OpenELM para evitar violações de direitos de patente potencialmente reivindicados pela Apple.

OpenELM é o nome de uma série de modelos (LLMs) de inteligência artificial (IA) generativa que a Apple liberou para uso público. O conjunto chama a atenção por ter código-fonte aberto e ser mais leve do que a maioria dos modelos de IA atuais, o que deve facilitar a sua implementação em projetos com os mais diversos fins.

O nome OpenELM significa “Modelos de Linguagem Eficientes de Código Aberto”. Os modelos da iniciativa geram conteúdo em texto, mas seguem bases de parâmetros diferentes. Da menor para a maior, estes são os tamanhos das bases disponíveis:

270 milhões de parâmetros
450 milhões de parâmetros
1,1 bilhão de parâmetros
3 bilhões de parâmetros

Entenda como parâmetros a quantidade de variáveis que o modelo compreende por meio de seu treinamento para gerar resultados. A maior base da Apple tem uma quantidade de parâmetros ligeiramente abaixo daquela que está disponível para o Phi-3, o menor modelo de IA da Microsoft, com 3,8 bilhões de parâmetros.

Ideal para dispositivos portáteis

As pequenas quantidades de parâmetros do OpenELM quando comparadas a outras LLMs não são exatamente uma desvantagem. Essa característica permite que aplicações de IA generativa sejam executadas em dispositivos com capacidade de processamento ou baterias relativamente modestas, a exemplo de celulares de baixo custo ou dispositivos vestíveis.

Quais aplicações seriam essas? A Apple disponibilizou o OpenELM no Hugging Face com um “licença de código de amostra”. Ela permite que o código-fonte dos modelos seja modificado ou até usado de modo comercial. Assim, o seu uso dependerá do objetivo e da criatividade de cada desenvolvedor que se interessa pela iniciativa.

Podemos pensar em um usuário que recebe um e-mail e dá um comando por voz ao celular para que o aparelho gere uma resposta contendo determinada informação. Um aplicativo baseado no OpenELM poderia executar essa tarefa sem exigir muito processamento ou energia. Mas, claro, esse é um cenário meramente hipotético.

(Imagem: Thássius Veloso/Tecnoblog) — Apple Park (imagem: Thássius Veloso/Tecnoblog)

Qualquer um pode usar

O ideal seria o OpenELM ser disponibilizado por meio de uma licença de código aberto conhecida. Mas, vindo da Apple, uma empresa que não é lá muito adepta do open source, a licença do OpenELM até que é flexível.

Mas é importante estudá-la bem para evitar complicações. Exemplo: o The Register observa que a licença permite à Apple reivindicar um patente se um trabalho derivado do OpenELM for considerado uma violação dos direitos da companhia.

Só para constar, os modelos do OpenELM foram treinados com 1,8 trilhão de tokens oriundos de plataformas como Reddit, StackExchange, Wikipedia e arXiv.