Apple aposta na IA generativa com o OpenELM, um projeto de código aberto
OpenELM é conjunto de modelos para inteligência artificial generativa que pode ser implementado livremente em qualquer projeto
OpenELM é conjunto de modelos para inteligência artificial generativa que pode ser implementado livremente em qualquer projeto
OpenELM é o nome de uma série de modelos (LLMs) de inteligência artificial (IA) generativa que a Apple liberou para uso público. O conjunto chama a atenção por ter código-fonte aberto e ser mais leve do que a maioria dos modelos de IA atuais, o que deve facilitar a sua implementação em projetos com os mais diversos fins.
O nome OpenELM significa “Modelos de Linguagem Eficientes de Código Aberto”. Os modelos da iniciativa geram conteúdo em texto, mas seguem bases de parâmetros diferentes. Da menor para a maior, estes são os tamanhos das bases disponíveis:
Entenda como parâmetros a quantidade de variáveis que o modelo compreende por meio de seu treinamento para gerar resultados. A maior base da Apple tem uma quantidade de parâmetros ligeiramente abaixo daquela que está disponível para o Phi-3, o menor modelo de IA da Microsoft, com 3,8 bilhões de parâmetros.
As pequenas quantidades de parâmetros do OpenELM quando comparadas a outras LLMs não são exatamente uma desvantagem. Essa característica permite que aplicações de IA generativa sejam executadas em dispositivos com capacidade de processamento ou baterias relativamente modestas, a exemplo de celulares de baixo custo ou dispositivos vestíveis.
Quais aplicações seriam essas? A Apple disponibilizou o OpenELM no Hugging Face com um “licença de código de amostra”. Ela permite que o código-fonte dos modelos seja modificado ou até usado de modo comercial. Assim, o seu uso dependerá do objetivo e da criatividade de cada desenvolvedor que se interessa pela iniciativa.
Podemos pensar em um usuário que recebe um e-mail e dá um comando por voz ao celular para que o aparelho gere uma resposta contendo determinada informação. Um aplicativo baseado no OpenELM poderia executar essa tarefa sem exigir muito processamento ou energia. Mas, claro, esse é um cenário meramente hipotético.
O ideal seria o OpenELM ser disponibilizado por meio de uma licença de código aberto conhecida. Mas, vindo da Apple, uma empresa que não é lá muito adepta do open source, a licença do OpenELM até que é flexível.
Mas é importante estudá-la bem para evitar complicações. Exemplo: o The Register observa que a licença permite à Apple reivindicar um patente se um trabalho derivado do OpenELM for considerado uma violação dos direitos da companhia.
Só para constar, os modelos do OpenELM foram treinados com 1,8 trilhão de tokens oriundos de plataformas como Reddit, StackExchange, Wikipedia e arXiv.