Bloom é um modelo de IA com código aberto que promete ser mais democrático

Modelo de linguagem grande (LLM) BLOOM é de código aberto e gratuito; projeto quer democratizar o acesso e a pesquisa sobre inteligência artificial

Por Bruno Ignacio

há 2 anos

Inteligência artificial (Imagem: Pixabay/Geralt)

Um modelo de linguagem de inteligência artificial (IA) de código aberto chegou com um objetivo bem ousado. O chamado BLOOM pretende democratizar o acesso e a pesquisa sobre essa tecnologia. O projeto é disponibilizado gratuitamente para qualquer pessoa e desmonopolizando a IA das “Big Techs” do Vale do Silício.

O modelo de linguagem é maior que o GPT-3 (Generative Pre-trained Transformer 3), que é um modelo de linguagem autorregressivo que usa deep learning para produzir textos semelhantes aos que um humano escreveria. Assim, o BLOOM promete um desempenho semelhante aos principais sistemas do Vale do Silício.

Democratizando o acesso e estudo de IA

Estamos falando de um modelo de linguagem grande (LLM), mas que traz uma abordagem diferente de quase tudo que conhecemos no universo da inteligência artificial. Enquanto as maiores empresas de tecnologia tendem a esconder bem seus LLMs e mantê-los indisponíveis para qualquer um, o BLOOM é um projeto de código aberto.

Isso significa que esse modelo de linguagem para IA é gratuito e disponibilizado para todos, seguindo o objetivo do projeto de democratizar o acesso à tecnologia. Além disso, o BLOOM também é multilíngue, ao contrário do LaMDA do Google e do GPT-3 da OpenAI, um recurso um tanto incomum em um setor dominado pelo inglês.

Pensando a longo prazo, um projeto como esse pode causar um grande impacto no mercado tech. No quadro geral, os LLMs estão se mostrando muito eficientes e já são utilizados em uma grande variedade de tarefas, incluindo produção textual, geração de códigos e tradução de idiomas.

O BLOOM oferece aos pesquisadores uma chance de explorar seus riscos e benefícios. Afinal, a tecnologia também é capaz de produzir conteúdo considerado nocivo. Além disso, todas as suas capacidades e aplicações ainda são difíceis de prever neste momento.

BLOOM é modelo IA de 176 bilhões de parâmetros

Inteligência artificial (imagem ilustrativa: Max Pixel)

Em comunicado obtido pela Next Web do Financial Times, Teven Le Scao, co-líder do treinamento da BLOOM, afirmou que o modelo de linguagem é “uma demonstração de que os modelos de IA mais poderosos podem ser treinados e lançados pela comunidade de pesquisa mais ampla com responsabilidade e de maneira realmente aberta, em contraste com o sigilo típico dos laboratórios de pesquisa de IA industrial.”

Além disso, a abertura de LLMs para o mercado é particularmente cara para ser executada. O custo do treinamento do modelo GPT-3, por exemplo, foi estimado em US$ 27,6 milhões. Assim, as empresas de tecnologia naturalmente buscam proteger seus grandes investimentos, especialmente quando há bastante demanda e competição.

Por isso, LLMs raramente são de código aberto, especialmente um modelo com o nível técnico do BLOOM. A Meta, por exemplo, ofereceu em maio acesso ao sistema OPT, mas somente mediante solicitações, análises dos requerentes e para fins não comerciais.

O modelo de 176 bilhões de parâmetros já está disponível gratuitamente para qualquer indivíduo ou instituição que concorde com a Licença de IA Responsável do sistema. Qualquer um pode visualizar publicamente as notas de reuniões, as discussões e o código por trás do modelo.

O BLOOM foi criado pela BigScience, um projeto de pesquisa lançado no início de 2021. A iniciativa é liderada pela startup de IA Hugging Face. A equipe contou com cerca de 100.000 pesquisadores de mais de 60 países e 250 instituições para desenvolver o BLOOM e promover a inclusão e responsabilidade no setor de LLMs.

Com informações: The Next Web