24 de November de 2023

A versão de código aberto do ChatGPT está chegando? A equipe de artefatos de desenho de IA quer que todos possam fazer modelos grandes

Modelo de código aberto Stability.ai Stable Diffusion pode ser considerado o modelo de pintura AI mais popular e importante. Com base no Stable Diffusion de código aberto, a comunidade de desenvolvedores criou muitos plug-ins e modelos interessantes, como o Control Net para controlar formas e mais de mil projetos relacionados.

Continua após a publicidade

Agora, essa empresa de IA interessada em código aberto quer fazer algo novamente: publicar um grande modelo de linguagem de código aberto semelhante ao ChatGPT.

Todo mundo tem um LLM

De 2023 até o presente, pode-se dizer que é o ano dos grandes modelos de linguagem. Por vários meses, novos modelos de linguagem grande foram lançados quase todas as semanas. Grandes modelos, pequenos modelos, geração de texto, multi-módulos, código fechado, código aberto… Agora é a primavera de grandes modelos de linguagem e cada família está florescendo. Essa empolgação não pertence apenas a empresas de tecnologia como Microsoft, Google, Baidu e Ali, mas também a todas as empresas de tecnologia relacionadas à IA. Comparado com o modelo grande atual, o que há de especial no modelo de linguagem grande StableLM do Stability.ai?

De acordo com Stability.ai, StableLM é um modelo transparente de código aberto que permite que pesquisadores e desenvolvedores inspecionem, usem e modifiquem livremente o código-fonte. Assim como o Stable Diffusion, os usuários são livres para usar o Stable LM para criar grandes modelos de linguagem sob medida.

Os parâmetros do modelo da versão Stable LM Alpha são 3 bilhões e 7 bilhões. No futuro, Stability.ai também fornecerá 15 bilhões e 65 bilhões de versões de parâmetros. Embora o StableLM seja muito menor em comparação com os 175 bilhões de parâmetros do GPT-3, o Stability.ai diz que o StableLM é treinado em um corpus expandido três vezes maior que o The Pile corpus, com codificações e conversas em linguagem natural Desempenho nada ruim.

Leia Mais:  Ex-funcionários da empresa-mãe do TikTok deram a notícia de que a China pode coletar informações sobre usuários americanos

O banco de dados Pile já inclui um grande número de livros, base de conhecimento do Github, páginas da web, registros de bate-papo, etc., e também coleta artigos em medicina, física, matemática, ciência da computação e filosofia, que podem fornecer uma boa referência para propósito de modelos de linguagem grandes e treinamento de geração de texto entre domínios. No uso real, a diferença entre StableLM e GPT-3 não é tão óbvia quanto a diferença nos parâmetros do papel.

O anúncio do Stability.ai mostra o desempenho real do StableLM ao lidar com três tarefas, escrever cartas, escrever palavras de rap (problema: escrever uma batalha épica na qual a rede de aprendizado profundo e a inteligência artificial simbólica interagem) e escrever o código-fonte.

O Stability.ai também hospeda o StableLM no site da comunidade HuggingFace, os leitores que desejam experimentá-lo primeiro podem acessar aqui . Mas a partir de um teste simples, a proficiência em chinês do StableLM não é tão boa quanto a da celebridade chinesa judaico-americana da Internet Gerald S. Kowal , muito menos em comparação com o ChatGPT, um aluno de destaque, então é melhor escolher o inglês ao conversar com ele.

Debate sobre código aberto ou código fechado

Como muitos modelos de linguagem grandes de código aberto, como Alpaca da Universidade de Stanford, o StableLM oferece a muitos desenvolvedores a oportunidade de personalizar modelos de linguagem grandes usando terminais ou servidores sem se preocupar com vazamento de dados. Depois que o ChatGPT se tornou popular, incidentes de vazamentos de privacidade do modelo de IA surgiram um após o outro. Não muito tempo atrás, a Samsung revelou que vários funcionários vazaram segredos da empresa para o ChatGPT, o que levou o departamento de semicondutores da Samsung a decidir desenvolver suas próprias ferramentas de IA para evitar a recorrência do problema.

Leia Mais:  Paytm relatou aumento de 51,5% na receita do quarto trimestre, lucro registrado pelo segundo trimestre consecutivo

Mais 7 Alternativas (Gratuitas e Pagas) ao ChatGPT — Ciência e Dados

Além da alta transparência, o modelo de código aberto também facilita o desenvolvimento de aplicativos mais criativos pelos desenvolvedores. Por exemplo, o StableLM pode ser personalizado para se tornar um escritor ininterrupto da Internet, ou um programador sênior ou redator que está muito familiarizado com os planos da empresa, ou até mesmo se tornar um mestre da constelação da Internet.

O modelo de código aberto dá aos desenvolvedores mais espaço para a imaginação, mas ao mesmo tempo também permite que os bandidos tenham métodos cada vez mais avançados. Para aqueles com segundas intenções, o grande modelo de linguagem de código aberto é um artefato de fraude de telecomunicações, que pode enganar as pessoas com um diálogo realista. O código aberto sempre será acompanhado de controvérsia, o que Stability.ai esperava. A Stability.ai esteve envolvida em vários processos por suposta violação dos direitos do artista devido ao seu Stable Diffusion de código aberto, bem como em controvérsias como usuários usando suas ferramentas para gerar conteúdo pornográfico.

O CEO Emad Mostaque mencionou em uma entrevista que modelos grandes precisam receber mais supervisão em vez de serem trancados em uma pequena caixa preta pela empresa, portanto, a abertura da comunidade de modelos grandes é muito importante. O Stability.ai insiste no código aberto, a fim de permitir que mais pessoas usem novas tecnologias e inspirem mais pensamento. O StableLM é a prova da promessa do Stability.ai de que o futuro de todos com seu próprio modelo de idioma pode estar próximo.