24 de November de 2023

As empresas de IA pagarão pela coleta de conteúdo do Reddit, CEO: não há necessidade de enviar dados para grandes empresas gratuitamente

Desde o lançamento do chatbot ChatGPT da OpenAI, houve uma “mania de IA” em todo o mundo. Desenvolvedores, grandes e pequenos, têm trabalhado duro para encontrar materiais de treinamento para IA em vários sites. Recentemente, o usuário akhudek do Reddit  descobriu que o Reddit atualizou os termos de uso da API . Se as respostas do usuário forem usadas como dados de treinamento de IA, o consentimento deve ser obtido primeiro.

Continua após a publicidade

O Reddit atualizou os termos de uso da API anteriormente, estipulando claramente que os desenvolvedores de IA precisam obter a permissão dos usuários do Reddit antes que possam usar aprendizado de máquina de treinamento (Machine Learning) ou modelos de inteligência artificial (modelo AI).

O Reddit passou por 18 invernos e verões desde seu lançamento em 2005. Quase 57 milhões de pessoas visitam o fórum todos os dias, e os tópicos variam de maquiagem a jogos de computador e até mecânica quântica.Também existem comunidades dedicadas. Devido à ampla gama de tópicos envolvidos e à profundidade do conteúdo, as várias conversas do Reddit são uma excelente fonte de materiais de treinamento para empresas de inteligência artificial, como Google e OpenAI. Depois que o Reddit atualizou seus termos de uso, ele não autoriza mais os desenvolvedores automaticamente a usar a API para treinar IA.

Em entrevista ao New York Times, o fundador e CEO do Reddit, Steve Huffman, disse que o corpus do Reddit (Corpus) é muito valioso e não há necessidade de fornecer dados de corpus gratuitos para empresas de renome mundial. Huffman diz que o corpus do Reddit é valioso porque as discussões no Reddit são mais autênticas e relevantes do que em outros sites: “Há muito conteúdo no Reddit que só pode ser ouvido em grupos de apoio como psicoterapeutas e Alcoólicos Anônimos (AA)”.

Leia Mais:  Regulador de concorrência do Reino Unido lança revisão do mercado de IA

▲ Steven Huffman. 

Huffman reiterou que o Reddit ainda fornecerá APIs gratuitamente para desenvolvedores de aplicativos Reddit terceirizados, mas grandes empresas de modelos de inteligência artificial precisarão pagar. Os novos termos de uso da API entrarão em vigor em 19 de junho.