29 de November de 2023

Atualização épica do ChatGPT do Google, o novo modelo PaLM 2 subverterá completamente o modelo de pesquisa

Olhando para as conferências I/O nos últimos sete anos, a IA sempre foi a principal prioridade do Google. Por exemplo, antes do ChatGPT se tornar popular, o Google mostrou a série LaMDA de modelos de linguagem na conferência I/O, mas não foi popular . A popularidade do ChatGPT levou a IA ao seu melhor momento, mas também deixou o Google extremamente ansioso. Assistindo a toda a conferência, o Google mencionou a palavra “IA” quase 200 vezes, quase escrevendo IA em todos os produtos, como Gmail, pesquisa, Pixel, etc., ansioso para provar a todos que ainda é uma empresa de IA de ponta.

Continua após a publicidade

Se esta conferência tivesse ocorrido há meio ano, teria sido extremamente emocionante: trabalho de escritório assistido por IA, pesquisa de IA, programação de IA, cada uma das quais é uma grande atualização tecnológica. É uma pena que a Microsoft tenha roubado todos os holofotes e a reação do público tenha sido até um pouco fria. Houve apenas dois elogios: o modo escuro de Bard e o dock gratuito para o tablet Pixel.

Nesta conferência I/O, as novas tecnologias de produtos do Google parecem estar alcançando a Microsoft e a OpenAI ─ ─ alcançando o futuro da IA ​​que foi realizado preventivamente.

PaLM 2, a arma secreta do Google contra GPT-4

O modelo de linguagem grande tornou-se o principal produto no círculo de tecnologia, e toda empresa deseja criar um modelo comparável ao GPT para provar sua força, e o Google não é exceção. O Google lançou um novo modelo de linguagem grande PaLM 2 desta vez, contra GPT-4. De acordo com o Google  , o PaLM 2 é treinado com um grande número de bancos de dados matemáticos e científicos.Comparado com o modelo PaLM do ano passado, os recursos multilíngues de processamento, raciocínio e programação do PaLM 2 foram bastante aprimorados.

Alguns resultados do teste PaLM 2 do Google, como matemática, são melhores do que GPT-4. O Google não divulgou a escala de parâmetros do PaLM 2, apenas mencionando que o PaLM 2 é baseado nas mais recentes instalações de computação JAX e TPU v4. O Google otimizou o algoritmo PaLM 2 para tornar o volume menor que o PaLM, mas o desempenho geral é melhor e a eficiência do cálculo é maior.

O PaLM 2 suporta mais de 100 idiomas e mais de 20 linguagens de programação, incluindo JavaScript, Python, Prolog, Verilog, Fortran, etc. Não basta apenas entender e gerar texto convencional. O PaLM 2, que suporta vários módulos, também pode entender e gerar conteúdo audiovisual. O Google mostra o Med-PaLM, um modelo ajustado para a área médica, que pode analisar lesões de pacientes com base em raios X. Google Este aspecto atingiu o nível dos médicos humanos.

O modelo PaLM 2 também pode ser “dividido” em 4 versões, que podem ser implantadas em vários dispositivos. Por exemplo, um smartphone pode executar um modelo Gecko menor e um dispositivo móvel também pode ter um modelo de linguagem grande. O PaLM 2 está aberto para visualização, e o próprio robô de bate-papo do Google, Bard, usou o modelo PaLM 2 para aprimorar sua capacidade de resposta. O conteúdo do Google tem mais de 70 equipes de produtos usando PaLM 2 para criar produtos. A maioria das atualizações é baseada no design do modelo PaLM 2. Pode-se dizer que PaLM 2 é o principal mecanismo da IA ​​abrangente do Google.

Leia Mais:  Comentário: O GPT-4 da OpenAI tem algumas limitações que podem ser corrigidas - e outras que não são

Além do PaLM 2, o CEO Sundar Pichai também estragou um pouco as novidades do modelo grande de próxima geração Gemini (Gemini), dizendo que o Gemini visa alcançar multimodalidade, eficiência e inovação para o futuro. Gemini é um novo modelo desenvolvido em conjunto pela fusão de duas grandes equipes de IA, Google Brain e DeepMind. Como pode ser visto pelo nome, Gemini combina os pontos fortes dos dois e espera-se que esteja entre os mais poderosos modelos de linguagem grande.

Bard: Upgrade multi-módulo, pode desenhar e ler imagens

Parece melhor, é mais abrangente e pode ser usado por mais pessoas. Menos de dois meses após a atualização, o Google mudou Bard para o modelo de linguagem grande mais poderoso PalM 2, um concorrente substancialmente atualizado e mais poderoso para ChatGPT e BingChat:

  • Cancele a lista de espera e abra mais de 180 países.
  • Adicionado pergunta e resposta de imagem, o diálogo é mais intuitivo.
  • Integre o Adobe Firefly para gerar imagens rapidamente.
  • Citações de fontes, modo escuro, botão de exportação de código, atualização de mais detalhes.

Restrições britânicas e americanas, apenas inglês, lista de espera, não é fácil usar o Bard com muitas restrições. Mas a partir de agora, a Bard vai cancelar a lista de espera e abrir a experiência em mais de 180 países. O Bard atualmente suporta japonês e coreano e em breve expandirá para 40 idiomas, incluindo chinês.

Em termos de funções, o Bard também foi bastante atualizado, e o resumo de quatro palavras é “imagens e textos”. Ao fazer perguntas ao Bard, não é mais um robô que só pode responder secamente com texto, mas pode exibir respostas mais ricas com imagens. O Google também trouxe a função Google Lens para o Bard, que pode não apenas responder imagens, mas também entender imagens, escrever ensaios com base nas informações da imagem, como fornecer fotos de cães e intitular de acordo com as raças de cães.

Talvez por causa das ótimas críticas da função de imagem de Vincent ao lado, o Google também adicionou a mesma função ao Bard, mas cooperou com o Adobe Firefly, e o Bard integrando o Firefly pode gerar imagens de alta qualidade em linguagem natural. Com o endosso da Adobe, não há necessidade de se preocupar com a qualidade dos direitos autorais das imagens, e a Adobe é apenas o começo. O Google também trabalhará com parceiros como Kayak, OpenTable, zip manpower e Khan Academy para adicionar mais recursos ao Bard.

Leia Mais:  Os usuários logo terão a ajuda dos navegadores da web para evitar as tarefas irritantes de CAPTCHAs.

Google atualiza Bard em seus recursos de lógica e matemática

O posicionamento de Bard é mais BingChat, levando em consideração tanto os mecanismos de busca quanto as ferramentas de produtividade, e adicionará uma função de referência na próxima semana para exibir a fonte do código para garantir a precisão. Adicionado a função de exportar e executar código para facilitar o trabalho dos desenvolvedores. A propósito, um novo modo escuro foi adicionado, o que arrancou aplausos da cena. Embora tenha sido um oolong em sua primeira aparição, o Google ainda permite que as pessoas vejam a melhoria contínua do Bard, mas infelizmente a palavra mais ouvida é “vamos”. Depois que todas as funções lançadas hoje forem implementadas, o Bard será considerado um abrangente e ferramenta madura.

Duet AI: Toda a papelada é entregue à AI

Aí vem o concorrente Copilot. O Google apresenta uma nova ferramenta Duet AI for Workspace e vê o papel desempenhado pelo software de escritório do Google baseado em nuvem AI:

  • Word : Resuma o texto completo, escreva automaticamente
  • PowerPoint : diagrama de Vincent, melhorar a eficiência
  • Excel : analise dados, desenvolva estratégias

Você pode dizer ao Duet AI qual conteúdo deseja criar e permitir que ele gere artigos automaticamente. Você também pode deixá-lo gerar diferentes estilos de escrita de acordo com suas necessidades. A função “ChatPDF” de “ler” artigos e perguntas-chave não ficou para trás, e o Google Mail também possui geração, expansão e ajuste de texto.

Para apresentações, o Duet AI atua como um gerador de imagens, economizando tempo na busca de imagens na Internet e enriquecendo as apresentações de slides com conteúdo original.

O Duet AI pode organizar automaticamente os dados de acordo com as perguntas para tornar os dados mais organizados.

Essas funções também podem cooperar com outros serviços do Google. Por exemplo, depois que Bard cria um formulário on-line, ele pode ser convertido em um arquivo de documento com um clique para uso posterior. O Duet AI também adiciona ferramentas de desenvolvimento em nuvem do Google orientadas por aprendizado de máquina, que podem corrigir código, gerar etc. em tempo real e oferecer suporte a várias linguagens de desenvolvimento, como Go, Java, Javascript, Python e SQL.

Não é mais necessário esperar pelo Bard, mas agora pelo Duet AI. Se você quiser experimentar novos recursos, ainda precisa entrar na lista de espera e esperar que o Google abra o teste. No geral, Duet AI carece da surpresa de ver o Copilot pela primeira vez, e suas funções parecem ser fracas, mas Bard se recuperou em menos de dois meses, então espere mais possibilidades do Duet AI.

Leia Mais:  O trabalho de IA ganhou o World Photography Award, o criador se recusou a aceitar o prêmio: a competição não está pronta para elogiar a inteligência artificial

Pesquisa do Google: redefinido, tudo

Pesquisas futuras devem ficar assim:

Impulsionada pelo PaLM 2, a pesquisa do Google também abraçou a inovação, lançando um novo mecanismo de pesquisa SGE (Search Generative Experience), não precisa mais dividir grandes perguntas em várias pequenas perguntas e, em seguida, reunir as respostas após a pesquisa. AI, você pode deixar a pesquisa fazer o trabalho duro.

O Google mostra como a IA generativa pode melhorar as compras. Ao pesquisar um produto no Google, você verá a descrição, as avaliações, os preços e as imagens do produto. O Google, que tem mais de 35 bilhões de listas de produtos, está constantemente atualizando a uma taxa de 1,8 bilhão por hora. Usando o Google para pesquisar e comprar, há resultados mais atualizados e confiáveis.

O Google acredita que a publicidade é uma parte importante da Web e continuará mantendo seu compromisso com a transparência da publicidade e manterá os anúncios e os resultados de pesquisa separados. O Google também está abrindo registros de laboratório de pesquisa a partir de hoje e abrirá o acesso dentro de algumas semanas para oferecer suporte aos navegadores Google App e Chrome.

A ansiedade da IA ​​do Google só pode ser resolvida com IA

Algumas pessoas dizem, brincando, que o Google I/O deste ano deveria se chamar Google AI/O. Microsoft e OpenAI estão liderando o caminho, e o Google perdeu um momento incrível, mas é sem dúvida a auto-revolução mais resoluta do Google nos últimos anos. O Google, que afirma ser AI-first, tem perdido oportunidades muitas vezes por causa de sua estratégia cautelosa e conservadora. Agora o Google finalmente percebe que deve agir rapidamente, assim como o “ousado e responsável” que muitos executivos do Google disseram, e pode não hesite mais por medo de errar não antes.

É claro que a IA não é uma panacéia. Após uma grande atualização, Bard pode não ser capaz de mudar a tendência de superação da pesquisa do Google, mas não há dúvida de que a IA remodelará a pesquisa e mudará completamente a forma de interação humano-computador. Sua participação é muito inferior ao Microsoft Bing do Google. Em apenas alguns meses, existem centenas de milhões de usuários ativos diariamente e mais de 500 milhões de bate-papos. 70% dos usuários que experimentam o novo recurso de bate-papo do Bing também o usam para pesquisa.

Quando o maior mecanismo de busca do mundo decide abandonar seus fardos e abraçar totalmente as novas tendências, pode não apenas mudar o futuro do Google, mas também subverter o mecanismo de rede e mudar o modo de interação de bilhões de usuários. Um mundo novo e mais simples está chegando.