Google lança Gemini, super inteligência artificial que promete superar especialistas humanos – e o ChatGPT
Empresa diz que sistema será mais capaz que a concorrência para processar múltiplas informações e dar respostas mais complexas e precisas
O Google (GOGL34) anunciou nesta quarta-feira (6) o lançamento do Gemini, a sua nova ferramenta de inteligência artificial generativa. De acordo com a empresa, a versão mais sofisticada é o primeiro modelo de IA a bater especialistas humanos em um teste que combina 57 disciplinas, como matemática, física e história. E, principalmente, que vence no mesmo critério o GPT 4.0, a base da versão paga do ChatGPT.
Trata-se, portanto, mais um capítulo na batalha das big techs para liderar a corrida pela liderança na IA.
Receba no seu e-mail a Calculadora de Aposentadoria 1-3-6-9® e descubra quanto você precisa juntar para se aposentar sem depender do INSS
“A nova era dos modelos de IA representa um dos maiores esforços científicos e de engenharia que empreendemos como empresa”, afirmou o CEO da empresa, Sundar Pichai, em comunicado. “Esse é um avanço incrível e, no entanto, estamos apenas começando a arranhar a superfície do que é possível”.
O que é o Gemini do Google?
O Gemini é o sistema de inteligência artificial generativa do Google. O desenvolvimento é da DeepMind, empresa pioneira em IA criada em 2010 e comprada pela big tech em 2014.
Últimas em Negócios
O sistema tem três graus de sofistificação. O super sistema que bateu especialistas humanos é o Gemini Ultra, para “atividades altamente complexas”. O Google diz que essa ferramenta será disponibilizada primeiro para clientes, desenvolvedores e especialistas em segurança e que ele será base do novo Bard Advanced, que virá “no início” de 2024.
O que entra em vigor agora é o Gemini Pro e o Gemini Nano, respectivamente o nível intermediário e mais básico do sistema. O Google afirma que o Pro bate o GPT 3.5, que é o sistema que roda na atual versão gratuita do ChatGPT.
O Gemini Pro já está valendo no modelo chatbot, de perguntas e respostas, no Bard. No entanto, neste momento você pode utilizar a versão melhorada do buscador do Google apenas em inglês. A partir do dia 13, desenvolvedores poderão trabalhar em versões personalizadas para as suas tarefas.
Por fim, o Gemini Nano é a versão pensada para dispositivos móveis. O sistema roda no Pixel 8 Pro, aparelho desenvolvido pelo Google. A empresa liberou o sistema para desenvolvedores de aplicativos do sistema Android.
De cara, o Nano no Pixel 8 vai permitir respostas inteligentes no WhatsApp. Para os próximos meses, o Google promete expandir para outros aplicativos de mensagens e para outras frentes, como Busca, Google Ads e o Chrome.
O que torna o Gemini diferente do ChatGPT
O Google não finge que produziu o Gemini ignorando a concorrência do sistema GPT. “Nós fizemos uma análise detalhada dos sistemas lado a lado”, afirmou Demis Hassabis, CEO da DeepMind, segundo o The Verge.
A empresa se vangloria neste momento de uma grande diferença. A empresa afirma que o Gemini foi desenvolvido como multimodal desde o primeiro momento. Na prática, isso significa que ele seria mais capaz de ler texto, imagem, áudio e vídeo ao mesmo tempo. E, assim, dar respostas mais complexas e precisas para as demandas.
A multimodalidade foi algo que a OpenAI só conseguiu trazer para o seu sistema a partir do GPT 4.0. Os testes divulgados hoje pelo Google afirmam que, mesmo com a inclusão da função da versão mais recente, o novo Gemini ainda é mais hábil nessa tarefa.
Um exemplo que o Google traz em seu relatório é o de um exercício de física, respondido a mão por um estudante. O Gemini é capaz de entender a linguagem escrita à mão, entender a lógica de raciocínio do aluno, cruzar com conhecimentos a respeito do tema, identificar e corrigir o erro.
Novo sistema não resolve “alucinações”
Um dos problemas comuns das inteligências artificiais é a chamada “alucinação”. Esse é o termo que define as respostas aparentemente conflitantes com os dados que treinaram a inteligência artificial.
“Há uma necessidade contínua de seguir com as pesquisas em andamento e desenvolvimento sobre as ‘alucinações’ geradas para garantir que os modelos de resposta sejam mais confiáveis e verificadas”, escrevem os especialistas do Gemini em relatório técnico.
O Google afirma, no entanto, que inseriu 100.000 prompts de “vários graus de toxicidade extraídos da web”. Assim, a expectativa é que o Gemini consiga filtrar respostas violentas e preconceituosas, entre outras.