Google lança Gemini, super inteligência artificial que promete superar especialistas humanos – e o ChatGPT

Empresa diz que sistema será mais capaz que a concorrência para processar múltiplas informações e dar respostas mais complexas e precisas

Capacidade de ser “multimodal” é grande diferencial do Gemini, diz Google. Foto: Divulgação / Google

PorLívia Venaglia Jornalista da Inteligência Financeira

06 dez. 2023, 19:36 Última Atualização: 15 maio. 2024, 11:55

Twitter

Facebook

Empresas citadas na reportagem:

O Google (GOGL34) anunciou nesta quarta-feira (6) o lançamento do Gemini, a sua nova ferramenta de inteligência artificial generativa. De acordo com a empresa, a versão mais sofisticada é o primeiro modelo de IA a bater especialistas humanos em um teste que combina 57 disciplinas, como matemática, física e história. E, principalmente, que vence no mesmo critério o GPT 4.0, a base da versão paga do ChatGPT.

Trata-se, portanto, mais um capítulo na batalha das big techs para liderar a corrida pela liderança na IA.

“A nova era dos modelos de IA representa um dos maiores esforços científicos e de engenharia que empreendemos como empresa”, afirmou o CEO da empresa, Sundar Pichai, em comunicado. “Esse é um avanço incrível e, no entanto, estamos apenas começando a arranhar a superfície do que é possível”.

O que é o Gemini do Google?

O Gemini é o sistema de inteligência artificial generativa do Google. O desenvolvimento é da DeepMind, empresa pioneira em IA criada em 2010 e comprada pela big tech em 2014.

O sistema tem três graus de sofistificação. O super sistema que bateu especialistas humanos é o Gemini Ultra, para “atividades altamente complexas”. O Google diz que essa ferramenta será disponibilizada primeiro para clientes, desenvolvedores e especialistas em segurança e que ele será base do novo Bard Advanced, que virá “no início” de 2024.

O que entra em vigor agora é o Gemini Pro e o Gemini Nano, respectivamente o nível intermediário e mais básico do sistema. O Google afirma que o Pro bate o GPT 3.5, que é o sistema que roda na atual versão gratuita do ChatGPT.

O Gemini Pro já está valendo no modelo chatbot, de perguntas e respostas, no Bard. No entanto, neste momento você pode utilizar a versão melhorada do buscador do Google apenas em inglês. A partir do dia 13, desenvolvedores poderão trabalhar em versões personalizadas para as suas tarefas.

Por fim, o Gemini Nano é a versão pensada para dispositivos móveis. O sistema roda no Pixel 8 Pro, aparelho desenvolvido pelo Google. A empresa liberou o sistema para desenvolvedores de aplicativos do sistema Android.

De cara, o Nano no Pixel 8 vai permitir respostas inteligentes no WhatsApp. Para os próximos meses, o Google promete expandir para outros aplicativos de mensagens e para outras frentes, como Busca, Google Ads e o Chrome.

O que torna o Gemini diferente do ChatGPT

O Google não finge que produziu o Gemini ignorando a concorrência do sistema GPT. “Nós fizemos uma análise detalhada dos sistemas lado a lado”, afirmou Demis Hassabis, CEO da DeepMind, segundo o The Verge.

A empresa se vangloria neste momento de uma grande diferença. A empresa afirma que o Gemini foi desenvolvido como multimodal desde o primeiro momento. Na prática, isso significa que ele seria mais capaz de ler texto, imagem, áudio e vídeo ao mesmo tempo. E, assim, dar respostas mais complexas e precisas para as demandas.

A multimodalidade foi algo que a OpenAI só conseguiu trazer para o seu sistema a partir do GPT 4.0. Os testes divulgados hoje pelo Google afirmam que, mesmo com a inclusão da função da versão mais recente, o novo Gemini ainda é mais hábil nessa tarefa.

Um exemplo que o Google traz em seu relatório é o de um exercício de física, respondido a mão por um estudante. O Gemini é capaz de entender a linguagem escrita à mão, entender a lógica de raciocínio do aluno, cruzar com conhecimentos a respeito do tema, identificar e corrigir o erro.

Novo sistema não resolve “alucinações”

Um dos problemas comuns das inteligências artificiais é a chamada “alucinação”. Esse é o termo que define as respostas aparentemente conflitantes com os dados que treinaram a inteligência artificial.

“Há uma necessidade contínua de seguir com as pesquisas em andamento e desenvolvimento sobre as ‘alucinações’ geradas para garantir que os modelos de resposta sejam mais confiáveis e verificadas”, escrevem os especialistas do Gemini em relatório técnico.

O Google afirma, no entanto, que inseriu 100.000 prompts de “vários graus de toxicidade extraídos da web”. Assim, a expectativa é que o Gemini consiga filtrar respostas violentas e preconceituosas, entre outras.

Tópicos:

Twitter

Facebook

A Inteligência Financeira é um canal jornalístico e este conteúdo não deve ser interpretado como uma recomendação de compra ou venda de investimentos. Antes de investir, verifique seu perfil de investidor, seus objetivos e mantenha-se sempre bem informados.