Chatbot da Google lê e resume emails a pedido em Portugal. Como funciona a actualização do Gemini?
Já se pode pedir ao chatbot com IA da Google para usar informação no Gmail, Maps e YouTube para responder a perguntas. O PÚBLICO explica como funciona e o que é guardado pelo Gemini.
O chatbot inteligente da Google, o Gemini, já é capaz de procurar, ler e resumir emails e documentos de utilizadores em Portugal. As extensões do Gemini, lançadas em Setembro, chegam esta quinta-feira a terras lusas, tornando-se possível autorizar (ou não) o chatbot com IA generativa da Google a usar informação de várias aplicações e serviços da empresa, incluindo o Gmail e o YouTube para responder às perguntas dos utilizadores.
Isto permite, por exemplo, pedir ao Gemini para ajudar a planear o jantar de aniversário de um amigo, ao ler imagens trocadas sobre o evento (Gmail), a procurar restaurantes nas redondezas (Google Maps) ou vídeos de receitas de bolos (YouTube). A Google diz que a informação não será usada para mostrar anúncios personalizados, nem será vista por revisores humanos.
“Com as extensões, o Gemini pode poupar-lhe tempo ao encontrar informação relevante nas aplicações e serviços Google”, justifica a equipa da Google em comunicado.
O PÚBLICO explica como activar os serviços, o que é partilhado com a Google e os cuidados a ter. Confirmar a informação dada pelo chatbot continua a ser essencial – emails ou newsletters com formatação mais complexa podem levar o sistema a partilhar informação errada. O Gemini também revela dificuldades com conceitos temporais em português (é o caso de “mais recente” ou “mais antigo”).
O que é o Gemini?
O Gemini é o chatbot com IA generativa da Google, disponível desde Julho de 2023 na União Europeia. O lançamento segue a proliferação de novas ferramentas de IA que escrevem ensaios, geram imagens e resolvem equações a pedido. Tudo começou com o lançamento do ChatGPT em Novembro de 2022 – o chatbot da OpenAI foi o primeiro a lançar uma ferramenta que usa IA para perceber a linguagem humana e produzir conteúdo original.
Na base da tecnologia, está o GPT (Generative Pre-Trained Transformer), a sigla inglesa que foi anexada ao nome do chatbot da OpenAI. Os transformers são modelos linguísticos criados para encontrar padrões em sequências de dados.
Inicialmente, a versão da Google era conhecida por Bard. Funciona de forma semelhante ao Copilot (inicialmente Bing Chat) da Microsoft e ao ChatGPT da OpenAI. Ao contrário destas, o chatbot da Google não gera imagens – a funcionalidade foi temporariamente suspensa quando o sistema começou a produzir retratos com erros históricos numa tentativa mal-sucedida de promover a diversidade.
Como é que se activa o sistema?
É possível ver as extensões a que o Gemini tem acesso, nas definições do chatbot. Para tal, é preciso aceder à página online da Gemini (https://gemini.google.com) > Definições > Extensões. Em Portugal, apenas se pode aceder ao Gemini através de um navegador online. Contrariamente às ferramentas da OpenAI (ChatGPT) e da Microsoft (Copilot), a app do Gemini ainda não chegou aos países da União Europeia.
As extensões disponíveis no site incluem o Google Workspace (Editor de documentos, Drive e Gmail), o YouTube, o Maps e o sistema de pesquisa de voos e hotéis da Google. As extensões estão activadas por definição, mas isto não quer dizer que o chatbot da Google tenha autorização para as usar.
Por exemplo, é preciso dar autorização explícita ao Gemini para ler os emails da Google. A opção está disponível nas definições do Gmail (canto superior direito) > ver todas as definições > activar a opção “Funcionalidades inteligentes e a personalização noutros produtos Google”.
Como é que se usa o sistema?
As diferentes extensões podem ser usadas na página do Gemini (gemini.google.com) através da combinação @extensão + pedido. Por exemplo, “@Gmail, resume as últimas três mensagens enviadas pela Karla Pequenino”. Ou “@Youtube, resume o último vídeo publicado pela conta jornalpublicovideos”.
A Google diz que em breve também será possível aceder ao sistema directamente através do motor de busca da Google, ao activar o chatbot com @Gemini. Ou seja, “@Gemini, usa o @Youtube para encontrar receitas de pastéis de nata veganos”.
Numa primeira utilização, parece uma ferramenta útil para poupar tempo, recolhendo informação de várias fontes em simultâneo. No entanto, devem-se verificar as respostas: o sistema do Gemini identifica um vídeo publicado há cerca de um mês como o mais recente do PÚBLICO (não é). O mesmo acontece quando se pede para resumir emails enviados de um endereço específico em português – vale a pena notar, porém, que, quando o pedido foi feito em inglês, o sistema não falhou.
Porque é que os chatbots confundem tanto a informação?
As ferramentas de conversa com IA não foram criadas para reproduzir factos ou verificar informação. As ferramentas foram programadas para responder a pedidos feitos por humanos com base em vastos bancos de dados. A missão é gerar a resposta que melhor se enquadra no contexto de uma conversa. “Confirme as respostas”, aconselha um pequeno rodapé que se repete nas ferramentas da Google, Microsoft e OpenAI.
Este é um dos motivos que levam alguns profissionais da educação a defender o planeamento de aulas que expliquem como utilizar estas ferramentas, abordando também as suas falhas.
A que informação é que a Google tem acesso?
Ao activar a extensão do Gmail, o sistema da Gemini tem autorização para usar a informação nos emails para responder às perguntas dos utilizadores. O mesmo acontece com a extensão do Drive (armazenamento na nuvem da Google) ou com o Docs (processador de texto). De acordo com a Google, a informação não é partilhada com revisores humanos, nem é usada para publicidade personalizada ou para treinar o sistema da Gemini.
As autorizações dadas podem ser revogadas a qualquer altura nas definições. É possível ver os resumos e definir o período de tempo durante o qual a Google mantém conversas no Gemini nas definições de Actividade do chatbot.