Microsoft Copilot ganha comandos de voz e vai entender o que está na tela

Assistente com inteligência artificial generativa terá novo design, resumo de notícias e melhorias na capacidade de raciocínio

Giovanni Santa Rosa
• Atualizado há 2 semanas
Tela inicial do Copilot, com cards que trazem sugestões de pedidos para IA
Tela inicial do Copilot terá sugestões (Imagem: Divulgação / Microsoft)
Resumo
  • A Microsoft anunciou atualizações para o Copilot, incluindo redesign e novos recursos de inteligência artificial, com exclusividades para PCs Copilot+.
  • O Copilot Voice permite interações por voz natural, disponível inicialmente em países de língua inglesa, com opções como sugestões de presentes e interrupção de respostas.
  • O Copilot Vision, em fase de testes, usará texto e imagens da navegação para oferecer ajuda contextual, semelhante ao Recall, mas com maior controle de privacidade.

A Microsoft apresentou uma série de novidades para sua ferramenta de inteligência artificial generativa Copilot. Os recursos vão de um redesign no aplicativo (para iOS, Android, web e Windows) até novas capacidades de raciocínio e atalhos com base no que está na tela.

Algumas das atualizações apresentadas serão exclusivas dos Copilot+ PCs, nome dado aos computadores com poder de processamento suficiente para rodar recursos de IA localmente, com desempenho satisfatório, sem depender da nuvem. Por fim, os recursos de IA do Microsoft 365 serão liberados também para assinantes dos planos pessoais da ferramenta.

“Acreditamos que o Copilot pode ir além de dar respostas básicas ou gerar conteúdo, para dar apoio a você em suas tarefas”, diz Yusuf Mehdi, vice-presidente executivo da Microsoft.

Copilot Voice e Copilot Daily

O Copilot Voice é uma das principais novidades anunciadas pela Microsoft. Ele lembra o assistente de voz do ChatGPT, com capacidade para lidar com linguagem natural e dar respostas rápidas. Também é possível interromper o assistente, caso o que ele esteja falando não seja o que você precisa no momento, e fazer um novo pedido. O Copilot oferece quatro opções de voz.

Em um dos exemplos, o usuário pede ajuda ao Copilot para dar um presente a um amigo que não bebe vinho. O assistente sugere um azeite de boa qualidade, uma caixa de chás artesanais ou uma cesta de snacks gourmet.

Smartphone com uma mensagem "Estou ouvindo" na tela e um plano de fundo de água.
Copilot Voice terá interface minimalista (Imagem: Divulgação / Microsoft)

A voz soa natural e informal, e é capaz até de argumentar por que azeite é um bom presente. Acho que o Copilot não foi ao mercado recentemente para ver quanto o azeite está custando, mas este é outro assunto.

O Copilot Voice estará disponível inicialmente apenas em inglês, na Austrália, Canadá, Nova Zelândia, Reino Unido e Estados Unidos. A Microsoft promete expandir o suporte para mais regiões e idiomas em breve.

Outra novidade envolvendo voz é o Copilot Daily, que dá as informações básicas para o dia, como se fosse um programa de rádio. Uma voz digital, parecida com a de um locutor, dá notícias importantes para o usuário, previsão do tempo, curiosidades e dicas. Tem até uma música suave de fundo.

O Copilot Daily será liberado inicialmente para Estados Unidos e Reino Unido, devendo chegar em breve a outros países.

Think Deeper

Outro novo recurso é o Think Deeper (“pense melhor”, em tradução livre). Seguindo os passos da OpenAI e seu modelo o1, o Think Deeper promete lidar melhor com pedidos que envolvem raciocínio e informações complexas, como os que envolvem matemática e código.

O exemplo da Microsoft é planejar uma reunião de família. O Copilot pede detalhes sobre todo mundo — como idade, ocupação, o que gosta de fazer — e dá uma sugestão de local, transporte, cardápio e atividades para todos.

Tela do Copilot com duas tabelas contendo instruções detalhadas de viagem para diversos membros de uma mesma família.
Think Deeper promete ser capaz de lidar com grande quantidade de informações (Imagem: Divulgação / Microsoft)

E o lançamento? O Think Deeper será disponibilizado inicialmente para um número limitado de assinantes do Copilot Pro na Austrália, Canadá, Nova Zelândia, Reino Unido e Estados Unidos.

Copilot Vision

A Microsoft apresentou ainda o Copilot Vision. Ele está em fase de testes e não será lançado nesta leva de atualizações. Segundo Mehdi, o recurso poderá ver e ouvir o que a navegação do usuário. Quando solicitado, o assistente usará as informações de texto e imagens da página para responder a perguntas e dar ajuda.

Em uma demonstração, o usuário navega pelo site de cinema e TV Rotten Tomatoes. Ele pede ao Copilot sugestões de filmes e série, além de mais informações sobre títulos específicos.

O recurso lembra o Recall, já que ambos acompanham as atividades do usuário no computador. Provavelmente por isso, Mehdi diz que o Copilot Vision só funciona quando ativado, notificações avisam quando a ferramenta está funcionando e nenhuma conversa é armazenada após o fim da sessão. Anteriormente, a repercussão negativa do Recall obrigou a Microsoft a realizar uma série de mudanças.

O Copilot Vision chegará primeiro para um número limitado de assinantes do Copilot Pro nos EUA, por meio do Copilot Labs.

Copilot+ PC terá recursos exclusivos

Algumas novidades apresentadas pela Microsoft são exclusivas dos Copilot+ PC, nome dado às máquinas certificadas para rodar recursos de inteligência artificial localmente, sem depender da nuvem.

Um destes recursos se chama Click to Do (”clique para fazer”, em tradução livre). Ao usar o atalho, ele cria atalhos com base no que está na tela, como pesquisar, saber mais, editar ou comprar. A ferramenta funciona em páginas, documentos, imagens e vídeos.

Em um exemplo, o usuário pausa um vídeo e usa o Click to Do para procurar imagens similares a um objeto presente na filmagem. Isso lembra, de certa forma, o Circule para Pesquisar, do Google, presente em seus próprios smartphones da linha Pixel e nos aparelhos da Samsung, mas com possibilidades bem mais amplas.

Tela do Click to Do. O aplicativo Fotos está aberto, mostrando uma foto de uma pessoa de costas, diante de uma montanha. O usuário clicou com o botão direito do mouse. O Click to Do sugere a busca visual do Bing, borrar o fundo da imagem, apagar objetos com o Fotos ou remover o fundo com o Paint.
Click to Do “entende” o que está na tela e sugere ações com IA (Imagem: Divulgação / Microsoft)

Os computadores com o selo Copilot+ PC também terão uma busca aprimorada para o Windows. A Microsoft promete que o sistema vai encontrar qualquer coisa que o usuário pedir, seja um arquivo ou uma configuração, mesmo que ele não saiba o nome exato.

No exemplo dado pela empresa, o usuário digita “adicionar fones” na caixa de busca do app Configurações. Mesmo sem haver uma opção com este nome, ele sugere os itens “Configurações de Bluetooth e outros dispositivos” e “Aparelhos auditivos”.

O mesmo funciona com busca de fotos no File Explorer: se você digitar “churrasco”, verá fotos de churrasco, mesmo que não esteja escrito “churrasco” na imagem ou no nome de arquivo.

Tela do Explorador de Arquivos do Windows. O usuário digitou "churrasco" (em inglês) e a busca mostra várias fotos de churrasco salvas no PC.
Explorador de Arquivos vai entender o que usuário está procurando (Imagem: Divulgação / Microsoft)

Os aplicativos Fotos e Paint ganharam novidades nos Copilot+ PCs. O Fotos terá ferramentas aumentar a resolução das imagens — a IA ajuda a deixar a dar mais nitidez e detalhes.

Já o Paint poderá gerar objetos em áreas determinadas da imagem, usando apenas pedidos simples — você pode mostrar em que parte da praia quer um farol, por exemplo, e o app adiciona o que foi solicitado.

Relacionados

Escrito por

Giovanni Santa Rosa

Giovanni Santa Rosa

Repórter

Giovanni Santa Rosa é formado em jornalismo pela ECA-USP e cobre ciência e tecnologia desde 2012. Foi editor-assistente do Gizmodo Brasil e escreveu para o UOL Tilt e para o Jornal da USP. Cobriu o Snapdragon Tech Summit, em Maui (EUA), o Fórum Internacional de Software Livre, em Porto Alegre (RS), e a Campus Party, em São Paulo (SP). Atualmente, é autor no Tecnoblog.