Microsoft Copilot ganha comandos de voz e vai entender o que está na tela
Assistente com inteligência artificial generativa terá novo design, resumo de notícias e melhorias na capacidade de raciocínio
Assistente com inteligência artificial generativa terá novo design, resumo de notícias e melhorias na capacidade de raciocínio
A Microsoft apresentou uma série de novidades para sua ferramenta de inteligência artificial generativa Copilot. Os recursos vão de um redesign no aplicativo (para iOS, Android, web e Windows) até novas capacidades de raciocínio e atalhos com base no que está na tela.
Algumas das atualizações apresentadas serão exclusivas dos Copilot+ PCs, nome dado aos computadores com poder de processamento suficiente para rodar recursos de IA localmente, com desempenho satisfatório, sem depender da nuvem. Por fim, os recursos de IA do Microsoft 365 serão liberados também para assinantes dos planos pessoais da ferramenta.
“Acreditamos que o Copilot pode ir além de dar respostas básicas ou gerar conteúdo, para dar apoio a você em suas tarefas”, diz Yusuf Mehdi, vice-presidente executivo da Microsoft.
O Copilot Voice é uma das principais novidades anunciadas pela Microsoft. Ele lembra o assistente de voz do ChatGPT, com capacidade para lidar com linguagem natural e dar respostas rápidas. Também é possível interromper o assistente, caso o que ele esteja falando não seja o que você precisa no momento, e fazer um novo pedido. O Copilot oferece quatro opções de voz.
Em um dos exemplos, o usuário pede ajuda ao Copilot para dar um presente a um amigo que não bebe vinho. O assistente sugere um azeite de boa qualidade, uma caixa de chás artesanais ou uma cesta de snacks gourmet.
A voz soa natural e informal, e é capaz até de argumentar por que azeite é um bom presente. Acho que o Copilot não foi ao mercado recentemente para ver quanto o azeite está custando, mas este é outro assunto.
O Copilot Voice estará disponível inicialmente apenas em inglês, na Austrália, Canadá, Nova Zelândia, Reino Unido e Estados Unidos. A Microsoft promete expandir o suporte para mais regiões e idiomas em breve.
Outra novidade envolvendo voz é o Copilot Daily, que dá as informações básicas para o dia, como se fosse um programa de rádio. Uma voz digital, parecida com a de um locutor, dá notícias importantes para o usuário, previsão do tempo, curiosidades e dicas. Tem até uma música suave de fundo.
O Copilot Daily será liberado inicialmente para Estados Unidos e Reino Unido, devendo chegar em breve a outros países.
Outro novo recurso é o Think Deeper (“pense melhor”, em tradução livre). Seguindo os passos da OpenAI e seu modelo o1, o Think Deeper promete lidar melhor com pedidos que envolvem raciocínio e informações complexas, como os que envolvem matemática e código.
O exemplo da Microsoft é planejar uma reunião de família. O Copilot pede detalhes sobre todo mundo — como idade, ocupação, o que gosta de fazer — e dá uma sugestão de local, transporte, cardápio e atividades para todos.
E o lançamento? O Think Deeper será disponibilizado inicialmente para um número limitado de assinantes do Copilot Pro na Austrália, Canadá, Nova Zelândia, Reino Unido e Estados Unidos.
A Microsoft apresentou ainda o Copilot Vision. Ele está em fase de testes e não será lançado nesta leva de atualizações. Segundo Mehdi, o recurso poderá ver e ouvir o que a navegação do usuário. Quando solicitado, o assistente usará as informações de texto e imagens da página para responder a perguntas e dar ajuda.
Em uma demonstração, o usuário navega pelo site de cinema e TV Rotten Tomatoes. Ele pede ao Copilot sugestões de filmes e série, além de mais informações sobre títulos específicos.
O recurso lembra o Recall, já que ambos acompanham as atividades do usuário no computador. Provavelmente por isso, Mehdi diz que o Copilot Vision só funciona quando ativado, notificações avisam quando a ferramenta está funcionando e nenhuma conversa é armazenada após o fim da sessão. Anteriormente, a repercussão negativa do Recall obrigou a Microsoft a realizar uma série de mudanças.
O Copilot Vision chegará primeiro para um número limitado de assinantes do Copilot Pro nos EUA, por meio do Copilot Labs.
Algumas novidades apresentadas pela Microsoft são exclusivas dos Copilot+ PC, nome dado às máquinas certificadas para rodar recursos de inteligência artificial localmente, sem depender da nuvem.
Um destes recursos se chama Click to Do (”clique para fazer”, em tradução livre). Ao usar o atalho, ele cria atalhos com base no que está na tela, como pesquisar, saber mais, editar ou comprar. A ferramenta funciona em páginas, documentos, imagens e vídeos.
Em um exemplo, o usuário pausa um vídeo e usa o Click to Do para procurar imagens similares a um objeto presente na filmagem. Isso lembra, de certa forma, o Circule para Pesquisar, do Google, presente em seus próprios smartphones da linha Pixel e nos aparelhos da Samsung, mas com possibilidades bem mais amplas.
Os computadores com o selo Copilot+ PC também terão uma busca aprimorada para o Windows. A Microsoft promete que o sistema vai encontrar qualquer coisa que o usuário pedir, seja um arquivo ou uma configuração, mesmo que ele não saiba o nome exato.
No exemplo dado pela empresa, o usuário digita “adicionar fones” na caixa de busca do app Configurações. Mesmo sem haver uma opção com este nome, ele sugere os itens “Configurações de Bluetooth e outros dispositivos” e “Aparelhos auditivos”.
O mesmo funciona com busca de fotos no File Explorer: se você digitar “churrasco”, verá fotos de churrasco, mesmo que não esteja escrito “churrasco” na imagem ou no nome de arquivo.
Os aplicativos Fotos e Paint ganharam novidades nos Copilot+ PCs. O Fotos terá ferramentas aumentar a resolução das imagens — a IA ajuda a deixar a dar mais nitidez e detalhes.
Já o Paint poderá gerar objetos em áreas determinadas da imagem, usando apenas pedidos simples — você pode mostrar em que parte da praia quer um farol, por exemplo, e o app adiciona o que foi solicitado.