thumb-google-maps-voz

Uma nova forma de buscar coisas dentro do Google Maps (ou Google Mapas, no nome comercial para o português). Foi apresentado ontem o recurso de reconhecimento de voz integrado à pesquisa de mapas do Google, especialmente para quem tem preguiça de digitar o nome do lugar cuja localização deseja conhecer. Leia mais

Realizar pesquisas de voz no Google deixará de ser privilégio dos usuários do Android em breve. Desde o começo desta semana o gigante da web começou a disponibilizar a funcionalidade para alguns “usuários selecionados” de língua inglesa em seus desktops. A exemplo do sistema do robozinho, a funcionalidade aparece como um microfone cinza no final da caixa de busca. Ele ainda não tem data para dar as caras aos usuários mortais. | ReadWriteWeb

Google Translate agora aceita entradas de voz

Sem fazer muito alarde, o Google liberou na tarde desta quinta-feira um novo recursos para o serviço Translate que permite que o navegante dite o texto que gostaria de ser traduzido. Por ora disponível apenas para entradas em inglês, a novidade é identificada com um pequeno microfone na parte inferior direita da janela de entrada de texto, e usa a tecnologia HTML5 para funcionar (somente no Chrome).

chrome-beta-voice-thumb

A versão de beta do Chrome é uma espécie de laboratório em larga escala do Google. Eles testam diversas novas características para saber se devem ou não implementá-las posteriormente na versão estável do navegador, usando como base o grande número de usuários que enviam feedback. Essa semana, como de costume, ele ganhou novas funções por meio de uma atualização. Graças ao poder do HTML5 o Chrome agora pode ouvir quando você falar.
Leia mais

thumb-wozniak-cparty-0211

Esse Steve Wozniak vem dando trabalho para os jornalistas nos últimos tempos. Mais ou menos como o patrão Silvio Santos normalmente faz, Woz diz uma coisa, depois volta atrás, aí explica tudo de novo. Então nós aceitamos a explicação, e lá vem ele novamente com entrevistas seguidas de desmentidos. Nessa segunda-feira a coisa se repetiu (mais uma vez).

Leia mais

YouTube: agora com legendas geradas automaticamente

A partir desta quarta-feira (4) o YouTube passou a tornar disponíveis legendas automáticas (auto-captioning, em inglês) a todos os usuários do YouTube. Com isso, o Google pretende tornar os vídeos mais acessíveis a deficientes auditivos e a pessoas do mundo todo que não entendem inglês.

O recurso — que estava em um beta exclusivo a usuários selecionados desde Novembro de 2009 — consiste em identificar automaticamente o que é falado no vídeo (através das tecnologias de reconhecimento de voz que o google usa no Google Voice e no Nexus One) e assim gerar automaticamente a legenda para o vídeo, mesmo que o usuário que o colocou no a não tenha adicionado nenhuma legenda. Outra possibilidade disponível assim que se gera a legenda é a de tradução automática para 50 idiomas, incluindo o português.

O recurso ainda não funciona com perfeição, principalmente se os vídeos tiverem ruídos que atrapalhem o reconhecimento (o ideal seriam vídeos com o áudio isento de ruídos e sons de fundo, contendo apenas a fala). Ainda assim, para quem é deficiente auditivo ou não entende a língua do vídeo, a transcrição é boa o suficiente para quebrar um galho.

Outra restrição do serviço é que, ao menos por hora, ele apenas transcreve a partir do áudio em inglês — aliás, eu ri bastante vendo os resultados potencialmente hilários obtidos quando o sistema tenta entender um vídeo em português, apresentando a legenda com as palavras em inglês que mais soam parecidas com o que é falado em português. Mas como o sistema roda nos servidores do Google, que claramente está investindo bastante em tecnologias de reconhecimento de voz para seus produtos, não se surpreenda se, sem aviso algum, o sistema for melhorando, passando a reconhecer melhor as palavras em inglês e até mesmo acrescentando reconhecimento de outras línguas. Na verdade, no anúncio no blog do YouTube o gerente de produto Hiroto Tokusei afirma que o Google planeja adicionar reconhecimento de fala a mais línguas nos próximos meses.

Além disso, outra vantagem o novo recurso é que o usuário que fez o upload do vídeo pode tomar uma legenda automaticamente gerada como base para criar uma legenda precisa. Basta que ele baixe a legenda automática, corrija o que estiver errado e faça o upload. Essa facilidade tem potencial para aumentar significativamente o número de vídeos com legendas precisas adicionadas pelos próprios autores, uma vez que o trabalho dos mesmos passará a ser muito menor.

A cara do Google Image Swirl

A cara do Google Image Swirl

Andam sendo dias agitados lá para o lado do Google. Além do Chrome OS a empresa discretamente anunciou que o Youtube passará a legendar filmes automaticamente, usando um sistema de reconhecimento de voz.

A novidade utiliza o mesmo algoritmo usado para reconhecer falar no Google Voice para analisar o áudio dos vídeos e transformar as palavras em texto. Apesar da empresa reconhecer que as legendas ainda não saem exatamente perfeitas, avisa que a tecnologia será “continuadamente aprimorada” para melhores resultados.

O reconhecimento de fala também promete facilitar a vida daqueles que preferem fazer suas próprias legendas, já que o recurso Auto Timming é capaz de ler o texto enviado e automaticamente sincronizá-lo com o vídeo. Por hora todas essas novidades estão disponíveis para vídeos em inglês.

Já o Google Labs liberou o Image Swirl, um recurso parecido com o Wonder Wheel, que estreou no sistema de busca há algum tempo. Nele a grande sacada é sua capacidade de agrupar imagens semelhantes e permitir que o usuário refine sua busca apenas com alguns cliques. Como todo bom protótipo, ainda não tem data para entrar no mecanismo oficial de busca.

Assista ao vídeo de apresentação do sistema de reconhecimento de voz do Youtube: