As origens do Capti Voice não são o típico programador de gênio que encontra a história de fundo de banqueiros de investimento, já que o negócio por trás dele foi fundado por professores de ciência da computação e alunos de doutorado.
Dez anos após sua criação de cinco pessoas, Charmtech Labs LLC opera fora do Centro de Oportunidades Educacionais da Universidade de Buffalo no estado de Nova York e tem uma força de trabalho muito maior de pesquisadores.
As soluções a partir das quais o Charmtech Labs foi desenvolvido foi um projeto de pesquisa para fornecer leitura de tela para cegos. Desde então, esse trabalho se diversificou para ferramentas universalmente acessíveis que podem personalizar a experiência de leitura, tornar a leitura mais interativa e melhorar a produtividade.
Vamos dar uma olhada em Capti Voice e ver se suas origens universitárias renderam um vencedor comercial ou um exercício acadêmico?
- Quer experimentar o Voice Reader Home 15? Confira o site aqui
Planos e preços
Para uso pessoal, Capti Voice é gratuito. Você se inscreve e pode abrir um documento ou destacar uma seção de uma página da web, e a tecnologia irá lê-lo para você.
Mas, se você deseja vozes de melhor qualidade, mais tipos de documentos, edição de documentos e traduções de idiomas, então você precisa assinar o Plano Premium e uma Voz Premium.
O Plano Premium custa $ 1,99 por mês, $ 9,99 por seis meses ou $ 19,99 anualmente. E cada voz premium custa $ 5,99 por mês, $ 9,99 por três meses e $ 29,99 anualmente.
Com o Plano Premium e um Premium Voice, o custo total de $ 49,98 a cada ano parece muito razoável, e se você ficar entediado com a voz, poderá trocá-la por outra ao final do período de assinatura.
Projeto
A interface baseada na web do Capti Voice não diverge muito do que vimos de outros fornecedores de conversão de texto em voz (TTV).
Os documentos são agrupados como faixas em listas de reprodução, e clicar neles na barra lateral esquerda os abre no painel de documentos de onde podem ser falados.
As faixas podem ser carregadas diretamente do computador ou de um link, ou obtidas no Blackboard, Canvas, Dropbox, Google Drive, Instapaper, OneDrive, Bookshare ou Gutenberg,
Algumas dessas opções sugerem o tom educacional dessa solução, e há muitos aspectos dessa solução que se prestam a propósitos pessoais de aprendizado e ensino.
Por exemplo, para cada passagem de texto, é possível destacar parágrafos e criar notas laterais. Para quem trabalha com peças de William Shakespeare, ou documentos semelhantes, ter as palavras faladas e criar notas sobre as intenções do personagem ou contexto histórico, por exemplo, seria um excelente uso para esta ferramenta.
O que a versão gratuita não permite é a edição do documento, mas uma licença Premium permite que o Capti seja usado como uma solução para correção de erros. Muitas vezes, é mais fácil ouvir os erros do que vê-los, para a maioria das pessoas.
Uma estranheza com Capti é que a voz padrão em inglês, Salli, é notavelmente ruim.
Não tenho certeza se isso foi um empurrãozinho intencional, para encorajar a compreensão do Premium Voices, mas o padrão é uma mulher americana que parece uma criança chata.
Junto com o jovem Salli, os usuários do Windows 10 também verão qualquer uma das vozes da área de trabalho que são instaladas automaticamente pela Cortana. A Microsoft não pode aceitar que nem todos no mundo sejam americanos, então todos deveriam ter o Zira americano e, em nossos computadores, também temos o Hazel britânico.
Capti Voice também assume que todo falante de inglês é americano, tornando Salli o padrão. Quando mudamos nossa nacionalidade para o Reino Unido, ela se tornou Premium Voice, e nosso padrão era Hazel fornecido pela Microsoft.
Essa mudança não nos decepcionou, já que ouvir Salli era como estar preso em um episódio especialmente irritante de Saved By the Bell.
Capti é uma ferramenta sofisticada, mas carece de um recurso que muitos poderiam esperar. Não existe um mecanismo padrão para exportar o áudio falado como MP3 ou qualquer outro formato de áudio.
Existem maneiras de contornar isso usando um driver de áudio que redireciona a saída para a entrada, permitindo que qualquer aplicativo de gravação de áudio a capture, mas esse recurso em Capti seria mais elegante.
Precisão
Comparado com algumas soluções TTV que podemos mencionar, Capti Voice é notavelmente preciso.
Como estávamos testando o software de fala, desenvolvemos alguns documentos que contêm frases e palavras que tropeçam nessas soluções e testam as diferenças de pronúncia entre as regiões, e Capti Voice ignorou esses campos minados verbais de forma impressionante.
O que ele consegue é entender o contexto, como na frase "O soldado polonês decidiu engraxar os sapatos.", Onde uma grafia é usada duas vezes, mas pronunciada de forma diferente a cada vez. Capti Voice foi bem-sucedido neste teste, e alguns outros foram escritos de forma idêntica, palavras precisam de tratamento sutil. O quão bom o software é nisso é importante, uma vez que não contém nenhum mecanismo para ajustar a pronúncia se não for o correto.
Essa limitação pode ser um problema para dizer alguns sobrenomes, imaginamos.
No geral, Capti Voice faz um trabalho excelente ao falar o texto e cometeu menos erros do que normalmente veríamos.
Veredicto final
Não é sempre que dizemos isso sobre um produto, mas Capti Voice é uma das melhores soluções de texto para voz que já vimos para aqueles que desejam que os documentos sejam lidos de volta para eles.
O software atravessa frases complexas com facilidade consumada e as entrega de forma clara e concisa. E, com uma assinatura do Plano Premium, ele pode traduzir para outros idiomas e até mesmo ler texto de imagens.
Quando você leva em consideração o preço relativamente baixo, o número de vozes e idiomas que ele suporta, isso faz com que seus concorrentes pareçam decididamente superfaturados e pouco sofisticados.
É perfeito para qualquer pessoa com deficiência visual, dificuldades de aprendizagem ou para quem prefere ouvir documentos em vez de lê-los.
Se houver um ponto fraco, é que os desenvolvedores nunca consideraram que algumas pessoas usam esses tipos de ferramentas para gerar arquivos de áudio MP3 para passar por cima de vídeos ou para reproduzir a partir de dispositivos de áudio digital simples.
Você não precisa arranhar muito abaixo da superfície para ver as origens acadêmicas desta solução, mas para aqueles que trabalham com educação, há muito o que gostar em sua abordagem.
Só não presuma que Salli é a melhor voz que Capti pode fazer, porque tem vozes muito melhores a oferecer do que essa.