Revisão Vocalmatic

Índice:

Anonim

Vocalmatic é um serviço de transcrição online criado por uma empresa canadense Enactics Inc.

Segundo seu site, existe para “ajudar as pessoas que trabalham com gravações de áudio a economizar tempo na transcrição de áudio e vídeo em texto”.

Dado o número de diferentes ferramentas de transcrição online disponíveis, o que o torna especial?

  • Quer experimentar o Vocalmatic? Confira o site aqui

Planos e preços

Quando você se inscreve no Vocalmatic, você recebe imediatamente 30 minutos de tempo de transcrição e, quando esse tempo acabar, horas adicionais podem ser compradas a partir de US $ 15 por hora.

Quanto mais horas você compra, menos custam, com 90-100 horas custando em média apenas US $ 6 por hora.

Esses preços são para usuários individuais, e o Enactics oferece preços flexíveis para empresas onde vários usuários exigem acesso e os volumes serão, presumivelmente, altos.

Se você tiver um requisito em massa, a melhor maneira de reduzir os custos é usar um passe diário. Isso permite o uso ilimitado do serviço por um dia, com um limite de três arquivos por hora.

Usando esses passes, um único dia custa $ 15, três dias $ 17 e sete dias custa $ 25, e se você pode organizar todo o seu trabalho em blocos, esta é a forma mais barata de usar o Vocalmatic.

Projeto

Mesmo pelos padrões de transcrição online, o Vocalmatic é básico. Mas, por outro lado, torna-o extremamente simples de usar, mesmo para aqueles com habilidades de computação limitadas.

O processo simples de quatro etapas começa com você definindo se você tem áudio, vídeo ou exclusivamente para clientes americanos, você gostaria de ligar e ter suas palavras transcritas diretamente.

A maioria dos usuários usará arquivos de áudio ou vídeo e, na etapa 2, eles serão carregados no site da Vocalmatic. Os tipos atualmente suportados incluem; arquivos de áudio mp3, m4a, mp4, flac, ogg, wav, aac, opus, oga, mogg, webm e wma.

A terceira etapa é definir a nacionalidade do palestrante e a quarta etapa é dizer como você gostaria do resultado.

Idiomas é certamente um ponto forte deste sistema, já que atualmente transcreve inglês, espanhol, francês, alemão, português, italiano, holandês, polonês, tcheco, romeno, chinês (mandarim), chinês (cantonês), japonês, filipino, vietnamita, árabe , Persa, hindi, tailandês, coreano, urdu, turco, hebraico, grego, búlgaro, russo, finlandês, sueco, dinamarquês, afrikaans, amárico, armênio, azerbaijani, indonésio, malaio, bengali, catalão, basco, galego, georgiano, gujarati , Croata, zulu, islandês, javanês, canarês, khmer, lao, letão, lituano, húngaro, malaiala, marata, norueguês, sérvio, ucraniano, cingalês, eslovaco, esloveno, sundanês, suaíli, tâmil e télugo.

Por mais impressionante que seja essa lista, nem todos os sotaques e dialetos em cada idioma são reconhecidos.

Uma opção de saída padrão usa formatação simples, e a escolha SRT é projetada para aqueles que criam legendas para um vídeo.

Com essas seleções feitas e o arquivo fornecido, se você tiver tempo suficiente restante na conta, o sistema começará a processar o arquivo em texto.

Um e-mail é enviado para anunciar que o sistema iniciou o processo e outro é enviado quando ele for concluído.

Quanto tempo leva depende inteiramente de quão ocupados os servidores do Vocalmatic estão, mas geralmente, descobrimos que era perto do momento da gravação, ou talvez um pouco mais.

Uma gravação de 19 minutos que processamos levou cerca de 28 minutos para renderizar, mas outras partes mais curtas foram proporcionalmente mais rápidas.

Uma vez que o arquivo é processado, você pode ir a um editor e ver como ele se saiu e fazer alguns ajustes na formatação e no conteúdo.

O que este sistema não faz é fornecer qualquer formatação gramatical. Ele não insere retornos de carro entre as frases, independentemente da lacuna na fala, e nem sempre capitaliza os nomes.

E coloca o timecode entre pedaços de transcrição, mesmo quando você não o está usando para geração de arquivo SRT.

O áudio pode ser reproduzido no editor de conteúdo, mas não faz nenhuma tentativa de mostrar onde o áudio está na transcrição.

Assim que estiver "satisfeito" com os resultados, o texto pode ser exportado como um documento do Word ou arquivo de texto no modo padrão e arquivos SRT se você escolher esse modo de saída.

Precisão

Nas perguntas frequentes do Vocalmatic, "Esperamos uma precisão de 80 a 90% em um áudio nítido. Se houver muito ruído de fundo ou se as pessoas estiverem falando ao mesmo tempo, a transcrição pode ter menos de 10% de precisão. '

Bem, no teste limitado, mesmo trechos de audiolivros, com o áudio mais claro possível, não conseguimos atingir esse nível de precisão.

Mesmo nas melhores tentativas, ele frequentemente repetirá parte de um parágrafo ou de palavras, errará um nome que acertou a frase anterior e suja a transcrição com erros.

Quando as gravações não estão intocadas, como nossos testes de discursos históricos, os resultados podem ser incompreensíveis.

O que achamos mais preocupante é que, quando tem um problema com uma palavra ou frase, o Vocalmatic vomita letras isoladas aleatoriamente. Em inglês, o idioma que usamos para testar, uma letra ‘y’ por si só não é uma palavra, e nem é ‘m’, “k ou‘ t ’.

O fato de a saída não estar de acordo com nenhum dicionário ou formas gramaticais definidas parece não ser um problema para o software. Também carece de uma compreensão do contexto, uma vez que interpretou repetidamente filho como "Sol".

Quando você leva em consideração todas as correções e adiciona pontos, vírgulas e letras maiúsculas corretamente, mesmo as melhores tentativas requerem um ajuste substancial para serem consideradas precisas.

Veredicto final

Este serviço não é barato, rápido ou muito preciso.

A alegria de ter 30 minutos de tempo livre esgota-se com rapidez perturbadora, mesmo que a solução seja altamente acessível e muito fácil de usar.

Uma vantagem que o tempo livre aproveita para um cliente em potencial é que ele permite que você carregue um exemplo das gravações que você provavelmente precisará transcrever e veja o seu desempenho.

Somente se ele retornar um texto que geralmente representa o que foi falado no áudio, prosseguiremos, mas tente algumas outras opções antes de pagar por esta.

Comparado com algumas das outras opções, mais notavelmente Transcribe by Wreally, Trint e Happy Scribe, isso não é preciso o suficiente para compensar o gasto.

Talvez sejamos rudes e ele seja brilhante em transcrever suaíli ou outras línguas, mas simplesmente com base em seus esforços com o inglês, escolheríamos outra coisa.