De acordo com o site, o Temi é usado por mais de 10.000 clientes, incluindo ESPN e San Diego Union-Tribune.
A empresa por trás da Temi é afiliada a outra operação de transcrição Rev que usa humanos para processar áudio, mas esta solução usa aprendizado baseado em máquina para processar arquivos de forma rápida e barata.
Todos nós queremos um áudio que seja transcrito a um custo perdido e com precisão, mas é isso que o Temi está oferecendo?
- Quer experimentar o Temi? Confira o site aqui
Planos e preços
O modelo de preço do Temi é extremamente simples, sendo US $ 0,25 por minuto de gravação de áudio. Portanto, convém evitar o envio de um arquivo em que os primeiros dez minutos consistam em pessoas entrando na sala e ninguém dizendo nada significativo.
Embora o preço seja simples, ele não leva muito em consideração os usuários que podem mover grandes quantidades de conteúdo por meio da solução.
O que devemos mencionar é que o Temi agora está mais caro do que antes, já que há apenas alguns anos ele cobrava apenas US $ 0,10 por minuto. Comparado com a transcrição manual, ainda é barato, mas outros podem oferecer serviços baseados em IA mais baratos.
Projeto
O Temi tem um front end tão básico quanto é possível construir para esse fim. O site o orienta a fazer o upload do arquivo e, em seguida, faz algumas perguntas simples sobre a qualidade do áudio, antes de prosseguir com o processamento do áudio em texto.
Quando o processamento for concluído, você será informado por e-mail, permitindo que você edite e analise a transcrição usando a interface da web do Temi.
A velocidade de transcrição é quase a metade do tempo de gravação, portanto, um clipe de áudio de 2 minutos leva cerca de um minuto para ser processado.
E isso é tudo que existe para o Temi, já que não inclui a capacidade de avisar ao processador AI qual é o dialeto que ele está prestes a processar, e o único idioma que ele pode manipular é o inglês.
Os formatos de áudio suportados são mp3, mp4, m4a, aac e wav. E os arquivos de vídeo dos quais ele pode extrair o som incluem mp4, wma, mov e avi. Embora seja válido afirmar que esses arquivos de vídeo não são formatos, mas tecnicamente pacotes e, portanto, podem conter estruturas de áudio e vídeo que o Temi pode não entender.
E, pelo que entendemos, o Temi não consegue lidar com vídeos que contenham várias faixas de áudio.
Gravações
Assim que o arquivo for processado, você poderá acessá-lo por meio do editor baseado na web, onde poderá ver imediatamente como Temi o interpretou.
Uma vez no editor, você pode mover o som e o texto da transcrição com eles sincronizados, e você pode fazer algumas edições, realçar e golpear palavras, se necessário.
Você também pode identificar o locutor para que, ao exportar a transcrição, ele nomeie corretamente os envolvidos.
Mas, além disso, há pouca funcionalidade para detalhar neste editor. E, acima disso, há uma página do Dashboard que lista os arquivos processados como uma lista. O Dashboard não pode criar pastas ou rótulos para agrupar arquivos convertidos e foi projetado para lidar com apenas algumas dezenas de documentos ao mesmo tempo.
Os arquivos podem ser exportados como Word docx, PDF ou texto simples, ou como legendas em formato SRT ou VTT.
Ou, como alternativa, você pode compartilhar o acesso ao arquivo por meio de um link, que pode ser colocado em um e-mail ou distribuído nas redes sociais.
O que está faltando é uma conta de grupo onde vários usuários podem trabalhar em muitas transcrições ou coordenar seus esforços.
Precisão
Na melhor das hipóteses, o Temi é um sistema de transcrição decepcionante que não se restringe apenas ao inglês, mas também parece fortemente voltado apenas para o inglês americano. Nossas tentativas de processar áudio de alta qualidade de nativos ingleses geraram um número significativo de imprecisões e erros ortográficos regionais.
O sistema também parecia não saber que os títulos são maiúsculos em inglês, assim como os nomes próprios, resultando em 'mr' e 'mrs'. O modelo gramatical também não conseguiu estabelecer quando deveria usar 'were' ou 'where', ou outras palavras que soam iguais, mas requerem contexto para serem soletrados corretamente.
A rapidez com que o Temi processa o áudio é prejudicada pela quantidade de trabalho necessária para consertar as falhas aparentes nas transcrições geradas. Esses erros são problemáticos para uma ferramenta de transcrição, a menos que a precisão da conversão seja de pouco interesse para você.
A empresa por trás deste produto entende suas limitações, e um link no site direciona os clientes ao site Rev afiliado que precisa de 99% de precisão.
Uma frustração é que você não pode ajudar ativamente o Temi a fazer um trabalho melhor corrigindo palavras mal interpretadas repetidamente ou criando uma biblioteca de nomes, termos técnicos ou abreviações.
Por causa disso, você pode descobrir que cada vez que edita um arquivo processado pelo Temi, está repetindo as mesmas correções de antes, o que pode se tornar rapidamente irritante.
Se você está procurando uma transcrição em que uma alta porcentagem do texto corresponde ao que foi dito, o Temi provavelmente não é a ferramenta de que você precisa.
Tudo sobre Temi é básico, incluindo o editorMobile Temi
Continuando com o tema das interfaces básicas, a versão móvel do Temi está disponível para dispositivos Apple iOS e Google Android. Uma vez instalado, o aplicativo móvel permite que o telefone ou tablet grave áudio e envie-o diretamente para o processamento do Temi.
O software também permite o processamento de pagamento móvel, para que você possa pagar pela transcrição através do dispositivo.
Os recursos do aplicativo podem ser úteis para alguém que precisa gravar uma entrevista e fazer uma transcrição logo em seguida. Mas é preciso mencionar que tanto a Apple quanto o Google oferecem esta funcionalidade inerentemente em suas respectivas plataformas, a custo zero, para aqueles que desejam utilizá-la.
Veredicto final
Temi é uma solução relativamente barata, mas, neste caso, você obtém o que pagou.
Os responsáveis por este serviço prometem adicionar novos idiomas em breve para dar ao Temi um apelo mais amplo. No entanto, essas ambições ignoram a realidade de que a transcrição em inglês precisa ser mais precisa e mais capaz de lidar com as variações regionais.
O modelo atual só funciona de forma confiável com alto-falantes americanos e, mesmo com essa restrição, a precisão não é excepcional. Quando comparado com nomes como Happy Scribe, o Temi não entrega transcrições precisas de maneira eficiente, independentemente da qualidade de suas gravações.
O que aqueles por trás do Temi se esforçaram para criar é um sistema que é muito simples e não confundirá aqueles que o usam fazendo muitas perguntas. Mas sua simplicidade não permite que o usuário o ajude a fazer um trabalho melhor ou a construir um mecanismo de transcrição mais previsível.
Para aqueles com habilidades técnicas, o Temi tem uma API que pode permitir que os desenvolvedores de software acessem a direção do mecanismo de transcrição, e a integração do Zapier pode conectar contagens de negócios do Gmail, Dropbox e Google Drive como fontes para arquivos de áudio.
Portanto, se a precisão do Temi for boa o suficiente para seus objetivos e o preço aceitável, essa tecnologia pode ser aproveitada como parte de um processo de fluxo de trabalho.
Por mais útil que pareça, não estamos convencidos de que esta seja uma solução flexível o suficiente para todos os falantes de inglês para garantir o investimento de tempo e dinheiro para integrá-la aos sistemas existentes.