[AsteriskBrasil] RES: TTS - Text To Speech

Alexandre Cavalcante Alencar alexandre.alencar em gmail.com
Quarta Dezembro 9 16:26:57 BRST 2009


Olá, boa tarde,

2009/12/8 Newton Pasqualini <newtonpasqualini em gmail.com>:
> Olá Daviramos,
>
> Atuo em um projeto de call center, a finalidade e busca e localização de
> devedores.
>
> A minha intensão é fazer o TTS com ASR, com 30 a 60 canais simultâneos.
>
> Tenho bases de telefones para localizar que superam 1 milhão de números de
> todos os tipos, de telefone local até celular interurbano.
>
> Na verdade minha dúvida é, esse problema ocorre porque o sintetizador é
> ruim, no meu caso o eSpeak, ou porque a voz é ruim?
>

O sintetizador não é o componente mais complicado, o problema é
construir o banco de dados que treina o sintetizador... custa caro,
precisa de muito tempo...

> Preciso decidir que caminho tomar, se compro algo mais simples (a voz) ou se
> devo comprar o pacote.
>
> Vale apenas colocar aqui minha indignação, como pode ter tanta solução TTS
> no mercado e nenhuma boa TTS free.
>

Além da indignação, você está colocando suas doações para os projetos
de forma a financiar o desenvolvimento? (não considere isso uma ofença
ou algo pessoal, pois não é).

Como desenvolvedor de software livre, o que costumo ver por aí é
pessoas e empresas reclamando que software X não tem recurso Y e por
isso ela não poderá montar um serviço Z para um cliente e por isso vai
perder um valor ou ter que contratar licença de software proprietário,
mas dificilmente vejo alguma destas mesmas empresas, principalmentes
destas que ganham dinheiro com o ecosistema Asterisk e GNU/Linux
investirem nos projetos, desenvolvedores, etc.

O maior exemplo disto é que no Brasil, temos diversas grandes empresas
que possuem portuguese-brazil-core-sounds e nunca submeteram a Digium
para inclusão no Asterisk.

> Estou perdendo um pouco do meu tempo estudando sobre TTS e ver se consigo
> melhorar algo no eSpeak, alguém tem algum tutorial sobre este conceito.
>

Tutoriais ajudam, mas sem um banco de dados livre de qualidade, o
eSpeak e outros não vão poder ajudar muito.

eSpeak
Mbrola (tem pt-BR)
Festival
OpenMary
Euler
FreeTTS
Flite
Festvox
GNUSpeech
Epos
HTS

Como funciona o processo em http://en.wikipedia.org/wiki/Speech_synthesis

> Um abraço!
>

-- 
Alexandre Alencar (Skarmeth)
http://blog.alexandrealencar.net/
http://www.alexandrealencar.net/
ITIL, CSM, LPI, MCP-I, MCP


Mais detalhes sobre a lista de discussão AsteriskBrasil