INATEL - Instituto Nacional de Telecomunicações


INATEL - Instituto Nacional de Telecomunicações - Mestrado em Telecomunicações - Aluno: Ramon Mayor Martins
[Meus passos na pesquisa do Mestrado para Reconhecimento Automatico de Voz]


quarta-feira, 5 de novembro de 2014

Matriz Full Covariance nos experimentos HTK

matriz full covariance, isto envolve utilizar as macros do HTK.
Fiz de 3 maneiras: Usando matriz cov diagonal (macro <diagC> ), usando matriz cov full (macro <fullC>) e usando uma matriz covariância inversa (macro <invCovar>). Ainda tem um metodo chamado - matriz de decomposicao de cholesky (macro <LLTCovar>) que coloquei para rodar agora.

Em anexo os resultados em .txt

Resumo dos resultados:

<diagC> WER% 7.71
<fullC> WER% 7.62
<InvCovar> WER% 25.54%

Estudo do programa GMM do professor Ynoguti (INATEL)

-Estudo do programa GMM do professor Ynoguti [ok]
-Adequação dos .mfc extraídos no HTK para o programa GMM [ok]
-Definição do experimento [ok]
-Inicio da simulação para encontrar o alpha ótimo para cada locutor

Preparação SCRIPT para busca do alpha ótimo

-Somente utilizarei o HCopy (Faz a extração de características seguindo o alpha determinado), HParse(Constroi uma rede de palavras), HVite(Faz o reconhecimento e entrega a máxima verossimilhança) no HTK
-Preparei o script para fazer a busca de 13 alphas em cada locutor
-Utilizei alphas de 0.88 até 1.12
-Serão 50 locutores (25 boys e 25 girls)
-Preparei o dicionário de palavras, para o HVite fazer o reconhecimento de uma palavra conhecida já.
-Utilizo o HMM (hmmdefs) q foi encontrado na baseline

18/10 [funcionando ok]