matriz full covariance, isto envolve utilizar as macros do HTK.
Fiz de 3 maneiras: Usando matriz cov diagonal (macro <diagC> ), usando matriz cov full (macro <fullC>) e usando uma matriz covariância inversa (macro <invCovar>). Ainda tem um metodo chamado - matriz de decomposicao de cholesky (macro <LLTCovar>) que coloquei para rodar agora.
Em anexo os resultados em .txt
Resumo dos resultados:
<diagC> WER% 7.71
<fullC> WER% 7.62
<InvCovar> WER% 25.54%
[Automatic Speech Recognition using HTK]
INATEL - Instituto Nacional de Telecomunicações
[Meus passos na pesquisa do Mestrado para Reconhecimento Automatico de Voz]
quarta-feira, 5 de novembro de 2014
Estudo do programa GMM do professor Ynoguti (INATEL)
-Estudo do programa GMM do professor Ynoguti [ok]
-Adequação dos .mfc extraídos no HTK para o programa GMM [ok]
-Definição do experimento [ok]
-Inicio da simulação para encontrar o alpha ótimo para cada locutor
-Adequação dos .mfc extraídos no HTK para o programa GMM [ok]
-Definição do experimento [ok]
-Inicio da simulação para encontrar o alpha ótimo para cada locutor
Preparação SCRIPT para busca do alpha ótimo
-Somente utilizarei o HCopy (Faz a extração de características seguindo o alpha determinado), HParse(Constroi uma rede de palavras), HVite(Faz o reconhecimento e entrega a máxima verossimilhança) no HTK
-Preparei o script para fazer a busca de 13 alphas em cada locutor
-Utilizei alphas de 0.88 até 1.12
-Serão 50 locutores (25 boys e 25 girls)
-Preparei o dicionário de palavras, para o HVite fazer o reconhecimento de uma palavra conhecida já.
-Utilizo o HMM (hmmdefs) q foi encontrado na baseline
18/10 [funcionando ok]
-Preparei o script para fazer a busca de 13 alphas em cada locutor
-Utilizei alphas de 0.88 até 1.12
-Serão 50 locutores (25 boys e 25 girls)
-Preparei o dicionário de palavras, para o HVite fazer o reconhecimento de uma palavra conhecida já.
-Utilizo o HMM (hmmdefs) q foi encontrado na baseline
18/10 [funcionando ok]
Assinar:
Postagens (Atom)