Dados do Trabalho
Título
PARAMETROS PARA COMPARAÇAO DE LOCUTOR: EXTRAÇAO E ANALISE AUTOMATICAS PARA FINS FORENSES
Introdução
Os primeiros registros do uso da fala como evidência forense remontam o século XVII. Com os avanços metodológico-técnicos, a análise da fala de diferentes suspeitos foi denominada Comparação de Locutor (CL). A dificuldade da atividade é que diferente do DNA e das digitais, não há uma característica específica da fala que seja em sua totalidade biologicamente determinada, inalterável e invariante. Para lidar com o problema e garantir um grau de confiança aceitável à análise, utilizam-se diversos parâmetros na CL. Apesar do ganho em robustez analítica, dado a complexidade e custo temporal em correlacionar diferentes parâmetros, surgem duas necessidades inerentes à Fonética Forense: investigar/formular possíveis novos parâmetros e ampliar técnicas de extração/análise automáticas. Ambas configuram o tema central do presente trabalho.
Objetivos
O trabalho, em suma, visa atingir três objetivos: (i) avaliar e selecionar parâmetros acústicos pertinentes à CL, (ii) produzir scripts para extração automática dos parâmetros e (iii) testar a qualidade de extração em diversas relações sinal-ruído e a implementação prática do script em simulações de casos forenses.
Parte experimental
Inicialmente, adicionamos ruídos aos dados do corpus e analisamos estatisticamente (teste de Kruskal-Wallis) o comportamento dos parâmetros acústicos que compõem o script. Em seguida, realizamos duas simulações que consistiram em testes-cegos para falantes geneticamente relacionados (gêmeos idênticos) e não-relacionados. Selecionamos para cada condição, em um conjunto de 10 falantes do corpus, um "criminoso" a ser identificado, sendo essa identificação probabilística com a análise de clustering e discriminante.
Resultados e Discussões
As categorias que apresentaram melhor desempenho nas tarefas de CL foram as unidades Vogal-Vogal, as fricativas, as laterais e nasais. O centro de gravidade espectral com o filtro de 1000 a 2000 Hz foi o parâmetro mais promissor por captar informações da estrutura das cavidades nasal e oral, logo, específicas e dependentes do falante, e por ter tempos razoáveis para estabilização da variância e boa resistência ao ruído.
Conclusões
Tendo em vista a hipótese central de que um conjunto grande o suficiente de parâmetros acústicos é capaz de representar o comportamento do falante e esse será suficientemente distinto de outros falantes, podemos afirmar que o conjunto paramétrico foi capaz de diferencia-los acima da probabilidade de classificação aleatória dos dados.
Referências e agradecimentos
Agradeço à FAPESP (2019/24234-7) pelo financiamento deste trabalho.
Palavras Chave
Fonética forense; Fonética acústica; Sistemas de processamento da fala.
Arquivos
Área
Áreas forenses
Instituições
Universidade Estadual de Campinas - São Paulo - Brasil
Autores
NIASCHE MORAES MENDES DE AQUINO, PLINIO ALMEIDA BARBOSA