Dados do Trabalho

Name: Interforensics 2023
Start: 2023-08-28
End: 2023-08-31
Location: CICB – Centro Internacional de Convenções do Brasil

Título

PARAMETROS PARA COMPARAÇAO DE LOCUTOR: EXTRAÇAO E ANALISE AUTOMATICAS PARA FINS FORENSES

Introdução

Os primeiros registros do uso da fala como evidência forense remontam o século XVII. Com os avanços metodológico-técnicos, a análise da fala de diferentes suspeitos foi denominada Comparação de Locutor (CL). A dificuldade da atividade é que diferente do DNA e das digitais, não há uma característica específica da fala que seja em sua totalidade biologicamente determinada, inalterável e invariante. Para lidar com o problema e garantir um grau de confiança aceitável à análise, utilizam-se diversos parâmetros na CL. Apesar do ganho em robustez analítica, dado a complexidade e custo temporal em correlacionar diferentes parâmetros, surgem duas necessidades inerentes à Fonética Forense: investigar/formular possíveis novos parâmetros e ampliar técnicas de extração/análise automáticas. Ambas configuram o tema central do presente trabalho.

Objetivos

O trabalho, em suma, visa atingir três objetivos: (i) avaliar e selecionar parâmetros acústicos pertinentes à CL, (ii) produzir scripts para extração automática dos parâmetros e (iii) testar a qualidade de extração em diversas relações sinal-ruído e a implementação prática do script em simulações de casos forenses.

Parte experimental

Inicialmente, adicionamos ruídos aos dados do corpus e analisamos estatisticamente (teste de Kruskal-Wallis) o comportamento dos parâmetros acústicos que compõem o script. Em seguida, realizamos duas simulações que consistiram em testes-cegos para falantes geneticamente relacionados (gêmeos idênticos) e não-relacionados. Selecionamos para cada condição, em um conjunto de 10 falantes do corpus, um "criminoso" a ser identificado, sendo essa identificação probabilística com a análise de clustering e discriminante.

Resultados e Discussões

As categorias que apresentaram melhor desempenho nas tarefas de CL foram as unidades Vogal-Vogal, as fricativas, as laterais e nasais. O centro de gravidade espectral com o filtro de 1000 a 2000 Hz foi o parâmetro mais promissor por captar informações da estrutura das cavidades nasal e oral, logo, específicas e dependentes do falante, e por ter tempos razoáveis para estabilização da variância e boa resistência ao ruído.

Conclusões

Tendo em vista a hipótese central de que um conjunto grande o suficiente de parâmetros acústicos é capaz de representar o comportamento do falante e esse será suficientemente distinto de outros falantes, podemos afirmar que o conjunto paramétrico foi capaz de diferencia-los acima da probabilidade de classificação aleatória dos dados.