View
1.087
Download
5
Category
Preview:
Citation preview
1
Grupo de Control y Procesamiento Digital de Señales
Estimación del pitch en señales
monofónicas de voz cantada
Andrés Eduardo Coca Salazar
Departamento de MúsicaUniversidad de Caldas
Grupo de control y procesamiento digital de señalesUniversidad Nacional de Colombia
Sede Manizales
2
Grupo de Control y Procesamiento Digital de Señales
1. Introducción2. Algoritmos para la estimación del
pitch3. Marco experimental4. Resultados5. Conclusiones
Contenido
3
Grupo de Control y Procesamiento Digital de Señales
Planteamiento del problema
• La estimación del pitch para señales de voz cantada requieren de un tratamiento diferente al utilizado en la estimación para señales de voz hablada.
• Los algoritmos existentes para la estimación del pitch para señales de voz cantada se deben adecuar.
• Se deben crear algoritmos nuevos especiales para este tipo de señales.
4
Grupo de Control y Procesamiento Digital de Señales
Diferencias entre la voz cantada y la voz hablada
CantoHabla
Control del pitchPitch es involuntario
2 octavasMenos de una Octava
Oscila en una frecuencia media Intervalos musicales
Intensidad: 40-60dB Intensidad: hasta 120dB
Planteamiento del problema
5
Grupo de Control y Procesamiento Digital de Señales
Algoritmos para la estimación del pitch
• La vibración de las cuerdas vocales no necesariamente es periódica• Las transiciones de sonoridad• Ruidos acústicos de fondo
Errores típicos de la estimación
• Doble-pitch: La frecuencia es el doble de la esperada. Errores de octava.• Medios-pitch: La frecuencia es la mitad de la esperada.
Factores que dificultan la extracción
Tipos de estimación
TIEMPO
Forma de onda
FAC
Cepstral
FRECUENCIA
FFT
MIXTA
WT
6
Grupo de Control y Procesamiento Digital de Señales
Separación y acumulación armónica (SAA)
• Especial para aplicaciones musicales• Nombre de la nota musical y su numero de octava.• Se basa en la serie armónica. Análisis de Fourier de señales periódicas.
Escala de los armónicos
• Apropiado: Instrumentos de teclado y algunos de viento.
• No apropiados: Las voces y los instrumentos de cuerda. Frecuencias microtonalístas
Algoritmos para la estimación del pitch
7
Grupo de Control y Procesamiento Digital de Señales
Etapas del algoritmo SAA
Etapa para hallar el nombre de la nota
a
Algoritmos para la estimación del pitch
Se usa la escala cromática
8
Grupo de Control y Procesamiento Digital de Señales
Etapa para el valor de frecuencia
2
1240 55 4 .2
abf
a = # semitonosb = # de octava
Etapa para hallar el número de octava
b
Algoritmos para la estimación del pitch
Algoritmo SAA
9
Grupo de Control y Procesamiento Digital de Señales
12 señales musicales 6 octavas
Creación de las señales musicales para SAA
Energía más significativa
# # # # #E C C D D E F F G G AB A CB
1 1n n nn nE E E E maxn n n
Algoritmos para la estimación del pitch
6
1
2n nn
N t sen f t
12 nn if f 12110 2iif
Algoritmo SAA
10
Grupo de Control y Procesamiento Digital de Señales
• Se busca que posición ocupa el valor más significativo en la escala de los armónicos.• Primeros nueve armónicos de la serie sin repetir los que son iguales.
9DAcordes
Tónica:1 7 4 10 2n n n n
2 5 9 3 7n n n n
3 8 3 6 10n n n n
4 2 9 6 4n n n n
5ªJusta:
3ªM :
7ªm:
5
8
2
1,
2,
3,
4,
n
n
n
n
Búsqueda en la escala de los armónicos
Algoritmos para la estimación del pitch
Algoritmo SAA
11
Grupo de Control y Procesamiento Digital de Señales
Máxima verosimilitud (ML)
2 2 22 TE Y Y Y Y YY
ˆ min max TY E YY
Se busca en un conjunto de espectros ideales predefinidos el que mayor similitud tenga con el espectro de la trama de análisis.
Gran similitud Si el error de la diferencia es mínima
Cuando el producto es máximo
Algoritmos para la estimación del pitch
12
Grupo de Control y Procesamiento Digital de Señales
Representación gráfica
Diagrama en bloques
MIDI
Nota
Máxima verosimilitud (ML)
Algoritmos para la estimación del pitch
13
Grupo de Control y Procesamiento Digital de Señales
Algoritmo MLCreación de las señales musicales de prueba
Definir sistema de afinación usado Microtonalísmos
Algoritmos para la estimación del pitch
269 12 log12o
MIDI
fN
Nombre de la nota
Únicamente
12
14
Grupo de Control y Procesamiento Digital de Señales
61 1 2
i
if f
.6
1 1 , 2n
kknf f x x
1
cos 2N
nn
n s
fS t t h
f
Crear los valores
de frecuencia
Crear señales musicales
Corrección
2 1log log
log 2
F Fk
2
1
6
log
log 2
F
FN
Hallar número
de octavas
Hallar el númerode notas
Algoritmo MLCreación de las señales musicales de prueba
Algoritmos para la estimación del pitch
15
Grupo de Control y Procesamiento Digital de Señales
Marco experimental
16
Grupo de Control y Procesamiento Digital de Señales
Características de las muestras
Representación
en el pentagrama
Tabla con los registros musicales
Género Registro Ninf Nsup
FemeninoSoprano C4 A5
Mezzo-soprano B3 G5
Contralto G3 E5
Masculino
Tenor C3 A4
Barítono A2 F4
Bajo F2 D4
Marco experimental
17
Grupo de Control y Procesamiento Digital de Señales
Resultados
18
Grupo de Control y Procesamiento Digital de Señales
Resultados
Resultados en el dominio del tiempo
Separación y acumulación armónica (SAA)
Nombre nota y Nº Octava
C3 = 130,81 Hz
Tenor
19
Grupo de Control y Procesamiento Digital de Señales
Resultados en el dominio de la frecuencia
Resultados
Máxima verosimilitud (ML)
A3 = 220 Hz
Tenor
20
Grupo de Control y Procesamiento Digital de Señales
Resultados con señales de voz cantada
Primera frase del Introito del Réquiem en D menor K.626 de Mozart, sección de la contralto.
Tabla con las frecuencias
Algoritmo ML
Resultados
D4 C4 C♮4 B♭3 E4 A3 F4 F♯4 B♮3
293,66
277,18
261,62
233,08
329,63
220 349,23
369,99
246,94
21
Grupo de Control y Procesamiento Digital de Señales
Test de Kolmogorov-Smirnov Ho = igual distribución de probabilidad
ReferenciaEscala cromática
Análisis estadístico
Resultados
Método
= 0.05 = 0.01
SAA Rechaza Rechaza
ML No Rechaza
No Rechaza
Funciones de distribución acumulativa
22
Grupo de Control y Procesamiento Digital de Señales
Prueba de hipótesis
t - student
SNR = 20 dB
0 0rH X X
Resultados
Método = 0.05 = 0.01
SAA No rechaza No rechaza
ML No rechaza No rechaza
Prueba de inmunidad ante el ruido de fondo
23
Grupo de Control y Procesamiento Digital de Señales
CONCLUSIONES
• Los algoritmos ML y SAA, requieren de una afinación exacta de las señales musicales de entrada.
• El algoritmo SAA es muy sensible a los errores de octava, y presenta errores esporádicos en el resultado del nombre de la nota, se mejora aplicando la moda del vector.
24
Grupo de Control y Procesamiento Digital de Señales
Agradecimientos
• Héctor Fabio Torres C.• Ph.D Germán Castellanos• M.sc. Franklin A. Sepúlveda• GC & PDS
25
Grupo de Control y Procesamiento Digital de Señales
¿Preguntas?¿Preguntas?
Muchas gracias por su atención
Recommended