Estimación del pitch en señales monofónicas de voz cantada

Grupo de Control y Procesamiento Digital de Señales

Estimación del pitch en señales

monofónicas de voz cantada

Andrés Eduardo Coca Salazar

Departamento de MúsicaUniversidad de Caldas

Grupo de control y procesamiento digital de señalesUniversidad Nacional de Colombia

Sede Manizales

1. Introducción2. Algoritmos para la estimación del

pitch3. Marco experimental4. Resultados5. Conclusiones

Contenido

Planteamiento del problema

• La estimación del pitch para señales de voz cantada requieren de un tratamiento diferente al utilizado en la estimación para señales de voz hablada.

• Los algoritmos existentes para la estimación del pitch para señales de voz cantada se deben adecuar.

• Se deben crear algoritmos nuevos especiales para este tipo de señales.

Diferencias entre la voz cantada y la voz hablada

CantoHabla

Control del pitchPitch es involuntario

2 octavasMenos de una Octava

Oscila en una frecuencia media Intervalos musicales

Intensidad: 40-60dB Intensidad: hasta 120dB

Planteamiento del problema

Algoritmos para la estimación del pitch

• La vibración de las cuerdas vocales no necesariamente es periódica• Las transiciones de sonoridad• Ruidos acústicos de fondo

Errores típicos de la estimación

• Doble-pitch: La frecuencia es el doble de la esperada. Errores de octava.• Medios-pitch: La frecuencia es la mitad de la esperada.

Factores que dificultan la extracción

Tipos de estimación

TIEMPO

Forma de onda

Cepstral

FRECUENCIA

Separación y acumulación armónica (SAA)

• Especial para aplicaciones musicales• Nombre de la nota musical y su numero de octava.• Se basa en la serie armónica. Análisis de Fourier de señales periódicas.

Escala de los armónicos

• Apropiado: Instrumentos de teclado y algunos de viento.

• No apropiados: Las voces y los instrumentos de cuerda. Frecuencias microtonalístas

Etapas del algoritmo SAA

Etapa para hallar el nombre de la nota

Se usa la escala cromática

Etapa para el valor de frecuencia

1240 55 4 .2

a = # semitonosb = # de octava

Etapa para hallar el número de octava

Algoritmo SAA

12 señales musicales 6 octavas

Creación de las señales musicales para SAA

Energía más significativa

# # # # #E C C D D E F F G G AB A CB

1 1n n nn nE E E E maxn n n

N t sen f t

12 nn if f 12110 2iif

Algoritmo SAA

• Se busca que posición ocupa el valor más significativo en la escala de los armónicos.• Primeros nueve armónicos de la serie sin repetir los que son iguales.

9DAcordes

Tónica:1 7 4 10 2n n n n

2 5 9 3 7n n n n

3 8 3 6 10n n n n

4 2 9 6 4n n n n

5ªJusta:

3ªM :

Búsqueda en la escala de los armónicos

Algoritmo SAA

Máxima verosimilitud (ML)

2 2 22 TE Y Y Y Y YY

ˆ min max TY E YY

Se busca en un conjunto de espectros ideales predefinidos el que mayor similitud tenga con el espectro de la trama de análisis.

Gran similitud Si el error de la diferencia es mínima

Cuando el producto es máximo

Representación gráfica

Diagrama en bloques

Algoritmo MLCreación de las señales musicales de prueba

Definir sistema de afinación usado Microtonalísmos

269 12 log12o

Nombre de la nota

Únicamente

61 1 2

1 1 , 2n

kknf f x x

cos 2N

fS t t h

Crear los valores

de frecuencia

Crear señales musicales

Corrección

2 1log log

Hallar número

de octavas

Hallar el númerode notas

Algoritmo MLCreación de las señales musicales de prueba

Marco experimental

Características de las muestras

Representación

en el pentagrama

Tabla con los registros musicales

Género Registro Ninf Nsup

FemeninoSoprano C4 A5

Mezzo-soprano B3 G5

Contralto G3 E5

Masculino

Tenor C3 A4

Barítono A2 F4

Bajo F2 D4

Marco experimental

Resultados

Resultados en el dominio del tiempo

Separación y acumulación armónica (SAA)

Nombre nota y Nº Octava

C3 = 130,81 Hz

Resultados en el dominio de la frecuencia

Resultados

A3 = 220 Hz

Resultados con señales de voz cantada

Primera frase del Introito del Réquiem en D menor K.626 de Mozart, sección de la contralto.

Tabla con las frecuencias

Algoritmo ML

Resultados

D4 C4 C♮4 B♭3 E4 A3 F4 F♯4 B♮3

293,66

277,18

261,62

233,08

329,63

220 349,23

369,99

246,94

Test de Kolmogorov-Smirnov Ho = igual distribución de probabilidad

ReferenciaEscala cromática

Análisis estadístico

Resultados

Método

= 0.05 = 0.01

SAA Rechaza Rechaza

ML No Rechaza

No Rechaza

Funciones de distribución acumulativa

Prueba de hipótesis

t - student

SNR = 20 dB

0 0rH X X

Resultados

Método = 0.05 = 0.01

SAA No rechaza No rechaza

ML No rechaza No rechaza

Prueba de inmunidad ante el ruido de fondo

CONCLUSIONES

• Los algoritmos ML y SAA, requieren de una afinación exacta de las señales musicales de entrada.

• El algoritmo SAA es muy sensible a los errores de octava, y presenta errores esporádicos en el resultado del nombre de la nota, se mejora aplicando la moda del vector.

Agradecimientos

• Héctor Fabio Torres C.• Ph.D Germán Castellanos• M.sc. Franklin A. Sepúlveda• GC & PDS

¿Preguntas?¿Preguntas?

Muchas gracias por su atención

Estimación del pitch en señales monofónicas de voz cantada

Technology

Pitch Control

Pitch deck2

Elevator Pitch

Pitch Class

Taller Pitch

Visi pitch

Pitch CAAAPITAL

Elevetor pitch

La Voz Cantada

Ventureka Pitch

Pitch Zeitlos

Pitch Gacela

Roam Pitch

Voz Cantada

Pitch Kopyk

Elevator Pitch 2014

Pitch ventures

Pitch - Nerds

Memoria Cantada

Pitch ORCO