View
24
Download
0
Category
Preview:
Citation preview
ALGORITMO PARA LA DETECCIÓN, CLASIFICACIÓN Y LOCALIZACIÓN DE
CUALQUIER TIPO DE EMBARCACIÓN UTILIZANDO UN HIDRÓFONO.
DAVID PÉREZ ZAPATA
LUIS ESTEBAN GÓMEZ CADAVID
UNIVERSIDAD DE SAN BUENAVENTURA SECCIONAL MEDELLÍN
FACULTAD DE INGENIERÍAS
INGENIERÍA DE SONIDO
MEDELLÍN
2015
ALGORITMO PARA LA DETECCIÓN, CLASIFICACIÓN Y LOCALIZACIÓN DE
CUALQUIER TIPO DE EMBARCACIÓN UTILIZANDO UN HIDRÓFONO.
DAVID PÉREZ ZAPATA.
LUIS ESTEBAN GÓMEZ CADAVID
Anteproyecto presentado para optar al título de Ingeniero de sonido
Asesor
Luis Alberto Tafur Jiménez, Ms.C. en sonido y vibraciones.
UNIVERSIDAD DE SAN BUENAVENTURA SECCIONAL MEDELLÍN
FACULTAD DE INGENIERÍAS
INGENIERÍA DE SONIDO
2015
YO CANTO
Hoy canto por la vida que lucha sin parar, y canto por el muerto que no resucitará.
Canto para que la guerra deje de ser, y por la sonrisa del niño que se ve crecer en los lindos
jardines de aquel edén.
Canto para que el sol siempre esté brillando, y de buena energía al que combate,
con palabras de paz que lleguen al corazón, y vibren en las almas oscuras que no tienen razón.
Canto por la vida que lucha sin parar,
que da sonrisas al mundo y hacen ver brillar de lejos una luna que siempre estará
con los enamorados como su confidencial.
Y canto por las nubes que siempre existirán, moviéndose en el espacio y que inspirarán
a aquel poeta, que desde su ventana las ve pasar.
Y canto la alegría de la vida y a las estrellas que sirven de guía y aquellas que de lejos brillan más.
Las canto más en mi alma porque servirán de motivo para ser alcanzadas.
DAYAN ALEXIS MONTOYA MORALES
DEDICATORIA
A mis padres Martha y Jairo,
por su infinito sacrificio y sus constantes enseñanzas.
A mi padre Guillermo por su esfuerzo y entrega;
a mi madre Luz Ángela por ser motivo de inspiración
y llenarme la vida de color.
AGRADECIMIENTOS
Agradecemos principalmente a MSc. Luis Alberto Tafur Jiménez por brindarnos la
confianza de trabajar en este proyecto, por ser guía en las decisiones a tomar y
apoyarnos en cada circunstancia. Agradecemos también a MSc. Héctor García
Mayén por su disponibilidad y ayuda cada vez que a él recurrimos. Igualmente
agradecemos a algunos compañeros de la academia quienes nos acompañaron en
mediciones en pro al proyecto y a todos los que de una forma u otra formaron parte
de todo este proceso.
6
Tabla de contenido
1. Introducción. ................................................................................................... 12
2. Objetivos del proyecto. ................................................................................... 14
2.1 Objetivo general. ..................................................................................... 14
2.2 Objetivos específicos. .............................................................................. 14
3. Marco referencial. ........................................................................................... 15
3.1 Estado del arte. ....................................................................................... 15
3.2 Marco conceptual. ................................................................................... 21
3.2.1 Propagación acústica en el mar. ...................................................... 21
3.2.2 Factores de atenuación. ................................................................... 21
3.2.3 Velocidad del Sonido. ....................................................................... 23
3.2.4 Propagación de una onda acústica en el agua en función de la
profundidad. .................................................................................................... 23
3.2.5 Señales determinísticas. .................................................................. 24
3.2.6 Señales Estocásticas. ...................................................................... 25
3.2.7 Parámetros estadísticos. .................................................................. 26
3.2.8 Fenómenos de Generación de Burbujas .......................................... 30
3.2.9 Hidrófonos. ....................................................................................... 32
3.3 Marco teórico. .......................................................................................... 33
3.3.1 Procesamiento digital de señales para obtención de firma acústica.33
3.3.2 Estimación espectral de potencia. .................................................... 39
3.3.3 Sonares. ........................................................................................... 46
4. Desarrollo del trabajo. ..................................................................................... 49
4.1 Descripción del Algoritmo y procedimiento de obtención de datos. ......... 49
4.1.1 Grabación de embarcaciones. .......................................................... 49
4.1.2 Procedimiento de grabación. ............................................................ 50
4.1.3 Codificación del algoritmo con base en el protocolo BPMN. ............ 54
4.1.4 Pruebas de funcionamiento del código. ............................................ 60
4.1.5 Corrección del código. ...................................................................... 60
4.2 Consideraciones para la extracción de una firma acústica ...................... 61
4.2.1 Comparación entre FFT y PSD. ....................................................... 61
4.2.2 Análisis espectral de los motores. .................................................... 64
4.3 Análisis espectral del ruido de ambiente. ................................................ 69
4.4 Análisis de la firma acústica para diferentes condiciones. ....................... 73
4.4.1 Extracción de la firma acústica ......................................................... 73
7
4.4.2 Desplazamientos en el dominio de la frecuencia en una firma
acústica debido a cambios de velocidad de la embarcación. ......................... 85
4.4.3 Cambios en el dominio de la frecuencia en la firma acústica debido a
diferentes condiciones de carga. .................................................................... 87
4.5 Determinación de los umbrales de detección mediante la ecuación de
Sonar Pasivo ...................................................................................................... 88
4.5.1 Umbrales de detección. .................................................................... 88
4.5.2 Estimación de distancia. ................................................................... 90
4.6 Aplicación de la correlación cruzada para la clasificación y localización . 92
4.6.1 Correlación para la discriminación entre lanchas. ............................ 92
4.6.2 Análisis de la correlación para la localización. ................................. 94
5. Conclusiones .................................................................................................. 98
6. Referencias ..................................................................................................... 99
ANEXOS
A.1 Código para la obtención de máximos de la señal.
A.2 Código para obtención de firma acústica.
A.3 Código encargado de grabación y comparación con firmas acústicas pre-
establecidas.
A.4 Código para detección de umbrales y estimación de distancia lancha Verde.
A.5 Código para detección de umbrales y estimación de distancia lancha Amarilla.
A.6 Código para la localización.
A.7 Código para el cálculo de variables estadísticas usando R (software).
8
LISTA DE TABLAS
Tabla 1. Descripción de las embarcaciones de prueba. ........................................ 50
Tabla 2. Requisitos funcionales ............................................................................. 58
Tabla 3. Requerimientos no funcionales ................................................................ 59
Tabla 4.Estadísticos para Máximos entre 451Hz y 539Hz. .................................... 77
Tabla 5. Estadísticos para Máximos entre 726Hz y 796Hz. ................................... 78
Tabla 6.Estadísticos para Máximos entre 955Hz y 1043Hz. .................................. 79
Tabla 7.Estadísticos para Máximos entre 1166Hz y 1301Hz. ................................ 80
Tabla 8. Estadísticos para Máximos entre 1430Hz y 1518Hz. ............................... 81
Tabla 9. Diferencia nivel señal-ruido por distancia. ................................................ 91
9
LISTA DE FIGURAS
Figura 1. Muestra de retraso en la señal [13]. ....................................................... 19
Figura 2. Propagación onda acústica en el mar [21]. ............................................. 24
Figura 3. Tipos de señales. .................................................................................... 25
Figura 4. Distribuciones de probabilidad con media = 0 y varianza = 1, pero diferente
curtosis. (Gráfica realizada en Gnuplot). ........................................................ 29
Figura 5. Cavitación por motores sumergidos en un líquido. a) ω = 0. b) ω < ωc. c)
ω> ωc. Donde ω: frecuencia angular motor, ωc: frecuencia angular donde se
produce cavitación [31]. .................................................................................. 31
Figura 6.Fenómeno de aireación del agua [32]. .................................................... 31
Figura 7. Muestra del efecto en el espectro en frecuencia de a) Ventana
Rectangular, b) Ventana Hamming y c) Espectro exacto. Las ventanas fueron
aplicadas con N = 21 [35]. .............................................................................. 36
Figura 8. Estimación de la Densidad Espectral mediante el método de Welch o
WOSA [35]. ..................................................................................................... 44
Figura 9.Estimación de la Densidad Espectral mediante el método de Welch
Modificado [35]. .............................................................................................. 44
Figura 10. Clasificación de los métodos del análisis espectral. ............................. 45
Figura 11. Nivel de pre-amplificación para la señal capturada por el hidrófono. .... 50
Figura 12. Arreglo para anclaje del hidrófono. Con los círculos rojos se indican las
mancuernas. ................................................................................................... 51
Figura 13. Distancias para la toma de datos. El punto rojo simboliza el hidrófono y
la flecha la dirección de paso de la lancha. .................................................... 51
Figura 14. Diagrama de flujo de la descripción del procedimiento. ........................ 53
Figura 15. Medición de temperatura en la piscina. ................................................ 54
Figura 16.Diagrama de flujo del algoritmo de detección clasificación y localización
de fuentes. ...................................................................................................... 56
Figura 17. Flujo de conexión para el funcionamiento del algoritmo. ...................... 57
Figura 18. a) FFT para un Recorrido Completo. b) Análisis espectral en diferentes
instantes de tiempo mediante el uso de la FFT. ............................................. 62
10
Figura 19. Análisis espectral de diferentes instantes de tiempo mediante el uso de
la PSD............................................................................................................. 63
Figura 20. Análisis espectral de los motores de la lancha amarilla. ....................... 64
Figura 21. Análisis espectral de los motores de la lancha amarilla. ....................... 65
Figura 22. Comparación de la Lancha Amarilla Anclada y en Recorrido. .............. 66
Figura 23. Comparación de la Lancha Verde Anclada y en Recorrido. ................. 67
Figura 24. Comportamiento de la densidad de burbuja con respecto a la velocidad
[12]. ................................................................................................................. 68
Figura 25. Efectos de la aireación sobre las frecuencias características de la fuente.
........................................................................................................................ 68
Figura 26. Comparación de ruido ambiente a diferentes profundidades. ............... 69
Figura 27. Comparación del ruido ambiente a 80cm de profundidad con el filtro
encendido y apagado. .................................................................................... 70
Figura 28. Comparación ruido de fondo a 80cm con el filtro encendido y paso de
lanchas. .......................................................................................................... 71
Figura 29. Comparación ruido de fondo a 80cm con el filtro apagado y paso de
lanchas. .......................................................................................................... 72
Figura 30. 24 Recorridos de la Lancha Verde a 1m de distancia del Hidrófono. ... 73
Figura 31. Espectro mediante media aritmética. .................................................... 74
Figura 32. Ajuste del espectro mediante Spline. .................................................... 75
Figura 33. Comparación de Ajuste Spline Vs Promedio. ....................................... 76
Figura 34. Histograma de Máximos ubicados en el Rango de 451Hz a 539Hz. .... 77
Figura 35. Histograma de Máximos ubicados en el Rango de 726Hz a 796Hz. .... 78
Figura 36. Histograma de Máximos ubicados en el Rango de 955Hz a 1043Hz. .. 79
Figura 37. Histograma de Máximos ubicados en el Rango de 1166Hz a 1301Hz. 80
Figura 38. Histograma de Máximos ubicados en el Rango de 1430Hz a 1518Hz. 81
Figura 39. Regla empírica de la distribución Normal. ............................................ 83
Figura 40. Banco de Filtros para la extracción de máximos de la firma acústica. .. 84
Figura 41. Máximos de Nivel para ambas embarcaciones. ................................... 84
11
Figura 42. Relación entre máximos para cada lancha. .......................................... 85
Figura 43. Desplazamiento en frecuencias debido al cambio de velocidad. .......... 86
Figura 44 Comparación espectro lancha Verde sin peso y con peso añadido. ..... 87
Figura 45. Comparación recorrido a 2m lancha Verde con ruido de fondo sin filtro.
........................................................................................................................ 90
Figura 46. Pérdida por transmisión en una frecuencia. .......................................... 91
Figura 47. Correlación entre dos señales de lancha Verde. .................................. 93
Figura 48. Correlación entre dos señales de lancha Amarilla. ............................... 93
Figura 49. Correlación entre una señal de lancha Verde y Amarilla ...................... 94
Figura 50. Correlación cruzada entre señal original, adelantada y atrasada. ........ 95
Figura 51. Arreglo Virtual de Hidrófonos para determinar la localización de la señal
separados una distancia Δd y desplazadas en tiempo Δt. a) Embarcación
pasando adelante del arreglo. b) Embarcación pasando por detrás del arreglo.
........................................................................................................................ 97
12
1. Introducción.
El desarrollo tecnológico en el campo de la computación y el extenso estudio en el
área de la acústica han impulsado la creación de algoritmos que manipulen
variables de dicha índole con el objetivo de resolver problemas o necesidades. Parte
de estos menesteres está en la detección, clasificación y localización de fuentes por
medio del fenómeno acústico. Los algoritmos destinados a dichos fines cumplen
tareas básicas como la determinación de qué tipo de fuente es la emisora del sonido
percibido además de indicar en qué dirección llega la onda sonora. Con esta
información se pueden realizar acciones de interés sobre la fuente detectada.
Dicho tipo de códigos han sido implementados, por ejemplo, con motivos de
seguridad para identificación de disparos en lugares que autoridades competentes
desean resguardar. El algoritmo indica si el sonido emitido es o no un disparo y
señala la dirección de procedencia, así las autoridades competentes del control del
lugar pueden tomar medidas al respecto. Otro ejemplo en aplicación para este tipo
de codificación es el seguimiento de fauna marina. Instituciones dedicadas al
estudio de animales marinos implementan algoritmos de clasificación para estimar
si cerca de su zona de control ha pasado cierto tipo de especie y en qué dirección,
esto les permite llevar registros sobre los animales que rodean el ecosistema bajo
estudio.
En Colombia se cuenta con sistemas de detección de embarcaciones basadas en
radares. Estas técnicas han funcionado eficientemente para embarcaciones de gran
tamaño pero son deficientes y poco fiables cuando la embarcación es pequeña, por
ejemplo las lanchas rápidas tipo go-fast. Además en el país no se cuenta con
suficiente información acústica de vehículos acuáticos para la implementación de
tecnologías en detección y clasificación, tecnologías que son aplicables al caso
colombiano, ya que se han puesto en funcionamiento en otros países con el objetivo
de detección de embarcaciones y otros fines como el seguimiento de cachalotes y
fauna marina en general, dando estas implementaciones resultados favorables. Por
estas razones se espera que en el caso colombiano la implementación de dichos
códigos tenga resultados positivos, consiguiendo firmas acústicas variadas se
puede dar implementación a tecnologías computacionales y acústicas para el
objetivo de clasificación y localización.
13
El algoritmo a desarrollar en este proyecto propone detectar, clasificar y localizar el
ruido emitido por embarcaciones y compararlas con una base de datos de firmas
acústicas previamente grabadas con intención de afirmar con seguridad, si el tipo
de embarcación registrada es o no el vehículo objetivo. El código tiene como
objetivo embarcaciones que se desplazan en la superficie del agua, es decir, no
está pensado para vehículos tipo submarinos que funcionan completamente
sumergidos. El desarrollo del código está basado en el método de Welch, el cual da
una estimación de densidad espectral de potencia utilizando la transformada de
Fourier, además usa la teoría de sonar pasivo para la determinación de umbrales
de detección y estimación de la distancia de arribo. El algoritmo tiene la capacidad
de adaptarse a la firma acústica de cualquier vehículo previamente grabado y así
funcionar como detector de dicha embarcación, sólo es necesaria la modificación
de parámetros acústicos en los códigos de detección. (En la sección de Anexos A1,
A2, A3, A4 y A5 se encuentra el código implementado).
Sobre el proyecto se pueden mencionar las siguientes ventajas esperadas:
capacidad de detectar embarcaciones de pequeña envergadura; tiempos de
respuesta rápidos; bajo porcentaje de falsas alarmas y fácil manipulación de las
variables de entrada por parte del personal respectivo. Como desventajas
esperadas se pueden describir a continuación: dependencia de características
computacionales del sistema que leerá el código y modificación de parámetros
internos. Considerando entonces la situación actual del país en cuanto a tecnologías
acústicas para rastreo de fuentes, se plantea como una solución el código de
detección expuesto en el presente documento. A futuro se espera la implementación
del código en aguas colombianas siendo útil a instituciones que requieran control
de embarcaciones en zonas marítimas específicas.
Este trabajo se encuentra dividido en secciones, primero se definen los objetivos
del proyecto, tanto general como específicos, a continuación se hace énfasis en los
contenidos teóricos que dieron pie al desarrollo del proyecto, en este se encuentra
tanto teoría de acústica como de procesamiento digital de la señal, posteriormente
se explica la metodología que se utilizó para la obtención de los datos y se muestra
la estructura de los códigos implementados para la extracción de las firmas
acústicas. Luego se procede a hacer el análisis de la información, donde se discuten
los resultados obtenidos de los diferentes experimentos que se llevaron a cabo,
finalmente se encuentran las conclusiones y recomendaciones para quienes en un
futuro vallan a aportar al proyecto.
14
2. Objetivos del proyecto.
2.1 Objetivo general.
Desarrollar un algoritmo para la detección, clasificación y localización de cualquier
tipo de embarcación utilizando un hidrófono.
2.2 Objetivos específicos.
Obtener firmas acústicas de lanchas de prueba en condiciones controladas.
Diseñar un algoritmo de detección de fuentes con funcionamiento en tiempo
real.
Determinar un umbral de detección basado en la firma acústica de la
embarcación y las condiciones del medio.
Realizar las pruebas respectivas para la validación del algoritmo.
Diseñar un algoritmo de localización para un arreglo virtual de dos hidrófonos.
15
3. Marco referencial.
3.1 Estado del arte.
Nehorai y et al. (1994), presentaron un método para la localización de fuentes
acústicas usando arreglos vectoriales de sensores. Se entiende por arreglo vectorial
aquel que posee un medidor de presión acústica y un medidor de velocidad de
partícula, lo cual hace que se disponga de más información acústica y obtener
mayor precisión en la localización. Además utilizan la cota de Cramér-Rao (CRB)
para evaluar el rendimiento óptimo de los estimadores insesgados sobre los errores
de estimación de la dirección de la fuente. Luego optimizan las cotas aplicando el
error angular cuadrático medio (MSAE) y posteriormente mediante algoritmos de
localización de un arreglo de vector estiman la dirección de la fuente. Dos algoritmos
DOA son propuestos, el primero basado en intensidad utilizando presión y velocidad
de partícula, para hallar el vector unitario u en dirección opuesta a la del vector
intensidad. El segundo basado solo en la velocidad de partícula utilizando la
covarianza como estadístico para hallar el vector unitario en dirección a la fuente
acústica. La ventaja principal de estos estimadores CRB y MSAE es que
proporcionan instantáneamente la dirección de la fuente utilizando un sensor
pequeño comparado con la longitud de onda. Además es posible, con un solo
arreglo de vector, hallar la dirección de dos fuentes a la vez [1].
K. T.Wong et al. (1997), posteriormente exponen un método para la estimación de
los ángulos de azimut y de elevación mediante un esquema basado en el algoritmo
ESPRIT, usando un arreglo rectangular de hidrófonos espaciados mucho más de
media longitud de onda, un hidrófono de vector comprende de dos o tres sensores
de velocidad de partícula que se sitúan juntos y ortogonales entre sí, con el fin de
captar cada una de las componentes cartesianas del vector de velocidad de
partícula, adicionalmente acompañados de un sensor de presión [2].
Xerri et al. (2002), presentan un método acústico de localización y rastreo de objetos
en movimiento en el mar ya sea para seguir buques en la superficie (2D) o para
objetos bajo el agua (3D), mediante la ubicación de hidrófonos en una posición fija
sumergidos bajo el agua. El método se basa en los retardos existentes en la
propagación entre la fuente y receptor para cada uno de los receptores, y de la
función de ambigüedad que es ideal para identificar la localización cuando la fuente
está en movimiento. Existen factores determinísticos en el método, como la relación
señal a ruido (SNR), la compensación del efecto Doppler, y el método de
blanqueamiento (whitening), la uniformidad de la densidad espectral de potencia, y
el tiempo de integración son necesarios para la precisión de la localización de la
16
fuente. El algoritmo presentado puede ser usado en tiempo real. Los resultados
fueron los esperados, sin embargo fue necesario obtener más precisión y utilizar
compensaciones de Doppler de segundo orden sobre todo durante los giros para
no perder el rastro de la fuente. El cálculo de la trayectoria requiere de la función de
ambigüedad para cada par de receptores y de una etapa de pre-procesamiento para
suprimir los ecos, los cuales dependen de la profundidad del área [3].
Zha y Qiu (2006), propusieron un nuevo método FOC-ESPRIT de detección en 2-
D basado en correlación de orden fraccional y de localización de fuentes usando
arreglos de hidrófonos de vector conformados por dos o tres sensores de velocidad
de partícula ubicados ortogonalmente entre sí, más un sensor de presión, con el fin
de extraer información del ángulo azimut y de elevación de las ondas acústicas
submarinas. Las simulaciones demostraron que este método es mucho más
eficiente en un amplio rango de características que los algoritmos de detección
basados en ESPRIT, además analizan el rendimiento del método mediante el error
cuadrático medio (MSE) y la cota de Cramér-Rao [4].
Giraudet y Glotin (2006), describieron un método para el rastreo de ballenas con un
arreglo de cinco hidrófonos espaciados, basados en un algoritmo de TDOA
(Diferencias de tiempos de llegada) la señal acústica es captada por cada uno de
los hidrófonos y procesada para cancelar los ecos que pueden presentar TDOAs
adicionales, debido a la reflexiones con la superficie, con el fondo, e inclusive con
diferentes capas de agua, los cuales no pueden ser tenidos en cuenta para la
localización de las ballenas, para ello se presenta un algoritmo sencillo pero
eficiente para cancelar los ecos presentes. El algoritmo de localización presentado
en este paper se ejecuta dos veces más rápido que un algoritmo en tiempo real,
pero da resultados similares [5].
B.Borowski et al. (2008), presentaron un método de detección de fuentes acústicas
bajo el agua aplicando la teoría de sonar pasivo, y describieron la forma en que se
hallaron las diferentes variables, como lo son la perdida por transmisión, la densidad
espectral de potencia de la fuente y el ruido ambiente. Concluyeron que las
dificultades al usar un sistema de detección pasivo en una ciudad, se debe al alto
nivel de ruido ambiente y a la complejidad de la propagación del sonido en aguas
poco profundas.
La pérdida por transmisión, fue medida comparando los niveles de ruido del paso
de las embarcaciones en diferentes puntos a lo largo de sus rutas y la distancia
entre la fuente y el hidrófono se calculó con la ayuda de cámaras y de software.
Posteriormente utilizando un solo hidrófono omnidireccional y variando ciertas
17
condiciones, se miró cómo se afectaba la localización de la fuente y finalmente se
notó la mejora de los resultados obtenidos con un arreglo de hidrófonos que con un
solo hidrófono omnidireccional [6].
Poco después He y Liu (2009), expusieron un nuevo algoritmo de detección de
señales acústicas usando un arreglo lineal de hidrófonos de vector, utilizando un
método llamado “propagador” para encontrar los ángulos de dirección de la señal
tanto en azimut como en elevación, provenientes de la información suministrada por
las componentes de la velocidad de partícula. Se presenta el algoritmo como una
mejora del algoritmo SUMWE, que tiene la particularidad de no necesitar las
diferencias de tiempo de llegada entre los sensores adyacentes, lo cual permite un
espaciado más grande entre los sensores, inclusive mucho más de media longitud
de onda de separación sin generar ambigüedades y errores en la estimación de los
ángulos [7].
Luego estos mismos autores (2009) propusieron en otra publicación un algoritmo
que emplea la invariancia espacial entre los dos hidrófonos vector, pero no requiere
información a priori de los factores espaciales. Utiliza ruido aditivo no-gaussiano,
que se encuentra a menudo en aplicaciones de acústica submarina. Se aplica el
método ESPRIT para estimar y luego emparejar los cosenos directores del eje x con
los cosenos directores del eje y de forma automática obtener el ángulo de azimut y
de elevación. La metodología propuesta por He y Liu presentó similitudes con los
algoritmos descritos por K. T.wong et al. [2] y por Zha y Qiu [4], en los que se
utilizaron hidrófonos de vector desplazados, utilizó invariancia espacial y usó el
método ESPRIT. Difiere en que no necesita de una geometría rectangular como se
menciona en [2] sino que utiliza dos hidrófonos de vector desplazados
arbitrariamente [8].
En el año 2009, M. R. Arshad habló de la importancia que tienen los sensores
submarinos en la actualidad, todas las aplicaciones que se les ha dado en la
industria y en el área ingenieril, las ventajas y desventajas de los sensores acústicos
y los no acústicos como los ópticos y los electroquímicos, los retos que se presentan
actualmente en el diseño de los sensores. Además se habló de soluciones
potenciales a futuro, como lo son los sensores bio-inspirados y los MEMS (Sistemas
Microelectromecánicos), y qué posibles retos y trabajos se pueden presentar en un
futuro próximo [9].
P. Felisberto et al. (2010) describieron un método de localización de fuentes en
azimut, con un algoritmo basado en intensidad utilizando un solo arreglo de
hidrófono de vector sumergido desde un bote en movimiento a baja velocidad en
18
aguas poco profundas. El método es capaz de rastrear fuentes en movimiento de
alta frecuencia en un rango de hasta 2 km, y también es capaz de rastrear la
orientación del ruido de baja frecuencia de una embarcación. El método demanda
bajo nivel computacional, lo cual lo hace ideal para ser utilizado en estaciones
móviles. Los resultados demostraron que el rendimiento con un simple sensor de
vector es similar a los resultados con arreglos y técnicas de beamforming [10].
Luego en otra publicación P. Felisberto et al. (2010), mostraron un comparativo en
aplicaciones DOA de acústica submarina, entre hidrófonos de presión, sensores de
velocidad de partícula y arreglos de sensores de vector, demostrando que los
arreglos vectoriales son mucho más efectivos y presentan mayor precisión en los
resultados [11].
Posteriormente L.Houégnigan et al. (2010), hicieron un análisis de las técnicas de
monitoreo pasivo que juegan un papel fundamental en la conservación de los
cetáceos e investigan el desarrollo y la eficiencia de dichas técnicas para ser usadas
en un módulo de localización para un sistema de monitoreo acústico pasivo en
tiempo real. Algunos métodos están basados en TDOA (Diferencias de tiempos de
llegada) y otros en diferencias espacio-temporales, se presenta un método híbrido
que representa una mejora en los niveles de ruido, en el tiempo de procesamiento,
y es mucho más robusto, es decir mucho más estable y menos sensible a ecos y
reverberaciones. Se presentan diferencias entre los métodos TDOA y espacio
temporales y se demuestra la eficiencia de los métodos híbridos sobre estos en la
localización de cetáceos y embarcaciones [12].
Tesei et al. (2012), presentaron algoritmos de detección y localización optimizados
para botes de pequeño y mediano tamaño, basados en la información de una
estación submarina de un arreglo de cuatro hidrófonos, o de la unión entre dos
arreglos volumétricos de hidrófonos. Los algoritmos de localización se basan en la
correlación cruzada entre un par de hidrófonos en función del tiempo. La señal
acústica emitida por el motor de los botes, los barcos, las turbinas, los ejes, o de la
estructura del barco en sí interactúa con el medio de propagación, que en este caso
es el agua, y con la superficie generando movimiento. Luego mediante un método
de estimación TDOA se puede identificar la dirección de la fuente.
Los arreglos volumétricos de hidrófonos se encuentran siempre en campo lejano
con respecto a la fuente de ruido, por lo tanto el frente de onda que captan será
plano. Asumiendo esta última condición, el ruido emitido alcanza a los sensores que
están retrasados uno respecto al otro generando así una diferencia de tiempo ∆𝑇
(ver Figura 1) que está en función del ángulo de marcación α el cual indica la
19
dirección de la fuente con respecto al eje entre un par de hidrófonos, por lo tanto el
algoritmo DOA analiza la coherencia de tiempo entre las señales acústicas recibidas
por los hidrófonos del arreglo tetraédrico mediante correlación cruzada de a pares
entre ellos [13].
Figura 1. Muestra de retraso en la señal [13].
En presencia de una fuente de ruido, la correlación cruzada muestra un pico,
durante un intervalo de tiempo, este intervalo es la diferencia de tiempos de llegada
entre el par de hidrófonos, y mediante una simple relación trigonométrica es posible
conocer el ángulo de dirección α. Luego por cada par de hidrófonos del arreglo
volumétrico se obtiene un correlograma cruzado, cuyas variables son el tiempo vs
∆𝑇, con el fin de identificar las fuentes de ruido presentes en el área de la medición
en forma de líneas continúas de energía. Toda la información recopilada por cada
par de receptores es unida con el fin de obtener el vector de onda k de la fuente de
ruido, aplicando un algoritmo LMS (Método del mínimo cuadrado medio). Se llegó
a la conclusión de que con un solo arreglo tetraédrico, la compensación entre
azimuth y el cálculo de elevación, (teniendo en cuenta la información de cada par
de hidrófonos), genera una mejora notable en la precisión, sin embargo pequeños
errores en elevación genera errores significativos en la localización a cortas
distancias, por lo que mejores resultados se obtienen al utilizar y unir la información
suministrada por dos arreglos tetraédricos, especialmente cuando el ruido ambiente
es bastante alto y el ambiente es complejo [13].
Haitsma et al. (2002), propusieron firmas acústicas basadas en los Coeficientes
Cepstrum de Bark Frecuencia (BFCC), utilizaron ventanas que se solapaban para
extraer características de interés. El espectro lo dividieron en 33 bandas BFCC
cubriendo el rango de frecuencia entre 300 Hz y 2000 Hz, y se hallaba una firma
acústica cada 370 milisegundos, que a su vez contenía una sub-firma acústica con
20
paso de 11.7 milisegundos. La sub-firma acústica que hallaban era un vector de 32
posiciones con diferentes coeficientes [14].
Ke et al. (2005), utilizaron parte de la extracción que hicieron Haitsma et al. (2002),
sin embargo le añadieron un enfoque diferente de aprendizaje de características.
No analizaron la firma acústica como un vector de una dimensión, la transformaron
en una imagen 2-D en función de la frecuencia y el tiempo, parecido a un
espectrograma, y posteriormente aplicaban el enfoque de aprendizaje de
características basado en visión computacional llamado AdaBoost, usado para
reconocimiento de rostros [15].
Luego Baluja et al. (2006), introdujeron la extracción de patrones por medio de
wavelets usando la técnica de min-hash, la cual consiste en determinar qué tan
parecidas son dos señales mediante permutaciones independientes relativas al
valor mínimo. En los resultados demostraron que se logró identificar pequeñas
muestras de audio que fueron degradadas de diferentes maneras, entre ellas
adición de ruido a la señal, baja calidad en la grabación y reproducción desde
dispositivos celulares [16].
J.Wang et al. (2010), utilizaron el espectrograma para la extracción de patrones,
aplicando FFT sobre una muestra cada 67 ms hasta cubrir toda la señal de audio.
Luego analizaron los máximos de nivel mediante un gradiente de energía sobre
cada punto del espectograma. Este método fue utilizado en un buscador de
canciones y el algoritmo logró identificar muestras grabadas con micrófonos en
presencia de altos niveles de ruido con buena precisión y eficiencia [17].
A.Ramalingam y S.Krishnan (2006), describieron un método para la extracción de
coeficientes usando la STFT sobre pequeños tramos de la señal de audio,
extrayendo en cada muestra ocho coeficientes, centroide espectral, ancho de banda
espectral, energía de la banda espectral, medida de la planitud espectral, factor de
cresta espectral, entropía de Renyi, entropía de Shannon y los coeficientes
cepstrales en las frecuencias de mel (MFCC). Estos coeficientes se guardaban en
un vector que posteriormente se dirigía a una base de datos [18].
De la misma manera G.Tzanetakis (2002), extrajo de una canción diferentes
coeficientes, con base en esos coeficientes logró clasificar géneros musicales. Los
coeficientes que tuvo en cuenta eran: Textura característica del timbre, caída
espectral, flujo espectral, cruces por cero en el dominio del tiempo, coeficientes
cepstrales en las frecuencias de mel (MFCC), ventanas de análisis y de textura y
característica de baja energía [19].
21
3.2 Marco conceptual.
3.2.1 Propagación acústica en el mar.
Cualquier fuente que genere movimiento en el agua y perturbe el medio se propaga
en forma de onda acústica las cuales hacen que las moléculas de agua presenten
compresión y rarefacción. Esta propagación acústica es conocida como onda
mecánica elástica y se propaga en los 3 ejes coordenados. Estas ondas se irradian
eficientemente en el agua por lo cual se usan para efectos de detección de blancos
a través de sistemas de sonar [20].
Por otro lado cuando el sonido se transmite desde una fuente, su energía se
expande en el tiempo en áreas cada vez mayores análogamente al principio de la
ley del inverso cuadrado para ondas esféricas. Además se produce una absorción
sonora cuando la onda viaja a través del agua y parte de la energía se convierte en
calor producto de la fricción ocasionada por la viscosidad del líquido. Adicionalmente
se produce un efecto de dispersión sobre la energía restante, la cual genera formas
de onda secundarias que viajan en distintas direcciones por efecto del reflejo de los
rayos con las superficies, burbujas, sólidos suspendidos, entre otros. A medida que
el sonido viaja por el medio, la energía asociada a la onda acústica sufre una
disminución, lo que se conoce como pérdida de transmisión sonora causada por
estos tres factores. Dicha pérdida por transmisión es directamente proporcional a la
distancia entre la fuente y el receptor [9] [21] [22].
3.2.2 Factores de atenuación.
Cuando el sonido se transmite desde una fuente, su energía se propaga en áreas
cada vez mayores a medida que transcurre el tiempo, haciendo que la proporción
de energía por unidad de área disminuya al aumentar la distancia, dicha pérdida es
directamente proporcional a la distancia entre la fuente y el receptor [9] [21].
Los factores principales que determinan la atenuación de la onda acústica en el
agua son la reflexión, la absorción y la dispersión:
Reflexión.
La transmisión en el agua puede tomar diferentes caminos debido a los obstáculos
que suelen estar presentes en el medio. Cuando una onda choca contra un objeto
esta se refleja perdiendo generalmente intensidad y modificando la fase, a causa de
los diversos caminos de llegada al receptor, la onda arriba con características
diferentes a la señal original. Las diferentes reflexiones y la pérdida por transmisión,
22
pueden modificar la señal original tanto en nivel total de intensidad sonora así como
por frecuencia. [21].
Absorción.
Una onda acústica necesita de un medio para propagarse. En un medio la
transmisión de energía de una molécula a otra no se hace al 100%, al contrario, por
contacto con el medio y el choque con otras partículas, la energía se va convirtiendo
en calor por el rozamiento entre ellas. La pérdida por fricción y la disipación de calor
está en función de la distancia, es decir, a medida que la onda viaja su intensidad
disminuye exponencialmente. En el agua marítima la absorción es menor que en
agua dulce o en el aire. [21] .
Dispersión.
Debido a que el océano es considerado como un medio de transmisión no
homogéneo en el que se presentan cambios en la temperatura, la salinidad y la
presión, se generan canales. Cuando estos canales son comparables a la longitud
de onda, estos producen reflexiones las cuales genera formas de onda secundarias
que viajan en distintas direcciones. Cuando la longitud de onda es mayor a la
dimensión del obstáculo, la onda es capaz de rodearlo y seguir propagándose.
[21].
Tipos de propagación en el agua.
Análogamente a los tipos de propagación sonora en el aire, en el agua también se
cuenta varios tipos de propagación acústica. Para fuentes puntuales la energía
decaerá proporcionalmente al cuadrado de la distancia de acuerdo con el modelo
de propagación esférica; diferentes condiciones geométricas causadas por las olas
provocan una tasa de decaimiento diferente [22]. Éste tipo de propagación se
presenta cuando la fuente se encuentra sumergida en el agua a una profundidad
considerable, esta condición significa que la superficie del agua y el fondo están lo
suficientemente lejos para no modificar la propagación en todas las direcciones,
lográndose de esta manera una propagación esférica. Otro modelo de propagación
son las ondas planas caracterizadas por no tener pérdidas de energía – o ser muy
poca la pérdida - a medida que la onda se transmite por el medio. La creación de
ondas planas requiere que las variaciones de presión se encuentren distribuidas a
lo largo de una línea recta, pueden darse en lugares donde se produzca ruido y esté
encerrado en una cavidad de forma esférica. La propagación cilíndrica tiene
características de ambas propagaciones (esférica y plana). Este tipo de
propagación se puede hallar en piscinas, donde la profundidad y la superficie se
23
encuentran a una distancia relativamente cercana entre sí, comportándose estas
zonas como superficies reflectantes en las cuales el sonido no viaja más allá,
provocando así la forma de un cilindro en la propagación de la onda sonora [23]. Un
factor añadido al medio acuático es el oleaje y el movimiento del líquido, esto influye
en la propagación obligándola a crear diferentes caminos de transmisión, aspecto
que se ve reflejado en la proporción del decaimiento de energía de la onda sonora.
[22] [23].
3.2.3 Velocidad del Sonido.
La velocidad del sonido en el agua oscila entre 1450 m/s y 1540 m/s. Aunque la
variación de la velocidad del sonido en el agua es relativamente pequeña (≤ +/- 3%),
la propagación del sonido puede ser considerablemente afectada. Éste valor de
velocidad puede ser medido directamente o calculado si se conoce la temperatura
(T), la salinidad (S), la presión del agua (P) y la profundidad (z) [22] [24].
La Ecuación 2 (de Chen Millero) se utiliza para el cálculo de la velocidad de sonido
usada en la mayoría de aplicaciones [22] [24] :
𝑐 = 1449,2 + 4,6 ∗ 𝑇 − 0,055 ∗ 𝑇2 + 0,00029 ∗ 𝑇3 + (1,34 − 0,01 ∗ 𝑇)(𝑆 − 35)
+ 0,016 ∗ 𝑧 (2)
donde:
C = velocidad sonido [m/s] T = temperatura [°C] 0 ≤ T ≤ 35. S = salinidad [pps] 0 ≤ S ≤ 45. Z = profundidad [m] 0 ≤ Z ≤ 1000.
3.2.4 Propagación de una onda acústica en el agua en función de la
profundidad.
La razón con la cual la onda se desplaza cierta distancia en un determinado tiempo,
se le denomina velocidad de propagación de onda, en el caso de la onda acústica,
dicha velocidad se encuentra en función de la densidad y la presión en el medio de
propagación. En el agua, especialmente en el océano, la presión incrementa a
medida que aumenta la profundidad. Por otro lado, la densidad del agua está en
función del grado de salinidad y de la temperatura, lo cual hace que la velocidad de
onda en el agua presente variaciones a medida que se propaga en este medio.
Análogamente a la teoría de rayos de la luz, la dirección de propagación del sonido
puede ser representada mediante líneas “rectas”, las cuales representan el frente
24
de onda acústico. La dirección de estos rayos depende de la velocidad, ya que los
rayos presentan una tendencia a propagarse hacia donde la velocidad del sonido
sea menor. Debido a estos cambios de presión, temperatura y salinidad en el
océano, a partir de los 1000 metros de profundidad se generan canales
denominados “canales profundos”, los cuales hacen que el frente de onda acústico
quede encausado en él. Mediante la representación de la onda en forma de rayos
es más fácil entender este fenómeno asumiendo que la temperatura del océano
para una altura determinada es igual en todos los puntos, así los rayos pueden ser
dibujados como segmentos de recta y aproximados de forma que representen una
curvatura (ver Figura 2) [20] [21]
Figura 2. Propagación onda acústica en el mar [21].
Un efecto importante de la física del sonido es el efecto doppler, el cual se refiere a
un cambio de frecuencia percibido en un punto de recepción para una fuente sonora
con movimiento relativo. Este fenómeno puede causar falsas alarmas en los
sistemas de detección acústica submarina debido al aparente cambio de frecuencia
por el desplazamiento de la fuente [25].
3.2.5 Señales determinísticas.
Son aquellas que pueden ser descritas de forma precisa por una función
matemática. Éste tipo de señales se dividen en estacionarias y no estacionarias.
Las señales no estacionarias son aquellas donde ninguno de sus valores se
mantiene constante. Las señales estacionarias son aquellas donde el valor de
interés se mantiene constante en el tiempo o es igual siempre que la señal es
medida, además las estacionarias se subdividen en señales periódicas y no
periódicas. Las periódicas repiten sus resultados cada cierto tiempo o cada cierto
intervalo de la variable independiente, a este intervalo de repetición se le denomina
25
periodo. Las señales no periódicas no cuentan con un periodicidad fija en sus
valores. [26]. En la Figura 3 se puede apreciar fácilmente la clasificación de estas
señales.
3.2.6 Señales Estocásticas.
Son señales que no pueden ser descritas exactamente por funciones matemáticas,
así que se recurre a parámetros estadísticos para caracterizarlas. Se subdividen en:
estacionarias y no estacionarias. Las señales no estacionarias son señales
estocásticas cuyos parámetros estadísticos varían dependiendo del instante en que
se calculen. Por el contrario, las señales estacionarias estocásticas son señales las
cuales algún parámetro estadístico en un instante es igual a los demás instantes de
la señal. Además éste tipo de señales se subdividen en ergódicas, cuyos
parámetros estadísticos tomados en un instante son iguales a los de toda la señal;
y no ergódicas donde es necesaria una muestra para determinar sus parámetros
estadísticos [26]. En la Figura 3 se puede apreciar fácilmente la clasificación de
estas señales.
Figura 3. Tipos de señales.
26
3.2.7 Parámetros estadísticos.
Promedio.
Es una operación matemática que da como resultado una medida de tendencia
central [27] :
�� =1
𝑁∑𝑥𝑖
𝑁
𝑖=1
(3)
donde:
��: promedio de los datos.
𝑥𝑖: representa cada dato.
𝑁: cantidad total de datos.
Mediana.
Es el valor central de un conjunto de datos ordenados. La mediana debe ser hallada
después de organizar los datos en forma ascendente o descendente [27].
Si el número de datos es impar la mediana se encuentra en la posición (n+1)/2 de
los valores:
𝑀𝑒 = 𝑥(𝑛+1)/2 (4)
Si el número de datos es par la mediana es el promedio entre la posición n/2 y
(n/2)+1:
𝑀𝑒 =(𝑥𝑛
2+ 𝑥
(𝑛2+1))
2 (5)
Moda.
Es el dato que más se repite en el conjunto de datos analizado. Si existen dos datos
con igual número de apariciones absolutas se llama distribución bimodal; si hay tres
datos con igual número de apariciones absolutas se denomina distribución trimodal;
si todos los datos aparecen con la misma frecuencia entonces no hay moda [27].
27
Varianza.
Es una medida de dispersión que indica qué tan alejados están los valores del
conjunto de datos de su promedio. Se debe tener en cuenta que éste parámetro es
fácilmente influenciado por valores atípicos [27]. Se halla con la Ecuación 6:
𝑠2 =1
𝑁∑(𝑥𝑖 − ��)
2
𝑁
𝑖=1
(6)
Desviación estándar.
Es la raíz cuadrada de la varianza [27].
𝜎 = √𝑠2 = √1
𝑁∑(𝑥𝑖 − ��)2𝑁
𝑖=1
(7)
Cuartiles.
Son tres valores C1, C2 y C3 que dividen el conjunto de datos en cuatro grupos
iguales, cada uno representando el 25% de los valores. C2 siempre coincide con la
mediana [28].
Esperanza.
Indica el valor que se espera cuando un suceso aleatorio no cambia de probabilidad
en sus resultados. Si todos los valores de un evento tienen la misma probabilidad la
esperanza es igual al promedio [28]:
𝐸[𝑋] = ∑𝑥𝑖 ∗ 𝑝(𝑥𝑖)
𝑁
𝑖=1
(8)
donde:
𝐸[𝑋]: indica la esperanza de todo el conjunto de datos.
𝑝(𝑥𝑖): es la probabilidad de suceso del valor 𝑥𝑖.
28
Momento central.
Es una operación matemática que utiliza el operador Esperanza para hallar valores
de parámetros usados en otros conceptos [28]:
𝜇𝑘 = 𝐸[(𝑋 − 𝐸[𝑋])𝑘] (9)
Si 𝑘 = 1, 𝜇1 = 0; si 𝑘 = 2, 𝜇2 = 𝜎2; si 𝑘 = 3, 𝜇3 se utiliza para hallar la Asimetría; si
𝑘 = 4, 𝜇4 se utiliza para hallar la Curtosis.
Asimetría.
Es un indicador que permite determinar la simetría del conjunto de datos teniendo
como valor de referencia la media [28]:
𝛾 = 𝜇3𝜎3 (10)
donde:
𝛾: indica la asimetría del conjunto de datos.
𝜇3: tercer momento central.
𝜎: desviación estándar.
Si 𝛾 > 0, la distribución es asimétrica positiva; si 𝛾 < 0 la distribución es asimétrica
negativa; si 𝛾 = 0 la distribución es simétrica.
Curtosis.
Es una medida de la forma de la distribución de un conjunto de datos. Si el valor de
curtosis es alto indica que mayor densidad de datos cercanos a la media mientras
existe también varios datos alejados de esta [28]:
𝛽2 = 𝜇4𝜎4 (11)
donde:
𝛽2: indica la curtosis del conjunto de datos.
𝜇4: tercer momento central.
𝜎: desviación estándar.
29
A menudo se calcula una curtosis especial la cual es comparada con la curtosis de
una distribución normal, así el resultado indica qué tan parecida o alejada es la
distribución en cuestión comparada con una distribución normal.
𝑔2 = 𝜇4𝜎4− 3 (12)
El valor de curtosis de una distribución normal es 3. Utilizando la Ecuación 12 se
puede comparar entones si 𝑔2 > 0 la distribución es más apuntada y con colas más
alargada que la normal, si 𝑔2 < 0 la distribución es menos apuntada y con colas
menos alargadas que la normal; si 𝑔2 = 0 la distribución es normal. La Figura 4
ejemplifica el valor de la curtosis.
Figura 4. Distribuciones de probabilidad con media = 0 y varianza = 1, pero diferente curtosis. (Gráfica realizada en Gnuplot).
Test de Shapiro-Wilk.
El test de Shapiro-Wilk se usa para analizar la normalidad de un conjunto de datos,
se considera que este test es uno de los más potentes para el contraste de
normalidad y es usado cuando se posee un número pequeño de muestras n≤30. Se
basa en una hipótesis donde los datos están normalmente distribuidos [29].
𝑊 =(∑ 𝑎𝑖𝑥(𝑖)
𝑛𝑖=1 )
2
∑ (𝑥𝑖 − ��)2𝑛𝑖=1
(13)
donde:
𝑊, es el estadístico de prueba.
��, es la media muestral.
Los coeficientes 𝑎𝑖, se calculan mediante la siguiente ecuación:
30
𝑎𝑖 =𝑚𝑇𝑉−1
(𝑚𝑇𝑉−1𝑉−1𝑚)2 (14)
donde:
𝑚, son los valores medios del estadístico ordenado.
𝑉, es la matriz de covarianzas del estadístico.
Si el valor-p, que es la probabilidad de rechazar la hipótesis siendo cierta, es menor
al nivel de confianza (típicamente 5%), la hipótesis se rechaza lo que indica que los
datos no provienen de una distribución normal, pero si el p-valor es mayor a 0.05,
la hipótesis se acepta indicando que los datos provienen de una distribución normal
[29].
Spline.
Son un conjunto de curvas polinomiales utilizadas para la interpolación y el ajuste
de curvas. Se han convertido en uno de los métodos más utilizados dada su
simplicidad de cálculo y programación en comparación con otros métodos, además
son un sistema poco sensible a valores inesperados o anormales. Los métodos
spline sirven para aproximaciones de curvas, superficies o volúmenes, es decir,
pueden extenderse para trabajar en más de una dimensión [30].
3.2.8 Fenómenos de Generación de Burbujas
Cavitación.
Es la creación de burbujas de aire provocada por las turbulencias creadas en el
borde de las hélices en contacto con el líquido. En la Figura 5 se ilustra el fenómeno:
31
Figura 5. Cavitación por motores sumergidos en un líquido. a) ω = 0. b) ω < ωc. c) ω> ωc. Donde ω: frecuencia angular motor, ωc: frecuencia angular donde se produce cavitación [31].
Aireación o ventilación.
Efecto que consiste en la absorción de aire por medio de las hélices de los motores
debido al contacto con la superficie del líquido. La aireación también es producida
por la embarcación en sí misma. En la Figura 6 se ilustra el fenómeno de aireación:
Figura 6.Fenómeno de aireación del agua [32].
32
3.2.9 Hidrófonos.
Dispositivos que detectan los cambios de presión de una señal acústica en el agua,
produciendo a su salida un voltaje proporcional a la presión. Los hidrófonos
funcionan con un ancho de banda amplio aunque su punto en contra es la relación
señal a ruido que manejan. Es común en estos dispositivos que la señal más
pequeña detectable sea igual o ligeramente menor al ruido ambiente marítimo,
incluso el ruido del hidrófono puede incrementarse si se suma el ruido de los
preamplificadores, algunas veces siendo comparable o superando éste resultado el
ruido ambiente del mar. Para corregir este problema se hacen calibraciones de
sensibilidad de transductor con pruebas en ruidos ambientes marítimos [33].
Existen varios tipos transducción desde la señal en presión a la señal de voltaje, la
más utilizada en estos instrumentos son los materiales piezoeléctricos cerámicos,
principalmente por su facilidad al momento de darles forma. Esto ayuda a construir
numerosas formas de hidrófonos destinados a diferentes fines y propósitos. La
sensibilidad de todo el transductor depende de su encapsulado, de la dirección de
arribo de la señal, del material interno con que esté construido y de la frecuencia.
Por esta razón se manejan varias geometrías de hidrófonos y principios de
transducción dependiendo de la finalidad del dispositivo [33]. Algunos de éstos son:
Hidrófonos esféricos y circular-cilíndricos.
Son probablemente los más comunes, su diseño permite alta sensibilidad, ancho de
banda amplio sin alteraciones de nivel y suavizado en la frecuencia de resonancia.
Generalmente tienen baja impedancia, alta capacidad para soportar presión
hidrostática y son simples en sí mismos. El hidrófono utilizado en éste proyecto
pertenece a este grupo. [33].
Hidrófonos de planar.
Gracias a su forma son utilizados en arreglos de encapsulados cercanos, es decir,
son disposiciones de hidrófonos muy cerca uno del otro. Estos arreglos son usados
comúnmente para proporcionar un haz de captura específico, en otras palabras,
realizar una combinación de hidrófonos para crear un sistema direccional y así
enfatizar una fuente deseada [33].
Hidrófonos de vector.
Los hidrófonos comunes convierten la presión acústica en su análoga señal
eléctrica, pero este dato de presión es un escalar, así que no se cuenta con dirección
de llegada de la señal. Los hidrófonos de vector tienen la capacidad de capturar
magnitud y dirección de la presión, en otras palabras, capturan el vector de presión
33
que arriba a ellos. Este tipo de transductores son útiles a la hora de realizar arreglos
para localización de fuentes ya que se requieren solo dos o tres elementos,
suficientes para capturar la información necesaria [33].
3.3 Marco teórico.
Para el análisis de la señal capturada por el hidrófono es necesario realizar ciertas
operaciones matemáticas sobre la señal pare extraer información de ella. Los
procedimientos de manipulación de señal están descritos en el siguiente marco
teórico, describiendo la transformada de Fourier y sus diferentes formas de
calcularla; también se define qué son las funciones ventanas, cuáles son las más
comunes y por qué se utilizan en el desarrollo de este proyecto, se expondrá el tema
de la correlación y su utilidad para la clasificación de fuentes, por último la sesión
de filtros indica el diseño de los filtros aplicados a la señal capturada. Con las
operaciones matemáticas mencionadas es posible realizar un análisis de la señal y
determinar parámetros y valores de interés para el desarrollo del código.
3.3.1 Procesamiento digital de señales para obtención de firma acústica.
Transformada rápida de Fourier.
La transformada de Fourier es una herramienta para el análisis de componentes en
frecuencia de una señal, su función es transformar la señal del dominio del tiempo
al dominio de la frecuencia y así mostrar todo el contenido en frecuencia que forma
parte de la señal analizada. Dicha transformación es ampliamente usada en campos
como la ingeniería y la física, además es reversible, es decir, puede convertir una
función del tiempo a la frecuencia y de la frecuencia al tiempo. La expresión
matemática para realizar el cambio entre dominios es [34]:
𝐹(𝑤) = ∫ 𝑓(𝑡)𝑒−𝑖𝑤𝑡 𝑑𝑡
∞
−∞
(15)
La transformada de Fourier inversa está representada por la ecuación [34]:
𝑓(𝑡) =1
2𝜋∫ 𝐹(𝑤)𝑒𝑖𝑤𝑡𝑑𝑡∞
−∞
(16)
Generalmente se necesita analizar señales que no se encuentran en el dominio del
tiempo continuo, por ende se debe de hacer un cambio equivalente al tiempo
discreto, se debe tener en cuenta que en la discretización temporal también sufrirán
discretizaciones las frecuencias, así que el cambio debe ser congruente y afectar
34
de igual manera a ambos dominios. Con base en la necesidad anterior se define
entonces la transformada de Fourier discreta (DFT – por sus siglas en inglés):
𝑋(𝑘) = ∑ 𝑥(𝑛)𝑒−𝑗2𝜋𝑘𝑛/𝑁
𝑁−1
𝑛=0
𝑘 = 0,1,2, … ,𝑁 − 1 (17)
Así mismo existe la transformada inversa de Fourier discreta (IDFT-por sus siglas
en inglés):
𝑥(𝑛) =1
𝑁∑𝑋(𝑘)𝑒𝑗2𝜋𝑘𝑛/𝑁
𝑁−1
𝑘=0
𝑛 = 0,1,2, … ,𝑁 − 1 (18)
Las ecuaciones DFT y IDFT tienen un factor en contra y es su largo procedimiento
para el cálculo de cada uno de los factores 𝑘, se debe tener en cuenta que cada
factor 𝑘 es un número complejo, así que hallar su magnitud y su fase es un proceso
engorroso y de mucho consumo en tiempo hasta para computadoras. Si se fuera a
realizar un cálculo directo utilizando la DFT sería necesario [34] :
- 2N2 cálculos de funciones trigonométricas.
- 4N2 multiplicaciones reales.
- 4N(N-1) sumas reales.
Debido a la cantidad de cálculos necesarios para realizar computacionalmente una
transformada o antitransformada de Fourier, se codifican algoritmos con la
capacidad de realizar menor número de cálculos obteniendo los mismos resultados.
Función ventana.
Las ventanas en matemáticas son funciones encargadas de recortar el largo de una
señal para el análisis específico de una de sus partes, así evitar errores de
discontinuidades al principio o final de las señales. Este tipo de funciones son
usadas frecuentemente en el análisis y manipulación de señales, son útiles para
hallar promediados de información de la señal o filtración de datos en la misma.
Aplicar una ventana a una señal consiste solo en multiplicar la señal por la función
de la ventana respectiva, como resultado se tendrá la señal “ventaneada” con los
cambios en ella que la ventana provoque. Las ventanas modifican el espectro en
frecuencia de la señal, por esta razón existen varios tipos de ventanas que producen
en el espectro resultados diferentes, a continuación se presentan los más utilizados
[35].
35
Rectangular:
ℎ(𝑡) = {1 𝑠𝑖 𝑡 ∈ [0, 𝑇]0 𝑟𝑒𝑠𝑡𝑜
(18)
Hanning:
𝑤(𝑛) =1
2[1 − cos (
2𝜋𝑛
𝑁 − 1)] 0 ≤ 𝑛 < 𝑁 (19)
Barlett:
𝑤(𝑛) =
{
2𝑛
𝑁 − 1 0 ≤ 𝑛 ≤
𝑁 − 1
2
2 −2𝑛
𝑁 − 1 𝑁 − 1
2≤ 𝑛 < 𝑁
(20)
Hamming:
𝑤(𝑛) = 0,54 − 0,46 cos (2𝜋𝑛
𝑁 − 1) 0 ≤ 𝑛 < 𝑁 (21)
Blackman:
𝑤(𝑛) = 0,4 − 0,5 cos (2𝜋𝑛
𝑁 − 1) + 0,08 cos (
4𝜋𝑛
𝑁 − 1) 0 ≤ 𝑛 < 𝑁 (22)
donde:
𝑁: es el largo de la ventana a aplicar.
𝑛: son las muestras que entran dentro de la sección de la señal que se desea
ventanear.
El efecto que produce el ventaneo de una señal es mostrado en la Figura 7, con una
ventana rectangular y una hamming comparada con la señal sin ventanear [35]:
36
Figura 7. Muestra del efecto en el espectro en frecuencia de a) Ventana Rectangular, b) Ventana Hamming y c) Espectro exacto. Las ventanas fueron aplicadas con N = 21 [35].
Es apreciable la aparición de lóbulos en frecuencias de la Figura 7 al comparar la
señal exacta con el ventaneo; la disminución de estos lóbulos al aplicar hamming
es considerable, siendo ésta más similar a la señal original. El espectro también se
ve afectado en su amplitud, esto se debe a las características de corte de señal de
cada función ventana. Para la aplicación de ventanas se debe considerar el objetivo
de aplicarla y además el tipo de señal, la utilización de una ventana no adecuada
puede causar resultados inesperados, además por la influencia de cada ventana en
el espectro el resultado será diferente dependiendo de la función utilizada para el
corte.
Derrame Espectral (Spectral Leackage):
La convolución de la función ventada 𝑊(𝑓) con 𝑋(𝑓) produce un suavizado del
espectro de 𝑋(𝑓), sin embargo al convolucionar la señal 𝑋(𝑓) con los lóbulos
laterales de 𝑊(𝑓) produce energía de lóbulos laterales en la señal convolucionada
en frecuencias donde 𝑋(𝑓) = 0, este fenómeno se denomina derrame espectral
[34].
37
Correlación.
La función de correlación o correlación cruzada es una función matemática muy
parecida a la convolución, difiere en que a la señal desplazada no se refleja. Sirve
para comparar dos señales y determinar qué tanto se parecen morfológicamente.
Relaciona la intensidad media de dos señales en un intervalo de tiempo
especificado [34] [36].
Las técnicas de correlación son usadas en varios campos como en detección de
señales de radar/sonar cuando se aplica correlación entre la señal emitida y la señal
recibida de un objetivo, en la medicina cuando los ultrasonidos se usan para
detectar anomalías dentro del cuerpo humano, en comunicaciones, geología,
electrónica, física, entre otros [34] [36].
La correlación cruzada entre dos señales 𝑥(𝑡) y 𝑦(𝑡) está dada por la ecuación (23):
Rxy(t) ≜ 𝑥(𝑡)⨀𝑦(𝑡) = ∫ 𝑥(𝜏)ℎ(𝜏 − 𝑡)𝑑𝜏∞
−∞
= ∫ 𝑥(𝜏 + 𝑡)ℎ(𝜏)𝑑𝜏∞
−∞
(23)
Nótese que cuando 𝑥(𝑡) = 𝑦(𝑡):
Rxx(t) ≜ 𝑥(𝑡)⨀𝑥(𝑡) (24)
Esta es la llamada función de autocorrelación.
|𝑅𝑥𝑥(𝑡)| ≜ |𝑥(𝑡)⨀𝑥(𝑡)| ≤ 𝑅𝑥𝑥(0) (25)
La Ecuación 25, indica que cuando 𝑡 = 0, el valor absoluto de la autocorrelación es
igual o mayor que en cualquier otro instante de tiempo, la correlación en este
instante tiende a una función delta de Dirac [34].
Ahora suponga que se tienen dos señales discretas 𝑥(𝑛) y 𝑦(𝑛), la correlación
cruzada entre ambas señales está dada por:
𝛾𝑥𝑦(𝑙) = ∑ 𝑥(𝑛)𝑦(𝑛 − 𝑙)∞𝑛=−∞ 𝑙 = 0,±1, ±2,… (26)
Donde 𝑙 indica el “lag” o retardo, el cual es el parámetro de desplazamiento de la
señal en el tiempo [35].
38
Filtros IIR.
La implementación de filtros con respuesta infinita al impulso (IIR – por sus siglas
en inglés) son frecuentemente utilizados en el procesamiento de señales. La razón
principal de su uso es la simulación precisa que hacen de los filtros analógicos, que
es un campo del que se tiene un fundamento teórico vasto. Implementar un filtro IIR
requiere las siguientes condiciones [36]:
Calcular los valores de la salida en forma creciente, es decir, desde 𝑛 = −∞
hasta 𝑛 = ∞.
Utilizar los valores ya calculados de la salida para llegar a 𝑦[𝑛].
La Ecuación (27) indica el procedimiento para implementación de filtros IIR:
��[𝑛] = ∑𝑏𝑘
𝐿
𝑘=0
𝑥[𝑛 − 𝑘] +∑𝑎𝑟��[𝑛 − 𝑟]
𝑁
𝑟=1
(27)
donde:
𝑥[𝑛]: es la señal de audio.
𝑎 𝑦 𝑏: son coeficientes que definen el tipo de filtro.
��[𝑛]: es la señal de audio filtrada.
𝑁: número total de muestras de la señal.
𝐿: cantidad de valores previamente calculados.
Siempre que los valores de 𝑥[𝑛] se mantengan disponibles en forma consecutiva y
��[𝑛] se calcule de la misma manera, la operación será finita y se podrá realizar
muestra a muestra [36].
La Ecuación (27) puede ser representada por su función de transferencia, Ecuación
(28):
𝐻(𝑧) =𝑏0 + 𝑏1𝑧
−1 +⋯+ 𝑏𝐿𝑧−𝐿
1 − 𝑎1𝑧−1 −⋯− 𝑎𝑁𝑧−𝑁 (28)
Esta representación racional significa que su respuesta al impulso es una suma de
potencias. Además los coeficientes 𝑎 𝑦 𝑏 representan la caracterización del filtro, es
39
decir, dependiendo del valor que tomen estos coeficientes el filtro implementado
podrá ser Butterworth, Chebyshev u otro [36].
3.3.2 Estimación espectral de potencia.
La estimación de potencia es una parte importante en el algoritmo a desarrollar
porque es por medio de ésta como se diferenciarán las diferentes embarcaciones
que se aproximen. Los métodos expuestos a continuación dan como resultado la
potencia de la señal distribuida por unidad de Hz. De esta manera es posible
determinar cuáles son las frecuencias más representativas de la señal,
distinguiéndolas por su diferencia en niveles de potencia con respecto a las demás
frecuencias.
Teorema de Wiener-Khintchine.
La densidad espectral de energía de una señal, es la transformada de Fourier de su
función de autocorrelación. Esto significa que la función de autocorrelación de 𝑥(𝑛),
siendo 𝑥(𝑛) una señal real, y su densidad espectral de energía contienen la misma
información de la señal, sin embargo ninguna de estas dos funciones posee
información sobre la fase de la señal [34].
𝛾𝑋𝑋(𝑙)𝐹↔ 𝑆𝑋𝑋(𝜔) (29)
Densidad Espectral de Potencia (PSD).
Gran parte de los fenómenos que ocurren en la naturaleza se representan de mejor
manera como señales estocásticas y se caracterizan estadísticamente en términos
de valores medios, sin embargo se desconoce su comportamiento completo.
Cuando de señales aleatorias se trata, la función de autocorrelación representa el
promedio estadístico “apropiado” en el dominio del tiempo; la Transformada de
Fourier de la función de autocorrelación transforma el dominio temporal al dominio
de la frecuencia, donde los valores de magnitud representan la potencia de la señal
por unidad de frecuencia [34]. Ahora, si una señal es determinista, estacionaria y de
tiempo finito, esta posee energía finita y en consecuencia su Transformada de
Fourier existe, por lo tanto la manera de caracterizar este tipo de señales en el
dominio de la frecuencia es mediante la Densidad Espectral de Energía. Pero si se
trata de una señal estocástica o aleatoria estacionaria, no posee energía finita y su
Transformada de Fourier no existe, sin embargo posee potencia media finita, lo cual
40
hace que la manera apropiada de caracterizar este tipo de señales sea mediante la
Densidad Espectral de Potencia [34] [36].
Sea 𝑥(𝑡) una señal aleatoria estacionaria, su función de autocorrelación está dada
por la Ecuación (30) [34]:
𝛾𝑥𝑥(𝜏) = 𝐸[𝑥∗(𝑡)𝑥(𝑡 + 𝜏)] , (30)
donde:
𝐸[], es el operador esperanza o promedio estadístico.
Aplicando el teorema de Wiener-Khintchine, se tiene que:
Γ𝑥𝑥(𝐹) = ∫ 𝛾𝑥𝑥(𝜏)𝑒−𝑗𝜔𝜏𝑑𝑡
∞
−∞
(31)
Sin embargo como el proceso es aleatorio, solo se puede realizar la autocorrelación
sobre una realización del proceso, esto quiere decir que no se conoce 𝛾𝑋𝑋(𝜏) con
exactitud, por lo tanto tampoco se podría conocer la transformada de Fourier, pero
para poder calcularla, se tendría que suponer su ergodicidad, es decir, mirando una
sola realización del proceso desde −∞ a ∞ ya se tiene toda la información del
proceso. Esta propiedad permite que una sola realización del proceso pueda inferir
en el comportamiento estadístico de infinitas realizaciones del mismo [34] [36].
Suponiendo ergodicidad en el proceso, se puede calcular la función de
autocorrelación promediada en el tiempo mediante la Ecuación (32):
𝑅𝑥𝑥(𝜏) =1
2𝑇0∫ 𝑥∗(𝑡)𝑥(𝑡 + 𝜏) 𝑑𝑡𝑇0
−𝑇0
(32)
donde:
𝑇0, es la duración del intervalo observado
𝑅𝑥𝑥, es la función de autocorrelación promediada en el tiempo.
Ahora, por su ergodicidad se tiene que:
𝛾𝑥𝑥(𝜏) = lim𝑇0→∞
𝑅𝑥𝑥(𝜏) = lim𝑇0→∞
1
2𝑇0∫ 𝑥∗(𝑡)𝑥(𝑡 + 𝜏) 𝑑𝑡𝑇0
−𝑇0
(33)
Por último, la transformada de Fourier de la función de autocorrelación promediada
en el tiempo, produce una estimación 𝑃𝑥𝑥(𝐹) de la Densidad Espectral de Potencia.
Ahora, de manera discretizada:
41
𝑟𝑥𝑥(𝑚) =1
𝑁∑ 𝑥∗(𝑛)𝑥(𝑛 + 𝑚) 0 ≤ 𝑚 ≤ 𝑁 − 1
𝑁−𝑚−1
𝑛=0
(34)
𝑃𝑥𝑥(𝐹) = ∑ 𝑟𝑥𝑥(𝑚
𝑁−1
𝑚=−(𝑁−1)
)𝑒−𝑗𝜔𝑚 (35)
Sustituyendo:
𝑃𝑥𝑥(𝐹) =1
𝑁|∑ 𝑥(𝑛)𝑒−𝑗𝜔𝑚𝑁−1
𝑛=0
|
2
=1
𝑁|𝑋(𝑓)|2 (36)
Esta forma de estimar la densidad espectral de potencia es conocida como “El
Periodograma”, el cual sirve para detectar y medir las periodicidades escondidas en
los datos. El periodograma posee una limitante, su varianza, esto se debe a que
para señales aleatorias estacionarias la única manera de caracterizar su
comportamiento en frecuencia es mediante el promediado de un número finito de
datos, esto se hace mediante la aplicación de una ventana ya que la media del
espectro estimado solo es posible convolucionando el verdadero espectro de la
densidad de potencia Γ𝑥𝑥(𝐹) con una función ventana triangular de Barlett (Ecuación
20), lo que conlleva que la media del espectro estimado sufra de suavizado y
derrame espectral, causando así que la estima incremente su varianza [34] [36].
El periodograma en conclusión, no representa a la verdadera densidad espectral de
potencia, sin embargo es una aproximación útil, a medida que se tenga mayor
número de muestras mejor es la estimación, pero a mayor número de muestras,
mayor tiempo de procesamiento, no obstante por su simplicidad computacional es
útil hasta donde el tiempo de procesamiento sea relevante [34] [36].
Métodos no paramétricos para estimación espectral de potencia.
Los métodos no paramétricos para la estimación espectral de una señal son
algoritmos relativamente simples de implementar usando el principio de
funcionamiento de la transformada rápida de Fourier. Pero es necesario disponer
de una gran cantidad de datos para poder lograr una buena resolución en
frecuencia. Estos métodos de procesamiento pueden presentar problemas de
Leakage en frecuencias que podrían enmascarar señales débiles dentro del rango
de análisis útil [37].
42
Los métodos no paramétricos más conocidos son Barlett, Blackman y Tukey y el
método de Welch.
El Periodograma modificado.
La única diferencia que posee con el periodograma es una modificación en el cálculo
del espectro estimado, se convoluciona el verdadero espectro de la densidad de
potencia Γ𝑥𝑥(𝐹) con una ventana arbitraria 𝑤(𝑛) con duración 𝑀, esto permite que
se pueda elegir la ventana en función del ancho del lóbulo principal y el nivel de los
secundarios [34].
Está dado por la Ecuación (37):
��𝑥𝑥(𝑓) =1
𝑀𝑈|∑ 𝑥(𝑛)
𝑀−1
𝑛=0
𝑤(𝑛)𝑒−𝑗2𝜋𝑓𝑛|
2
(37)
Donde M representa un factor de solapamiento, U es un factor de normalización
para la potencia de la función ventana 𝑤(𝑛).
Método de Welch.
También llamado método de WOSA (Weighted Overlapped Segment Averaging)
Promedio Ponderado del Solapamiento de Segmentos. El método de Welch permite
reducir la varianza del periodograma. En estadística una manera de reducir la
varianza es mediante el promedio. Si en vez de tomar un solo periodograma se
promediara un determinado número de ellos se mejoraría la estima de la densidad
espectral de potencia y la varianza se reduciría [36].
Consiste en realizar el periodograma varias veces sobre un conjunto de datos
diferentes pertenecientes a la misma señal. La Figura 8 muestra un esquema del
funcionamiento del método de Welch, y la Figura 9 ilustra una variación del método,
denominado método de Welch Modificado [36].
Los datos se pueden representar mediante la expresión:
𝑥𝑖(𝑛) = 𝑥(𝑛 + 𝑖𝐷) (38)
𝑛 = 0,1, … ,𝑀 − 1 ; 𝑖 = 0,1, … , 𝐿 − 1
donde:
𝑖𝐷, representa el punto de inicio de la i-ésima secuencia.
43
𝐷, representa el factor de solapamiento.
El periodograma modificado está dado por la Ecuación (39):
��𝑥𝑥(𝑖)(𝑓) =
1
𝑀𝑈|∑ 𝑥𝑖(𝑛)
𝑀−1
𝑛=0
𝑤(𝑛)𝑒−𝑗2𝜋𝑓𝑛|
2
, 𝑖 = 0,1, … , 𝐿 − 1 (39)
Luego la estima de Welch de la potencia espectral consiste en el promedio de los
periodogramas modificados, la Ecuación (40) es el promedio del periodograma
modificado Ecuación (39).
𝑃𝑥𝑥𝑊(𝑓) =
1
𝐿∑��𝑥𝑥(𝑓)
𝐿−1
𝑖=0
(40)
44
Figura 8. Estimación de la Densidad Espectral mediante el método de Welch o WOSA [35].
Figura 9.Estimación de la Densidad Espectral mediante el método de Welch Modificado [35].
45
Métodos paramétricos.
Tienen la característica de que extrapolan valores de la auto correlación, la cual solo
es posible teniendo información de cómo se generaron los datos. La densidad
espectral de potencia se calcula a partir de la construcción de un modelo para
generar la señal con unos parámetros estimados. No requieren el uso de ventanas
debido a la técnica de modelad el cual al no utilizar la transformada de Fourier evita
que ocurra el fenómeno de derrame espectral, proporcionando mayor resolución en
frecuencia y disminuyendo la varianza a comparación de los métodos no
paramétricos. El modelo se halla mediante la implementación de filtrado lineal para
encontrar los parámetros 𝑎𝑘 y 𝑏𝑘 de una función de transferencia, introduciendo
una señal de referencia conocida (Ruido Blanco). Los modelos comúnmente
utilizados son [34]:
Proceso autoregresivo de medias móviles (ARMA)
Proceso autoregresivo (AR)
Proceso de medias móviles (MA)
Para la detección de fuentes sonoras en el océano se usan algoritmos tipos DOA
(Direction of arrival) como lo son MUSIC, ESPRIT Y ROOTMUSIC. En términos
generales la resolución de los algoritmos tipos DOA mejoran con el número de
capturas de la señal, número de elementos en el arreglo de captura e incremento
de la relación señal-ruido [22] [38].
Figura 10. Clasificación de los métodos del análisis espectral.
46
3.3.3 Sonares.
Sonar pasivo.
La ecuación de sonar pasivo se basa en la relación de potencia señal a ruido e
incluye los cambios que sufre la onda sonora por efectos de la pérdida de
transmisión en el camino fuente-receptor, el nivel de ruido ambiental, el nivel de
presión sonora producido por la fuente y el índice de directividad que indica la
ganancia del arreglo receptor. El parámetro de ganancia del arreglo es una ganancia
en dB de la relación señal a ruido comparativamente con un único hidrófono
direccional. La directividad y la ganancia del arreglo son parámetros idénticos. La
ecuación de sonar pasivo se describe de acuerdo a la Ecuación 41 [22] [25].
𝑆𝑁𝑅 = 𝑆𝐿 − 𝑇𝐿 − 𝑁𝐿 + 𝐷𝐼 (41)
donde:
SNR es la relación señal a ruido en dB.
SL es el nivel de señal radiado por la fuente en dB.
TL es la perdida de transmisión sonora en dB.
NL es el nivel de ruido total en dB.
DI es el índice de directividad del receptor en dB.
La relación señal a ruido se define como la relación existente entre el nivel de señal
transmitida por la fuente y el nivel de ruido total en dB, está dada por la Ecuación
(42):
𝑆𝑁𝑅 = 10 log ( 𝑆
𝑁) (42)
El nivel de señal radiado por la fuente se define según la Ecuación (43) para un nivel
de intensidad sonora de referencia en el agua de 𝐼𝑜 = 0.67𝑥10−18(𝑊
𝑚2):
𝑆𝐿 = 20𝑙𝑜𝑔 (𝐼
𝐼𝑜) (43)
La pérdida de propagación corresponde a la relación entre el nivel de intensidad
emitida por la fuente Ie y el nivel de intensidad recibida Ir según la Ecuación (44):
𝑇𝐿 = 10 log (𝐼𝑒
𝐼𝑟) (44)
47
El nivel de ruido NL es el nivel de intensidad de ruido para un nivel de intensidad de
referencia 𝐼𝑟𝑒𝑓 = 0.67𝑥10−18(𝑊
𝑚2)y está definido por la Ecuación (45):
𝑁𝐿 = 20 log (𝐿𝑟𝑢𝑖𝑑𝑜
𝐿𝑟𝑒𝑓) (45)
El índice de directividad DI esta dado según la Ecuación (46) donde 𝐼𝑜𝑚𝑛𝑖 es la
intensidad del ruido medida en un sensor omnidireccional e Idir es la intensidad del
ruido medida en un sensor direccional.
𝐷𝐼 = 𝐴𝐺 = 10𝑙𝑜𝑔 (𝐼𝑜𝑚𝑛𝑖
𝐼𝑑𝑖𝑟) (46)
La Ecuación (41) expresa que cuando una señal es radiada desde una fuente el
nivel de señal disminuye por efecto de la perdida de transmisión sonora del medio,
el nivel de ruido en el receptor degrada la señal recibida mientras que el factor de
directividad en el receptor mejora la relación señal a ruido del sistema [22] [25].
Sonar activo.
La ecuación de sonar activo tiene en cuenta que cuando una señal es emitida por
la fuente ésta se propaga hacia los obstáculos, se refleja y luego se transmite el
receptor. Estas reflexiones ocasionadas por el medio producto de choques de la
onda sonora con el fondo o las superficies marinas generan un nivel de ruido
adicional llamado ruido reverberante. La ecuación de sonar activo se presenta de
tres formas monoestática, biestática y multiestática siendo la monoestática la más
usada por su simplicidad como lo muestra la Ecuación (47) [22] [25].
𝑆𝑁𝑅 = 𝑆𝐿 − 2𝑇𝐿 + 𝑇𝑆 − 𝑁𝐿 + 𝐴𝐺 (47)
donde:
SNR es la relación señal a ruido en dB.
SL es el nivel de la fuente en dB.
TL es la perdida de transmisión en el medio en dB.
TS es la habilidad de un blanco para producir eco en dB.
NL es el nivel de ruido total en dB.
AG es el índice de directividad en dB.
48
TS por sus siglas en ingles de Target Strength se define como una relación entre la
intensidad acústica reflejada y la intensidad de la onda incidente, y está dada por la
Ecuación (48):
𝑇𝑆 = 10𝑙𝑜𝑔 (𝐼𝑟
𝐼𝑖) (48)
En la Ecuación (47) se tiene en cuenta el nivel de la fuente, la pérdida de
transmisión, la habilidad de la fuente de producir eco sobre cualquier obstáculo, el
nivel de ruido total y el factor de directividad del arreglo receptor [22] [25].
Firma Acústica
Una firma acústica es la caracterización en frecuencia de una fuente. Todas las
fuente acústicas poseen una distribución en frecuencia que las hace diferenciables,
esto depende de sus cualidades físicas y su modo de generación de sonido. La
forma y velocidad de propagación influyen en la manera en que la señal acústica es
captada por un receptor.
Para diferenciar embarcaciones que tengas espectros en frecuencia similares se
utilizan a menudo factores como niveles máximos, frecuencias principales,
relaciones entre picos relevantes, entre otros, que ayuden a distinguir una
embarcación de otras. También se ha usado el concepto de firma acústica para
calcular parámetros que representan cantidad de bajas frecuencias, medias y altas
en la música, permitiendo esto distinguir entre géneros musicales según los
resultados de dichos parámetros.
Los parámetros de diferenciación pueden ser obtenidos realizando operaciones
matemáticas que permitan una distinción entre espectros similares de fuentes
diferentes. La diferenciación se puede obtener de distintos procesos en el dominio
de la frecuencia, tales como transformada de Fourier, transformada corta de
Fourier, densidad espectral de potencia, espectrogramas, cepstrum, entre otros.
49
4. Desarrollo del trabajo.
4.1 Descripción del Algoritmo y procedimiento de obtención de datos.
El procedimiento para el desarrollo del algoritmo se compuso principalmente de
cuatro partes: 1. Grabación de lanchas, 2. Codificación del código, 3. Prueba de
funcionamiento del código y 4. Corrección del mismo. Las secciones de grabación
y codificación se realizaban en días diferentes; teniendo en cuenta las señales
grabadas, un análisis posterior de éstas y con base en los resultados codificar el
algoritmo. Las secciones de prueba y corrección se hacían en simultáneo desde
que el error a corregir fuera puntual, si esto no era posible se anotaban los errores
mostrados por el código y se corregían luego, considerando someterlos a prueba
nuevamente en la próxima salida de campo.
4.1.1 Grabación de embarcaciones.
Lugar de grabación de la firma acústica.
Piscina Fray Pablo Castillo Nova, sede Salento (Bello-Antioquia) de la Universidad
de San Buenaventura. Las dimensiones de la piscina son: 50m de largo, 25m de
ancho y 2,4m de profundidad.
Instrumentos utilizados.
Hidrófono RESON TC4032.
Cable para hidrófono RESON TL8140 de 10m.
Interfaz de audio Sound Devices USB Pre 2.
Software de grabación Audacity.
Batería voltaje directo 12V/2,3A Mtek.
Multímetro UNI-T UT 132C.
Dos lanchas de prueba; lancha Verde y Amarilla (ver Tabla 1) para
adquisición de firmas acústicas y validación del algoritmo.
Cinta métrica.
Computador portátil.
Flotador de piscina.
Mancuernas de 3Lb.
Hilo de nylon.
50
Tabla 1. Descripción de las embarcaciones de prueba.
Embarcación Referencia
Embarcación marca Hot Racing
ref DR-6 (dos motores)-
“Lancha 01”
Embarcación Speed Up Racing
Ref 01 (dos motores) – “Lancha
02”
4.1.2 Procedimiento de grabación.
Establecimiento de la ganancia de la interfaz Sound Devices: se dispuso a
grabar la señal de la lancha por medio del hidrófono a una distancia cercana. El
transductor estaba a poca profundidad de la superficie (solo estaba sumergido
hasta la totalidad del cuerpo del hidrófono), se posicionó cerca de superficies
reflectantes y se aceleró la lancha verde anclada al lado del hidrófono. Con las
anteriores condiciones de trabajo se establece un nivel de ganancia en la perilla de
la interfaz donde la señal no sea distorsionada por nivel. Cualquier otra condición
de trabajo será entonces con menor intensidad de señal en el hidrófono. El nivel
establecido se da cuando el indicador de la perilla está en el medio de los puntos 3
y 4 (contando de izquierda a derecha) marcados en la interfaz (ver Figura 11).
Figura 11. Nivel de pre-amplificación para la señal capturada por el hidrófono.
51
Ubicación del hidrófono para la medición: el transductor se dispone con el
flotador de piscina de tal forma que permita el control de profundidad del hidrófono.
Se hace el arreglo a 12,5m de las paredes laterales y a una distancia de 5,2m de
otra superficie reflectante. Para evitar el desplazamiento del flotador a causa del
movimiento del agua éste se ancló con las mancuernas al fondo de la piscina, para
este anclaje se utilizó el nylon (ver Figura 12):
Figura 12. Arreglo para anclaje del hidrófono. Con los círculos rojos se indican las mancuernas.
Toma de grabaciones: para la grabación de la señal se definen primero las
distancias a las que pasará la lancha del hidrófono. Luego de medir la distancia
entre la superficie reflectante y el hidrófono (5,2m) se suma a esta medida 1m, 2m,
4m y se señalan a ambos costados de la piscina. Luego se dispone la lancha sobre
la marca correspondiente a 1m y al otro costado de la piscina algún objeto sobre la
marca de igual distancia, este con el fin de dirigir la lancha en una línea recta – o lo
mejor posible – de un lado a otro. Vale la pena aclarar que la lancha cruzó la piscina
a lo ancho (ver Figura 13).
Figura 13. Distancias para la toma de datos. El punto rojo simboliza el hidrófono y la flecha la dirección de paso de la lancha.
52
El procedimiento anterior se repitió para los pasos de 1m, 2m y 4m de distancia al
hidrófono; cada paso de lancha a dos profundidades del transductor: 0,8m y 1,5m.
El mismo método para lancha Verde y Amarilla. Se tomaron grabaciones a
diferentes distancias del hidrófono para posteriormente realizar un análisis de
pérdida de nivel de la señal a causa del alejamiento de la fuente al transductor. Esta
información será útil al momento de estimar la distancia a la cual se desplazó la
embarcación tomando como referencia el lugar donde se encuentra el hidrófono. La
Figura 14 muestra el diagrama de flujo para la obtención de datos de las diferentes
embarcaciones.
Para determinar la localización de la embarcación es necesario realizar un arreglo
virtual de dos hidrófonos. Para este paso es necesario contar con una separación
específica que dependerá de la frecuencia mínima de utilidad del arreglo. Al
necesitar la velocidad de sonido en el agua y ésta depender de la temperatura se
hace la medición correspondiente en la piscina usando el multímetro, el resultado
fue: 24°C. (Ver Figura 15)
54
Figura 15. Medición de temperatura en la piscina.
4.1.3 Codificación del algoritmo con base en el protocolo BPMN.
El protocolo BPMN (siglas en inglés de Business Process Model and Notation) [39],
es una notación gráfica estandarizada que permite modelar y explicar diferentes
procesos. Es usado en áreas como los negocios, los procesos industriales y en
programación para especificar el flujo de un código dado. La Figura 14 es un
ejemplo de un proceso ilustrado por medio del BPMN, mostrando al tiempo las
figuras usadas y su significado dentro del protocolo.
Proceso BPMN Algoritmo de detección.
Necesidad:
SIDACAM es un macro proyecto que nace de la necesidad de control y guardia en
zonas costeras del territorio colombiano por parte de la fuerza naval nacional. El
algoritmo desarrollado en este proyecto aportará al avance de SIDACAM en el
ámbito de la detección, clasificación y localización de fuentes a través de un
hidrófono. El código propuesto en el presente trabajo tendrá la capacidad de indicar
qué tipo de lancha ha pasado cerca al hidrófono (dispuesto en un lugar específico)
e indicar una distancia aproximada a la cual ha pasado la embarcación de la zona
de interés.
El algoritmo debe funcionar de manera eficiente y precisa, estos conceptos se
refieren a la rapidez con la cual debe hacer los cálculos respectivos para dar
respuesta, además de obtener una cantidad mínima de falsas alarmas (errores en
la clasificación) para evitar despliegues de operación innecesarios.
55
Actividades:
Proceso de reingeniería a un código de clasificación previamente
proporcionado: Se debe adecuar los parámetros de éste algoritmo para que sea
funcional con las condiciones en las cuáles se podrá a prueba. Para esta actividad
se requiere la grabación de firmas acústicas en condiciones controladas y con base
en dichas grabaciones cambiar los valores de cálculo para hacerlo efectivo.
Puesta a prueba del algoritmo rediseñado: luego de modificar los parámetros de
operación del algoritmo de clasificación se pondrá a prueba con diferentes señales
de entrada al sistema (lanchas a control remoto). El código debe advertir si se ha
detectado una embarcación cerca al hidrófono y deberá entregar una distancia
aproximada basada en información de umbrales.
Codificación del algoritmo de localización: para comenzar a desarrollar ésta
parte del trabajo se debe tener en correcto funcionamiento la sección de
clasificación. A continuación se graban trayectorias de la lancha con diferentes
posiciones de hidrófono con intención de manejar así un arreglo virtual de dos
hidrófonos; como opción alternativa está el aplicar un proceso de retraso a la señal
grabada para que parezca retrasada en el tiempo y suponer dicha señal como la
que llega a un “segundo” hidrófono. Teniendo listas las grabaciones se procede a la
codificación del algoritmo con base en la teoría encontrada en la revisión
bibliográfica. Vale la pena aclarar que con un solo hidrófono solo se puede dar una
estimación de la distancia a la cual la embarcación cruzó, sin embargo en código se
puede hacer una prueba como si existiesen dos señales y efectivamente mostrar si
la lancha pasó por un lado A o un lado B a X distancia.
Puesta a prueba del algoritmo de localización: en este parte del proceso se
verifica el funcionamiento del algoritmo de localización anotando sus aciertos y
errores. Se tendrá en consideración el tiempo de ejecución previo a dar respuesta
y la exactitud de la respuesta, es decir, qué tan preciso es su cálculo del ángulo de
arribo de la señal. Esta parte solo se podrá hacer en código, es decir, no se
implementará en la realidad puesto que no se cuenta con un segundo hidrófono
para someter el algoritmo a prueba.
Acople y funcionamiento de las secciones de clasificación y localización: en
este punto del proyecto se dispondrán ambos códigos (clasificación y localización)
como un único algoritmo. Con la anterior condición cumplida se someterá a prueba
el código esperando como respuesta la distinción de la lancha que ha pasado cerca
al hidrófono al tiempo que discrimina el lado en que pasó.
56
A continuación se muestran el diagrama de flujo correspondiente al código de
detección, clasificación y localización (Figura 16).
Figura 16.Diagrama de flujo del algoritmo de detección clasificación y localización de fuentes.
57
Interacciones con el código:
El algoritmo estará soportado en una computadora la cual cuenta con una interfaz
de audio a la cual se conecta el hidrófono. Este sería el ensamble físico para la
operación del código (Figura 17)
Figura 17. Flujo de conexión para el funcionamiento del algoritmo.
El orden de sucesos e interacciones en el algoritmo son los siguientes:
Condiciones iniciales: firma acústica de la lancha que se desea detectar grabada
en la memoria del algoritmo; hidrófono colocado bajo el agua (piscina en este caso)
en el punto donde se hará la prueba de funcionamiento; verificar que a la
computadora llegue señal por medio de la interfaz de audio y el hidrófono.
Funcionamiento: La embarcación a detectar realiza un recorrido cerca de la zona
donde se encuentra sumergido del hidrófono, la lancha provocará un ruido
característico que el hidrófono convertirá en señal eléctrica y luego la interfaz la
transformará en señal digital; esta es la que entra en primer contacto con el
algoritmo. A continuación al código compara la señal que llega con las firmas
acústicas previamente almacenadas, si coincide en su contenido en su morfología
y componentes en frecuencia además de poseer una diferencia señal a ruido que
supere el umbral de detección (previamente establecido en el interior del código)
entonces se indicará la advertencia que la lancha deseada ha sido detectada. Luego
con la misma información que llegó al hidrófono se procede a la localización de
arribo de la señal a través de un proceso matemático del cual se encargará el
algoritmo.
Información de salida: el algoritmo mostrará en la pantalla de la computadora si la
lancha grabada corresponde a alguna firma acústica previamente almacenada,
además de indicar el lado al cual llegó la señal. Esta información será vista por una
58
persona encargada de observar los resultados que arroja el algoritmo cada vez que
este se ponga en funcionamiento.
Caso de no detección: si el algoritmo compara la señal que llega y no es similar a
la almacenada en la base de datos mostrará un mensaje indicando que no hubo
detección alguna y no continuará con la parte de localización.
La Tabla 2 y la Tabla 3 describen los requerimientos funcionales y no funcionales
respectivamente del algoritmo de detección, clasificación y localización.
Tabla 2. Requisitos funcionales
Requerimientos funcionales.
ID. Nombre. Descripción. Prioridad. Usuario.
1 Software Matlab.
Se requiere el software Matlab.
Plataforma en la cual se desarrolló el
algoritmo.
Alta Personal pendiente del código y sus resultados.
2 Computadora.
Es necesaria una computadora con el
software Matlab instalado, además debe contar con
entradas USB para las interfaces de audio.
Alta Personal pendiente del código y sus resultados.
3 Archivos código.
Cada una de las partes del código
debe estar para su correcto
funcionamiento. Porque del resultado
de una sección depende la próxima.
Alta
Personal final a usar el código. Se recomienda
asesoría de los programadores.
4
Densidad espectral de
potencia. (PSD).
Es una operación matemática para
indicar la potencia de la señal por frecuencia.
Alta Algoritmo internamente.
5 Filtros
Son utilizados para la caracterización de
frecuencias principales.
Alta Algoritmo internamente.
6 Correlación y comparación.
Comparación de la morfología de la señal
grabada para Media Algoritmo internamente.
59
comparar con las firmas almacenadas.
7 Filtros y PSD.
Se repite el proceso para la señal
capturada y así dar un porcentaje de
seguridad sobre la embarcación detectada.
Alta Algoritmo internamente.
8 Correlación y localización.
Se repite la función de correlación para
identificar la localización de la
señal (arreglo virtual).
Alta Algoritmo internamente.
Tabla 3. Requerimientos no funcionales
Requerimientos no funcionales.
ID Nombre Descripción Prioridad Usuario
1 Interfaz
de audio.
Es necesaria una interfaz de audio que convierta la
señal de voltaje del hidrófono en una señal
digital.
Alta
Personal pendiente del código y sus resultados.
2 Hidrófono Transductor encargado de
capturar la señal de la embarcación bajo el agua.
Alta
Personal pendiente del código y sus resultados.
3 Cable
hidrófono.
Elemento encargado de transportar la señal del
hidrófono hasta la interfaz.
Alta
Personal pendiente del código y sus resultados.
4 Batería de 12V
DC
Elemento encargado de la alimentación eléctrica del
hidrófono Alta
Personal pendiente del código y sus resultados.
5 Lancha.
Encargada de generar el sonido para detección,
además de ser el objetivo a discriminar.
Media Personal quien
maneje la embarcación.
60
4.1.4 Pruebas de funcionamiento del código.
Las pruebas de funcionamiento del algoritmo se realizaron en la misma piscina
donde se realizaron las grabaciones. Se realizaban tanto en condiciones de
grabación de la lancha como en condiciones diferentes semejándose más a la
realidad, es decir, se pasaba la lancha a distancias diferentes a 1, 2 y 4m, con
trayectoria diagonal al hidrófono, a diferentes velocidades o con diferentes pesos
para así mirar la respuesta del código bajo variadas condiciones de funcionamiento
de la lancha.
Durante las pruebas se tomaban diferentes anotaciones con respecto al tiempo de
respuesta del código para dar resultados; qué cantidad de resultados eran los
esperados y cuáles no; cantidad de falsas alarmas y factores externos que podrían
modificar la respuesta del algoritmo (como proximidad del hidrófono a superficies
reflectantes). Se determinaban cuál de las variables que afectaban el resultado del
hidrófono eran momentáneas o cuales de funcionamiento normal, esto era útil al
modificar el algoritmo para hacerlo más adecuado al medio de prueba. Por último
se hacían apuntes de qué posiblemente era el error del código y cómo se podría
corregir, así pasar posteriormente a la etapa de corrección.
4.1.5 Corrección del código.
Las correcciones y modificaciones del código se realizaban al momento de
corroborar su funcionamiento siempre y cuando el problema fuera algo exacto y de
fácil detección al momento de la prueba. Ah no ser así, las correcciones se hacían
días diferentes, eso alargaba un poco el procedimiento porque se debía esperar la
próxima salida de campo para verificar si las correcciones efectuadas fueron
pertinentes y correctas.
Esta sección en el desarrollo del código fue importante porque ayudaba a la
optimización del algoritmo y a la reducción de errores y falsas alarmas, además se
notó la posibilidad de dar un plus al código donde no solo determinaba si una lancha
era o no era la pre-grabada, sino de contar con unas grabaciones previas de varias
lanchas y al pasar alguna determinar cuál de las ya grabadas era la lancha
detectada.
Después de realizar las correcciones y las pruebas necesarias, se somete el
algoritmo a una prueba final, donde debe indicar qué lancha pasó y a qué distancia
aproximadamente, además de mostrar un porcentaje de acierto en la lancha
detectada. Los resultados de estas pruebas fueron satisfactorios.
61
4.2 Consideraciones para la extracción de una firma acústica
4.2.1 Comparación entre FFT y PSD.
Uno de los interrogantes que se hicieron para poder realizar el análisis de la firma
acústica fue saber de qué manera se analizarían las características espectrales de
la lancha. Para ello se realizó una prueba entre la Transformada Rápida de Fourier
(FFT) y la Densidad Espectral de Potencia (PSD) analizando un recorrido de la
lancha en diferentes intervalos de tiempo. El recorrido que se capturó fue
segmentado mediante el software Protools en 9 instantes de igual duración, y
posteriormente se hizo el análisis con los diferentes métodos. La Figura 18 muestra
los resultados obtenidos mediante la FFT y la Figura 19 muestra los resultados
obtenidos mediante la PSD.
En la Figura 18.a se observa la FFT del recorrido completo y la Figura 18.b
igualmente muestra los resultados de la FFT para cada uno de los 9 segmentos. Se
tomó como referencia las frecuencias de 820.3 Hz y 1266 Hz, las cuales presentan
un pico de amplitud máxima para el recorrido completo, sin embargo se puede
apreciar en la Figura 18.b que en la mayoría de los instantes de tiempo 820.3 Hz
no corresponde a un máximo, solo se cumple en los instantes 1, 5 y 8, mientras que
en los demás instantes para esta frecuencia se llega a un valor intermedio o
inclusive mínimo, como en el instante 6, de igual manera la frecuencia de 1266 Hz
sólo es máxima en el instante 3, 6 y 7, en los demás instantes posee una amplitud
intermedia o mínima, como en el instante 2,5,8,9. Lo anterior demuestra que
usando la FFT las componentes en frecuencia de la firma de la lancha varían con
los instantes de tiempo, esto se debe a que la FFT es una medida de la amplitud de
las componentes espectrales presentes específicamente en ese intervalo de
tiempo, razón por la cual cualquier evento inesperado podría alterar la estimación,
además a pesar de la variación en frecuencia en la que se presentan diferentes
máximos de amplitud existen cancelaciones significativas, a causa de que la
magnitud de la FFT es dependiente de la fase y sensible a condiciones del medio
como distancias lancha-hidrófono, esto causa que ciertas frecuencias asociadas a
dicha separación se encuentren en contrafase y por lo tanto se cancelen.
Por otro lado en la Figura 19 se muestra la Densidad Espectral de Potencia en cada
uno de estos instantes. Se percibe que en cada segmento de tiempo, los máximos
de potencia de la señal se dan siempre en la misma frecuencia y entre ellos solo
existen variaciones de nivel, por esta razón al buscar las características y el
comportamiento en frecuencia propio de la fuente es preferible utilizar la Densidad
Espectral de Potencia.
62
Figura 18. a) FFT para un Recorrido Completo. b) Análisis espectral en diferentes instantes de tiempo mediante el uso de la FFT.
63
Figura 19. Análisis espectral de diferentes instantes de tiempo mediante el uso de la PSD.
Ahora bien, existe una razón teórica por la cual es preferible utilizar la Densidad
Espectral de Potencia en vez de la transformada de Fourier, y todo parte desde la
naturaleza de la señal. La señal que se está grabando corresponde a un paso de la
lancha a una distancia conocida, sin embargo es imposible predecir
matemáticamente el suceso y existen variables que aseguran la aleatoriedad de la
señal, condiciones físicas tales como temperatura, velocidad del viento, cambios del
ruido ambiente, eventos inesperados, cambios de dirección de la lancha, diferente
funcionamiento de los motores, distancias variables entre la lancha y el sensor, lo
cual hace que el evento sea aleatorio. En consecuencia no sería correcto determinar
el comportamiento espectral mediante la transformada de Fourier, ya que al tratarse
de una señal aleatoria su energía, en teoría, es infinita y por lo tanto no se podría
hallar, no obstante la manera correcta de caracterizar el espectro en frecuencia de
la señal es mediante la Densidad Espectral de Potencia, sin embargo se calcula
mediante un método no paramétrico (Welch) y no representaría el verdadero
espectro de densidad de potencia, pero sería una aproximación cercana y viable
considerando tiempos de computación y facilidad del algoritmo. Es cierto también
que entre más duración tenga la señal, mejor estimación de la Densidad Espectral
de Potencia, sin embargo en la Figura 19 se utilizaron segmentos de duración muy
corta, menos de un segundo por instante, y se alcanzan a apreciar los picos
máximos a pesar de su baja resolución.
64
4.2.2 Análisis espectral de los motores.
La propulsión de las embarcaciones utilizadas se debe a la acción de dos motores
eléctricos. Cuando el recorrido de las lanchas es hacia adelante los dos motores
funcionan a la par, pero cuando se dispone a dar dirección, ya sea a la izquierda o
la derecha, uno de los motores, el contrario al sentido de dirección, se detiene o
disminuye considerablemente su velocidad de rotación. En condiciones ideales, los
dos motores deben ser exactamente iguales, sin embargo en la práctica se percibe
que la velocidad de rotación es diferente en cada uno de los motores, razón por la
cual se realizó un análisis espectral independiente para cada uno de los motores, y
uno cuando ambos motores se encontraban funcionando al mismo tiempo. La
Figura 20 y la Figura 21 muestran el comportamiento en frecuencia de cada motor
en ambas embarcaciones, para la lancha amarilla y la lancha verde
respectivamente.
Figura 20. Análisis espectral de los motores de la lancha amarilla.
En la Figura 20, se nota que el motor izquierdo en la frecuencia de 1230 Hz posee
un pico característico, sin embargo presenta un desplazamiento en frecuencia y
menor intensidad con respecto al motor derecho, cuyo máximo se encuentra en
1172 Hz, lo que a su vez traduce en que el motor izquierdo posee menor velocidad
de rotación que el motor derecho. Cuando ambos motores funcionan al mismo
tiempo el pico máximo se presenta en 1195 Hz.
65
Figura 21. Análisis espectral de los motores de la lancha amarilla.
En el caso de la lancha verde (Ver Figura 21), es evidente el cambio en intensidad
en uno de los motores, el motor izquierdo en nivel se encuentra por debajo del
motor derecho, sin embargo se puede apreciar que se conserva una relación entre
frecuencia y nivel para ambos. En el motor derecho se presenta un máximo en 796
Hz, este mismo máximo para el motor izquierdo se encuentra en 843.8 Hz, de igual
forma se cumple para 1066 Hz en el derecho y 1113 Hz en el izquierdo, y en general
siempre se nota un corrimiento en frecuencia entre los dos motores, lo cual indica
que el motor izquierdo posee mayor velocidad de rotación que el motor derecho.
Al momento de realizar una medición donde se requería que la lancha permaneciera
fija en un punto (anclada), como en el caso del análisis de los motores, se percibía
auditivamente que la lancha realizaba un mayor esfuerzo para poder avanzar. Por
ende se realizó un análisis entre las lanchas ancladas en un punto y un recorrido a
la misma distancia al hidrófono en la que se realizó el anclaje.
66
Figura 22. Comparación de la Lancha Amarilla Anclada y en Recorrido.
Se alcanza a apreciar en la Figura 22 que cuando la lancha amarilla se encuentra
anclada se percibe una componente en frecuencia en 1195 Hz, no obstante cabe
decir que en esta grabación la mayor parte del tiempo los motores se encontraron
inmersos percibiéndose en mayor medida esta frecuencia del motor, mientras que
en el recorrido la lancha no se sumerge lo suficiente generando ruido por las
burbujas que se crean en la superficie del agua, haciendo que este tipo de ruido
esté presente la mayor parte del tiempo. Se puede apreciar que entre 500 Hz y 1000
Hz se presenta un incremento de intensidad debido a este fenómeno hidrodinámico
en el que la hélice se encuentra en contacto permanente entre los dos medios, agua
y el aire, generando así aireación, la cual viene asociada a un ruido característico
debido a la densidad de las burbujas producidas (sección 4.1.2.7) [31].
67
Figura 23. Comparación de la Lancha Verde Anclada y en Recorrido.
En el caso de la lancha verde (Figura 23) se presentó un comportamiento contrario
al de la lancha amarilla. Cuando la lancha se encontraba anclada, la medición
presentó en gran medida aireación, por lo que se puede apreciar que hay un
incremento de nivel más que todo a baja frecuencia, mientras que en el recorrido el
ruido por la aireación se presenta pero no en la misma proporción, esto es debido a
la velocidad de la lancha. Cuando la lancha presenta mayor velocidad se da una
inclinación de la parte delantera, haciendo que los motores se encuentren más
inmersos en el agua, esto conlleva a una relación menor entre agua y aire en la
hélice, causando que la densidad de burbujas generadas por aireación sea menor,
y en consecuencia menor generación de ruido [31].
4.2.2.1 Ruido generado por el fenómeno de aireación
La generación de ruido por una embarcación en el agua no solo se debe por la
interacción del motor con el agua, hay otros factores que intervienen, como el paso
de la embarcación en el agua, que produce ruido hidrodinámico. El origen del ruido
se puede dividir en dos, origen cavitante y no cavitante, el primero hace referencia
a fenómenos de cavitación en las palas, colapso de burbujas, torbellinos. El no
cavitante se refiere a ruido generado por desplazamiento del agua por acción de las
palas de la hélice, interacción hélice y flujo de agua del alrededor, la estela vorticial
o turbulencia que genera la aireación [40].
También interviene la velocidad, cuando una embarcación va con una velocidad
baja produce mayor densidad de burbujas que cuando va más rápido, esto se debe
a que cuando presenta mayor velocidad los motores se sumergen más a causa de
68
la inclinación que presenta el cuerpo de la embarcación Figura 24a, produciendo
así menos aireación, pero cuando la embarcación tiene poca velocidad no se
produce mucha inclinación, haciendo que la densidad de burbuja sea poca (ver
Figura 24b) y afecte directamente las intensidades de la firma acústica [31].
Figura 24. Comportamiento de la densidad de burbuja con respecto a la velocidad [12].
Para determinar la contribución en frecuencia que aporta la aireación del agua sobre
la firma acústica, se realizó una medición con la lancha anclada en un punto,
realizando presión sobre ella con el fin de no generar aireación por el contacto con
la superficie del agua, de igual manera se realizó otra toma en el mismo punto
permitiendo el contacto de las hélices con la superficie, generando así ruido por
aireación. En la Figura 25 se observan diferentes tomas con y sin ruido por
aireación.
Figura 25. Efectos de la aireación sobre las frecuencias características de la fuente.
69
Se observa que existen frecuencias en común en ambos casos, donde se mantiene
un mismo nivel de potencia, como en las frecuencias 832, 1061, 1529, 1857 Hz
entre otras a frecuencias altas. Sin embargo la señal con ruido presenta mayores
niveles de potencia a frecuencias bajas, además de algunos picos que no se
encuentran presentes en la señal de la lancha anclada como en 568.4 y 679.7 Hz y
algunos incrementos de la potencia de la señal entre 1 y 2kHz los cuales se dan
debido a que el ruido de aireación posee características espectrales parecidas en
estas frecuencias, que al sumarse con las componentes de la lancha generan estos
aumentos de nivel, creando picos en el espectro de potencia que en realidad no
pertenecen estrictamente a la firma acústica de la embarcación de prueba .
4.3 Análisis espectral del ruido de ambiente.
Al tener mediciones de los recorridos de la lanchas a diferentes profundidades de
hidrófono se decide hacer un análisis del comportamiento del ruido ambiente para
cada profundidad, además interesa observar diferentes condiciones de medición
como el motor del filtro (de ahora en adelante llamado filtro) limpia piscina
encendido y apagado. La Figura 26 muestra la comparación entre el ruido de fondo
con el motor limpia piscina apagado para las profundidades de hidrófono en que se
realizaron las mediciones.
Figura 26. Comparación de ruido ambiente a diferentes profundidades.
En la Figura 26 se percibe un incremento entre los 500Hz y 1000Hz para la
profunidad de 80cm. Entre los 2000Hz y 3100Hz el ruido ambiente de 150cm de
profundidad tiene un incremento en comparación a la misma banda de los 80cm,
sin embargo a partir de los 3100Hz el ruido de los 150cm presenta una pérdida en
70
frecuencias altas, cayendo por debajo del nivel de la misma banda en 80cm de
profunidad. Estas consideraciones son útiles para comprender cambios de relación
señal a ruido al momento de pasar las embarcaciones en los anchos de frecuencias
mencionados, además ayudan a la determinación de los umbrales de detección que
se usarán en el algoritmo.
Figura 27. Comparación del ruido ambiente a 80cm de profundidad con el filtro encendido y apagado que se usarán en el algoritmo.
En la Figura 27 es apreciable el incremento en nivel de todo el espectro del ruido de
fondo. Aunque hay una zona entre los 500Hz y 1000Hz donde los niveles dan
similares, el resto de frecuencias presentan un incremento hasta de 10dB o más. A
continuación se mostrará la influencia del motor de la piscina en las detección de
las emabarcaciones.
71
Figura 28. Comparación ruido de fondo a 80cm con el filtro encendido y paso de lanchas.
En la Figura 28 se muestra el espectro del ruido de fondo con el motor del filtro
limpia piscina encendido y el espectro de la lancha Amarilla; es apreciable el
enmascaramiento que logra el ruido de fondo con filtro al espectro de la lancha
Amarilla. Esta condición hace difícil establecer umbrales de señal a ruido para la
detección de dicha lancha puesto que el ruido en casi todo el espectro se encuentra
en general a niveles superiores. Con base en lo anterior si la piscina tiene el motor
del filtro liimpiador encendido la detección para la lancha Amarilla no es confiable
por la alta posibilidad de falsa alarma debido a la contribución del ruido ambiente.
En el caso de la lancha Verde (línea punteada), se cuenta con varios picos en
frecuencia que superan el nivel del ruido de fondo, éstas frecuencias serán útiles
para la determinación tanto de umbrales y frecuencias características usadas al
momento de la clasificación. La detección de la lancha Verde con el filtro encendido
es posible, los umbrales de detección para las frecuencias características tienen
una relación señal a ruido suficiente para discriminar si pasa o no la lancha cerca al
hidrófono.
72
Figura 29. Comparación ruido de fondo a 80cm con el filtro apagado y paso de lanchas.
En la Figura 29 se maneja la misma representación gráfica que la figura anterior.
En este caso es observable la superioridad en nivel en todo el espectro de la lancha
Amarilla y con mayor diferencia aún la lancha Verde comparadas con el ruido de
fondo. En estas condiciones es posible determinar umbrales y frecuencias de
detección para la lancha Amarilla y así lograr que el código la distinga y diferencie
de otros sucesos. Al comparar las Figura 28 y Figura 29 se decide realizar todas las
pruebas posteriores del código y las demás mediciones en condiciones de filtro
apagado, este ambiente de trabajo amplía el alcance del algoritmo por una mayor
relación señal a ruido posibilitando firmas acústicas diferenciable con el ruido de
fondo.
Las grabaciones de ruido ambiente realizadas en el presente proyecto fueron en
una piscina, es decir, fueron en condiciones totalmente controladas donde el ruido
no tenía mayores variaciones, era considerablemente estable a lo largo del tiempo.
Sin embargo es notable la consecuencia de las variaciones de ruido ambiente en la
zona control, en este caso si el ruido ambiente aumenta (filtro encendido) la
identificación de la lancha Amarilla es menos confiable. Si el algoritmo se desea
acondicionar en un futuro a otros tipos de medios, por ejemplo ríos o mares, se debe
tener en cuenta que en éstas condiciones el ruido ambiente es variable, puede
modificar tanto su espectro como su nivel repentinamente por variados factores
(fauna marina, actividades subacuáticas, etc.), así que el algoritmo debe tener la
73
capacidad de adecuarse al ruido ambiente del momento. Para esta necesidad se
recomienda usar algoritmos adaptativos; téngase en cuenta que este tipo de
códigos consumen más recursos computaciones que algoritmos comunes además
de ser complejos a la hora de programarlos, pero sus ventajas de funcionamiento
permiten la implementación del código en cualquier condición de ruido ambiente.
4.4 Análisis de la firma acústica para diferentes condiciones.
4.4.1 Extracción de la firma acústica
La caracterización de las embarcaciones se realizó mediante la extracción de los
picos más significativos sobre el espectro de la densidad de potencia de la señal.
En total se realizaron 36 mediciones de las cuales se descartaron 12 debido a
factores que generaban cambios en el comportamiento del espectro (Cambios de
velocidad de la lancha y de sus motores). La Figura 30 muestra la PSD para cada
uno de los recorridos realizados, se puede observar que las gráficas a pesar de que
no siempre dan igual, poseen una tendencia a formar máximos definidos.
Figura 30. 24 Recorridos de la Lancha Verde a 1m de distancia del Hidrófono.
En la Figura 30 se puede observar también que a pesar de que se trata de la misma
fuente, no siempre se obtienen los mismos resultados, sin embargo la firma acústica
debe garantizar la identidad de la fuente, razón por la cual no se debe elegir una
firma arbitrariamente, es necesario realizar un análisis de tendencias para poder
elegir una densidad espectral de potencia que represente el comportamiento de la
embarcación, como también es necesario analizar estadísticamente mediante
74
medidas de dispersión la variabilidad de los datos y si es posible a qué tipo de
distribución se aproxima.
Para poder obtener una sola gráfica que sea representativa de la población se
realizó el promedio aritmético por frecuencia entre los 24 recorridos, el resultado se
ilustra en la Figura 31. Los máximos resultantes de realizar el promedio aritmético
se encuentran en 492.2 Hz, 779.3 Hz, 984.4 Hz, 1230 Hz, 1477 Hz y 1951 Hz
Figura 31. Espectro mediante media aritmética.
Debido a la complejidad de la geometría, en la que algunos de los recorridos
presentan picos de mayor nivel que otros, con desplazamientos de los datos en el
dominio de la frecuencia, se decide analizar la tendencia mediante un suavizado por
spline cúbico, la Figura 32 muestra los resultados luego de realizar el ajuste.
75
Figura 32. Ajuste del espectro mediante Spline.
Si se comparan los máximos obtenidos a partir del promedio y los máximos
obtenidos mediante el suavizado de splines, se puede ver la gran similitud que
presentaron ambos métodos, sin embargo solo se presentó una variación en una
frecuencia, 1477 Hz pasó a ser mediante spline a 1471 Hz, 6 Hz de diferencia que
en realidad no representa una variación significativa en frecuencia.
Por otro lado está la variación en nivel, en la Figura 33 se ilustra una comparación
entre las dos aproximaciones del espectro, nótese que aunque en nivel también
presentan un comportamiento similar, el ajuste por promedio presenta unos picos
de mayor nivel en comparación al suavizado spline, en al menos tres picos máximos
es notoria la diferencia, situación que es favorable para la aplicación. Esto muestra
que el spline es menos sensible a datos extremos que el ajuste por promedio
aritmético, sin embargo para este caso es preferible que el método a utilizar sea
discriminativo con datos alejados de la media, ya que un dato extremo podría afectar
la detección en esa frecuencia, y aumente la relación señal a ruido, bajando la
probabilidad de detección.
76
Figura 33. Comparación de Ajuste Spline Vs Promedio.
De la Tabla 4 a la Tabla 8 se muestran los resultados de los estadísticos aplicados
sobre cinco rangos de frecuencia entre los cuales se encuentran siempre máximos
de los 24 recorridos. El primer rango se definió entre 451 Hz y 539 Hz, el segundo
entre 726 Hz y 796 Hz, el tercero entre 955 Hz y 1043 Hz, el cuarto entre 1166 Hz
y 1301 Hz, y por último el quinto rango entre 1430 Hz a 1518 Hz. Para cada uno se
calculó medidas de posición, medidas de dispersión y medidas de forma con el fin
de interpretar de manera más exacta su comportamiento, sobretodo la variabilidad
que presentan los máximos en frecuencia, la cual indica que tanto se están alejando
los diferentes recorridos con respecto de la media (firma acústica) y poder
determinar un intervalo de confianza para la detección. Igualmente de la Figura 34
a la Figura 38 se ilustran los histogramas de cada rango, con el propósito de ver la
forma y la distribución de los datos.
77
Tabla 4.Estadísticos para Máximos entre 451Hz y 539Hz.
Figura 34. Histograma de Máximos ubicados en el Rango de 451Hz a 539Hz.
451Hz a 539Hz
Promedio 492.188
Desv.Estand 9.774
Varianza 95.533
Mediana 492.188
Curtosis 1.320
Asimetría 0.307
Moda 486.328
Máximo 515.625
Mínimo 468.750
Cuartil (Q1) 486.328
Cuartil (Q3) 498.047
P-Valor de Test Shapiro-Wilk
0.07681
78
Tabla 5. Estadísticos para Máximos entre 726Hz y 796Hz.
726Hz a 796Hz
Promedio 777.832
Desv.Estand 11.231
Varianza 126.134
Mediana 779.297
Curtosis -0.206
Asimetría -0.177
Moda 779.297
Máximo 796.875
Mínimo 755.859
Cuartil (Q1) 773.438
Cuartil (Q3) 785.156
P-Valor de Test Shapiro Wilk
0.03619
Figura 35. Histograma de Máximos ubicados en el Rango de 726Hz a 796Hz.
79
Tabla 6.Estadísticos para Máximos entre 955Hz y 1043Hz.
955Hz a 1043Hz
Promedio 990.967
Desv.Estand 23.201
Varianza 538.308
Mediana 987.305
Curtosis -0.015
Asimetría 0.779
Moda 978.516
Máximo 1042.969
Mínimo 955.078
Cuartil (Q1) 977.051
Cuartil (Q3) 1003.418
P-Valor de Test Shapiro-Wilk
0.1183
Figura 36. Histograma de Máximos ubicados en el Rango de 955Hz a 1043Hz.
80
Tabla 7.Estadísticos para Máximos entre 1166Hz y 1301Hz.
1166Hz a 1301Hz
Promedio 1230.957
Desv.Estand 24.854
Varianza 617.732
Mediana 1230.469
Curtosis 1.645
Asimetría 0.149
Moda 1230.469
Máximo 1294.922
Mínimo 1171.875
Cuartil (Q1) 1223.145
Cuartil (Q3) 1242.188
P-Valor de Test Shapiro-Wilk
0.5522
Figura 37. Histograma de Máximos ubicados en el Rango de 1166Hz a 1301Hz.
81
Tabla 8. Estadísticos para Máximos entre 1430Hz y 1518Hz.
1430Hz a 1518Hz
Promedio 1472.412
Desv.Estand 25.539
Varianza 652.251
Mediana 1470.703
Curtosis -0.546
Asimetría 0.249
Moda 1517.578
Máximo 1517.578
Mínimo 1429.688
Cuartil (Q1) 1457.520
Cuartil (Q3) 1488.281
P-Valor de Test Shapiro-Wilk
0.433
Figura 38. Histograma de Máximos ubicados en el Rango de 1430Hz a 1518Hz.
Dentro de los rangos de frecuencia, los datos a analizar fueron sólo valores
máximos de cada recorrido, esto con el fin de poder eliminar una de las variables,
el nivel, y poder realizar el análisis solamente sobre la variable de frecuencia. El
82
histograma sirve para hacer una referencia visual acerca de si los datos tienden a
una distribución normal, sin embargo la manera correcta de determinar si los datos
son de origen normal es mediante el test (prueba) de Shapiro-Wilk.
Nótese además que de la Figura 34 a la Figura 38¡Error! No se encuentra el
rigen de la referencia., los histogramas presentan una distribución parecida a la
normal, sin embargo no es tan claro debido a los pocos datos que se tienen, a
excepción de la Figura 35 que a simple vista se puede decir que los datos no se
distribuyen normalmente y tiende a ser multimodal, es decir, sobre el histograma se
presentan varios picos que hacen que no se distribuyan los datos en forma de
campana . Para corroborar lo anterior, observe que en todos los rangos el P-Valor
del test de Shapiro-Wilk, se encuentran por encima del nivel de confianza (0.05)
teniendo en cuenta una confianza del 95%, a excepción del rango entre 726 Hz y
796 Hz (ver Tabla 3) cuyo P-Valor es de 0.03619.
Otra forma de determinar si los datos dentro de los rangos poseen distribución
normal es mediante relación entre la asimetría y la curtosis. Siempre y cuando la
distribución sea unimodal (que presente un solo pico sobre el histograma) y la
asimetría y la curtosis se encuentren ambas entre -0.5 y 0.5, se puede asumir que
la distribución es normal [28], sin embargo, en este caso sólo se cumpliría en
algunas frecuencias, por lo que se recomienda realizar otras pruebas de normalidad
para verificar si las que cumplen la condición anterior siguen aproximándose a una
distribución normal y si por el contrario, las que no cumplen continúan teniendo otro
tipo de distribución. Cabe aclarar que así se cumplan dichas condiciones de
asimetría y de curtosis no necesariamente los datos en realidad tengan una
distribución normal.
La ventaja de suponer que los datos presentan una distribución normal, es que al
asumir una confianza del 95%, los valores se encuentran a una distancia de dos
desviaciones estándar de la media aritmética (ver Figura 39), a esto se le denomina
“Regla empírica de la distribución normal” [28], analizando los estadísticos
anteriores, en el peor caso se tiene una desviación estándar de 25.5Hz, lo que
quiere decir que suponiendo normalidad y la peor condición, cualquier máximo de
la firma acústica de un recorrido de la embarcación (teniendo en cuenta la media
aritmética como la frecuencia del máximo de referencia), podría encontrarse en el
95% de los casos 50 Hz por encima o 50 Hz por debajo [28] [41].
83
Figura 39. Regla empírica de la distribución Normal.
Teniendo en cuenta esta regla, dentro del algoritmo se diseña un filtro pasa banda
para extraer un valor máximo sobre la señal. El ancho de banda del filtro va a
corresponder, para esta embarcación, a cuatro desviaciones estándar, es decir
aproximadamente 100 Hz para el peor de los casos de las frecuencias
anteriormente analizadas, sin embargo el algoritmo debe extraer los máximos de la
señal en todo el dominio de la frecuencia, o por lo menos en el rango de utilidad de
la firma acústica, en este caso de 300Hz hasta 2050Hz (ver Figura 40) , por lo que
es necesario implementar un banco de filtros, estos consisten en filtrar la señal
realizando un “paso a paso” en frecuencia, este paso determinará cuantos máximos
se van a extraer de la firma acústica y se debe elegir teniendo en cuenta dos
condiciones, que tan cercanos se encuentren los picos máximos de la señal uno de
otros y el tiempo de procesamiento del algoritmo. En este proyecto se determinó un
paso de 100Hz, es decir, el filtro se moverá en frecuencia cada 100Hz filtrando así
la señal en un rango determinado.
84
Figura 40. Banco de Filtros para la extracción de máximos de la firma acústica.
El algoritmo guardará en memoria una matriz que contenga el valor máximo en nivel
que se consigue con cada filtrado, además de almacenar la frecuencia en la cual se
da dicho máximo. Estos resultados serán útiles al momento de definir parámetros
de discriminación entre firmas acústicas. En la Figura 41 se ilustran los máximos y
las frecuencias de cada lancha:
Figura 41. Máximos de Nivel para ambas embarcaciones.
Luego de obtener los máximos por frecuencia se “normalizan” los valores respecto
a un promedio de los niveles máximos dados. Es decir, se tienen datos de niveles
que fueron máximos en ciertas bandas de frecuencia, éstos valores se promedian
85
aritméticamente, después cada valor máximo es dividido entre dicho promedio. Este
procedimiento sirve para establecer relaciones de nivel entre máximos en las
frecuencias características de cada lancha, estas frecuencias fueron determinadas
previamente con la extracción de máximos mediante un banco de filtros. La Figura
42 muestra el resultado del proceso anterior:
Figura 42. Relación entre máximos para cada lancha.
Se puede observar en la Figura 42 cuáles frecuencias tienen una mayor presencia
en la firma acústica o son fácilmente distinguibles de otras. Aquellas que su valor
en el eje y sea mayor a uno (1) significa que se encuentran por encima del
promediado de niveles, es decir, estarán más presentes en la señal de la
embarcación.
4.4.2 Desplazamientos en el dominio de la frecuencia en una firma acústica
debido a cambios de velocidad de la embarcación.
En diferentes grabaciones de la lancha Verde y su posterior representación gráfica
se notaban picos en frecuencias diferentes incluso cuando la toma se hacía en
condiciones similares. Para analizar este desplazamiento se hicieron pasos de la
lancha Verde a diferentes velocidades, el cambio de velocidad era consecuencia
del agotamiento de batería. Los motores de la lancha pierden fuerza a medida que
la beteria se agota, lo que también causa que la frecuencia del motor cambie. El
desplazamiento en frecuencias se ilustra en la Figura 43:
86
Figura 43. Desplazamiento en frecuencias debido al cambio de velocidad.
En la figura anterior cada línea corresponde a un paso de lancha Verde a diferentes
velocidades, estableciendo un orden de mayor a menor el “I1” expresa la velocidad
más alta y el “I5” la velocidad más baja. Es apreciable el corrimiento del valor
máximo de nivel hacia frecuencias menores en el espectro anterior a 500Hz, nótese
que la línea I1 tiene su primer máximo cercano a los 500Hz, en cambio la línea I5
tiene su máximo antes, en 351Hz.
El espectro comprendido entre 500Hz y 1000Hz también sufre un desplazamiento
en frecuencia afectado por la velocidad, aunque la diferencia es menos notoria en
comparación a las frecuencias previas a 500Hz, en ésta zona los picos aparecen
corridos pero más cercanos entre sí, no obstante los cambios en frecuencias son lo
suficientemente considerables como para modificar en su momento parte del
espectro de la firma acústica de las lancha.
A partir de 1000Hz se notan dos frecuencias que se mantienen (poseen poco
corrimiento entre instantes) a pesar de los cambios de velocidad. En 1219Hz y
1453Hz todos los recorridos presentan un máximo en dichas frecuencias, si alguno
se desplaza su corrimiento no es abrupto, manteniéndose cerca a la frecuencias
mencionadas. Estas dos frecuencias son de gran interés e importancia al momento
de determinar frecuencias características tanto para la obtención de la firma
acústica como para la determinación de las frecuencias usadas en la clasificación
de las señales.
87
4.4.3 Cambios en el dominio de la frecuencia en la firma acústica debido a
diferentes condiciones de carga.
Con intención de conocer cómo se modifica la firma acústica de la lancha al añadir
peso en ella, se agrega a la embarcación dos pesos diferentes tales que sean
comparables con el peso de la lancha, con el fin de variar la velocidad de
desplazamiento de la lancha pero con sus motores funcionando a plenitud. En una
primera medición se agregaron 100g, luego se duplica este peso al añadir 200g; lo
anterior se hizo para variar tanto la velocidad de la lancha como su condición de
funcionamiento. En la Figura 44 se compara el espectro de la lancha en las
diferentes condiciones de funcionamiento.
Figura 44 Comparación espectro lancha Verde sin peso y con peso añadido.
En la figura anterior las líneas correspondientes a las grabaciones sin peso y con
peso añadido de 100g presentan un comportamiento similar en todo su espectro;
los cambios notables son diferencias de nivel en frecuencias características. El
recorrido sin peso presenta componentes principales en 984Hz, 1219Hz y 1453Hz,
así mismo el recorrido con los 100g muestra picos de nivel en las mismas
frecuencias exceptuando 1453Hz, en esta componente el nivel decrece alrededor
de 10dB, que en términos de potencia espectral es un decremento considerable. En
el espectro anterior a los 1000Hz es apreciable la similitud tanto en frecuencias
como en niveles entre las dos condiciones de lancha, esto indica que el peso
añadido no modifica abruptamente el comportamiento de la señal no obstante hay
diferencias de niveles en frecuencias características de la embarcación.
88
La Figura 44 también compara el paso de lancha sin peso contra un peso añadido
de 200 g. Esta condición de trabajo sí tuvo como consecuencia un comportamiento
distinto en el funcionamiento de la embarcación, en lo que corresponde al recorrido
con 200g de más, donde el espectro cambia notoriamente. El espectro anterior a
1000Hz presenta un incremento general en nivel, esto corresponde al peso añadido
el cual provoca que los motores de la lancha tengan menos contacto con la
superficie del agua manteniéndose mayor parte del tiempo sumergidos, esta
condición aumenta la aireación producida por las hélices de los motores la cual se
ve reflejada en aumento de las frecuencias bajas. En al rango de 1000Hz a 2000Hz
no se presentan picos característicos en la señal del peso añadido. A partir de los
2000Hz aparece un pico similar a otro máximo en el recorrido sin peso, luego de
éste las frecuencias más altas comienzan a decaer similar a las otras dos
condiciones.
Con base en lo dicho, se puede afirmar que existe cierta cantidad de peso añadido
que no modifica en gran medida el comportamiento de la señal, sin embargo este
va variando a medida que el peso añadido aumenta. El cambio afecta
principalmente las bajas frecuencias (anteriores a 1000Hz), además se observa que
a altas frecuencias (superiores a 2000Hz) el comportamiento es semejante. Con
estas consideraciones se podría estimar a futuro qué tan cargada va una lancha
que previamente fue grabada, teniendo definidas las frecuencias que más se
afectan con el peso y cómo varían en comparación a la lancha vacía.
4.5 Determinación de los umbrales de detección mediante la ecuación de
Sonar Pasivo
4.5.1 Umbrales de detección.
La firma acústica de la lancha contiene información de interés en el rango de los
300Hz a 5 kHz. Para determinar los picos máximos de la señal dentro de este rango
es necesario dividir el espectro linealmente en pequeños intervalos de frecuencia
(100Hz de ancho de banda), este ancho de banda es suficiente para discriminar
máximos que se encuentren cerca uno de otro. Se realiza de esta manera porque
al implementar filtros por tercios de octava a frecuencias altas el ancho de banda de
los filtros se hace más amplio, lo cual no es un escenario conveniente ya que la
firma acústica podría contener varios picos máximos dentro de la misma banda de
tercio de octava.
Al dividir el espectro de forma lineal el ancho de banda corresponde a la diferencia
entre 𝑓1 𝑦 𝑓2 (𝑓1 < 𝑓2) de un filtro pasa-banda Butterworth de orden 10, dicho filtro se
89
aplica de forma iterativa recorriendo todo el espectro, es decir, luego del primer
filtrado la 𝑓1 = 𝑓2 y 𝑓2 = 𝑓2 + 100𝐻𝑧, y así hasta cubrir el rango de interés. Una vez
aplicado el filtro se calcula la PSD de la señal filtrada. El cálculo de la densidad
espectral de potencia se realiza de forma no paramétrica mediante el método del
promediado de periodogramas modificados (método de Welch). Como resultado se
obtiene un vector de valores máximos de potencia en función de la frecuencia, las
cuales representan las componentes espectrales más significativas de la señal.
Una vez determinados los valores representativos de la firma acústica de la lancha,
se vuelve a aplicar varios filtros pasa-banda tipo Butterworth tanto a la señal de la
lancha como al ruido ambiente, pero esta vez más restrictivos (Ancho de banda
según el paso mínimo del vector frecuencia al aplicar Pwelch), donde la frecuencia
central de los filtros en ambas señales son las frecuencias donde se encontró un
máximo de potencia.
Se calcula la diferencia entre el nivel máximo de cada frecuencia representativa
correspondiente a la señal y la misma frecuencia en el ruido de fondo mediante la
ecuación de sonar pasivo, este resultado servirá como umbral de detección al
momento de implementar el algoritmo para la clasificación. La determinación de
umbrales se realiza por medio de la ecuación de sonar pasivo, donde el hidrófono
se encarga de capturar el nivel emitido por la fuente y la pérdida por transmisión.
Los demás parámetros son calculados en el código.
El algoritmo de clasificación realiza el filtrado restrictivo a la señal grabada en tiempo
real, y compara los niveles hallados con el vector de diferencias de nivel. Si el nivel
recién hallado es igual o superior al umbral calculado anteriormente entonces el
algoritmo mostrará “detección”. La determinación de umbrales de detección que
realiza el código se hace de la siguiente manera (muestra solo con un paso de
lancha Verde, puesto que el procedimiento se repite para las frecuencias de interés):
90
Figura 45. Comparación recorrido a 2m lancha Verde con ruido de fondo sin filtro.
Cuando se escogen las frecuencias para la clasificación de la lancha (996,1Hz en
el caso de la Figura 45) se resta el nivel de ésta frecuencia en la señal de la lancha:
-61,72Hz, al nivel de la misma frecuencia en el ruido de fondo: -89,92Hz, así: -61,72-
(-89,92) = 28,2dB. Este valor será el umbral de dicha frecuencia para la clasificación
de las embarcaciones, si el algoritmo en la frecuencia de 996Hz calcula una
diferencia de nivel con el ruido de fondo en la misma frecuencia igual o superior a
28,2dB entonces marca detección en dicha componente.
Este procedimiento además de utilizarse en la clasificación de las lanchas también
sirve para dar un porcentaje de detección al paso de embarcaciones. Si se utilizan
tres frecuencias para clasificar la lancha Verde y al momento de detectarla dos de
sus frecuencias superan el umbral, entonces el algoritmo mostrará que hay una
similitud del 66,6%. Lo anterior es útil al momento de discriminar falsas alarmas.
4.5.2 Estimación de distancia.
La propagación de sonido a través de un medio causa pérdidas de energía en la
señal emitida, este fenómeno puede ser predicho con exactitud si se cuenta con un
modelo teórico descriptivo del fenómeno, teniendo en cuenta las condiciones del
medio de propagación. Existen varios modelos de propagación de ondas sonoras
(esférico, cilíndrico y plano) claramente definidos cuando el medio es aire, estos
modelos pueden predecir la pérdida por transmisión que se da en el viaje de la onda
acústica cada vez que esta se aleja de la fuente. Sin embargo para el caso de una
piscina (situación dada en éste proyecto) no se tiene conocimiento de un modelo
91
claramente establecido; para la situación de mar sí existen modelos de propagación
acústica, pero no se puede comparar directamente mar con piscina porque las
condiciones de salinidad, profundidad y temperatura, factores influyentes en la
propagación, son distintos en ambos medios.
Para la estimación del paso de distancia de la embarcación con referencia al
hidrófono se aprovechó la pérdida por transmisión que mostraban varias
frecuencias del espectro, tal cual se ilustra en la Figura 46:
Figura 46. Pérdida por transmisión en una frecuencia.
De la Figura 46. Pérdida por transmisión en una frecuencia. Se extrae la siguiente
información:
Tabla 9. Diferencia nivel señal-ruido por distancia.
492,2 Hz
Distancia [m] Nivel [dB] SNR [dB]
1 -67,06 28,78
2 -68,18 27,66
4 -74,12 21,72
En el código se utilizan el resultado de SNR para estimar la distancia de la siguiente
forma (se toma como ejemplo el SNR a 1m de distancia de la Tabla 9): Se
preestablece en el algoritmo un condicional que compare el SNR de la grabación
con la cual el algoritmo fue pre-entrenado (grabación de comparación para la
92
captura de la señal del hidrófono). Luego se captura la señal del transductor y se
halla el SNR en la misma frecuencia que el SNR pre-establecido, comparando con
el ruido de fondo del que ya se tiene información; si el SNR de la señal capturada
es igual o mayor al SNR de la señal de comparación, es decir SNRcapturada ≥ 28,78dB,
entonces la lancha debió cruzar aproximadamente a 1m de distancia.
El procedimiento mencionado se realiza para las frecuencias características que se
escojan, para cada recorrido y para cada lancha. Si el SNR de alguna frecuencia
cae en la distancia de 1m y luego el SNR de otra frecuencia del mismo paso caen
en la distancia de 2m (estas diferencias se pueden dar por diversas eventualidades
como cambios del ruido de fondo, paso de la lancha a una distancia diferente de
exactamente 1m o 2m, entre otros), el algoritmo realizará un promedio de distancia
y mostrará entonces que la distancia aproximada del paso de la lancha es: 1,5m.
4.6 Aplicación de la correlación cruzada para la clasificación y localización
4.6.1 Correlación para la discriminación entre lanchas.
El algoritmo cuenta con una sección donde se pueden cargar firmas acústicas ya
establecidas y éstas compararlas con la señal que llegue del hidrófono. Al hacer
esto se puede comparar la morfología de la PSD de la señal capturada con las ya
almacenadas y determinar qué tipo de lancha ha cruzado. Con esta parte el
algoritmo tendrá la capacidad de comparar la señal con varias firmas acústicas y
determinar cuál de esas embarcaciones previamente grabadas fue la que pasó
cerca al transductor. Esta comparación se logra por medio de la correlación cruzada
entre dos señales la cual da un resultado característico cuando ambas señales se
parecen.
En la Figura 47 se muestra el resultado de una correlación entre dos señales
diferentes de la misma lancha, en este caso la lancha Verde. Se puede apreciar que
si ambas señales se parecen la curva tiene un máximo cercano a uno (recordar que
los valores de magnitud están normalizados). También es apreciable que la gráfica
tiende a ese máximo tanto por la derecha como por la izquierda, eso sucede cuando
las señales tienen gran similitud. Observar dicha tendencia además de un pico
representativo en la imagen da a entender que las señales comparadas tienen una
morfología similar, en nuestro caso esto se traduce a que hay grandes
probabilidades de que sean el mismo tipo de lancha.
93
Figura 47. Correlación entre dos señales de lancha Verde.
En el caso de la lancha Amarilla también es posible observar el comportamiento de
la Figura 47. La Figura 48 ilustra la correlación cruzada entre dos señales diferentes
de lancha amarilla. Puede apreciarse igualmente el máximo cercano a uno y la
tendencia por derecha e izquierda.
Figura 48. Correlación entre dos señales de lancha Amarilla.
En la Figura 49 se presenta la correlación entre dos señales de lanchas diferentes.
Nótese que no hay algún máximo o pico característico como sí ha pasado con la
Figura 47 y Figura 48. En este caso la curva no sobrepasa el valor de 0,85 de la
magnitud normalizada. Esta característica de la correlación permite discriminar la
señal capturada por el hidrófono con firmas acústicas ya pre-establecidas y así
discriminar desde la captura la posibilidad de ser o no alguna de las lanchas
grabadas.
94
Figura 49. Correlación entre una señal de lancha Verde y Amarilla
4.6.2 Análisis de la correlación para la localización.
Con un solo hidrófono se puede estimar la distancia aproximada a la cual pasa la
embarcación, sin embargo falta información para dar una idea clara de la
proveniencia de la señal, puesto que solamente la distancia no indica dirección de
arribo. Para estimar con mayor precisión la dirección de arribo de la señal se hace
un arreglo virtual de dos hidrófonos, es decir, se toma alguna grabación del paso de
la lancha y se retrasa - o se adelanta – según la señal original.
Se decide tener por facilidad, una separación entre hidrófonos de 1m de distancia.
Con ésta distancia el arreglo será útil a partir de la frecuencia tal que un cuarto de
su longitud de onda (λ/4) coincida con la distancia de separación de los hidrófonos.
La frecuencia que cumple con estas características es 374Hz, lo cual es una ventaja
ya que las frecuencias características de la firma acústica se encuentran por encima
de esta frecuencia. Para conocer cuánto correspondía en tiempo una separación de
1m de distancia se calcula primero la velocidad de onda en el agua y posteriormente
es posible determinar el tiempo mediante un despeje. Teniendo en cuenta que la
temperatura de la piscina fue de 24°, el hidrófono se encontraba a 0.8m de
profundidad, y que la salinidad es del 0%, reemplazando en la Ecuación 2 se obtiene
que la velocidad del sonido 𝐶:
𝐶 = 1449.2 + 4.6(24°) − 0.055(24°)2 + 0.00029(24°)3 + (1.34 − 0.01(24°))(0 − 35)
+ 0.016(0.8𝑚)
95
𝐶 = 1493.3 [𝑚
𝑠]
Luego, se sabe que:
𝐶 =𝑑
𝑡
donde, 𝑑 es la distancia de separación de los hidrófonos y 𝑡 el tiempo de retraso de
la señal entre ellos.
Ahora, despejando 𝑡 y reemplazando cuando 𝑑 = 1𝑚, se obtiene que:
𝑡 = 66 [𝑚𝑠]
La correlación cruzada es aplicada a la señal atrasada y a la señal adelantada,
tomando como referencia la señal original, obteniendo los resultados mostrados en
la Figura 50:
Figura 50. Correlación cruzada entre señal original, adelantada y atrasada.
La Figura 50 presenta el resultado de la correlación cruzada entre las señales
mencionadas. En el eje horizontal se disponen las iteraciones o retrasos que realiza
la función de correlación cruzada en Matlab, el eje vertical muestra la magnitud
96
normalizada de la correlación. Efectivamente la correlación cruzada de la señal con
ella misma da su valor máximo en la muestra de retraso 0 (cero), esto indica que
ambas señales están llegando al tiempo. En la señal retrasada el máximo valor
aparece en -3168, esto indica que las dos señales correlacionadas tienen un retraso
de 3168 muestras. Si la frecuencia de muestreo es 48000Hz por segundo y el
retraso entre ambas señales es el mencionado anteriormente entonces el desfase
en tiempo que ha obtenido la operación de correlación es:
𝐷𝑒𝑠𝑓𝑎𝑠𝑒 = 1𝑠 ∗ (−3168 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠)
48000 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠= −0,066 = −𝟔𝟔𝒎𝒔.
Este resultado concuerda con el tiempo de retraso hallado usando la velocidad de
sonido en el agua, esto indica que la correlación cruzada es útil para determinar
efectivamente si la señal está retrasada o adelantada según una referencia e indicar
entonces si el arribo de la señal viene de adelante del arreglo o de atrás como se
nota en la Figura 51 . El análisis de la señal adelantada es igual al realizado con la
señal retrasada.
Si en la práctica se contara con dos hidrófonos iguales, cada uno de estos recibiría
el mismo paso de la embarcación con una diferencia de tiempo determinada por la
separación de los transductores. Esta técnica es una aplicación de ITD (Diferencias
Interaurales de tiempo, por sus siglas en inglés) donde se utiliza la correlación
cruzada para la identificación de arribo de la señal [42]. Hacia el lado donde la
lancha haya pasado, la señal llegaría primero al hidrófono de dicho lado y luego al
de la posición opuesta, al hacer la correlación de las señales captadas por cada
hidrófono se tendría una situación similar a la Figura 50, arrojando como resultado
si la señal arribó desde adelante o desde atrás del arreglo, tal como muestran las
gráficas de retraso y adelanto de la Figura 510.
97
Figura 51. Arreglo Virtual de Hidrófonos para determinar la localización de la señal separados una distancia Δd y desplazadas en tiempo Δt. a) Embarcación pasando
adelante del arreglo. b) Embarcación pasando por detrás del arreglo.
98
5. Conclusiones
Una mejor relación señal a ruido (ruido de fondo bajo en comparación a la señal de
las lanchas), conlleva a una mejor detección y clasificación de las embarcaciones,
reduciendo así las probabilidades de falsas alarmas (ver sección 4.3).
A pesar de las diferentes condiciones de operación en las que puede funcionar una
embarcación (cambio de peso o velocidad), hay frecuencias que se mantienen en
todo momento, estas son las frecuencias utilizadas para discriminar lanchas de
diferente tipo (ver sección 4.4).
La relación señal a ruido permitió determinar los umbrales de detección con los aba
el tipo de lancha verde o amarilla, además de estimar la distancia a la cual se
encuentra la embarcación del hidrófono (ver sección 4.5).
El algoritmo se programó teniendo en cuenta los resultados y el análisis de los
mismos. Fue puesto a prueba y el producto final cuenta con la posibilidad de
distinguir entre el paso de los dos tipos de lancha y estimar una distancia
aproximada del paso de éstas. Para esto se usaron todos los recursos teóricos
como la correlación, la teoría de sonar pasivo y la estimación de densidad espectral
(ver sección 4.1 y Anexos A1, A2, A3, A4, A5).
La dirección de arribo de la señal se logra discriminar con el uso de la correlación
cruzada, aunque solo es posible diferenciar entre un lado frontal y posterior del
arreglo. Para la implementación en tiempo real de ésta fase es necesario el uso de
dos hidrófonos (ver sección 4.6).
99
6. Referencias
[1] A. Nehorai y E. Paldi, «Acoustic vector-sensor array processing,» Signal
Processing, IEEE Transactions on, vol. 42, nº 9, pp. 2481-2491, Sep 1994.
[2] K. Wong y M. Zoltowski, «Extended-aperture underwater acoustic multisource
azimuth/elevation direction-finding using uniformly but sparsely spaced vector
hydrophones,» Oceanic Engineering, IEEE Journal of, vol. 22, nº 4, pp. 659-
672, Oct 1997.
[3] B. Xerri, J.-F. Cavassilas y B. Borloz, «Passive tracking in underwater
acoustic,» Signal Processing , vol. 82, nº 8, pp. 1067-1085, 2002.
[4] D. Zha y T. Qiu, «Underwater sources location in non-Gaussian impulsive noise
environments,» Digital Signal Processing , vol. 16, nº 2, pp. 149-163, 2006.
[5] P. Giraudet y H. Glotin, «Real-time 3D tracking of whales by echo-robust
precise TDOA estimates with a widely-spaced hydrophone array,» Applied
Acoustics , vol. 67, nº 11–12, pp. 1106-1117, 2006.
[6] B. Borowski, A. Sutin, H.-S. Roh y B. Bunin, «Passive acoustic threat detection
in estuarine environments,» de Society of Photo-Optical Instrumentation
Engineers (SPIE) Conference Series, 2008.
[7] J. He y Z. Liu, «Efficient underwater two-dimensional coherent source
localization with linear vector-hydrophone array,» Signal Processing , vol. 89,
nº 9, pp. 1715-1722, 2009.
[8] J. He y Z. Liu, «Underwater acoustic azimuth and elevation angle estimation
using spatial invariance of two identically oriented vector hydrophones at
unknown locations in impulsive noise,» Digital Signal Processing , vol. 19, nº
3, pp. 452-462, 2009.
[9] M. R. Arshad, «Recent advancement in sensor technology for underwaters
applications.,» Indian Journal of Marine Sciences, vol. 38, pp. 267-273, 2009.
[10] P. Felisberto, P. Santos y S. Jesus, «Tracking Source azimuth Using a Single
Vector Sensor,» de Sensor Technologies and Applications (SENSORCOMM),
2010 Fourth International Conference on, 2010.
100
[11] P. Santos, P. Felisberto y S. Jesus, «Vector Sensor Arrays in Underwater
Acoustic Applications,» de Emerging Trends in Technological Innovation, vol.
314, L. Camarinha-Matos, P. Pereira y L. Ribeiro, Edits., Springer Berlin
Heidelberg, 2010, pp. 316-323.
[12] L. Houégnigan, S. Zaugg, M. van der Schaar y M. André, «Space–time and
hybrid algorithms for the passive acoustic localisation of sperm whales and
vessels,» Applied Acoustics , vol. 71, nº 11, pp. 1000-1010, 2010.
[13] Tesei.A, «Localization of small surface vessels through acoustic data fusion of
two tetrahedral arrays of hydrophones,» Proceedings of Meetings on
Acoustics, vol. 17, nº 5, pp. POMA 17, 070050, 2013.
[14] J. Haitsma y T. Kalker, «A Highly Robust Audio Fingerprinting System,» de
Proceedings of the Third International Conference on Music Information
Retrieval, Paris, France, 2002.
[15] Y. Ke, D. Hoiem y R. Sukthankar, «Computer vision for music identification,»
de Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE
Computer Society Conference on, 2005.
[16] S. Baluja y M. Covell, «Content fingerprinting using wavelets,» de European
Conference on Visual Media Production (CVMP), 2006.
[17] M.-L. Bourguet y J. Wang, «A Robust Audio Feature Extraction Algorithm for
Music Identification,» de Audio Engineering Society Convention 129, 2010.
[18] A. Ramalingam y S. Krishnan, «Gaussian Mixture Modeling of Short-Time
Fourier Transform Features for Audio Fingerprinting,» Information Forensics
and Security, IEEE Transactions on, vol. 1, nº 4, pp. 457-463, Dec 2006.
[19] G. Tzanetakis y P. Cook, «Musical genre classification of audio signals,»
Speech and Audio Processing, IEEE Transactions on, vol. 10, nº 5, pp. 293-
302, Jul 2002.
[20] C. A. Capitán Rafael ricardo torres parra, «Propuesta De Un Sistema De
Detección Acústica Y Clasificación Autónoma De De Blancos En El Mar Para
Mejorar La Defensa Marítima Nacional. Fuerzas Militares De Colombia.,»
2009.
101
[21] C. Eckart. N. S. T. Reports, Principles Of Underwater Sound, Ed., Research
Analysis Group, 2012.
[22] U. de San Buenaventura, «Proyecto de Investigación SIDACAM,» Documentos
de Insumo. 2014.
[23] International Association of Oil & Gas Producers «Fundamentals for
Underwater sound,» Report No:406, 2008.
[24] K.Dieter, Underwater Acoustics, Institute of Wateracoustics, Sonar
Engineering and Signal Theory, Hochschule Bremen..
[25] R. P. Hodges, Underwater Acoustics: Analysis, Design and Performance of
Sonar, Wiley, Ed., Wiley, 2010.
[26] U. de Tarapacá, «Conceptos básicos de Señales y Sistemas,» Universidad de
Tarapacá, pp. 1-8.
[27] Briceño.Y.Y, «Descripción Matemática del Comportamiento Dinámico de un
Sistema de Control Mediante la Identificación de Parámetros a partir de datos
experimentales». Universidad Pontificia Bolivariana Seccional Bucaramanga
2011.
[28] C. Bencardino, Estadística y muestreo, Ecoe Ediciones, 1984.
[29] B. Shapiro, «An analysis of variance test for normality (complete samples),»
Biometrika, vol. 52, p. 591–611, 1965.
[30] R. H. Bartels, J. Beatty y B. Barsky, An Introduction to Splines for Use in
Computer Graphics and Geometric Modeling, Morgan Kaufmann, 1995.
[31] F. Caillé, «Sillages de bulles des navires de surface,» Université de Provence
Aix-Marseille, Institut de Recherche sur les Phénomènes Hors Équilibre, 2007.
[32] S. A. Culture, «Aquaculture Equipments». Public Brochure.
[33] C. B. J. Sherman, Transducers and arrays for underwater sound., Springer,
2007.
[34] J. Proakis y D. Manolakis, Tratamiento digital de Señales, Pearson Educación,
2007.
102
[35] A. Poularikas, Signals and Systems Primer with MATLAB, Taylor \& Francis,
2006.
[36] A. Colomer, V. Ornedo y J. Nebot, TRATAMIENTO DIGITAL DE LA SEÑAL.
TEORÍA Y APLICACIONES, Universitat Politécnica de Valéncia, 2007.
[37] W. D. Zhang, L. G. Guan, G. J. Zhang, C. Y. Xue, K. R. Zhang y J. P. Wang,
«Research of DOA Estimation Based on Single MEMS Vector Hydrophone,»
Sensors, vol. 9, nº 9, pp. 6823-6834, 2009.
[38] T. S. D. (Shendkar)., «Application of MUSIC, ESPRIT and ROOT MUSIC in
DOA Estimation,» Faculty of Electrical Engineering and Computing,University
of Zagreb,Croatia.
[39] Debevoise.T, Geneva.R, The Microguide to Process Modeling in BPMN 2.0:
How to Build Great Process, Rule, and Event Models, TIPS Technical
Publishing,Inc., 2011.
[40] HOMSEC, Informe del evento, 5to Salón Internacional de Tecnologías de
Seguridad Nacional, 2015.
[41] A. Webster, Estadística aplicada para administración y economía, Irwin, 1996.
[42] J. C. Murray, H. Erwin y S. Wermter, «Robotic Sound-Source Localization and
Tracking Using Interaural Time Difference and Cross-Correlation,» de
Neurobotics, Sunderland, 2004.
[43] P. Stoica y R. Moses, Spectral Analysis Of Signals, Prentice Hall, 2005.
[44] L. Stankovic, V. Popovic y M. Dakovic, «On the Capon's method application in
time-frequency analysis,» de Signal Processing and Information Technology,
2003. ISSPIT 2003. Proceedings of the 3rd IEEE International Symposium on,
2003.
[45] N. de Moura y R. Ramos, «Passive Sonar Signal Detection and Classification
Based on Independent Component Analysis, Sonar Systems,» Federal
University of Rio de Janeiro, COPPE/Poli, Signal Processing Laboratory, Rio
de Janeiro, Brazil, 2011.
[46] Rabiner.L, Fundamentals of Speech Recognition, Prentice-Hall International,
1993.
103
[47] E. F. García, «Métodos spline aplicados a la estimación de la densidad
espectral,» Estadística Española, vol. 37, pp. 435-459, 1995.
[48] C. J. F. Flores, «Modelo de regresión de Cox usando Splines,» 2011.
[49] F. O. Facundo Bellesi, Reconocimiento de Voz para Aplicación en Domótica.
[50] Brandon.G, Sensor and Technology Applications in Port Security, CSR, Ed.,
Stevens Institute of Technology, 2011.
[51] A. Averbuch, V. Zheludev, P. Neittaanmäki, P. Wartiainen, K. Huoman y K.
Janson, «Acoustic detection and classification of river boats,» Applied
Acoustics , vol. 72, nº 1, pp. 22-34, 2011.
[52] R. Adve, «Direction of Arrival Estimation,» Department of Electrical and
Computer Engineering University of Toronto.
[53] Sutin.A, «Acoustic measurement of bubbles in the wake of ship model in a
tank,» de Acoustic 08 Paris, 2008.
104
ANEXOS
A.1 Código para la obtención de máximos de la señal.
clc close all tic %% Cargo de señal y otros datos. dim_fft = 2048*2; F3dB1 = 300; n = 35; MaxdB=zeros(1,n); FreqDeMaxA=zeros(1,n); NL_dBTotalA = zeros(1,n); DT_PSDTotalA= zeros(1,n); SL_TL_PSDTotalA = zeros(1,n); MaxdB2 = -200; [y, fs] = audioread('R2-INT1.wav'); [y2, ~] = audioread('RUIDO DE FONDO RECOR.wav');
%% Llenado del vector de máximos. for i=1:n % Diseño Filtro Pasa-Banda N = 8; F3dB2 = F3dB1 + 50; h = fdesign.bandpass('N,F3dB1,F3dB2',N,F3dB1,F3dB2,fs); Hd = design(h,'butter'); Y = filter(Hd,y); % PSD [pxx,f]=pwelch(Y, hamming(dim_fft),[], [], fs); pxxdB = 10*log10(pxx); semilogx(f,pxxdB) xlim([300 2500]) % Máximos [MaxdB(i),position] = max(pxxdB); FreqDeMaxA(i) = f(position); F3dB1 = F3dB2; hold on end MaximosYSusFrecuenciasA = [MaxdB;FreqDeMaxA]; semilogx(FreqDeMaxA,MaxdB,'linewidth',3)
%% Graficación
[NL_PSD,f] = pwelch(y2,hamming(dim_fft),[],[],fs); [M_40M_PSD,~] = pwelch(y,hamming(dim_fft),[],[],fs); NL_PSD = 10*log10(abs(NL_PSD)); M_40M_PSD = 10*log10(abs(M_40M_PSD)); plot1=plot(f,M_40M_PSD,'b',f,NL_PSD,'r'); set(plot1(1),'DisplayName','Señal'); set(plot1(2),'DisplayName','Ruido Fondo'); legend xlim([200 5000]) xlabel('Frecuencia [Hz]') ylabel('PSD [dB/Hz]') title('Comparación señal de análisis con ruido de fondo.')
105
%% Umbrales de detección for i=1:n % Diseño Filtro Pasa-Banda 1 N = 8; F3dB1 = FreqDeMaxA(i)-f(5); F3dB2 = FreqDeMaxA(i)+f(5); h = fdesign.bandpass('N,F3dB1,F3dB2',N,F3dB1,F3dB2,fs); Hd = design(h,'butter'); NL_FIL = filter(Hd,y2); M_FIL = filter(Hd,y); NL_PSD_FIL = pwelch(NL_FIL,hamming(dim_fft),[],[],fs); M_PSD_FIL = pwelch(M_FIL,hamming(dim_fft),[],[],fs);
NL_dB = 10*log10(sum(NL_PSD_FIL(find(f==F3dB1):find(f==F3dB2)))); SL_TL_PSD = 10*log10(sum(M_PSD_FIL(find(f==F3dB1):find(f==F3dB2)))); DT_PSD = SL_TL_PSD - NL_dB + 1; SL_TL_PSDTotalA(i)=SL_TL_PSD; NL_dBTotalA(i) = NL_dB; DT_PSDTotalA(i)= DT_PSD; end
save ('FreqDeMaxA','FreqDeMaxA') save('NL_dBTotalA','NL_dBTotalA'); save('DT_PSDTotalA','DT_PSDTotalA'); save('SL_TL_PSDTotalA','SL_TL_PSDTotalA'); save ('MaximosYSusFrecuenciasA','MaximosYSusFrecuenciasA') save('f','f') toc
A.2 Código para la obtención de firma acústica
clc close all tic %% Determinación de máximos. dim_fft = 2048*2; n = 35; F3dB1 = 300; FirmaV = zeros(1,n); MaxdB=zeros(1,n); FreqDeMax2=zeros(1,n); [y, fs] = audioread('R2-INT1.wav'); [y2, ~] = audioread('RUIDO DE FONDO RECOR.wav'); [pxx,~]=pwelch(y, hamming(dim_fft),[], [], fs); [pxx2,f]=pwelch(y2, hamming(dim_fft),[], [], fs); plot(f,10*log10(pxx),'r',f,10*log10(pxx2)) xlim([300,5000])
%Llenado del vector de máximos. for i=1:n % Diseño Filtro Pasa-Banda N = 8;
106
F3dB2 = F3dB1 + 50; h = fdesign.bandpass('N,F3dB1,F3dB2',N,F3dB1,F3dB2,fs); Hd = design(h,'butter'); Y = filter(Hd,y); % PSD [pxx,f]=pwelch(Y, hamming(dim_fft),[], [], fs); pxxdB = 10*log10(pxx); % Máximos [MaxdB(i),position] = max(pxxdB); FreqDeMax2(i) = f(position); F3dB1 = F3dB2; end
%% Parámetros firma acústica prom = sum(MaxdB)/n; Comp_Prom = zeros(1,n); Comp_Log = zeros(1,n);
for i=1:n Comp_Prom(i) = MaxdB(i)/prom; FirmaV(i) =1./(Comp_Prom(i))^100; Comp_Log(i) = log10(Comp_Prom(i)); end
MaximosYSusFrecuencias =
[FreqDeMax2',MaxdB',Comp_Prom',FirmaV',Comp_Log']; save('FirmaV','FirmaV') save ('MaximosYSusFrecuencias','MaximosYSusFrecuencias') filename = 'MáximosFirmaAcústica.xlsx'; xlswrite(filename,MaximosYSusFrecuencias)
A.3 Código encargado de grabación y comparación con firmas acústicas pre-
establecidas.
clc close all %% Cargo Variables fs = 48000; dim_fft = 2048*2; load FirmaV load FirmaA
%% Grabación Indicator = 1; recObj = audiorecorder(48000, 16,1); while Indicator < 2 disp('Comienzo Grabación.') recordblocking(recObj, 9); disp('Fin Grabación.'); M = getaudiodata(recObj); %% Firma acústica n = length(FirmaV); MaxdB=zeros(1,n);
107
F3dB1 = 300; for i=1:n % Diseño Filtro Pasa-Banda N = 8; F3dB2 = F3dB1 + 50; h = fdesign.bandpass('N,F3dB1,F3dB2',N,F3dB1,F3dB2,fs); Hd = design(h,'butter'); Y = filter(Hd,M); % PSD [pxx,f]=pwelch(Y, hamming(dim_fft),[], [], fs); pxxdB = 10*log10(pxx); % Máximos [MaxdB(i),position] = max(pxxdB); F3dB1 = F3dB2; end % Comparación con promedo. prom = sum(MaxdB)/n; Comp_Prom = zeros(1,n); Comp_Potencia2 = zeros(1,n);
for i=1:n Comp_Prom(i) = MaxdB(i)/prom; Comp_Potencia2(i) = 1./(Comp_Prom(i))^100; end [CorrelaV,LeggV] = xcorr(Comp_Potencia2,FirmaV,'coeff'); [CorrelaA,LeggA] = xcorr(Comp_Potencia2,FirmaA,'coeff'); MaxCorrV = max(CorrelaV); MaxCorrA = max(CorrelaA); [~,pos] = find(CorrelaV == MaxCorrV); valV = CorrelaV(pos); [~,pos] = find(CorrelaA == MaxCorrA); valA = CorrelaA(pos);
if valV > 0.8 disp('Posible Detección Lancha Verde.') EstimacionVerde(M) elseif valA >= 0.7 disp('Posible Detección Lancha Amarilla') EstimacionAmarilla(M) end disp('--------------') Indicator = 1; end
108
A.4 Código para detección de umbrales y estimación de distancia lancha
verde.
function EstimacionVerde(M) fs = 48000; % Frecuencia de Sampleo dim_fft = 2048*2; distancia = zeros(1,3); load NL_dBTotalV load DT_PSDTotalV load FreqDeMaxV load f %% Primer filtro N = 8; % Filter Order F3dB1 = FreqDeMaxV(15)-f(5); % cutoff frequency 1 F3dB2 = FreqDeMaxV(15)+f(5); % cutoff frequency 2 h = fdesign.bandpass('N,F3dB1,F3dB2',N,F3dB1,F3dB2,fs); Hd = design(h,'butter'); M_FIL = filter(Hd,M); [M_PSD, ~] = pwelch(M_FIL,hamming(dim_fft),[],[],fs); SL_TL_M = 10*log10(sum(M_PSD(find(f==F3dB1):find(f==F3dB2)))); DT_M = SL_TL_M - NL_dBTotalV(15)+ 1; DT_MTotal(1) = DT_M; if DT_M >= 31 distancia(1) = 1; elseif 27 <= DT_M && DT_M < 31 distancia(1) = 2; else if 15 < DT_M && DT_M < 27 distancia(1) = 4; end end
%% Segundo Filtro N = 8; % Filter Order F3dB1 = FreqDeMaxV(20)-f(5); % cutoff frequency 1 F3dB2 = FreqDeMaxV(20)+f(5); % cutoff frequency 2 h = fdesign.bandpass('N,F3dB1,F3dB2',N,F3dB1,F3dB2,fs); Hd = design(h,'butter'); M_FIL = filter(Hd,M); [M_PSD, ~] = pwelch(M_FIL,hamming(dim_fft),[],[],fs); SL_TL_M = 10*log10(sum(M_PSD(find(f==F3dB1):find(f==F3dB2)))); DT_M = SL_TL_M - NL_dBTotalV(20) + 1; DT_MTotal(2) = DT_M; if DT_M >= 25 distancia(2) = 1; elseif 17 <= DT_M && DT_M < 25 distancia(2) = 2; else if 8 < DT_M && DT_M < 17 distancia(2)=4; end end
%% Tercer Filtro N = 8; % Filter Order F3dB1 = FreqDeMaxV(25)-f(5); % cutoff frequency 1 F3dB2 = FreqDeMaxV(25)+f(5); % cutoff frequency 2
109
h = fdesign.bandpass('N,F3dB1,F3dB2',N,F3dB1,F3dB2,fs); Hd = design(h,'butter'); M_FIL = filter(Hd,M); [M_PSD, ~] = pwelch(M_FIL,hamming(dim_fft),[],[],fs); SL_TL_M = 10*log10(sum(M_PSD(find(f==F3dB1):find(f==F3dB2)))); DT_M = SL_TL_M - NL_dBTotalV(25) + 1; DT_MTotal(3) = DT_M; if DT_M >= 37 distancia(3) = 1; elseif 33 <= DT_M && DT_M < 37 distancia(3) = 2; else if 25 < DT_M && DT_M < 33 distancia(3)=4; end end
%% Análisis detección cont = 0; if DT_MTotal(1) >= DT_PSDTotalV(15); disp('>>> Detección Freq 1') cont = cont + 1; end if DT_MTotal(2) >= DT_PSDTotalV(20); disp('>>> Detección Freq 2') cont = cont + 1; end if DT_MTotal(3) >= DT_PSDTotalV(25); disp('>>> Detección Freq 3') cont = cont + 1; end
if cont == 1; disp('porcentaje de detección 33,333%') elseif cont == 2; disp ('Porcentaje de detección 66,666%') elseif cont == 3; disp ('Porcentaje de detección 100%') else disp('>>> No hay Detección') end
distancia = sum(distancia)/length(distancia); a = ['La distancia aproximada es: ', num2str(distancia),'m']; disp(a)
110
A.5 Código para detección de umbrales y estimación de distancia lancha
Amarilla.
function EstimacionAmarilla(M) fs = 48000; dim_fft = 2048*2; distancia = zeros(1,3); load NL_dBTotalA load DT_PSDTotalA load FreqDeMaxA load f %% Primer filtro N = 8; F3dB1 = FreqDeMaxA(8)-f(5); F3dB2 = FreqDeMaxA(8)+f(5); h = fdesign.bandpass('N,F3dB1,F3dB2',N,F3dB1,F3dB2,fs); Hd = design(h,'butter'); M_FIL = filter(Hd,M); [M_PSD, ~] = pwelch(M_FIL,hamming(dim_fft),[],[],fs); SL_TL_M = 10*log10(sum(M_PSD(find(f==F3dB1):find(f==F3dB2)))); DT_M = SL_TL_M - NL_dBTotalA(8)+ 1; DT_MTotal(1) = DT_M; if DT_M >= 8.5 distancia(1) = 1; elseif 6 <= DT_M && DT_M < 8.5 distancia(1) = 2; else if 4 < DT_M && DT_M < 6 distancia(1) = 4; end end
%% Segundo Filtro N = 8; F3dB1 = FreqDeMaxA(12)-f(5); F3dB2 = FreqDeMaxA(12)+f(5); h = fdesign.bandpass('N,F3dB1,F3dB2',N,F3dB1,F3dB2,fs); Hd = design(h,'butter'); M_FIL = filter(Hd,M); [M_PSD, ~] = pwelch(M_FIL,hamming(dim_fft),[],[],fs); SL_TL_M = 10*log10(sum(M_PSD(find(f==F3dB1):find(f==F3dB2)))); DT_M = SL_TL_M - NL_dBTotalA(12) + 1; DT_MTotal(2) = DT_M; if DT_M >= 7 distancia(2) = 1; elseif 4 <= DT_M && DT_M < 7 distancia(2) = 2; else if 2 < DT_M && DT_M < 4 distancia(2)=4; end end
%% Tercer Filtro N = 8; F3dB1 = FreqDeMaxA(24)-f(5); F3dB2 = FreqDeMaxA(24)+f(5);
111
h = fdesign.bandpass('N,F3dB1,F3dB2',N,F3dB1,F3dB2,fs); Hd = design(h,'butter'); M_FIL = filter(Hd,M); [M_PSD, ~] = pwelch(M_FIL,hamming(dim_fft),[],[],fs); SL_TL_M = 10*log10(sum(M_PSD(find(f==F3dB1):find(f==F3dB2)))); DT_M = SL_TL_M - NL_dBTotalA(24) + 1; DT_MTotal(3) = DT_M; if DT_M >= 19.5 distancia(3) = 1; elseif 17 <= DT_M && DT_M < 19.5 distancia(3) = 2; else if 13 < DT_M && DT_M < 17 distancia(3)=4; end end
%% Análisis detección cont = 0; if DT_MTotal(1) >= DT_PSDTotalA(8); disp('>>> Detección Freq 1') cont = cont + 1; end if DT_MTotal(2) >= DT_PSDTotalA(12); disp('>>> Detección Freq 2') cont = cont + 1; end if DT_MTotal(3) >= DT_PSDTotalA(24); disp('>>> Detección Freq 3') cont = cont + 1; end
if cont == 1; disp('porcentaje de detección 33,333%') elseif cont == 2; disp ('Porcentaje de detección 66,666%') elseif cont == 3; disp ('Porcentaje de detección 100%') else disp('>>> No hay Detección') end
distancia = sum(distancia)/length(distancia); a = ['La distancia aproximada es: ', num2str(distancia),'m']; disp(a)
112
A.6 Código para la localización.
Se debe recibir la grabación de dos señales (correspondiente a un hidrófono
cada una)
clc close all %% Grabación 1 recObj = audiorecorder(48000, 16,1); disp('Comienzo Grabación.') recordblocking(recObj, 9); disp('Fin Grabación.'); M = getaudiodata(recObj); M = audioread(''); %señal de prueba. %% Grabación 2 recObj2 = audiorecorder(48000, 16,1); disp('Comienzo Grabación.') recordblocking(recObj2, 9); disp('Fin Grabación.'); N = getaudiodata(recObj2); N = audioread(''); %señal de prueba.
[Correla_MN,Lagg] = xcorr(M,N,'coeff'); [~,pos] = max(Correla_MN); if Lagg(pos) > 0 disp('La lancha cruzó por el lado A') elseif Legg(pos) < 0 disp('La lancha cruzó por el lado B') end
A.7 Código para el cálculo de variables estadísticas usando R (software).
library(modeest)
require(modeest)
library(e1071)
require(e1071)
#para el rango 1 = 451Hz a 539Hz
rango1<-frecuencia$Rango1
rango1
summary(rango1) #Calcula el mínimo, cuartiles, media, mediana y máximo
varianza1<-var(rango1) #Calcula la Varianza
varianza1
desviacion1<-sd(rango1) # Calcula la Desviación Estándar
desviacion1
curtosis1<-kurtosis(rango1,type=2) #Calcula la Curtosis
Recommended