4
1 Ex s = ) ( ) ( t Ds t x = ResumenEn este trabajo proponemos un método para la eliminación de ruido en bioseñales utilizando la Ecuación Algebraica de Lyapunov para sistemas lineales y estables. Las señales fueron extraídas de la base de datos de arritmias cardíacas del MIT-BIH. Hemos corrompido estas señales electrocardiográficas adicionando ruidos típicos encontrados en cualquier señal clínica de ECG. El método aquí presentado detecta las frecuencias de las señales ruidosas permitiendo de esta manera su posterior cancelación. Los resultados obtenidos demuestran una razonable efectividad y representa una alternativa más en la utilización de algoritmos para la separación ciega de fuentes. Se observa una correlación morfológica hasta los 100 Hz – rango de frecuencias del ECG-, conservando todas las frecuencias de la señal original, variando únicamente en este intervalo los valores de amplitud en un promedio del 25%. A medida que aumentamos los valores de amplitud del ruido generado en el tiempo, se pierde información en amplitud de la señal recuperada. Las frecuencias de las señales ruidosa introducidas fueron identificadas en todos los casos probados. Palabras clave— ECG, Lyapunov, ruido. I. INTRODUCCIÓN l estudio detallado de la señal electrocardiográfica constituye una herramienta imprescindible a la hora de diagnosticar cardiopatías. Su análisis cobró mayor relevancia a partir de la incorporación de técnicas digitales que pueden implementarse con tecnología al alcance de un laboratorio experimental, ampliando de esta manera las posibilidades de diagnóstico mediante algoritmos computacionales. Uno de los problemas que más frecuentemente se producen durante la captura de la señal de ECG es la suma de señales no deseadas a las cuales las denominamos comúnmente “ruido” que perturba la lectura de la señal fuente. Una de las posibles soluciones a este inconveniente es la separación del ruido interferente de la señal de interés. Usualmente la manera en que estas señales se encuentran incorporadas a la del ECG es desconocida y muchas veces el enmascaramiento producido debido a ellas es tal que pueden afectar la interpretación de anomalías cardíacas. La técnica utilizada en este trabajo es el Análisis de Componentes Independientes (ICA por sus siglas en inglés). El análisis ICA es una solución particular al problema más amplio de la separación ciega de fuentes (BSS) que consiste en obtener las señales originales de un proceso a partir de una mezcla desconocida de dicha señales [1]. La herramienta matemática que utilizamos para el Análisis de Componentes Independientes es la Ecuación Algebraica de Lyapunov. Ésta es una ecuación matricial que se basa en el concepto de estabilidad de sistemas lineales e invariantes en el tiempo. Este método se aplica para la eliminación de señales no deseadas ya sea en el espacio del tiempo como en el espacio de las frecuencias [2] y [3]. Nos planteamos como objetivo la identificación de frecuencias asociadas a señales espurias. II. MÉTODOS Las herramientas matemáticas presentadas aquí son el Análisis de Componentes Principales, la Ecuación Algebraica de Lyapunov y la Transformada de Fourier como así también métodos estadísticos de validación como ser la Kurtosis, el concepto de Covarianza y el Coeficiente de Correlación de Pearson. Todos ellos conforman el algoritmo para la resolución de los sistemas planteados. A. Separación Ciega de Fuentes con la Ecuación Algebraica de Lyapunov Sea el vector s(t) = [ s1(t), ..., sM(t) ] T que contiene a las M señales fuente, el vector x(t) = [ x1(t), ...,xN(t) ] T , con las N observaciones. Se dice que la mezcla es lineal e instantánea si: (1) donde D es una matriz NxM que recibe el nombre de matriz de mezcla. Nótese que la transformación es lineal e invariante en el tiempo. Como se dijo antes, identificaremos N= Nº. de sensores, M= Nº. de fuentes . Por hipótesis, tanto D como s(t) son desconocidos y sólo se cuenta con las observaciones. El objetivo al cual queremos arribar es encontrar: (2) siendo E una matriz MxN, que recibe el nombre de matriz de separación [4]. Considerando al corazón (sistema cardíaco) como un sistema biológico estable, utilizamos la Ecuación de Lyapunov. A los fines de la elaboración de este trabajo, planteamos la hipótesis de que el corazón es un sistema estable. Nos basamos para ello en la homeostasis, que alude a la tendencia a mantener el equilibrio fisiológico por compensación química, y que permite, por lo tanto, Separación de Frecuencias No Deseadas en la Señal Cardíaca utilizando ICA María Inés Pisarello, Carlos Álvarez Picaza y Jorge Monzón Facultad de Ciencias Exactas, Universidad Nacional del Nordeste, Corrientes, Argentina [email protected] E

T08TCAr29.pdf

Embed Size (px)

Citation preview

Page 1: T08TCAr29.pdf

1

Exs =

)()( tDstx =

Resumen— En este trabajo proponemos un método para la eliminación de ruido en bioseñales utilizando la Ecuación Algebraica de Lyapunov para sistemas lineales y estables. Las señales fueron extraídas de la base de datos de arritmias cardíacas del MIT-BIH.

Hemos corrompido estas señales electrocardiográficas adicionando ruidos típicos encontrados en cualquier señal clínica de ECG. El método aquí presentado detecta las frecuencias de las señales ruidosas permitiendo de esta manera su posterior cancelación.

Los resultados obtenidos demuestran una razonable efectividad y representa una alternativa más en la utilización de algoritmos para la separación ciega de fuentes.

Se observa una correlación morfológica hasta los 100 Hz –rango de frecuencias del ECG-, conservando todas las frecuencias de la señal original, variando únicamente en este intervalo los valores de amplitud en un promedio del 25%. A medida que aumentamos los valores de amplitud del ruido generado en el tiempo, se pierde información en amplitud de la señal recuperada.

Las frecuencias de las señales ruidosa introducidas fueron identificadas en todos los casos probados.

Palabras clave— ECG, Lyapunov, ruido.

I. INTRODUCCIÓN l estudio detallado de la señal electrocardiográfica constituye una herramienta imprescindible a la hora de diagnosticar cardiopatías. Su análisis cobró mayor

relevancia a partir de la incorporación de técnicas digitales que pueden implementarse con tecnología al alcance de un laboratorio experimental, ampliando de esta manera las posibilidades de diagnóstico mediante algoritmos computacionales. Uno de los problemas que más frecuentemente se producen durante la captura de la señal de ECG es la suma de señales no deseadas a las cuales las denominamos comúnmente “ruido” que perturba la lectura de la señal fuente.

Una de las posibles soluciones a este inconveniente es la separación del ruido interferente de la señal de interés. Usualmente la manera en que estas señales se encuentran incorporadas a la del ECG es desconocida y muchas veces el enmascaramiento producido debido a ellas es tal que pueden afectar la interpretación de anomalías cardíacas.

La técnica utilizada en este trabajo es el Análisis de Componentes Independientes (ICA por sus siglas en inglés). El análisis ICA es una solución particular al problema más amplio de la separación ciega de fuentes (BSS) que consiste en obtener las señales originales de un proceso a partir de una mezcla desconocida de dicha señales [1].

La herramienta matemática que utilizamos para el Análisis de Componentes Independientes es la Ecuación

Algebraica de Lyapunov. Ésta es una ecuación matricial que se basa en el concepto de estabilidad de sistemas lineales e invariantes en el tiempo.

Este método se aplica para la eliminación de señales no deseadas ya sea en el espacio del tiempo como en el espacio de las frecuencias [2] y [3].

Nos planteamos como objetivo la identificación de frecuencias asociadas a señales espurias.

II. MÉTODOS Las herramientas matemáticas presentadas aquí son el

Análisis de Componentes Principales, la Ecuación Algebraica de Lyapunov y la Transformada de Fourier como así también métodos estadísticos de validación como ser la Kurtosis, el concepto de Covarianza y el Coeficiente de Correlación de Pearson. Todos ellos conforman el algoritmo para la resolución de los sistemas planteados.

A. Separación Ciega de Fuentes con la Ecuación Algebraica de Lyapunov

Sea el vector s(t) = [ s1(t), ..., sM(t) ]T que contiene a las M señales fuente, el vector x(t) = [ x1(t), ...,xN(t) ]T, con las N observaciones. Se dice que la mezcla es lineal e instantánea si:

(1)

donde D es una matriz NxM que recibe el nombre de matriz de mezcla. Nótese que la transformación es lineal e invariante en el tiempo. Como se dijo antes, identificaremos N= Nº. de sensores, M= Nº. de fuentes .

Por hipótesis, tanto D como s(t) son desconocidos y sólo se cuenta con las observaciones.

El objetivo al cual queremos arribar es encontrar:

(2) siendo E una matriz MxN, que recibe el nombre de matriz de separación [4].

Considerando al corazón (sistema cardíaco) como un sistema biológico estable, utilizamos la Ecuación de Lyapunov. A los fines de la elaboración de este trabajo, planteamos la hipótesis de que el corazón es un sistema estable. Nos basamos para ello en la homeostasis, que alude a la tendencia a mantener el equilibrio fisiológico por compensación química, y que permite, por lo tanto,

Separación de Frecuencias No Deseadas en la Señal Cardíaca utilizando ICA

María Inés Pisarello, Carlos Álvarez Picaza y Jorge Monzón Facultad de Ciencias Exactas, Universidad Nacional del Nordeste, Corrientes, Argentina

[email protected]

E

Page 2: T08TCAr29.pdf

2

CPBAP =+

cFp =

Gcp =

11

−=∑

=

n

yxS

n

ii

xy

i

yx

xySrσσ

=

considerar al corazón como un sistema biológico estable y retroalimentado.

La Ecuación de Lyapunov tiene la siguiente forma:

(3) El criterio de estabilidad se basa en encontrar P de esta

ecuación, eligiendo previamente C.A(NxN) y B(MxM) son matrices constantes. Para el

procesamiento de las señales, se generaron mediante MATLAB® matrices tipo random (aleatorias). Las matrices C y la incógnita P son NxM.

Es decir, la resolución de la ecuación matricial anterior tiene una solución de la forma

(4)

donde F es la matriz (NxM) x (NxM) de la ecuación anterior, y p y c son las matrices P y C de (3) convertidas a vectores (NxM) x 1.

Esta ecuación tiene solución única si F es invertible, lo cual no ocurre ya que F es rectangular.

Para solucionar este inconveniente debemos transformar a F en una matriz cuadrada e invertible.

Aplicamos PCA (Análisis de Componentes Principales) a F, obteniendo una matriz G, la cual contiene más del 98 % de información de la matriz P (original). G es una matriz cuadrada e invertible.

En estas condiciones, las señales mezcladas pueden ser separadas.

(5)

De esta manera se obtiene una analogía directa entre (2)

y (5).

B. Hardware y Software Procesador Celeron, 2.8 GHz, 512 Mb de RAM, bajo

sistema operativo Windows XP. Utilizamos el sistema de cálculo MATLAB® (The

Mathworks, Natick, Massachusetts), y en particular la función lyap que resuelve la ecuación algebraica de Lyapunov, y la función rand para generar ruido aleatorio.

C. Señales Hemos extraído registros electrocardiográficos normales

y patológicos de la MIT-BIH Arrhythmia Database [5] y [6]. Utilizamos en particular los registros identificados como 100, 101 y 102, digitalizados a 11 bits y 360 Hz de velocidad de captura. El registro ECG #100, de 30 minutos de duración, representa 2239 latidos de ritmo sinusal normal.

Por su parte, el registro #101 contiene 1860 latidos normales y 3 APC.

El registro #102 fue seleccionado por presentar 2028 latidos de marcapaso, 99 latidos normales y 4 PVC. Todas ellas en 30 minutos de registro.

De la serie 200 utilizamos tres señales con una duración de 30 minutos cada una. Ellas son la #200, #201 y #202. Estas señales fueron elegidas por contener episodios de

fibrilación auricular, trigemia ventricular y taquicardia ventricular entre otras anomalías.

Estas seis señales fueron obtenidas utilizando la derivación precordial V1 y una modificación de la derivación II, denominada MLII, con electrodos pectorales. Se toman ambas derivaciones en razón de que el número de fuentes debe ser igual al número de observaciones, para llegar a un resultado cierto.

En la base de datos original del MIT-BIH, ninguno de estos seis registros muestra ruido interferente. Para lograrlo, hemos superpuesto al ECG normal señales de ruido de distintas frecuencias generadas aleatoriamente con MATLAB®.

Las señales de ruido generadas contenían frecuencias de 30, 50 y 60 Hz. Las cuales fueron elegidas debido a que en el ECG encontramos frecuencias menores a los 100 Hz.

D. Evaluación A los fines de evaluar cuantitativamente el

comportamiento del método propuesto en la eliminación del ruido –o recuperación de fuentes-, adoptamos el criterio de la Covarianza y el Coeficiente de Correlación Lineal de Pearson.

La Covarianza entre dos variables es un estadístico resumen indicador de si las puntuaciones están relacionadas entre sí. Se la utiliza para medir el grado de relación de dos variables. Este índice refleja la relación lineal que existe entre dos variable x e y [7].

(6)

El resultado numérico fluctúa entre +∞ y -∞. Un resultado positivo significa que existe una relación lineal positiva entre las variables. Si el resultado es 0, no existe relación lineal alguna.

El Coeficiente de Correlación Lineal de Pearson es un índice estadístico que permite medir la fuerza de la relación lineal entre 2 variables. Su resultado es un valor que fluctúa entre –1 (correlación perfecta en sentido negativo) y +1 (correlación perfecta en sentido positivo). Cuanto más cercano al 0 sean los valores, indican una mayor debilidad de la relación o incluso ausencia de correlación entre las variables. La expresión es:

(7)

siendo el denominador de esta expresión el producto de las Desviaciones Standard de las variables x e y.

Page 3: T08TCAr29.pdf

3

Figura 2. Salida del proceso. (a) Espectro de frecuencia de la señal no deseada. (b) Espectro de frecuencia de la señal de interés

(#100).

Figura 3. (a) Espectro de frecuencia de la señal #100 sin corromper. (b) Espectro de frecuencia de la señal (#100) luego

se la separación de fuentes.

III. RESULTADOS

En la Fig. 1 mostramos la señal #100 limpia y la misma con un ruido agregado de 50Hz. Ésta última, en sus dos derivaciones, componen la matriz de entrada del sistema.

Durante el proceso se utilizó la Transformada de Fourier Rápida para señales discretas (FFT) [8] para obtener los espectros de frecuencia de las señales estudiadas, que se encuentran mezcladas de una forma desconocida. Además de la FFT, aplicamos el proceso de ICA propuesto en conjunto con técnicas de PCA que permiten obtener una salida de la forma de la Fig. 2. En la Fig. 2 (a) se observa el espectro de frecuencia del ruido de 50Hz, ubicado en su componente de frecuencia correspondiente. La Fig. 2 (b) se observa el espectro de frecuencias de la señal de ECG, en este caso la #100.

Para poder comparar visualmente los resultados, agregamos la Fig. 3, donde el lector puede observar en (a) el espectro de frecuencias de la señal #100 limpia, es decir sin ruido agregado y en (b), puede observar el espectro de frecuencias de dicha señal que se obtuvo luego de separar las observaciones con el método propuesto. A simple vista ambas señales guardan analogía morfológica, distinguiéndose en sus valores de amplitud.

A los fines de evaluar cuantitativamente los resultados obtenidos en la separación en frecuencias del ruido perturbador –o señal no deseada- adoptamos los índices estadísticos que se mencionaran en la sección anterior.

La Tabla I muestra los resultados de los procesos realizados con las señales estudiadas evaluados con los índices estadísticos mencionados anteriormente.

Los índices evalúan la correlación existente entre el espectro de frecuencias de la señal de interés limpia Fig. 3 (a) y el espectro de frecuencias de la señal de interés luego de la separación Fig. 3 (b).

Una posibilidad para encontrar la matriz de separación Ees maximizar una cantidad que mida la no-gaussianidad de los datos, en nuestro caso elegimos la kurtosis, que representa la elevación o achatamiento de una distribución comparada con la distribución normal. Una kurtosis positiva indica una distribución relativamente elevada mientras que una kurtosis negativa indica una distribución relativamente plana [7].

En todos los casos probados, obtuvimos valores de kurtosis por superiores a 5.

Figura 1. Señal #100 limpia; 3000 muestras. (a) Señal limpia. (b) Señal corrompida con ruido blanco de 30Hz.

0 500 1000 1500 2000 2500 3000800

900

1000

1100

1200

1300

0 500 1000 1500 2000 2500 3000800

900

1000

1100

1200

1300

1400

(a)

(b)

0 50 100 150 200 250 300 350 400 450 5000

2

4

6

8x 10

5

0 50 100 150 200 250 300 350 400 450 500-5000

0

5000

10000

15000

20000

(a)

(b)

0 50 100 150 200 250 300 350 400 450 5000

0.5

1

1.5

2

2.5

3x 10

4

0 50 100 150 200 250 300 350 400 450 500-5000

0

5000

10000

15000

20000

(a)

(b)

Page 4: T08TCAr29.pdf

4

TABLA IRESULTADOS DE LOS ÍNDICES DE COVARIANZA Y CORRELACIÓN DE

PEARSON. SEÑALES #100, #101, #102, #200, #201 Y #202.

IV. CONCLUSIONES Los resultados alcanzados en este trabajo permiten

identificar las frecuencias de aquellas señales no deseadas y recuperar aquellas de la señal de interés.

Los datos obtenidos resultan alentadores pues revelan la posibilidad de utilizar la ecuación algebraica de Lyapunov como alternativa para la separación ciega de fuentes, no sólo en el espacio del tiempo, sino también en el espacio de las frecuencias, ampliando las perspectivas de eliminación de los ruidos que perturban a la señal de interés.

De la observación visual, podemos concluir que las señales separadas que se obtienen como salida de nuestro sistema, conservan una analogía morfológica con los espectros de frecuencia de las señales originales previas a su mezcla. Tal análisis está luego avalado con los altos valores de covarianza obtenidos y los valores del coeficiente de correlación muy próximos a 1, Tabla I.

Las frecuencias de las señales ruidosas introducidas son identificadas en todos los casos probados.

En una próxima etapa, intensificaremos la evaluación del algoritmo propuesto, utilizando bioseñales in vivo, y ampliando los tipos de ruidos que intervienen en la captura del ECG.

AGRADECIMIENTOS Este trabajo fue realizado con aportes de la Secretaría

General de Ciencia y Técnica de la Universidad Nacional del Nordeste, Corrientes, Argentina, P.I. Nº 062-07.

REFERENCIAS [1] P. Comon, “Independent component analysis, A new concept?,”

Signal Processing, Vol. 36, pp. 287–314, 1994 [2] Monzón JE, Pisarello MI, Álvarez Picaza C, “Blind source

separation of electrocardiographic signals using system stability criteria”, Proceedings of the 29th Annual International Conference IEEE-EMBS. 2007.

[3] Pisarello MI, Álvarez Picaza C, Monzón JE, “Eliminación de ruido en bioseñales utilizando la ecuación algebraica de Lyapunov”, IV Congreso Latinoamericano de Ingeniería Biomédica, CLAIB. 2007

[4] A. Hyvärinen, J. Karhunen and E. Oja, Independent Component Analysis. New York, NY:John Wiley & Sons, 2001, pp. 1–12.

[5] G. B. Moody and R. G. Mark, “The Impact of the MIT-BIH Arrhythmia Database,” IEEE Engineering in Medicine & Biology Magazine, Vol. 20, No. 3, pp.45-50, May/June 2001.

[6] G. B. Moody, R. G. Mark and A. L. Goldberger, “PhysioNet: A Web-Based Resource for the Study of Physiologic Signals,” IEEE Engineering in Medicine & Biology Magazine, Vol. 20, No. 3, pp.70-75, May/June 2001.

[7] S. Fernández Fernández, J. M. Cordero Sánchez, A. Córdoba Largo. “Estadística Descriptiva” ISBN 8473563069, 9788473563062 Esic Editorial, 2002.

[8] Matlab, Toolbox User´s Guide. Natick: Massachusetts: The MathWorks Inc., 2006E. Alarcos Llorach, Gramática de la Lengua Española, Madrid: Editorial Espasa Calpe, 1999.

Señal Ruido en Hz Covarianza Coeficiente de

Correlación 30Hz 8949058,28 0,996 50Hz 8949058,28 0,996 100 60Hz 8949058,28 0,996 30Hz 60650883,55 0,979 50Hz 59315682,65 0,980 101 60Hz 59563475,86 0,971 30Hz 83760641672,04 1,000 50Hz 83760641672,04 1,000 102 60Hz 83760641672,04 1,000 30Hz 313794816,81 0,969 50Hz 292948777,45 0,967 200 60Hz 290363108,58 0,946 30Hz 35842190,15 0,972 50Hz 35842190,15 0,972 201 60Hz 35842190,15 0,972 30Hz 89709075,73 0,984 50Hz 88343323,58 0,985 202 60Hz 88047050,92 0,976