I DENTIFICACIÓN DE S ISTEMAS El metodo de los minimos cuadrados 1

IDENTIFICACIÓN DE SISTEMAS

El metodo de los minimos cuadrados

Contenido

Modelado de datos

El problema del modelado de datos

Modelos lineales y modelos no lineales

Estimación de mínimos cuadrados lineal

Identificabilidad

Mínimos Cuadrados para un modelo lineal (dinamico)

Propiedades del método de los Minimos Cuadrados

Criterio de Akaike

Ejemplos

MODELADO DE DATOS3

MODELADO DE DATOS

El modelado de datos se puede expresar de la siguiente forma:

Dadas:

Una colección finita de datos

Una forma funcional

Hallar los parametros de la funcion

que mejor representen la relacion entre los datos

(xi, yi)

y = ax+b

MODELADO DE DATOS

Se busca minimizar unos residuos

(x1,y1)

(x2,y2)

(x3,y3)

(x4,y4)

(x5,y5)(x6,y6)

(x7,y7)

f(x) = ax+b

i i ik y k f x

CRITERIO DE LOS MINIMOS CUADRADOS

Formulacion del ajuste por Minimos cuadrados:

(x1,y1)

(x2,y2)

(x3,y3)

(x4,y4)

(x5,y5)(x6,y6)

(x7,y7)

f(x) = ax+b

kJ a b k

CRITERIO DE LOS MINIMOS CUADRADOS

En el ejemplo, hallar el valor de los coeficientes a y b tal que se minimiza

k y k f x k

kJ a b k

f x ax b

donde N es el numero de datos entrada-salida dado

UN PROBLEMA DE OPTIMIZACION

Aproximaciones computacionales:

Algoritmos numericos generales para la minimizacion de una funcion Basados en el gradiente; algoritmos numericos

generales para hallar raices; algoritmos que aprovechan la forma de la funcion

Algoritmos con una aproximacion basada en la inteligencia artificial: algoritmos geneticos

Solucion analitica: minimos cuadrados lineal

EL PROBLEMA DEL MODELADO DE DATOS

LA APROXIMACION DE FUNCIONES Una funcion puede verse como un mapeo

Ejemplo: ley fundamental de la dinámica F = ma

y = a, u = F, g(u) = u/m.

En general, y y u pueden ser vectores 10

LA APROXIMACION DE FUNCIONES Al realizar la aproximacion de una funcion,

sólo están disponibles un número finito de muestras

ˆ ˆ ˆ1 , 1 , , , , ,NZ u y u k y k u N y N

¿Podemos postular la existencia de un modelo que explique los datos?

LA APROXIMACION DE FUNCIONES En general, se asume que las muestras

disponibles son ruidosas

y k g u k v k k = 1,2,…, N

Entonces el problema de la aproximacion de funcioneses equivalente a reconstruir la hipersuperficie g(u)

a partir de los pares (u(k),y(k)).

EL PROBLEMA DE LA APROXIMACION DE FUNCIONES Dada cierta función, , donde

y , deseamos construir una función f

tal que

:g U Y nU RY R

0 0:f U Y

g u f u e u

EL PROBLEMA DE LA APROXIMACION DE FUNCIONES La informacion que se dispone de g son N

pares de entrada-entrada

ˆ ˆ ˆ1 , 1 , , , , ,NZ u y u k y k u N y N

normalmente se asume que los valores de salida del conjunto de muestras de entrenamiento estan adulterados por el ruido

EJEMPLO: UNA ENTRADA, UNA SALIDA

0 1 2 3 4 5 6 7 8 9 10

¿Como podemos modelar el proceso que genera estos datos? 15

EJEMPLO: DOS ENTRADAS, UNA SALIDA

0 2 3,1 ,5 ,6

2 4 6TZ

EL RETO Puede ser difícil proponer una buena función

f para ajustar el mapeo g

cuando sólo sabemos muy poco sobre la asociación entre U y Y en la forma de los pares de datos Z.

Puede ser dificil incluso saber cuando tenemos una buena aproximación

MODELOS LINEALES Y MODELOS NO LINEALES

MODELOS LINEALES VS . NO LINEALES

Es comun asumir que f (u) pertenece a una familia de funciones que

comparten la misma estructura y

difieren por los valores tomados por ciertos parametros θ.

,y f u

EL MODELO LINEAL (EN LOS PARAMETROS)

Un modelo lineal asume que la funcion es lineal respecto a los parametros θ

1 1 2 2, q qf u f u f u f u

Aquí, la linealidad se refiera a “con respecto a los parametros”

MODELOS NO-LINEALES

En los modelos no-lineales la funcion es no-lineal respecto a los parametros θ

, expf u u

ESTIMACIÓN DE MÍNIMOS CUADRADOS LINEAL

EL PROBLEMA

Dada una colección finita de observaciones

ZN = {u(0), y(0), u(1), y(1), ..., u(N), y(N)}

Proceso

Modelo

Regresor lineal

EL REGRESOR LINEAL

Se asume que la relación entrada-salida puede ser descrita por una estructura de regresor lineal

f(u,θ) es denominada la funcion de ajuste. Las fi(u) son denominadas las funciones base

1 1 2 2, q qf u f u f u f u

ALGUNAS FUNCIONES BASE

Funciones polinomiales

Funciones base Gausianas

Funciones base Sigmoidales

Fourier wavelets

( ) jjf u u

1 exp( )jf ua

LOS ERRORES COMETIDOS

Dados unos datos y el modelo lineal, deseamos calcular los “mejores” parametros.

Queremos minimizar los errores.

Cortesia de Johann Fredrich Carl Gauss (1777-1855)

LOS RESIDUOS

El ajuste de minimos cuadrados halla el vector de parametros θ tal que se minimiza

ˆ ,k y k f u k

residuos = errores

NATURALEZA DE LOS RESIDUOS

Normalmente se asume que los residuos son variables aleatorias, con las siguientes caracteristicas:

Independientes

Con valor esperado es cero

Normalmente distribuidas

Tienen la misma desviacion estandard

EL MODELO DE LOS DATOS

Considere, por ejemplo, el modelo con tres parametros:

Podemos escribir todo en forma vectorial

ˆ Ty k f u k k

1 1 2 2 3 3y k f u k f u k f u k k

CALCULO DE LOS MEJORES ΘJ’S

Considerando N datos, en forma matricial

f u f u f u

f u f u f uA

f u N f u N f u N

ˆ 2ˆ

cuando N > q normalmente no es posible encontrar los θj que simultáneamente satisfacen todas las N ecuaciones, entonces

El criterio para determinar el estimado de los parametros optimos es

ˆ arg min ,q

La Cantidad a ser minimizada es

Que expresada en forma matricial nos queda

ˆ ˆT

J y A y A

La Cantidad a ser minimizada es

igualando a cero su derivada

ˆ ˆ ˆ2T T T T TJ y y A y A A

ˆ2 2 0T TJA y A A

LA ECUACION NORMAL

El valor minimo de J se obtiene con el vector θ que satisface la ecuacion normal

ˆT TA A A y

Ecuacion normal

IDENTIFICABILIDAD35

EXISTENCIA DE LOS PARAMETROS

La solución única a las ecuaciones normales pueden ser obtenida siempre que la matriz (ATA) sea no singular (existencia de la inversa)

Llamado el Estimador de minimos cuadrados lineal

1ˆ ˆT TN A A A y

EXISTENCIA DE LOS PARAMETROS

El estimador de minimos cuadrado lineal:

1ˆ ˆT TN A A A y

f u f u f u

f u f u f uA

f u N f u N f u N

Notese que el minimizador obtenido es influenciado por:

Las funciones de ajuste seleccionadas, y

Las señales de entrada observadas.

IDENTIFICABILIDAD

Dadas:

Las señales de entrada observadas, y Las funciones de ajuste seleccionadas

El estimado de los parametros (del modelo) existen si la inversa de la matriz (ATA) existe

Se dice entonces que el modelo es identificable

IDENTIFICABILIDAD

Se dice entonces que el modelo es identificable

Observe que decimos “que entonces el modelo es identificable”

La identificabilidad se refiere al modelo

Quizas el modelo con otros datos sea identificable

O quizas los mismos datos otra estructura de modelo sea identificable 39

LOS PARAMETROS “VERDADEROS”

Si existen, el vector de parámetros “verdadero” describe a aquel que minimiza el error

A menudo es conveniente estudiar las propiedades de los parámetros en terminos del error

es el vector de parámetros “verdadero”.

MÍNIMOS CUADRADOS PARA UN MODELO LINEAL (DINAMICO)

EJEMPLO: ESTRUCTURA AR

En la identificacion de sistemas usualmente se usa un modelo AR (AutoRegressive model), donde

y k y k i

y(k) es la salida del sistema en el tiempo k ≥ 0.

Una forma util de ver el modelo AR es verlo como una manera de determinar el siguiente valor de la salida, dadas las observaciones previas

1 21 2aN ay k y k y k y k N

En este caso el modelo AR esta definido por el modelo lineal

Ty k k

1 , , ,T

ak y k y k i y k N

El termino φ(t) recibe el nombre de vector de regresiony, en general, contiene la información de entradas y

salidas anteriores a t

En este caso el modelo AR esta definido por el modelo lineal

Ty k k

1 , , ,T

ak y k y k i y k N

En general, el vector de regresión (regresor) se construye,, con los datos de entrada-salida pasados, hasta el instante k-1

EJEMPLO: ESTRUCTURA ARX

Por ejemplo, en el caso de una estructura de modelo simple como el ARX de primer orden:

1 21 1 2y t ay t b u t b u t

1 2, , 1 1 2f t t ay t b u t b u t

EJEMPLO: ESTRUCTURA ARX

En el caso de una estructura ARX la correspondencia con la formulación general seria

Ta b b 1 1 2

Tt y t u t u t

, , Tf t t t

El termino φ(t) recibe el nombre de vector de regresiony, en general, contiene la información de entradas y

salidas anteriores a t

LA MATRIZ DE DATOS

El problema de la estimacion de parametros consiste en encontrar relaciones matemáticas entre secuencias de entrada y las secuencias de salida.

En general, los datos se tienen en forma de una matriz

NZ ,y t u t t = 1,...N

IDENTIFICACION DE UN MODELO AR

La estimación de parámetros consiste en hallar la estima de que minimiza el criterio.

nnyn T

Error de Predicción

RELACION CON LA IDENTIFICACION

En el modelo de regresión lineal se suele incorporar un término de perturbación (n)

Ty k k v k

Para modelar la parte de la salida que no puede ser explicada por el regresor lineal

NATURALEZA DE (N)

Si se da una caracterización estocástica para (n),

(n) es un proceso estocástico

SOLUCION: MINIMOS CUADRADOS Asumamos que el sistema dinamico se puede

representar por el modelo lineal

ˆ 1 Ty t t t

es el vector de regresion t entradas y salidas retardadas

es el vector de parametros

SOLUCION: MINIMOS CUADRADOS

En estas condiciones

11 1ˆ T T

N YN N

Se introducen los terminos N a fin de retener expresiones que sean computacionalmente

factibles para señales de entrada cuasi-estacionarias

EXISTENCIA DE LA SOLUCION

El requisito necesario para garantizar una solución única es que la señal de excitación sea persistentemente

excitada de orden mayor que d, siendo d el numero de parametros del modelo, [Söderström89].

PROPIEDADES DEL MÉTODO DE LOS MINIMOS CUADRADOS

UNICIDAD DE LA SOLUCION

La principal ventaja de este método es que

Si se cumplen las condiciones de identificabilidad

la obtención del mínimo global está garantizada

Y la solucion es unica

NATURALEZA DE LOS PARAMETROS

Si se da una caracterización estocástica para (n),

(n) es un proceso estocástico

¡El estimador por mínimos cuadrados es una variable aleatoria!

LOS PARAMETROS “VERDADEROS”

Supongamos la existencia de un juego de parametros “verdadero”

*Ty t t e t

donde e(t) es un ruido blanco de media cero y variancia 2

PROPIEDADES DE LOS PARAMETROS ESTIMADOS

1. converge a cuando N tiende a infinito

2. La variable aleatoria se comporta como una distribución normal de media cero y covariancia

12 TPLS

PROPIEDADES DEL RUIDO ESTIMADO

3. Un estimador de la variancia de e(t) es:

2ˆ2 NV

siendo d el número de parámetros del modelo

OBSERVACION

si la perturbación e(t) no es un ruido blanco y la relación señal útil/señal ruido es importante,

la convergencia a no está garantizada.

CRITERIO DE AKAIKE62

CRITERIO DE AKAIKE

Una variante del método LS, conocido como Criterio de Akaike consiste en minimizar la función de pérdidas

1 2AICN N

EJEMPLOS 64

EJEMPLO

Ejemplo: Supóngase el sistema

¿Cuál es el tipo de estructura más apropiada a elegir para identificación?

ELECCION DE LA ESTRUCTURA El tipo de estructura más apropiada para

identificación debe ser del tipo “Output Error” (OE).

1 21 2 3

1 2 31

b q b qy t u t e t

f q f q f q

Por tanto nb = 2, nf = 3 y nk = 2.

ELECCION DE LA ESTRUCTURA

El tipo de estructura más apropiada para identificación debe ser del tipo “Output Error” (OE).

¡ Sin embargo, en la mayoría de los casos el diseñador no dispone de la información sobre el

sistema real !

ELECCION DE LA ESTRUCTURA: EJEMPLO El tipo de estructura más apropiada para

identificación debe ser del tipo “Output Error” (OE).

¡ Sin embargo, en la mayoría de los casos el diseñador no dispone de la información sobre el

sistema real !

EJEMPLO

Ejemplo: Supóngase el sistema

Estimar los parámetros del modelo OE escogido Estimar un modelo ARX. Comparar resultados.

EJERCICIO

Investigar las funciones mostradas del Toolbox de identificacion en matlab

present

PROBLEMAS

Ver el documento Tema 3_problemes.pdf

De los profesores Teresa Escobet y Bernardo Morcego

de la Escola Universitària Politècnica de Manresa [Escobet et al., 2003].

PROBLEMAS

Ver el documento Tema 3_problemes.pdf

De los profesores Teresa Escobet y Bernardo Morcego

de la Escola Universitària Politècnica de Manresa [Escobet et al., 2003].

FUENTES De Nicolao G., System Identification: Problems and perspectives.

Dipartimento di Informatica e Sistemistica, Universiti di Pavia, Pavia, Italy. 1995.

Passino Kevin M., Yurkovich Stephen, Fuzzy Control. Addison Wesley Longman, Inc. 1998

Recktenwald Gerald, A Curve-Fitting Cookbook for use with the NMM Toolbox. Mechanical Engineering Department, Portland State University, Portland, Oregon. October 17, 2000.

Recktenwald G. W., Numerical Methods with MATLAB: Implementations and Applications. Prentice-Hall, Englewood Cliffs, NJ, 2000.

Ljung Lennart, Linear System Identificación as Curve Fitting. Report no.: LiTH-ISY-R-2466. Division of Automatic Control. Department of Electrical Engineering Linkopings universitet, Linkoping, Sweden. August 7, 2002.

Moler C. and Moler K., Numerical Computing with MATLAB. The MathWorks, Inc. and Stanford University. 2003.

Sanjay Lall, Modern Control 1. Lecture Notes. Standford University. Winter quarter, 02-2003 76

ULTIMA DIAPOSITIVA

I DENTIFICACIÓN DE S ISTEMAS El metodo de los minimos cuadrados 1

Documents

S istemas de superior

RENDIMIENTOS MINIMOS - IMPRIMIR

PERFIL DEL PUESTO DENTIFICACIÓN DEL PUESTO

I DENTIFICACIÓN DE S ISTEMAS Identificacion de modelos no parametricos 1

Minimos teoricos

I dentificación de cambios químicos y reacciones quimicas

Regresion minimos cuadrados

I DENTIFICACIÓN DE S ISTEMAS Modelos parametricos y no parametricos 1

Istemas de Acumulacion de Costos A

Estandares Minimos Psoe

Idf Minimos Cuadrados

Maximos y minimos

Excel Minimos Cuadrados

I DENTIFICACIÓN DE S ISTEMAS Señales y Sistemas Estocásticos 1

hoja de vida tecnologo istemas

S istemas mixtos , religiosos y consuetudinarios

Clase Minimos Cuadrados

Presentacion de istemas de informacion

Requerimientos minimos

istemas de S Gestión