Identificación de Sistemas El metodo de los minimos cuadrados 1

Preview:

Citation preview

Identificación de Sistemas

El metodo de los minimos cuadrados

1

/77

Contenido

Modelado de datos

El problema del modelado de datos

Modelos lineales y modelos no lineales

Estimación de mínimos cuadrados lineal

Identificabilidad

Mínimos Cuadrados para un modelo lineal (dinamico)

Propiedades del método de los Minimos Cuadrados

Criterio de Akaike

Ejemplos

2

/77

MODELADO DE DATOS

3

/77

Modelado de datos

El modelado de datos se puede expresar de la siguiente forma:

Dadas:

Una colección finita de datos

Una forma funcional

Hallar los parametros de la funcion

que mejor representen la relacion entre los datos

4

(xi, yi)

y = ax+b

/77

Modelado de datos

Se busca minimizar unos residuos

5

(x1,y1)

(x2,y2)

(x3,y3)

(x4,y4)

(x5,y5)(x6,y6)

(x7,y7)

f(x) = ax+b

i i ik y k f x

/77

Criterio de los minimos cuadrados

Formulacion del ajuste por Minimos cuadrados:

6

(x1,y1)

(x2,y2)

(x3,y3)

(x4,y4)

(x5,y5)(x6,y6)

(x7,y7)

f(x) = ax+b

2

1,

N

kJ a b k

/77

Criterio de los minimos cuadrados

En el ejemplo, hallar el valor de los coeficientes a y b tal que se minimiza

7

k y k f x k

2

1,

N

kJ a b k

f x ax b

donde N es el numero de datos entrada-salida dado

/77

Un problema de optimizacion

Aproximaciones computacionales:

Algoritmos numericos generales para la minimizacion de una funcion

• Basados en el gradiente; algoritmos numericos generales para hallar raices; algoritmos que aprovechan la forma de la funcion

Algoritmos con una aproximacion basada en la inteligencia artificial: algoritmos geneticos

Solucion analitica: minimos cuadrados lineal

8

/77

EL PROBLEMA DEL MODELADO DE DATOS

9

/77

La aproximacion de funciones

Una funcion puede verse como un mapeo

Ejemplo: ley fundamental de la dinámica F = ma

10

y g u

y = a, u = F, g(u) = u/m.

En general, y y u pueden ser vectores

/77

La aproximacion de funciones

Al realizar la aproximacion de una funcion, sólo están disponibles un número finito de muestras

11

ˆ ˆ ˆ1 , 1 , , , , ,NZ u y u k y k u N y N

¿Podemos postular la existencia de un modelo que explique los datos?

/77

La aproximacion de funciones

En general, se asume que las muestras disponibles son ruidosas

12

y k g u k v k k = 1,2,…, N

Entonces el problema de la aproximacion de funcioneses equivalente a reconstruir la hipersuperficie g(u)

a partir de los pares (u(k),y(k)).

/77

donde y

El problema de la aproximacion de funciones

Dada cierta función,

deseamos construir una función f

tal que

13

:g U YnU R Y R

0 0:f U Y

g u f u e u

/77

El problema de la aproximacion de funciones

La informacion que se dispone de g son N pares de entrada-entrada

14

ˆ ˆ ˆ1 , 1 , , , , ,NZ u y u k y k u N y N

normalmente se asume que los valores de salida del conjunto de muestras de entrenamiento estan adulterados por el ruido

/77

Ejemplo: una entrada, una salida

0

2

4

6

8

10

12

14

16

0 1 2 3 4 5 6 7 8 9 10

X

Y

15

¿Como podemos modelar el proceso que genera estos datos?

/77

Ejemplo: dos entradas, una salida

16

0 2 3,1 ,5 ,6

2 4 6TZ

/77

El Reto

Puede ser difícil proponer una buena función f para ajustar el mapeo g

cuando sólo sabemos muy poco sobre la asociación entre U y Y en la forma de los pares de datos Z.

Puede ser dificil incluso saber cuando tenemos una buena aproximación

17

/77

MODELOS LINEALES Y MODELOS NO LINEALES

18

/77

Modelos lineales vs . No lineales

Es comun asumir que f (u) pertenece a una familia de funciones que

comparten la misma estructura y

difieren por los valores tomados por ciertos parametros θ.

19

,y f u

/77

El modelo lineal (en los parametros)

Un modelo lineal asume que la funcion es lineal respecto a los parametros θ

20

1 1 2 2, q qf u f u f u f u

Aquí, la linealidad se refiera a “con respecto a los parametros”

/77

Modelos no-lineales

En los modelos no-lineales la funcion es no-lineal respecto a los parametros θ

21

, expf u u

/77

ESTIMACIÓN DE MÍNIMOS CUADRADOS LINEAL

22

/77

El problema

23

Dada una colección finita de observaciones

ZN = {u(0), y(0), u(1), y(1), ..., u(N), y(N)}

t t

YU

U Y

Proceso

Modelo

Regresor lineal

y g u

/77

El regresor lineal

Se asume que la relación entrada-salida puede ser descrita por una estructura de regresor lineal

24

f(u,θ) es denominada la funcion de ajuste. Las fi(u) son denominadas las funciones base

1 1 2 2, q qf u f u f u f u

/77

Algunas funciones base

Funciones polinomiales

Funciones base Gausianas

Funciones base Sigmoidales

Fourier wavelets

25

( ) jjf u u

22

exp2

j

j

uf u

1( )

1 exp( )jf ua

/77

Los errores cometidos

Dados unos datos y el modelo lineal, deseamos calcular los “mejores” parametros.

Queremos minimizar los errores.

• Cortesia de Johann Fredrich Carl Gauss (1777-1855)

26

error

/77

Los residuos

El ajuste de minimos cuadrados halla el vector de parametros θ tal que se minimiza

27

ˆ ,k y k f u k

2

1

1 N

kJ k

N

residuos = errores

/77

Naturaleza de los residuos

Normalmente se asume que los residuos son variables aleatorias, con las siguientes caracteristicas:

Independientes

Con valor esperado es cero

Normalmente distribuidas

Tienen la misma desviacion estandard

28

20,N

/77

El modelo de los datos

Considere, por ejemplo, el modelo con tres parametros:

Podemos escribir todo en forma vectorial

29

ˆ Ty k f u k k

1 1 2 2 3 3y k f u k f u k f u k k

/77

Calculo de los mejores θj’s

Considerando N datos, en forma matricial

30

ˆA y

1 2 3

1 2 3

1 2 3

1 1 1

2 2 2

f u f u f u

f u f u f uA

f u N f u N f u N

1

2

3

ˆ 1

ˆ 2ˆ

ˆ

y

yy

y N

/77

Calculo de los mejores θj’s

cuando N > q normalmente no es posible encontrar los θj que simultáneamente satisfacen todas las N ecuaciones, entonces

El criterio para determinar el estimado de los parametros optimos es

31

ˆ arg min ,q

NN

RJ Z

/77

Calculo de los mejores θj’s

La Cantidad a ser minimizada es

Que expresada en forma matricial nos queda

32

2

1

N T

kJ k

ˆ ˆT

J y A y A

/77

Calculo de los mejores θj’s

La Cantidad a ser minimizada es

igualando a cero su derivada

33

ˆ ˆ ˆ2T T T T TJ y y A y A A

ˆ2 2 0T TJA y A A

/77

La ecuacion normal

El valor minimo de J se obtiene con el vector θ que satisface la ecuacion normal

34

ˆT TA A A y

Ecuacion normal

/77

IDENTIFICABILIDAD

35

/77

Existencia de los parametros

La solución única a las ecuaciones normales pueden ser obtenida siempre que la matriz (ATA) sea no singular (existencia de la inversa)

36

Llamado el Estimador de minimos cuadrados lineal

1ˆ ˆT TN A A A y

/77

Existencia de los parametros

El estimador de minimos cuadrado lineal:

37

1ˆ ˆT TN A A A y

1 2 3

1 2 3

1 2 3

1 1 1

2 2 2

f u f u f u

f u f u f uA

f u N f u N f u N

Notese que el minimizador obtenido es influenciado por:

Las funciones de ajuste seleccionadas, y

Las señales de entrada observadas.

/77

Identificabilidad

Dadas:

El estimado de los parametros (del modelo) existen si la inversa de la matriz (ATA) existe

38

Las señales de entrada observadas, y Las funciones de ajuste seleccionadas

Se dice entonces que el modelo es identificable

/77

Se dice entonces que el modelo es identificable

Observe que decimos “que entonces el modelo es identificable”

La identificabilidad se refiere al modelo

Identificabilidad

39

• Quizas el modelo con otros datos sea identificable

• O quizas los mismos datos otra estructura de modelo sea identificable

/77

Los parametros “verdaderos”

Si existen, el vector de parámetros “verdadero” describe a aquel que minimiza el error

A menudo es conveniente estudiar las propiedades de los parámetros en terminos del error

40

es el vector de parámetros “verdadero”.

*ˆ *

*

/77

MÍNIMOS CUADRADOS PARA UN MODELO LINEAL (DINAMICO)

41

/77

Ejemplo: estructura AR

En la identificacion de sistemas usualmente se usa un modelo AR (AutoRegressive model), donde

42

1

aN

ii

y k y k i

y(k) es la salida del sistema en el tiempo k ≥ 0.

/77

Ejemplo: estructura AR

Una forma util de ver el modelo AR es verlo como una manera de determinar el siguiente valor de la salida, dadas las observaciones previas

43

1 21 2aN ay k y k y k y k N

/77

Ejemplo: estructura AR

En este caso el modelo AR esta definido por el modelo lineal

44

Ty k k

1 , , ,T

ak y k y k i y k N

El termino φ(t) recibe el nombre de vector de regresiony, en general, contiene la información de entradas y

salidas anteriores a t

/77

Ejemplo: estructura AR

En este caso el modelo AR esta definido por el modelo lineal

45

Ty k k

1 , , ,T

ak y k y k i y k N

En general, el vector de regresión (regresor) se construye,, con los datos de entrada-salida pasados, hasta el instante k-1

/77

Ejemplo: estructura ARX

Por ejemplo, en el caso de una estructura de modelo simple como el ARX de primer orden:

46

1 21 1 2y t ay t b u t b u t

1 2, , 1 1 2f t t ay t b u t b u t

/77

Ejemplo: estructura ARX

En el caso de una estructura ARX la correspondencia con la formulación general seria

47

1 2

Ta b b 1 1 2

Tt y t u t u t

, , Tf t t t

El termino φ(t) recibe el nombre de vector de regresiony, en general, contiene la información de entradas y

salidas anteriores a t

/77

La matriz de datos

El problema de la estimacion de parametros consiste en encontrar relaciones matemáticas entre secuencias de entrada y las secuencias de salida.

En general, los datos se tienen en forma de una matriz

48

NZ ,y t u t t = 1,...N

/77

Identificacion de un modelo AR

La estimación de parámetros consiste en hallar la estima de que minimiza el criterio.

49

2

1,

NNN k

V Z k

nnyn T

Error de Predicción

/77

Relacion con la identificacion

En el modelo de regresión lineal se suele incorporar un término de perturbación (n)

50

Ty k k v k

Para modelar la parte de la salida que no puede ser explicada por el regresor lineal

/77

Naturaleza de (n)

Si se da una caracterización estocástica para (n),

51

(n) es un proceso estocástico

/77

Solucion: Minimos cuadrados

Asumamos que el sistema dinamico se puede representar por el modelo lineal

52

ˆ 1 Ty t t t

es el vector de regresion t entradas y salidas retardadas

es el vector de parametros

/77

Solucion: Minimos cuadrados

En estas condiciones

53

11 1ˆ T T

N YN N

Se introducen los terminos N a fin de retener expresiones que sean computacionalmente

factibles para señales de entrada cuasi-estacionarias

/77

Existencia de la solucion

54

El requisito necesario para garantizar una solución única es que la señal de excitación sea persistentemente

excitada de orden mayor que d, siendo d el numero de parametros del modelo, [Söderström89].

/77

PROPIEDADES DEL MÉTODO DE LOS MINIMOS CUADRADOS

55

/77

Unicidad de la solucion

La principal ventaja de este método es que

Si se cumplen las condiciones de identificabilidad

la obtención del mínimo global está garantizada

Y la solucion es unica

56

/77

Naturaleza de los parametros

Si se da una caracterización estocástica para (n),

57

(n) es un proceso estocástico

¡El estimador por mínimos cuadrados es una variable aleatoria!

/77

Los parametros “verdaderos”

Supongamos la existencia de un juego de parametros “verdadero”

58

*Ty t t e t

donde e(t) es un ruido blanco de media cero y variancia 2

/77

Propiedades de los parametros estimados

59

1. converge a cuando N tiende a infinito

2. La variable aleatoria se comporta como una distribución normal de media cero y covariancia

ˆN

*

*ˆNN

12 TPLS

/77

Propiedades del ruido estimado

60

3. Un estimador de la variancia de e(t) es:

2ˆ2 NV

N d

siendo d el número de parámetros del modelo

/77

Observacion

si la perturbación e(t) no es un ruido blanco y la relación señal útil/señal ruido es importante,

la convergencia a no está garantizada.

61

*

/77

CRITERIO DE AKAIKE

62

/77

Criterio de Akaike

Una variante del método LS, conocido como Criterio de Akaike consiste en minimizar la función de pérdidas

63

1 2AICN N

dV V

N

/77

EJEMPLOS

64

/77

Ejemplo

Ejemplo: Supóngase el sistema

65

¿Cuál es el tipo de estructura más apropiada a elegir para identificación?

/77

Eleccion de la estructura

El tipo de estructura más apropiada para identificación debe ser del tipo “Output Error” (OE).

66

2 3

1 21 2 3

1 2 31

b q b qy t u t e t

f q f q f q

Por tanto nb = 2, nf = 3 y nk = 2.

/77

Eleccion de la estructura: Ejemplo

El tipo de estructura más apropiada para identificación debe ser del tipo “Output Error” (OE).

¡ Sin embargo, en la mayoría de los casos el diseñador no dispone de la información sobre el

sistema real !

/77

Ejemplo

Ejemplo: Supóngase el sistema

• Estimar los parámetros del modelo OE escogido

• Estimar un modelo ARX. Comparar resultados.

68

/77

69

/77

70

/77

71

/77

Ejercicio

72

Investigar las funciones mostradas del Toolbox de identificacion en matlab

ar

armax

arx

bj

oe

pem

ivar

ivx

iv4

present

/77

Problemas

Ver el documento Tema 3_problemes.pdf

De los profesores Teresa Escobet y Bernardo Morcego

de la Escola Universitària Politècnica de Manresa [Escobet et al., 2003].

/77

Fuentes

De Nicolao G., System Identification: Problems and perspectives. Dipartimento di Informatica e Sistemistica, Universiti di Pavia, Pavia, Italy. 1995.

Passino Kevin M., Yurkovich Stephen, Fuzzy Control. Addison Wesley Longman, Inc. 1998

Recktenwald Gerald, A Curve-Fitting Cookbook for use with the NMM Toolbox. Mechanical Engineering Department, Portland State University, Portland, Oregon. October 17, 2000.

Recktenwald G. W., Numerical Methods with MATLAB: Implementations and Applications. Prentice-Hall, Englewood Cliffs, NJ, 2000.

Ljung Lennart, Linear System Identificación as Curve Fitting. Report no.: LiTH-ISY-R-2466. Division of Automatic Control. Department of Electrical Engineering Linkopings universitet, Linkoping, Sweden. August 7, 2002.

Moler C. and Moler K., Numerical Computing with MATLAB. The MathWorks, Inc. and Stanford University. 2003.

Sanjay Lall, Modern Control 1. Lecture Notes. Standford University. Winter quarter, 02-2003

74

/77

ULTIMA DIAPOSITIVA

75