156
Identificación de Sistemas Prof. Cesar de Prada Dpto. Ingeniería de Sistemas y Automática Universidad de Valladolid, España Tlf + 34 983 423164 [email protected] 1

Identificación de Sistemas

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Identificación de SistemasDpto. Ingeniería de Sistemas y Automática Universidad de Valladolid, España
Tlf + 34 983 423164 [email protected]
1
Indice
2
Mediante experimentación y análisis de datos
Modelos de conocimiento
Se obtienen mediante razonamientos y la aplicación de principios de conservación de masa, energia, momento, etc y otras leyes particulares del dominio de aplicación
Tienen validez general Requieren conocimiento profundo del proceso
y de las leyes fisico-químicas
4
q k hρ ρ= −
Ejemplo:
Formados por conjuntos de ecuaciones diferenciales y algebraicas
Utiles para muchos fines - ¿Qué pasa si? - Diseño - Pruebas antes de la implementación
Dificiles de manipular matemáticamente Se resuelven mediante simulación Suelen tener algún parámetro desconocido
6
q k hρ ρ= −
)TkT(q)TkT(h)kT(h −β+−α=
h y q son cambios de h y q sobre unos valores de equilibrio
Identificación El modelo se obtiene a partir de datos experimentales de entrada- salida del proceso
t t
YU U
Modelos de caja negra
• Se postula una relación matemática entre la entrada y la salida que depende de unos parámetros que deben ser estimados mediante los datos experimentales, sin que dicha relación deba estar fundada directamente en leyes fisico-químicas u otras.
γ+−β+−α= )TkT(q)TkT(h)kT(h
h 9
Modelos grises
• Son modelos de conocimiento en los que una parte está modelada como un modelo de caja negra, la cual representa ciertos fenómenos complejos o difíciles de modelar de otra forma.
• Todos los tipos de modelos requieren de una etapa de estimación de los valores de sus parámetros en mayor o menor medida.
10
Análisis y tratamiento de datos
Selección del tipo de modelo
Estimación de parámetros
Validación del modelo
Importancia de los experimentos y el tratamiento de datos
Modelos Dinámicos
medida cuantitativa de los efectos de las entradas en las salidas a lo largo del tiempo
deben representar los aspectos esenciales del proceso facilidad de manejo en el proceso siempre hay presentes perturbaciones
13
u(kT)
modelos discretos la salida en t = kT depende de las entradas y salidas
en instantes de tiempo (k-j)T anteriores
Tipos de modelos
Modelos lineales: – Paramétricos (FT, SS,...) – No paramétricos (Resp. salto, Resp. Frec.)
No lineales: – Hammerstein – Redes Neuronales – Modelos basados en leyes fisico-químicas – ...
15
Modelos Lineales
la salida actual depende linealmente de las entradas y salidas en instantes de tiempo anteriores
16
)mt(ub....)1t(ub)nt(ya....)1t(ya)t(y m1n1 −++−+−−−−−=
las variables u e y son perturbaciones sobre un punto de operación y t Y Y
u t U U ( ) ( )
Y
las variables u e y son cambios sobre un punto de operación U0 , Y0
El rango de validez está limitado a un entorno del punto de operación
Proceso
18
19
Operador retardo unitario q f(t) f(t 1) f t qf t1− = − + = con t = kT( ) ( )1
y t a y t a y t n b u t b u t mn m( ) ( ) .... ( ) ( ) .... ( )= − − − − − + − + + −1 11 1
( .... ) ( ) ( .... ) ( )1 1 1
1 1+ + + = + +− − − −a q a q y t b q b q u tn
n m
u t( ) ( ) ( )
1
1
A q a q a q B q b q b q
n n
m m
De regresión – ym depende tambien de p – todo tipo
Proceso
Modelo
23
•No requiere conocer la estructura del modelo •Puede describir dinámicas no usuales •Predicción simple y poco sensible a errores
•Limitado a sistemas asintóticamente estables •Contiene muchos parámetros •Sistemas con estructura poco definida: temp,
)t(u)q(H)t(u)qh...qhqh()t(y
)mt(uh...)2t(uh)1t(uh)jt(uh)jt(uh)t(y
g2 gj
Impulso = diferencia de dos saltos retrasados un periodo de muestreo T
1jjj ggh −−=
25
•No requiere conocer la estructura del modelo •Puede describir dinámicas no usuales •Predicción simple y poco sensible a errores
•Limitado a sistemas asintóticamente estables •Contiene muchos parámetros •Adecuado para sistemas de estructura poco definida
∑ ∞
=
g2 gn
g0=0
Si el sistema es asintóticamente estable los gj serán constantes a partir de uno dado gn
Variables de estado x t A t Bu t y t C t ( ) ( ) ( ) ( ) ( )
+ = + = 1 x
x
x(t) variable de estado del sistema A, B y C matrices de ordenes adecuados
•Se obtienen de forma natural por linealización de los modelos dinámicos obtenidos mediante balances, etc •Describe bien la estructura interna del proceso •Extensión multivariable directa
•Numero de parámetros no mínimo •Cálculos mas complejos
Métodos de subespacios
q q
1 1
1p p
1 1
1 n1m1
−−−−−−
−−
++=+++=
MFD matrix fraction description 28
Caso Multivariable
Si la Matriz A de la descripcion MFD es diagonal:
Caso Multivariable
1
2
M ...
y t M u t M u t M u t n t y t M u t M u t M u t n t
y t M u t M u t M u t n t
m m
m m
1 11 1 12 2 1 1
2 21 1 22 2 2 2
11 1 2 2
Algoritmos No recursivos
Modelo
33
Respuestas a entradas especiales Métodos basados en correlaciones Métodos de estimación espectral Métodos de minimización de error Métodos de variable instrumental Métodos de predicción de error Métodos de máxima verosimilitud Identificación global Minimización de la distancia paramétrica Subespacios invariantes
34
Ke s
Proceso u y
Se parte de un estado estacionario
Para eliminar el efecto de v(t) se toma la media de varios ensayos
36
Respuesta en frecuencia
u G(jw) y
Calculo de los diagramas de amplitud y fase excitando al sistema con señales sinusoidales de distintas frecuencias
G
ω
Métodos especiales con correladores para eliminar el efecto de ruidos
37
1N 1)kt(u)t(yE)k(R
La autocovarianza de una serie de datos estima la dependencia interna entre el valor que toma en un instante t y el que toma en t+k
La covarianza cruzada entre dos series de datos estima la dependencia entre el valor que toma una en un instante t y el que toma la otra en t+k
)k(R)k(R uyyu −=
39
k
Ru(k) Si los valores calculados están dentro de las bandas de confianza se supone que no son significativamente diferentes de cero
Las bandas de confianza se calculan a menudo mediante la expresión:
1n )k(R1009.2
40
Señal aleatoria en la que sus valores en un instante t son independientes del valor que han tomado en instantes anteriores.
Ru(k) = 0 k ≠ 0 k
Ru(k) 1
Métodos de correlación
Métodos de correlación
42
∑ =
)st(c...)1t(c)t()rt(vd...)1t(vd)t(v s1r1 −ξ++−ξ+ξ+−−−−−=
[ ]∑
∑ −
=

=
Para que exista solución
debe estar bien condicionada
PRBS
44
1i uiyu )ji(Rh)j(R
Si la entrada es un ruido blanco: Ru(k) = 0 k ≠ 0
)0(Rh)j(R ujyu =
Una ruido blanco es dificil de implementar, por lo que, amenudo, se usan en su lugar otras señales con características similares a las de ruido blanco:
PRBS
DRBS
tj yuyu
tj uu
Las condiciones teóricas de existencia de la Transformada de Fourier de una señal no se cumplen en el caso de procesos estocásticos
∞<∫ dt)t(f t
Espectro de potencia
{ }2 u )(UE
=ωΦ
46
El espectro de potencia de una señal es proporcional al valor esperado del cuadrado de la amplitud de la componente de la señal asociada a esa frecuencia, o sea a su potencia.
Φ
ω
Dominio de la frecuencia
)( )(
N
Criterio de estimación:Dado un conjunto de datos experimentales u(t), y(t), buscar los parámetros θ que minimizan la función de coste V :
Procesou
v
[ ] [ ]V N
y t t t
Criterio de estimación:Dado un conjunto de datos experimentales u(t), y(t), minimizar respecto a los parámetros θ :
y t tm ( ) ( )= ′ θθ vector de parámetros vector de datos
Modelo
49
y t tm ( ) ( )= ′ θ
La salida del modelo depende de valores pasados de las entradas del proceso
[ ] [ ]m21 h....,h,h
)mt(u),....,2t(u),1t(u)t( =θ′
y t tm ( ) ( )= ′ θ
La salida del modelo depende de valores pasados de las entradas del proceso
[ ] ]g,g,.....,g,g[
)1mt(u),mt(u),....,2t(u),1t(u)t(
52
y t a y t a y t a y t n b u t b u t m
m n
( ) ( ),...., ( ), ( ),.... ( ) ,...., , ,....,
′ = − − − − − −
′ =
y t tm ( ) ( )= ′ θ
La salida del modelo depende de valores pasados de las entradas y salidas del proceso
Función de transferencia
u tm ( ) ( ) ( )
1
1
Una función de transferencia no puede ponerse como función lineal de θ
y t a y t a y t a y t n b u t b u t m
m m m n m
m
Al ser las ym(t - i) función de los parámetros θ
Método de Mínimos cuadrados
y t t t
Criterio de estimación:Dado un conjunto de datos experimentales u(t), y(t), minimizar respecto a los parámetros θ :
Procesou
v
LS formulación matricial
)()'( N 1V θΦ−θΦ−= yy
Ejemplo [ ] [ ]
321
Modelo resp. impulso con 3 parametros hi y N=5 (se usan N+3-1 datos experimentales)
)3t(uh)2t(uh)1t(uh)t(y 321 −+−+−=
θy
56
[ ]V N N
y= − − = − − + 1 1( )' ( ) ' ' ' ' ' 'y y y y yΦθ Φθ Φ Φθ Φ Φθθ θ
[ ]∂ θ ∂θ
θθ θ
V N
[ ] ' 'θ = −Φ Φ Φ1 y [ ] ∑ =
=ΦΦ N
[ ]d21 ...
)N( ...

Considerando las d columnas φi de Φ como vectores de dimensión N, el problema de encontrar θ para minimizar V se puede ver como el de encontrar una combinación lineal de los vectores φi , o sea, un vector del hiperplano definido por ellos, que esté lo mas próximo posible al vector y. Esto corresponde a la proyección ortogonal de y sobre el hiperplano. d = número de parámetros a estimar
[ ] [ ])N(y),....,2(y),1(y'
)N(....)2()1(' =
h
h
h
h h h
321
3
2
1
φφφ
=Φ− θy
)3t(uh)2t(uh)1t(uh)t(y 321 −+−+−=
∑ =
ˆ
ii
El vector de errores e es perpendicular a cualquier vector φi , y por tanto, a las estimas
e y y
θ′−=−= )t()t(y)t(y)t(y)t(e
∑∑∑ ===
+=
+=
+= ⊥
−=
e
∑ ∑
62
Los resultados estimados de θ dependen de los experimentos y son, por tanto variables estocásticas
Propiedades (1)
[ ] ' 'θ = −Φ Φ Φ1 y
Suponiendo que el proceso puede ser representado de forma exacta por y(t)=(t)’θ0 +v(t)
[ ] [ ]v+θΦΦ′ΦΦ=θ − 0
1'ˆ
1Φ Φ Φ v
E{}θ θ= 0
Si la estima es no sesgada[ ] 0}{E 1 =Φ′ΦΦ′ − v
Propiedades (2)
1 )t(v)t( N 1)t()t(
N 1}{E v
Para que la estima de θ no sea sesgada los datos (t) no deben estar correlacionados con los ruidos v(t)
¿Cuando el término es nulo?[ ] }{E 1 vΦ′ΦΦ′ −
0)0(R)t(v)t( N 1
64






=







− −













−−−−
−− −
Processu
controller
Estimación no sesgada en lazo abierto: u y v no correlacionados
Estimación puede ser sesgada en lazo cerrado: v y u están correlacionadas a traves de la y de realimentación
Caso modelo de regresión
( ) ( ),...., ( ), ( ),.... ( )
,...., , ,....,
t y t y t n u t u t m
a a b bn m
′ = − − − − − − ′ =
y t B q A q
u t v t( ) ( ) ( )
Representación exacta del proceso
A q y t B q u t A q v t0 1
0 1
0 1( ) ( ) ( ) ( ) ( ) ( )− − −= +
0 Φ′ΦΦ′+θ=θ −
y(t) = (t)’θ0 +A0(q-1)v(t)
En general los valores de Φ y Α0v estarán correlacionados pues la salida depende de v, y la estimación será sesgada
Caso modelo de regresión
( ) ( ),...., ( ), ( ),.... ( )
,...., , ,....,
t y t y t n u t u t m
a a b bn m
′ = − − − − − − ′ =
Varianza de las estimaciones
Las estimaciones dependen de los datos experimentales y presentan una variabilidad
{ } { } [ ] [ ] 1 v
1 00 R)ˆ)(ˆ(Eˆcov −− ΦΦ′Φ′Φ′ΦΦ′=′θ−θθ−θ=θ
La varianza de las estimaciones depende del ruido y de los datos experimentales
θ′−= )t()t(y)t(eresiduos:
0)t()t(y)t(v θ′−=
Interpretación en frecuencia (1)
n
t
N
h q u t v t h q u t
N h q h q u t v t
k k
k i
v tk k
Datos tomados en lazo abierto: u y v están incorrelacionados
Dominio de la frecuencia (2)
71
v tk k
x T
k i
ji T
/
/
/
Los errores están pesados en cada frecuencia por el espectro de potencia de los datos de entrada. El modelo, a las frecuencias que no se exciten presentará mayor error que aquellas donde Φu(ω) sea significativo
Dominio de la frecuencia (3)
72
B e A e
u t v t( ) ( ) ( )
Caso modelo de regresión
Los errores están pesados en cada frecuencia no solo por Φu(ω) , sino tambien por A(ω). Como normalmente A sera
pasa alta, se tienden a favorecer los ajustes de alta frecuencia
Experimentos
Si se quiere determinar bien la dinámica de un proceso, los datos deben tener información sobre dicha dinámica
Por tanto deben realizarse experimentos que correspondan a respuestas del sistema en distintas situaciones de funcionamiento
Los registros históricos de variables reguladas, pueden no ser válidos al no tener información dinámica suficiente o estar correlacionada con el ruido.
73
Ensayos previos, tales como un salto a la entrada, pueden ayudar a determinar tiempos de asentamiento, amplitud adecuada de las señales, duración del experimento,.... (pre-test)
Experimentos, muestreo
El periodo de muestreo debe fijarse en función del uso y la dinámica del proceso considerado. Para control, en función del tiempo de asentamiento deseado en lazo cerrado. La toma de datos suele ser mas frecuente que su uso posterior.
La duración del experimento debe cubrir tanto datos para identificación como datos para validación (1000 →)
74
u
y
Dado que se están identificando modelos lineales, el cambio en las variables manipuladas debe ser lo mas pequeño posible para no alejarse de la zona de operación, pero también, si hay ruido, hay que mantener una adecuada relación señal/ruido, típicamente >3
Experimentos, frecuencia
Señales típicas que cubren las frecuencias de interés
Los experimentos deben diseñarse cuidadosamente fuera de línea y ejecutar lo planificado para evitar realimentaciones a través del ejecutor del experimento
Los experimentos deben hacerse con señales que cubran el rango de frecuencias de interés
0 100 200 300 400 500 600 700 800 900 1000
40
50
60
70
80
%bomba (%)
0 100 200 300 400 500 600 700 800 900 1000
20
40
60
Procesos tipo mecánico, electrónico,.. • Cualquier ensayo en un tiempo corto
Procesos tipo químico, biológico,... • Pueden hacerse durante mas tiempo pero sin
perturbar demasiado
Experimentos para identificación y para validación
El método de identificación puede imponer el tipo de experimento
77
20 40 60 80
caudal jarabe IV (m3/h)
10
20
30
1
2
presión escape (bar)
5 10 15 20 25 30 35 100 200 300 400 500
Filtrado paralelo
Ejemplo: Dos depósitos interconectados
Datos experimentales
Datos experimentales
82
100 200 300 400 500 600 700 800 900 1000 1100
-20
-10
0
10
20 Bomba (Unidades)
100 200 300 400 500 600 700 800 900 1000 1100
-20
-10
0
10
datos de la sesión - modelo en ModeloImpulsionalLargo01.mat
0 200 400 600 800 1000
30
40
50
60
70
10
20
30
tiempo (segundos)
Altura (Unidades)
Datos de validación con un tramo en que el nivel esta saturado a cero
Errores en esa zona de validación
Cubriendo el rango de frecuencias de interés
83
0 100 200 300 400 500 600 700 800 900 1000
40
50
60
70
80
%bomba (%)
0 100 200 300 400 500 600 700 800 900 1000
20
40
60
-10
0
10
%bomba (%)
-10
0
10
20
Herramienta gráfica orientada a facilitar la identificación de modelos dinámicos lineales multivariables.
Toolbox de Matlab
HIDENDatos experimentales
Modelo Dinámico
Implementa una metodología de identificación y ayuda al usuario a seguirla
RLS
85
[ ] 1)t()t()t( −Φ′Φ=P
yP
Inconvenientes: Memoria, tiempo de cálculo, fuera de linea,… Forma recursiva de procesar los datos
Operando:
RLS
86
[ ] )1t()t()t()t()1t()t(
)t()t()1t()t( 11 ′+−= −− PP
La matriz P(t) controla la velocidad de corrección Típicamente es decreciente:
Tras un cierto tiempo no hay corrección significativa Poco adecuado para identificación en tiempo real
Factor de olvido
PKPP PPK
[ ])1t(ˆ)t()t(y)t()t()1t(ˆ)t(ˆ −θ′−+−θ=θ K λ es el factor de olvido 0.95 ….0.999
[ ] λ−=⇒→ )1t()t( 0)t()t( PPP
Problemas de “explosión” con baja excitación
Modificaciones para evitar la explosión: métodos de traza de P constante, factor de olvido variables, etc.
Variables Instrumentales IV
[ ] }{E}ˆ{E 1 0 vΦ′ΦΦ′+θ=θ −
[ ] ' 'θ = −Φ Φ Φ1 yLa estimación LS es sesgada si el ruido v está correlacionado con Φ
El método IV usa la fórmula de estimación: [ ] y'W'Wˆ 1−Φ=θ
Con W escogida incorrelacionada con v, y W’Φ invertible
{ } [ ]{ } [ ]{ } [ ]{ } 0 1
00 11 'W'WE)('W'WE'W'WEˆE θ=Φ+θ=+θΦΦ=Φ=θ −−− vvy
La estimación IV es no sesgada para N → ∞ Consistente
Variables Instrumentales IV
89
Existen varias formar de escoger el vector w de variables instrumentales
[ ] y'W'Wˆ 1−Φ=θ
)N(z),....,2(z),1(z'W )N(),....,2(),1('
Modelo de regresión
90
e t y t y t y t a y t a y t a y t n
b u t b u t m A q y t B q u t
m
n
m
1 1 1
1 2 1
y t a y t a y t a y t n b u t b u t m
m n
N
B A- +
91
A q u tm ( ) ( )
A q u t
No-lineal en los parámetros. Ha de resolverse por minimización numérica
Modelo independiente
Métodos iterativos
dk
g
k
=θ−θ θ′∂
)t(ˆ)t()ˆ,t(e)ˆ)(t()ˆ,t(e
)ˆ(),t(e)ˆ,t(e),t(e
kkkkkkk
2)t(e N 1V


−−−−−−=
[ ]kkk ˆ)t()ˆ,t(e θ−θ
En LS: e(t) = y(t) - (y)’θ
[ ] ∑∑ =

=
A q u t
θ
θ2
1
La forma de los contornos depende de los datos experimentales, y por tanto la calidad de la identificación
Propiedades OE (1)
u t v t( ) ( ) ( )
u t
B q A q
u t v t
N
B q A q
( ) ( )
( ) ( )= −
+



N
( ) ( )
( ) ( )
( ) ( )
Si los datos se toman en lazo abierto de modo que u y v esten incorrelacionados, y si N tiende a infinito:
El mínimo alcanza el verdadero valor de los parámetros y la estimación es consistente B q
A q B q A q
0 1
0 1
B q A q
( ) ( )
( ) ( )= −
+



B e A e
Utilizando el Teorema de Parserval:
La estimación se mejora en el rango de frecuencias donde el espectro de potencia de u es grande
Modelo de ruido
ξ(t) ruido blanco de media nula
Las características estadísticas de v(t) dependen de la función de transferencia C/A
Alternativamente puede suponerse un ruido v(t) sin estructura de modelo predefinida, y estimarlo en función de las medidas experimentales.
101
Ruido blanco
Señal aleatoria en la que sus valores en un instante t son independientes del valor que han tomado en instantes anteriores.
Ru(k) = 0 k ≠ 0
k
Ru(k)
102
103
tm ( ) ( ) ( )
y t B q A q
u t C q D q
tm ( ) ( ) ( )
Prediction Error Methods (PEM)
y t G q u t H q tm ( ) ( ) ( ) ( ) ( )= +− −1 1 ξG y H funciones de transferencia, H estable, mónica y de fase mínima
Métodos del Error de Predicción
104
N
t
N
= = ∑ ∑1 12
( ) ( ) ( )
Criterio: Minimizar la suma de los cuadrados de los errores de predicción, respecto a los parámetros θ
( )y t θ Predicción de la salida del modelo con los parámetros θ
Procesou
v
y
y
m
e(t)
105
y t G q u t H q tm ( ) ( ) ( ) ( ) ( )= +− −1 1 ξ
[ ] [ ]y t G q u t H q H q
y t G q u t t
G q u t H q
y t G q u t G q H q
u t t
1 1
[ ]y t G q u t H q t tm ( ) ( ) ( ) ( ) ( ) ( )= + − +− −1 1 1 ξ ξ
PEM
106
( ) ( ) ( )
( ) ( )
u t H q
[ ]
( ) ( ) ( ) ( ) ( ) ( )
( ) ( )
( )
( ) ( ) ( ) ( )
e t y t y t y t G q H q
u t H q
θ θ= − = − − −
N
PEM: Propiedades
y t G q u t H q t( ) ( ) ( ) ( ) ( )= +− − 0
1 0
[ ]V E H q
G q u t H q t G q u t
E G q G q
H q u t
H q H q
y t G q u t t
N
108
( ){ } { } ( ){ } { }
= + =
= + ≥ =
1 1 0 1
H q u t
H q H q
( )ξ
Al ser H mónico, y G tener al menos un retardo:
La varianza del ruido es una cota inferior que se alcanza si:
PEM: dominio de la frecuencia
109
H q H q
En lazo abierto u y el ruido están incorrelacionados, luego:
V E G q G q
H q u t
H q H q
110
B e A e H e
d
- Φ
Φ
La estimación es mejor en aquel rango de frecuencias en el que 1/H y la señal de excitación son grandes
{ } { }V G q G q
H q E u t
H q H q
Residuos
111
y t G q u t H q t( ) ( ) ( ) ( ) ( )= +− − 0
1 0
0 1 0
1 ruido blanco
y t G q u t( ) ( ) ( ) ( )
( ) ( ) ( )− = = −− −θ θ
1 1
1 Residuos
→ →0
0
( ) ( )θ ξSi Test: Los residuos deben tener características de ruido blanco
Caso Multivariable
y1 = M11 u1+ M12 u2+...
Se hace una identificación para cada salida y todas las entradas m sistemas MISO
Caso multivariable
[ ] 21 n2i21in1i11ii
Puede formularse en la forma estandar: 11 )t()t(y θ′=
22 )t()t(y θ′=
Caso Multivariable
u1Ti
ReactanteTr
u2
AT
Si hay varias entradas, los cambios en las mismas deben de estar incorrelacionados para que el algoritmo de identificación pueda distinguir los efectos de cada entrada en las salidas
Experimentos
116
Por ejemplo, si se aplican señales proporcionales u1=αu2 a las entradas simultáneamente, hay muchas combinaciones de los modelos M1 y M2 que se ajustan a las mismas parejas de entradas y salidas
)t(u)MM()t(uM)t(uM)t(y 2212211 +α=+=
u1Ti
ReactanteTr
u2
AT
Excitar solo una entrada manteniendo las otras constantes y luego hacer lo mismo con las otras, no es una buena política: alarga el tiempo del experimento y no proporciona datos en condiciones realistas de funcionamiento
Dos depósitos acoplados
Modelos no lineales
Muchas de las técnicas de modelos lineales pueden aplicarse directamente a modelos no-lineales, pero lineales en los parámetros que se desea estimar, p.e.
y(t) = α eu(t-1) + β sen(2u(t-2)) Ya que pueden formularse en el formato:
y(t) = φ(t)’θ = (eu(t-1), sen(2u(t-2)) (α, β)’ El caso general requiere usar técnicas directas de
optimización de una función de costo.
119
Validación
El conjunto de test positivos y negativos permiten establecer el rango de validez del modelo
Distintas situaciones implican distintas técnicas: – El proceso existe y se trata de construir un modelo que
reproduzca la realidad – El proceso no existe aún y se trata de construir un modelo
para predecir su comportamiento y optimizarlo cara al diseño
120
Validación
Conjunto de pruebas de diferente naturaleza que ayudan a validar el modelo
La validación ha de hacerse a todos los niveles de construcción del modelo: – Hipótesis – Formulación – Codificación – Resolución numérica (verificación) – Aplicación
121
Validación
122
u y Model
Discusión y evaluación de respuestas tipo del modelo con expertos en el proceso
u y
124
Respuestas cualitativas
Test de Turing: ¿Se puede discriminar una respuesta del modelo y de la realidad si se presentan en el mismo formato?
Trazas de la evolución de variables tipo flujo, etc. a través de los distintos componentes
125
126
( )∑ =
y
modelo
experimental
t
Medida numérica de las discrepancias entre la respuesta del modelo y los datos experimentales
Pueden usarse para comparar varios modelos de un proceso y decidir sobre cual es mas adecuado
Indices de error
128
∑ =
Akaike Information Criterion AIC
Final Prediction Error FPE
Estima de la varianza del error de predicción con los datos nuevos
d2 N
))t(y)t(y( logN
Penaliza mas la complejidad del modelo)Nlog(d
N
+





−∑ =
Es consistente: La probabilidad de seleccionar un modelo erroneo tiende a cero con N
Indices de error
130
Test F para ver si el modelo j (con mas parámetros) es significativamente mejor que el modelo i, con un nivel α de confianza
)dN/())t(y)t(y(
)dd/())t(y)t(y())t(y)t(y(





−−


∑∑
=
==
Debe compararse con la distribución F(dj-di, N-dj) con el nivel α de confianza
Errores
Los errores de la estimación provienen de: – Errores de medida de los datos. Idealmente se suelen
suponer independientes, de media cero y varianza constante. Para caracterizarlos pueden usarse datos de las salidas con entradas constantes.
– Errores del modelo o la estima de parámetros. Si el modelo fuera perfecto, los residuos deberían tener las mismas características estadísticas que los errores de medida.
131
Modelo
Proceso
ym
e
Si el modelo es correcto los residuos no deben presentar una estructura “sistemática”, sino ser el resultado de las perturbaciones aleatorias que actuan sobre el proceso
Residuos e(t) = y(t) - ym(t)
133
e
t
e
t
nº de cambios de signo de los residuos (ncs) ¿Se ajustan a un modelo AR?
Test: 2/N 2 Nncs − Puede compararse con una distribución
N(0,1) para ver si hay un sesgo en los signos
Test estadísticos
2σ k k
No correlación entre la entrada y los residuos: Los errores deben ser independientes de un experimento particular
Lazo abierto, lazo cerrado
Varianza de los parámetros
135





=



C
Los términos cruzados de la matriz de covarianza dan una idea de la independencia de los parámetros, pues deben estar incorrelacionados
Sensibilidad
136
[ ]
≤≤ ==
−= ∑ =

Puede obtenerse a partir del problema dual de optimización en ciertos casos
Validación
137
Distorsiones de los parámetros
Varianza de las estimaciones
En ciertos casos, se utilizan fórmulas de predicción de controladores predictivos tales como el DMC, GPC, etc.
Distorsión de parámetros Butterfield 1986
139
¿ Como habría que modificar el valor de los parámetros del modelo para que sus respuestas coincidieran exactamente con las del proceso?
t
p El valor de la distorsión da una medida de la credibilidad del modelo
n,...,1t)t(y))t(,t(ymin * m ==+
pp
p
Supongamos que ahora los parámetros p pueden variar a lo largo del tiempo,
Distorsión de parámetros
Otros criterios de identificación
Patrones de respuesta a entradas especiales Respuesta en frecuencia Funciones de correlación y espectros Minimización de una función de error Minimización de errores de predicción Máxima verosimilitud Identificación global Minimización de distancia paramétrica Identificación de subespacios
141
Máxima verosimilitud (ML)
La respuesta del modelo ym(t) a los datos experimentales de entrada u(.) depende del valor de los parámetros del modelo θ
Sea p(y(t)|t-1,θ) la probabilidad de que ym(t) = y(t) con el modelo de parámetros θ y datos hasta el instante t-1
Criterio: elegir los parámetros θ que maximizan la probabilidad de obtener los datos y(1), y(2),..., y(N) medidos
142
143
p(y(t)|t-1,θ) probabilidad de que ym(t) = y(t) con el modelo de parámetros θ y datos hasta t-1
La probabilidad de obtener los valores y(1),y(2),...,y(N) es:
∏ =
∏∏ == πσ
144
Normalmente en lugar de maximizar esta función se minimiza su logaritmo cambiado de signo
[ ] πσ+ σ
θ−− =θ− ∑


El problema se expresa como una minimización numérica de suma de errores de predicción y(t) - ym(t | t-1, θ)
Identificación Global
[ ]V N
N
1
2
1
( ) ( ( ) ( , )θ
Criterio de minimización del error :Dado un conjunto de datos experimentales u(t), y(t), buscar los parámetros θ que minimizan la función de coste V :
Procesou
v
N
1
( ( ) ( ) ( )θ
θ1
θ2 Isodistancia: Lugar geométrico de los puntos del espacio paramétrico con igual valor de V
Todos los modelos sobre una isodistancia tienen la misma validez respecto al criterio de suma de cuadrados de errores
f V cte( ) .θ = =
147
Matching the uncertainty of the model given by global identification techniques to the robustness of a model based predictive controller M. Sanzo, J. Richalet, C. de Prada Advances in Model Based Predictive Control Oxford University Press, 1994
Matching the uncertainty of the model given by
global identification techniques to the robustness
of a model based predictive controller
M. Sanzo, J. Richalet, C. de Prada
Advances in Model Based Predictive Control
Oxford University Press, 1994
Modelos que explican ambos experimentos
Las isodistancias dependen de los datos experimentales y del nivel de exactitud V elegido
148
Isodistancias
θ1
θ2
Informan sobre la calidad de los parámetros, y el rediseño de experimentos
θ1
θ2
149
a
x
x Para cada valor de a se resuelve una ecuación de segundo grado para obtener el correspondiente valor de K
Ejemplo con un modelo sencillo de primer orden
150
151
θ1
p2
θ2
θ0
θ
y t t v t y t t t
V t t
t t t
Minimización de la distancia paramétrica
153
0
0
0
0
000
¿Qué valor de ρ hace V(t)-V(t-1) negativo?
Caso sin ruido
[ ]
[ ]
[ ]
[ ]
V t V t t y t y t V t V t
y t y t
t t V t
t
t
m
m
m
m
µ

t t t v t
d t d t t v t t t t
t
= − + − −
− +
= − + + − −
=
= −



− +
= − −
Si el ruido v(t) y (t) están incorrelacionados
Algoritmo NLMS NLMS Normalize Least Mean Square
Mínima media cuadrada normalizada
t = − +
1 2 con 0 < < 2
•Con ruido, el posible sesgo no depende de µ •La varianza de la estimación decrece con µ •La mejor velocidad de convergencia se obtiene con µ proximo a 1 •Compromiso velocidad / precisión • σ es una constante para evitar que θ cuando (t)
156
FUNCION DE TRANSFERENCIA
Experimentos
HIDEN
RLS
RLS
Minimización de funciones
Minimización de funciones
Algoritmo de Gauss-Newton
Algoritmo de Gauss-Newton
PEM: Predicciones
Residuos
Distorsión de parámetros
Caso sin ruido