Identificación de SistemasDpto. Ingeniería de Sistemas y Automática
Universidad de Valladolid, España
Tlf + 34 983 423164
[email protected]
1
Indice
2
Mediante experimentación y análisis de datos
Modelos de conocimiento
Se obtienen mediante razonamientos y la aplicación de principios de
conservación de masa, energia, momento, etc y otras leyes
particulares del dominio de aplicación
Tienen validez general Requieren conocimiento profundo del
proceso
y de las leyes fisico-químicas
4
q k hρ ρ= −
Ejemplo:
Formados por conjuntos de ecuaciones diferenciales y
algebraicas
Utiles para muchos fines - ¿Qué pasa si? - Diseño - Pruebas antes
de la implementación
Dificiles de manipular matemáticamente Se resuelven mediante
simulación Suelen tener algún parámetro desconocido
6
q k hρ ρ= −
)TkT(q)TkT(h)kT(h −β+−α=
h y q son cambios de h y q sobre unos valores de equilibrio
Identificación El modelo se obtiene a partir de datos
experimentales de entrada- salida del proceso
t t
YU U
Modelos de caja negra
• Se postula una relación matemática entre la entrada y la salida
que depende de unos parámetros que deben ser estimados mediante los
datos experimentales, sin que dicha relación deba estar fundada
directamente en leyes fisico-químicas u otras.
γ+−β+−α= )TkT(q)TkT(h)kT(h
h 9
Modelos grises
• Son modelos de conocimiento en los que una parte está modelada
como un modelo de caja negra, la cual representa ciertos fenómenos
complejos o difíciles de modelar de otra forma.
• Todos los tipos de modelos requieren de una etapa de estimación
de los valores de sus parámetros en mayor o menor medida.
10
Análisis y tratamiento de datos
Selección del tipo de modelo
Estimación de parámetros
Validación del modelo
Importancia de los experimentos y el tratamiento de datos
Modelos Dinámicos
medida cuantitativa de los efectos de las entradas en las salidas a
lo largo del tiempo
deben representar los aspectos esenciales del proceso facilidad de
manejo en el proceso siempre hay presentes perturbaciones
13
u(kT)
modelos discretos la salida en t = kT depende de las entradas y
salidas
en instantes de tiempo (k-j)T anteriores
Tipos de modelos
Modelos lineales: – Paramétricos (FT, SS,...) – No paramétricos
(Resp. salto, Resp. Frec.)
No lineales: – Hammerstein – Redes Neuronales – Modelos basados en
leyes fisico-químicas – ...
15
Modelos Lineales
la salida actual depende linealmente de las entradas y salidas en
instantes de tiempo anteriores
16
)mt(ub....)1t(ub)nt(ya....)1t(ya)t(y m1n1 −++−+−−−−−=
las variables u e y son perturbaciones sobre un punto de operación
y t Y Y
u t U U ( ) ( )
Y
las variables u e y son cambios sobre un punto de operación U0 ,
Y0
El rango de validez está limitado a un entorno del punto de
operación
Proceso
18
19
Operador retardo unitario q f(t) f(t 1) f t qf t1− = − + = con t =
kT( ) ( )1
y t a y t a y t n b u t b u t mn m( ) ( ) .... ( ) ( ) .... ( )= −
− − − − + − + + −1 11 1
( .... ) ( ) ( .... ) ( )1 1 1
1 1+ + + = + +− − − −a q a q y t b q b q u tn
n m
u t( ) ( ) ( )
1
1
A q a q a q B q b q b q
n n
m m
De regresión – ym depende tambien de p – todo tipo
Proceso
Modelo
23
•No requiere conocer la estructura del modelo •Puede describir
dinámicas no usuales •Predicción simple y poco sensible a
errores
•Limitado a sistemas asintóticamente estables •Contiene muchos
parámetros •Sistemas con estructura poco definida: temp,
)t(u)q(H)t(u)qh...qhqh()t(y
)mt(uh...)2t(uh)1t(uh)jt(uh)jt(uh)t(y
g2 gj
Impulso = diferencia de dos saltos retrasados un periodo de
muestreo T
1jjj ggh −−=
25
•No requiere conocer la estructura del modelo •Puede describir
dinámicas no usuales •Predicción simple y poco sensible a
errores
•Limitado a sistemas asintóticamente estables •Contiene muchos
parámetros •Adecuado para sistemas de estructura poco
definida
∑ ∞
=
g2 gn
g0=0
Si el sistema es asintóticamente estable los gj serán constantes a
partir de uno dado gn
Variables de estado x t A t Bu t y t C t ( ) ( ) ( ) ( ) ( )
+ = + = 1 x
x
x(t) variable de estado del sistema A, B y C matrices de ordenes
adecuados
•Se obtienen de forma natural por linealización de los modelos
dinámicos obtenidos mediante balances, etc •Describe bien la
estructura interna del proceso •Extensión multivariable
directa
•Numero de parámetros no mínimo •Cálculos mas complejos
Métodos de subespacios
q q
1 1
1p p
1 1
1 n1m1
−−−−−−
−−
++=+++=
MFD matrix fraction description 28
Caso Multivariable
Si la Matriz A de la descripcion MFD es diagonal:
Caso Multivariable
1
2
M ...
y t M u t M u t M u t n t y t M u t M u t M u t n t
y t M u t M u t M u t n t
m m
m m
1 11 1 12 2 1 1
2 21 1 22 2 2 2
11 1 2 2
Algoritmos No recursivos
Modelo
33
Respuestas a entradas especiales Métodos basados en correlaciones
Métodos de estimación espectral Métodos de minimización de error
Métodos de variable instrumental Métodos de predicción de error
Métodos de máxima verosimilitud Identificación global Minimización
de la distancia paramétrica Subespacios invariantes
34
Ke s
Proceso u y
Se parte de un estado estacionario
Para eliminar el efecto de v(t) se toma la media de varios
ensayos
36
Respuesta en frecuencia
u G(jw) y
Calculo de los diagramas de amplitud y fase excitando al sistema
con señales sinusoidales de distintas frecuencias
G
ω
Métodos especiales con correladores para eliminar el efecto de
ruidos
37
1N 1)kt(u)t(yE)k(R
La autocovarianza de una serie de datos estima la dependencia
interna entre el valor que toma en un instante t y el que toma en
t+k
La covarianza cruzada entre dos series de datos estima la
dependencia entre el valor que toma una en un instante t y el que
toma la otra en t+k
)k(R)k(R uyyu −=
39
k
Ru(k) Si los valores calculados están dentro de las bandas de
confianza se supone que no son significativamente diferentes de
cero
Las bandas de confianza se calculan a menudo mediante la
expresión:
1n )k(R1009.2
40
Señal aleatoria en la que sus valores en un instante t son
independientes del valor que han tomado en instantes
anteriores.
Ru(k) = 0 k ≠ 0 k
Ru(k) 1
Métodos de correlación
Métodos de correlación
42
∑ =
)st(c...)1t(c)t()rt(vd...)1t(vd)t(v s1r1 −ξ++−ξ+ξ+−−−−−=
[ ]∑
∑ −
=
−
=
Para que exista solución
debe estar bien condicionada
PRBS
44
1i uiyu )ji(Rh)j(R
Si la entrada es un ruido blanco: Ru(k) = 0 k ≠ 0
)0(Rh)j(R ujyu =
Una ruido blanco es dificil de implementar, por lo que, amenudo, se
usan en su lugar otras señales con características similares a las
de ruido blanco:
PRBS
DRBS
tj yuyu
tj uu
Las condiciones teóricas de existencia de la Transformada de
Fourier de una señal no se cumplen en el caso de procesos
estocásticos
∞<∫ dt)t(f t
Espectro de potencia
{ }2 u )(UE
=ωΦ
46
El espectro de potencia de una señal es proporcional al valor
esperado del cuadrado de la amplitud de la componente de la señal
asociada a esa frecuencia, o sea a su potencia.
Φ
ω
Dominio de la frecuencia
)( )(
N
Criterio de estimación:Dado un conjunto de datos experimentales
u(t), y(t), buscar los parámetros θ que minimizan la función de
coste V :
Procesou
v
[ ] [ ]V N
y t t t
Criterio de estimación:Dado un conjunto de datos experimentales
u(t), y(t), minimizar respecto a los parámetros θ :
y t tm ( ) ( )= ′ θθ vector de parámetros vector de datos
Modelo
49
y t tm ( ) ( )= ′ θ
La salida del modelo depende de valores pasados de las entradas del
proceso
[ ] [ ]m21 h....,h,h
)mt(u),....,2t(u),1t(u)t( =θ′
y t tm ( ) ( )= ′ θ
La salida del modelo depende de valores pasados de las entradas del
proceso
[ ] ]g,g,.....,g,g[
)1mt(u),mt(u),....,2t(u),1t(u)t(
52
y t a y t a y t a y t n b u t b u t m
m n
( ) ( ),...., ( ), ( ),.... ( ) ,...., , ,....,
′ = − − − − − −
′ =
y t tm ( ) ( )= ′ θ
La salida del modelo depende de valores pasados de las entradas y
salidas del proceso
Función de transferencia
u tm ( ) ( ) ( )
1
1
Una función de transferencia no puede ponerse como función lineal
de θ
y t a y t a y t a y t n b u t b u t m
m m m n m
m
Al ser las ym(t - i) función de los parámetros θ
Método de Mínimos cuadrados
y t t t
Criterio de estimación:Dado un conjunto de datos experimentales
u(t), y(t), minimizar respecto a los parámetros θ :
Procesou
v
LS formulación matricial
)()'( N 1V θΦ−θΦ−= yy
Ejemplo [ ] [ ]
321
Modelo resp. impulso con 3 parametros hi y N=5 (se usan N+3-1 datos
experimentales)
)3t(uh)2t(uh)1t(uh)t(y 321 −+−+−=
θy
56
[ ]V N N
y= − − = − − + 1 1( )' ( ) ' ' ' ' ' 'y y y y yΦθ Φθ Φ Φθ Φ Φθθ
θ
[ ]∂ θ ∂θ
θθ θ
V N
[ ] ' 'θ = −Φ Φ Φ1 y [ ] ∑ =
=ΦΦ N
[ ]d21 ...
)N( ...
=Φ
Considerando las d columnas φi de Φ como vectores de dimensión N,
el problema de encontrar θ para minimizar V se puede ver como el de
encontrar una combinación lineal de los vectores φi , o sea, un
vector del hiperplano definido por ellos, que esté lo mas próximo
posible al vector y. Esto corresponde a la proyección ortogonal de
y sobre el hiperplano. d = número de parámetros a estimar
[ ] [ ])N(y),....,2(y),1(y'
)N(....)2()1(' =
h
h
h
h h h
321
3
2
1
φφφ
=Φ− θy
)3t(uh)2t(uh)1t(uh)t(y 321 −+−+−=
∑ =
ˆ
ii
El vector de errores e es perpendicular a cualquier vector φi , y
por tanto, a las estimas
e y y
θ′−=−= )t()t(y)t(y)t(y)t(e
∑∑∑ ===
+=
+=
+= ⊥
−=
e
∑ ∑
62
Los resultados estimados de θ dependen de los experimentos y son,
por tanto variables estocásticas
Propiedades (1)
[ ] ' 'θ = −Φ Φ Φ1 y
Suponiendo que el proceso puede ser representado de forma exacta
por y(t)=(t)’θ0 +v(t)
[ ] [ ]v+θΦΦ′ΦΦ=θ − 0
1'ˆ
1Φ Φ Φ v
E{}θ θ= 0
Si la estima es no sesgada[ ] 0}{E 1 =Φ′ΦΦ′ − v
Propiedades (2)
1 )t(v)t( N 1)t()t(
N 1}{E v
Para que la estima de θ no sea sesgada los datos (t) no deben estar
correlacionados con los ruidos v(t)
¿Cuando el término es nulo?[ ] }{E 1 vΦ′ΦΦ′ −
0)0(R)t(v)t( N 1
64
=
−
− −
∝
−−−−
−− −
Processu
controller
Estimación no sesgada en lazo abierto: u y v no
correlacionados
Estimación puede ser sesgada en lazo cerrado: v y u están
correlacionadas a traves de la y de realimentación
Caso modelo de regresión
( ) ( ),...., ( ), ( ),.... ( )
,...., , ,....,
t y t y t n u t u t m
a a b bn m
′ = − − − − − − ′ =
y t B q A q
u t v t( ) ( ) ( )
Representación exacta del proceso
A q y t B q u t A q v t0 1
0 1
0 1( ) ( ) ( ) ( ) ( ) ( )− − −= +
0 Φ′ΦΦ′+θ=θ −
y(t) = (t)’θ0 +A0(q-1)v(t)
En general los valores de Φ y Α0v estarán correlacionados pues la
salida depende de v, y la estimación será sesgada
Caso modelo de regresión
( ) ( ),...., ( ), ( ),.... ( )
,...., , ,....,
t y t y t n u t u t m
a a b bn m
′ = − − − − − − ′ =
Varianza de las estimaciones
Las estimaciones dependen de los datos experimentales y presentan
una variabilidad
{ } { } [ ] [ ] 1 v
1 00 R)ˆ)(ˆ(Eˆcov −− ΦΦ′Φ′Φ′ΦΦ′=′θ−θθ−θ=θ
La varianza de las estimaciones depende del ruido y de los datos
experimentales
θ′−= )t()t(y)t(eresiduos:
0)t()t(y)t(v θ′−=
Interpretación en frecuencia (1)
n
t
N
h q u t v t h q u t
N h q h q u t v t
k k
k i
v tk k
Datos tomados en lazo abierto: u y v están incorrelacionados
Dominio de la frecuencia (2)
71
v tk k
x T
k i
ji T
/
/
/
Los errores están pesados en cada frecuencia por el espectro de
potencia de los datos de entrada. El modelo, a las frecuencias que
no se exciten presentará mayor error que aquellas donde Φu(ω) sea
significativo
Dominio de la frecuencia (3)
72
B e A e
u t v t( ) ( ) ( )
Caso modelo de regresión
Los errores están pesados en cada frecuencia no solo por Φu(ω) ,
sino tambien por A(ω). Como normalmente A sera
pasa alta, se tienden a favorecer los ajustes de alta
frecuencia
Experimentos
Si se quiere determinar bien la dinámica de un proceso, los datos
deben tener información sobre dicha dinámica
Por tanto deben realizarse experimentos que correspondan a
respuestas del sistema en distintas situaciones de
funcionamiento
Los registros históricos de variables reguladas, pueden no ser
válidos al no tener información dinámica suficiente o estar
correlacionada con el ruido.
73
Ensayos previos, tales como un salto a la entrada, pueden ayudar a
determinar tiempos de asentamiento, amplitud adecuada de las
señales, duración del experimento,.... (pre-test)
Experimentos, muestreo
El periodo de muestreo debe fijarse en función del uso y la
dinámica del proceso considerado. Para control, en función del
tiempo de asentamiento deseado en lazo cerrado. La toma de datos
suele ser mas frecuente que su uso posterior.
La duración del experimento debe cubrir tanto datos para
identificación como datos para validación (1000 →)
74
u
y
Dado que se están identificando modelos lineales, el cambio en las
variables manipuladas debe ser lo mas pequeño posible para no
alejarse de la zona de operación, pero también, si hay ruido, hay
que mantener una adecuada relación señal/ruido, típicamente
>3
Experimentos, frecuencia
Señales típicas que cubren las frecuencias de interés
Los experimentos deben diseñarse cuidadosamente fuera de línea y
ejecutar lo planificado para evitar realimentaciones a través del
ejecutor del experimento
Los experimentos deben hacerse con señales que cubran el rango de
frecuencias de interés
0 100 200 300 400 500 600 700 800 900 1000
40
50
60
70
80
%bomba (%)
0 100 200 300 400 500 600 700 800 900 1000
20
40
60
Procesos tipo mecánico, electrónico,.. • Cualquier ensayo en un
tiempo corto
Procesos tipo químico, biológico,... • Pueden hacerse durante mas
tiempo pero sin
perturbar demasiado
Experimentos para identificación y para validación
El método de identificación puede imponer el tipo de
experimento
77
20 40 60 80
caudal jarabe IV (m3/h)
10
20
30
1
2
presión escape (bar)
5 10 15 20 25 30 35 100 200 300 400 500
Filtrado paralelo
Ejemplo: Dos depósitos interconectados
Datos experimentales
Datos experimentales
82
100 200 300 400 500 600 700 800 900 1000 1100
-20
-10
0
10
20 Bomba (Unidades)
100 200 300 400 500 600 700 800 900 1000 1100
-20
-10
0
10
datos de la sesión - modelo en ModeloImpulsionalLargo01.mat
0 200 400 600 800 1000
30
40
50
60
70
10
20
30
tiempo (segundos)
Altura (Unidades)
Datos de validación con un tramo en que el nivel esta saturado a
cero
Errores en esa zona de validación
Cubriendo el rango de frecuencias de interés
83
0 100 200 300 400 500 600 700 800 900 1000
40
50
60
70
80
%bomba (%)
0 100 200 300 400 500 600 700 800 900 1000
20
40
60
-10
0
10
%bomba (%)
-10
0
10
20
Herramienta gráfica orientada a facilitar la identificación de
modelos dinámicos lineales multivariables.
Toolbox de Matlab
HIDENDatos experimentales
Modelo Dinámico
Implementa una metodología de identificación y ayuda al usuario a
seguirla
RLS
85
[ ] 1)t()t()t( −Φ′Φ=P
yP
Inconvenientes: Memoria, tiempo de cálculo, fuera de linea,… Forma
recursiva de procesar los datos
Operando:
RLS
86
[ ] )1t()t()t()t()1t()t(
)t()t()1t()t( 11 ′+−= −− PP
La matriz P(t) controla la velocidad de corrección Típicamente es
decreciente:
Tras un cierto tiempo no hay corrección significativa Poco adecuado
para identificación en tiempo real
Factor de olvido
PKPP PPK
[ ])1t(ˆ)t()t(y)t()t()1t(ˆ)t(ˆ −θ′−+−θ=θ K λ es el factor de olvido
0.95 ….0.999
[ ] λ−=⇒→ )1t()t( 0)t()t( PPP
Problemas de “explosión” con baja excitación
Modificaciones para evitar la explosión: métodos de traza de P
constante, factor de olvido variables, etc.
Variables Instrumentales IV
[ ] }{E}ˆ{E 1 0 vΦ′ΦΦ′+θ=θ −
[ ] ' 'θ = −Φ Φ Φ1 yLa estimación LS es sesgada si el ruido v está
correlacionado con Φ
El método IV usa la fórmula de estimación: [ ] y'W'Wˆ 1−Φ=θ
Con W escogida incorrelacionada con v, y W’Φ invertible
{ } [ ]{ } [ ]{ } [ ]{ } 0 1
00 11 'W'WE)('W'WE'W'WEˆE θ=Φ+θ=+θΦΦ=Φ=θ −−− vvy
La estimación IV es no sesgada para N → ∞ Consistente
Variables Instrumentales IV
89
Existen varias formar de escoger el vector w de variables
instrumentales
[ ] y'W'Wˆ 1−Φ=θ
)N(z),....,2(z),1(z'W )N(),....,2(),1('
Modelo de regresión
90
e t y t y t y t a y t a y t a y t n
b u t b u t m A q y t B q u t
m
n
m
1 1 1
1 2 1
y t a y t a y t a y t n b u t b u t m
m n
N
B A- +
91
A q u tm ( ) ( )
A q u t
No-lineal en los parámetros. Ha de resolverse por minimización
numérica
Modelo independiente
Métodos iterativos
dk
g
k
=θ−θ θ′∂
)t(ˆ)t()ˆ,t(e)ˆ)(t()ˆ,t(e
)ˆ(),t(e)ˆ,t(e),t(e
kkkkkkk
2)t(e N 1V
−−−−−−=
[ ]kkk ˆ)t()ˆ,t(e θ−θ
En LS: e(t) = y(t) - (y)’θ
[ ] ∑∑ =
−
=
A q u t
θ
θ2
1
La forma de los contornos depende de los datos experimentales, y
por tanto la calidad de la identificación
Propiedades OE (1)
u t v t( ) ( ) ( )
u t
B q A q
u t v t
N
B q A q
( ) ( )
( ) ( )= −
+
−
−
−
N
( ) ( )
( ) ( )
( ) ( )
Si los datos se toman en lazo abierto de modo que u y v esten
incorrelacionados, y si N tiende a infinito:
El mínimo alcanza el verdadero valor de los parámetros y la
estimación es consistente B q
A q B q A q
0 1
0 1
B q A q
( ) ( )
( ) ( )= −
+
−
−
−
B e A e
Utilizando el Teorema de Parserval:
La estimación se mejora en el rango de frecuencias donde el
espectro de potencia de u es grande
Modelo de ruido
ξ(t) ruido blanco de media nula
Las características estadísticas de v(t) dependen de la función de
transferencia C/A
Alternativamente puede suponerse un ruido v(t) sin estructura de
modelo predefinida, y estimarlo en función de las medidas
experimentales.
101
Ruido blanco
Señal aleatoria en la que sus valores en un instante t son
independientes del valor que han tomado en instantes
anteriores.
Ru(k) = 0 k ≠ 0
k
Ru(k)
102
103
tm ( ) ( ) ( )
y t B q A q
u t C q D q
tm ( ) ( ) ( )
Prediction Error Methods (PEM)
y t G q u t H q tm ( ) ( ) ( ) ( ) ( )= +− −1 1 ξG y H funciones de
transferencia, H estable, mónica y de fase mínima
Métodos del Error de Predicción
104
N
t
N
= = ∑ ∑1 12
( ) ( ) ( )
Criterio: Minimizar la suma de los cuadrados de los errores de
predicción, respecto a los parámetros θ
( )y t θ Predicción de la salida del modelo con los parámetros
θ
Procesou
v
y
y
m
e(t)
105
y t G q u t H q tm ( ) ( ) ( ) ( ) ( )= +− −1 1 ξ
[ ] [ ]y t G q u t H q H q
y t G q u t t
G q u t H q
y t G q u t G q H q
u t t
1 1
[ ]y t G q u t H q t tm ( ) ( ) ( ) ( ) ( ) ( )= + − +− −1 1 1 ξ
ξ
PEM
106
( ) ( ) ( )
( ) ( )
u t H q
[ ]
( ) ( ) ( ) ( ) ( ) ( )
( ) ( )
( )
( ) ( ) ( ) ( )
e t y t y t y t G q H q
u t H q
θ θ= − = − − −
N
PEM: Propiedades
y t G q u t H q t( ) ( ) ( ) ( ) ( )= +− − 0
1 0
[ ]V E H q
G q u t H q t G q u t
E G q G q
H q u t
H q H q
y t G q u t t
N
108
( ){ } { } ( ){ } { }
= + =
= + ≥ =
1 1 0 1
H q u t
H q H q
( )ξ
Al ser H mónico, y G tener al menos un retardo:
La varianza del ruido es una cota inferior que se alcanza si:
PEM: dominio de la frecuencia
109
H q H q
En lazo abierto u y el ruido están incorrelacionados, luego:
V E G q G q
H q u t
H q H q
110
B e A e H e
d
- Φ
Φ
La estimación es mejor en aquel rango de frecuencias en el que 1/H
y la señal de excitación son grandes
{ } { }V G q G q
H q E u t
H q H q
Residuos
111
y t G q u t H q t( ) ( ) ( ) ( ) ( )= +− − 0
1 0
0 1 0
1 ruido blanco
y t G q u t( ) ( ) ( ) ( )
( ) ( ) ( )− = = −− −θ θ
1 1
1 Residuos
→ →0
0
( ) ( )θ ξSi Test: Los residuos deben tener características de
ruido blanco
Caso Multivariable
y1 = M11 u1+ M12 u2+...
Se hace una identificación para cada salida y todas las entradas m
sistemas MISO
Caso multivariable
[ ] 21 n2i21in1i11ii
Puede formularse en la forma estandar: 11 )t()t(y θ′=
22 )t()t(y θ′=
Caso Multivariable
u1Ti
ReactanteTr
u2
AT
Si hay varias entradas, los cambios en las mismas deben de estar
incorrelacionados para que el algoritmo de identificación pueda
distinguir los efectos de cada entrada en las salidas
Experimentos
116
Por ejemplo, si se aplican señales proporcionales u1=αu2 a las
entradas simultáneamente, hay muchas combinaciones de los modelos
M1 y M2 que se ajustan a las mismas parejas de entradas y
salidas
)t(u)MM()t(uM)t(uM)t(y 2212211 +α=+=
u1Ti
ReactanteTr
u2
AT
Excitar solo una entrada manteniendo las otras constantes y luego
hacer lo mismo con las otras, no es una buena política: alarga el
tiempo del experimento y no proporciona datos en condiciones
realistas de funcionamiento
Dos depósitos acoplados
Modelos no lineales
Muchas de las técnicas de modelos lineales pueden aplicarse
directamente a modelos no-lineales, pero lineales en los parámetros
que se desea estimar, p.e.
y(t) = α eu(t-1) + β sen(2u(t-2)) Ya que pueden formularse en el
formato:
y(t) = φ(t)’θ = (eu(t-1), sen(2u(t-2)) (α, β)’ El caso general
requiere usar técnicas directas de
optimización de una función de costo.
119
Validación
El conjunto de test positivos y negativos permiten establecer el
rango de validez del modelo
Distintas situaciones implican distintas técnicas: – El proceso
existe y se trata de construir un modelo que
reproduzca la realidad – El proceso no existe aún y se trata de
construir un modelo
para predecir su comportamiento y optimizarlo cara al diseño
120
Validación
Conjunto de pruebas de diferente naturaleza que ayudan a validar el
modelo
La validación ha de hacerse a todos los niveles de construcción del
modelo: – Hipótesis – Formulación – Codificación – Resolución
numérica (verificación) – Aplicación
121
Validación
122
u y Model
Discusión y evaluación de respuestas tipo del modelo con expertos
en el proceso
u y
124
Respuestas cualitativas
Test de Turing: ¿Se puede discriminar una respuesta del modelo y de
la realidad si se presentan en el mismo formato?
Trazas de la evolución de variables tipo flujo, etc. a través de
los distintos componentes
125
126
( )∑ =
y
modelo
experimental
t
Medida numérica de las discrepancias entre la respuesta del modelo
y los datos experimentales
Pueden usarse para comparar varios modelos de un proceso y decidir
sobre cual es mas adecuado
Indices de error
128
∑ =
Akaike Information Criterion AIC
Final Prediction Error FPE
Estima de la varianza del error de predicción con los datos
nuevos
d2 N
))t(y)t(y( logN
Penaliza mas la complejidad del modelo)Nlog(d
N
+
−∑ =
Es consistente: La probabilidad de seleccionar un modelo erroneo
tiende a cero con N
Indices de error
130
Test F para ver si el modelo j (con mas parámetros) es
significativamente mejor que el modelo i, con un nivel α de
confianza
)dN/())t(y)t(y(
)dd/())t(y)t(y())t(y)t(y(
−
−
−
−−
−
∑
∑∑
=
==
Debe compararse con la distribución F(dj-di, N-dj) con el nivel α
de confianza
Errores
Los errores de la estimación provienen de: – Errores de medida de
los datos. Idealmente se suelen
suponer independientes, de media cero y varianza constante. Para
caracterizarlos pueden usarse datos de las salidas con entradas
constantes.
– Errores del modelo o la estima de parámetros. Si el modelo fuera
perfecto, los residuos deberían tener las mismas características
estadísticas que los errores de medida.
131
Modelo
Proceso
ym
e
Si el modelo es correcto los residuos no deben presentar una
estructura “sistemática”, sino ser el resultado de las
perturbaciones aleatorias que actuan sobre el proceso
Residuos e(t) = y(t) - ym(t)
133
e
t
e
t
nº de cambios de signo de los residuos (ncs) ¿Se ajustan a un
modelo AR?
Test: 2/N 2 Nncs − Puede compararse con una distribución
N(0,1) para ver si hay un sesgo en los signos
Test estadísticos
2σ k k
No correlación entre la entrada y los residuos: Los errores deben
ser independientes de un experimento particular
Lazo abierto, lazo cerrado
Varianza de los parámetros
135
=
C
Los términos cruzados de la matriz de covarianza dan una idea de la
independencia de los parámetros, pues deben estar
incorrelacionados
Sensibilidad
136
[ ]
≤≤ ==
−= ∑ =
Puede obtenerse a partir del problema dual de optimización en
ciertos casos
Validación
137
Distorsiones de los parámetros
Varianza de las estimaciones
En ciertos casos, se utilizan fórmulas de predicción de
controladores predictivos tales como el DMC, GPC, etc.
Distorsión de parámetros Butterfield 1986
139
¿ Como habría que modificar el valor de los parámetros del modelo
para que sus respuestas coincidieran exactamente con las del
proceso?
t
p El valor de la distorsión da una medida de la credibilidad del
modelo
n,...,1t)t(y))t(,t(ymin * m ==+
pp
p
Supongamos que ahora los parámetros p pueden variar a lo largo del
tiempo,
Distorsión de parámetros
Otros criterios de identificación
Patrones de respuesta a entradas especiales Respuesta en frecuencia
Funciones de correlación y espectros Minimización de una función de
error Minimización de errores de predicción Máxima verosimilitud
Identificación global Minimización de distancia paramétrica
Identificación de subespacios
141
Máxima verosimilitud (ML)
La respuesta del modelo ym(t) a los datos experimentales de entrada
u(.) depende del valor de los parámetros del modelo θ
Sea p(y(t)|t-1,θ) la probabilidad de que ym(t) = y(t) con el modelo
de parámetros θ y datos hasta el instante t-1
Criterio: elegir los parámetros θ que maximizan la probabilidad de
obtener los datos y(1), y(2),..., y(N) medidos
142
143
p(y(t)|t-1,θ) probabilidad de que ym(t) = y(t) con el modelo de
parámetros θ y datos hasta t-1
La probabilidad de obtener los valores y(1),y(2),...,y(N) es:
∏ =
∏∏ == πσ
144
Normalmente en lugar de maximizar esta función se minimiza su
logaritmo cambiado de signo
[ ] πσ+ σ
θ−− =θ− ∑
El problema se expresa como una minimización numérica de suma de
errores de predicción y(t) - ym(t | t-1, θ)
Identificación Global
[ ]V N
N
1
2
1
( ) ( ( ) ( , )θ
Criterio de minimización del error :Dado un conjunto de datos
experimentales u(t), y(t), buscar los parámetros θ que minimizan la
función de coste V :
Procesou
v
N
1
( ( ) ( ) ( )θ
θ1
θ2 Isodistancia: Lugar geométrico de los puntos del espacio
paramétrico con igual valor de V
Todos los modelos sobre una isodistancia tienen la misma validez
respecto al criterio de suma de cuadrados de errores
f V cte( ) .θ = =
147
Matching the uncertainty of the model given by global
identification techniques to the robustness of a model based
predictive controller M. Sanzo, J. Richalet, C. de Prada Advances
in Model Based Predictive Control Oxford University Press,
1994
Matching the uncertainty of the model given by
global identification techniques to the robustness
of a model based predictive controller
M. Sanzo, J. Richalet, C. de Prada
Advances in Model Based Predictive Control
Oxford University Press, 1994
Modelos que explican ambos experimentos
Las isodistancias dependen de los datos experimentales y del nivel
de exactitud V elegido
148
Isodistancias
θ1
θ2
Informan sobre la calidad de los parámetros, y el rediseño de
experimentos
θ1
θ2
149
a
x
x Para cada valor de a se resuelve una ecuación de segundo grado
para obtener el correspondiente valor de K
Ejemplo con un modelo sencillo de primer orden
150
151
θ1
p2
θ2
θ0
θ
y t t v t y t t t
V t t
t t t
Minimización de la distancia paramétrica
153
0
0
0
0
000
¿Qué valor de ρ hace V(t)-V(t-1) negativo?
Caso sin ruido
[ ]
[ ]
[ ]
[ ]
V t V t t y t y t V t V t
y t y t
t t V t
t
t
m
m
m
m
µ
t t t v t
d t d t t v t t t t
t
= − + − −
− +
= − + + − −
=
= −
− +
= − −
Si el ruido v(t) y (t) están incorrelacionados
Algoritmo NLMS NLMS Normalize Least Mean Square
Mínima media cuadrada normalizada
t = − +
1 2 con 0 < < 2
•Con ruido, el posible sesgo no depende de µ •La varianza de la
estimación decrece con µ •La mejor velocidad de convergencia se
obtiene con µ proximo a 1 •Compromiso velocidad / precisión • σ es
una constante para evitar que θ cuando (t)
156
FUNCION DE TRANSFERENCIA
Experimentos
HIDEN
RLS
RLS
Minimización de funciones
Minimización de funciones
Algoritmo de Gauss-Newton
Algoritmo de Gauss-Newton
PEM: Predicciones
Residuos
Distorsión de parámetros
Caso sin ruido