79
Trabajo de Iniciaci´on a la Investigaci´on Radio Espectral Conjunto y Radio Espectral Generalizado Departamento de Matem´aticas Facultad de Ciencias Exactas Universidad Nacional de La Plata Alumno: Esteban Baragatti Director: Dr. Mariano Ruiz 24 de febrero de 2011

Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Trabajo de Iniciacion a laInvestigacion

Radio Espectral Conjunto y Radio Espectral

Generalizado

Departamento de MatematicasFacultad de Ciencias Exactas

Universidad Nacional de La Plata

Alumno: Esteban BaragattiDirector: Dr. Mariano Ruiz

24 de febrero de 2011

Page 2: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Indice general

1. Introduccion 2

1.1. Aspectos preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.2. Radio Espectral Conjunto . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2. Teoremas principales 21

2.1. Formula Generalizada de Gelfand . . . . . . . . . . . . . . . . . . . . . . . . 212.2. Conjetura de Acotacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3. Contractibildad Simultanea 37

3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 373.2. Rango optimo para contractibilidad simultanea . . . . . . . . . . . . . . . . 393.3. Conjuntos con ρ(Σ) = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4. Calculo exacto y calculo aproximado del Radio Espectral Conjunto 55

4.1. Matrices palindromicas de orden 2 . . . . . . . . . . . . . . . . . . . . . . . . 554.2. Matrices con igual Radio Espectral . . . . . . . . . . . . . . . . . . . . . . . 624.3. Aproximacion para el Radio Espectral Conjunto . . . . . . . . . . . . . . . . 65

A. Matrices con igual Radio Espectral 70

B. Rutinas en Matlab utilizadas 73

Bibliografıa 77

1

Page 3: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Capıtulo 1

Introduccion

La nocion de Radio Espectral Conjunto fue introducida en el trabajo “A note on thejoint spectral radius” de Gian-Carlo Rota y Gilbert Strang, publicado en el ano 1960 (ver[22]). Como el mismo Strang explica (ver [4]), la motivacion era puramente teorica, y dehecho la publicacion permanecio practicamente desapercibida hasta el ano 1992, fecha en queIngrid Daubechies y Jeffrey C. Lagarias publican la serie de artıculos [9, 10, 11] . En lıneasgenerales, Daubechies y Lagarias redescubren el Radio Espectral Conjunto y lo relacionan conla convergencia de productos infinitos de matrices, asociados a las ecuaciones en diferenciascon dos escalas. Con el correr de los anos han ido surgiendo numerosas aplicaciones a diversasareas como por ejemplo wavelets, teorıa de control, teorıa de numeros, codificacion, etc.Paralelamente, se fueron desarrollando tecnicas para aproximar el Radio Espectral Conjunto,ası como el calculo exacto del mismo en conjuntos particulares de matrices, dado que engeneral, es extremadamente difıcil de obtener.

En [11], ademas de estudiar el Radio Espectral Conjunto definido por Rota y Strang,Daubechies y Lagarias definen el Radio Espectral Generalizado. Ası, dado un conjuntocualquiera Σ de matrices cuadradas con coeficientes complejos y considerando a Σk como elconjunto formado por todos los posibles productos de k factores formados por matrices enΣ, y dada una cierta norma ‖ · ‖ se define

Radio Espectral Generalizado:

ρ(Σ) = lım supk→∞

ρk(Σ)1/k con ρk(Σ) = supA∈Σk

ρ(A)

Radio Espectral Conjunto:

ρ(Σ) = lım supk→∞

ρk(Σ)1/k con ρk(Σ) = supA∈Σk

‖A‖

En el trabajo citado los autores demuestran la desigualdad (1.13) y en base a ella pro-ponen:

Conjetura para el Radio Espectral Generalizado. Posteriormente denominadaFormula Generalizada de Gelfand: para conjuntos finitos Σ se cumple

ρ(Σ) = ρ(Σ)

2

Page 4: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Tambien proponen una segunda conjetura relacionada con propiedades de acotacion paralos conjuntos que convergen en producto, ver (1.12) y Definicion 2.1.1:

Conjetura de Acotacion. Todos los conjuntos finitos que poseen la propiedad deconvergencia en producto generan un semigrupo multiplicativo acotado.

Estas dos conjeturas fueron demostradas por primera vez por Mare A. Berger y YangWang [2] (1992) utilizando herramientas avanzadas de teorıa de anillos. Posteriormente Lud-wig Elsner [14] (1995) publica una nueva demostracion basada en elementos de conjuntosconvexos. Tambien aparecen otras demostraciones: M.-H. Shih, J.-W. Wu y C.-T. Pang [24](1997); Jairo Bochi [7] (2003).

En el ano 1995, J. Lagarias y Y. Wang [18] proponen dos nuevas conjeturas relacionadascon la necesidad de calcular en forma exacta el Radio Espectral Conjunto:

Conjetura de Finitud. Para cada conjunto finito Σ de matrices con coeficientesreales, existe un valor k0 para el cual

ρ(Σ) = ρ(Σ) =

{sup

A∈Σk0

ρ(A)

}1/k0

.

Conjetura de Finitud Normada. Dada una norma ‖ · ‖ sobre Rn×n y un conjunto

finito Σ de matrices con coeficientes reales tal que para toda A ∈ Σ se cumple ‖A‖ ≤ 1y ρ(Σ) = 1, entonces existe un valor k0 tal que

1 = ρ(Σ) = ρ(Σ) =

{sup

A∈Σk0

ρ(A)

}1/k0

.

En el artıculo se prueba la equivalencia entre estas dos nuevas conjeturas; y se presentandemostraciones para la Conjetura de Finitud Normada para casos especiales de normas.Sin embargo,posteriormente se publican pruebas/contraejemplos mostrando la invalidez engeneral de estas conjeturas: Thierry Bousch y Jean Mairesse [2] (2002); Vincent D. Blondel,Jacques Theys y Alexander A. Vladimirov [6] (2003). En el contraejemplo propuesto porBlondel-Theys-Vladimirov se prueba que existen infinitos valores de a para los cuales lassiguientes matrices no cumplen la conjetura

A1 :=

(1 10 1

)y A2 := a

(1 01 1

).

Las conjeturas de finitud estan relacionadas con la necesidad de encontrar procedimientosefectivos que permitan calcular el Radio Espectral Conjunto; o decidir si un conjunto finitode matrices tiene Radio Espectral Conjunto menor a 1, dado que ası estaban caracterizadoslos conjuntos que convergen en producto. A pesar de la importancia que tiene el RadioEspectral Conjunto en las distintas areas de aplicacion, su calculo resulta extremadamentecomplejo, incluso para matrices de dimension 2 × 2. Es por esto que gran parte de lostrabajos recientes en el tema se ocupan tanto de estudiar metodos de aproximacion delRadio Espectral Conjunto como de calcularlo en forma exacta en conjuntos especıficos dematrices [5, 7, 15, 17, 19].

3

Page 5: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Descripcion del Trabajo de Iniciacion a la Investigacion

El presente trabajo de iniciacion a la investigacion consiste en el desarrollo de los re-sultados mas importantes sobre el Radio Espectral Conjunto, utilizando como principalesreferencias los artıculos [1, 2, 5, 11, 12, 14, 18]. En los Aspectos Preliminares se presenta unbreve resumen de las definiciones y propiedades del algebra lineal y el analisis matricial nece-sarios a lo largo del trabajo; haciendo enfasis en el radio espectral ρ(A) y concluyendo conla Proposicion 1.1.4 donde se caracteriza a traves de una serie de afirmaciones equivalenteslas matrices con ρ(A) < 1.

1. Ak → 0 para k → ∞ .

2. ρ(A) < 1 .

3. Existe una matriz H > 0 tal que A∗HA < H.

4. Existe una matriz H > 0 y 0 < γ < 1 tal que A∗HA ≤ γ2H.

5. Existe una matriz invertible S tal que ‖S−1AS‖sp < 1.

6. Existe una norma operador ‖ · ‖∗ tal que ‖A‖∗ < 1.

Cuadro 1.1: Equivalencias entre proposiciones relacionadas al radio espectral

En la siguiente seccion del capıtulo se define rigurosamente el Radio Espectral Conjuntoy el Radio Espectral Generalizado; dado un conjunto cualquiera Σ de matrices cuadradas concoeficientes complejos y considerando a Σk como el conjunto formado por todos los posiblesproductos de k factores formados por matrices en Σ, y dada una cierta norma ‖ · ‖ se define

Radio Espectral Generalizado:

ρ(Σ) = lım supk→∞

ρk(Σ)1/k con ρk(Σ) = supA∈Σk

ρ(A).

Radio Espectral Conjunto:

ρ(Σ) = lım supk→∞

ρk(Σ)1/k con ρk(Σ) = supA∈Σk

‖A‖.

Notar que la diferencia en ambas definiciones radica en que ρk(Σ) se define con el radioespectral en el primer caso; y ρk(Σ) con la norma elegida previamente. En la misma seccionse demuestran algunas de sus propiedades, y se incluyen algunos ejemplos demostrativos. Enparticular se desarrolla la demostracion de la desigualdad

ρk(Σ)1/k ≤ ρ(Σ) ≤ ρ(Σ) ≤ ρk(Σ)1/k,

4

Page 6: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

que es una generalizacion de la desigualdad tradicional conocida para el radio espectralρ(A) ≤ ‖A‖. El capıtulo siguiente esta dedicado a la demostracion de la Formula General-izada de Gelfand, conjeturada inicialmente en [11] para conjuntos finitos de matrices:

ρ(Σ) = ρ(Σ) para conjuntos Σ acotados.

La demostracion esta basada en [14] porque se considera, en algun sentido, mas simple quela publicada por primera vez en [2]. La razon por la que tal resultado generaliza la formulaclasica de Gelfand es la siguiente:

Para una unica matriz A ∈ Cn:

lımk→∞

ρ(Ak)1/k = ρ(A) = lımk→∞

‖Ak‖1/k.

Para conjuntos acotados de matrices Σ ⊆ Cn×n:

lım supk→∞

{supA∈Σk

ρ(A)

}1/k

= ρ(Σ) = ρ(Σ) = lım supk→∞

{supA∈Σk

‖A‖}1/k

.

En la seccion se incluye una caracterizacion para conjuntos acotados

ρ(Σ) = ınfv∈N

supA∈Σ

v(A),

donde N es el conjunto de todas las normas operador; es decir, aquellas normas sobre Cn×n

definidas a partir de una norma sobre Cn. Ademas, en el capıtulo mencionado se prueba que

para conjuntos de matrices en bloque el calculo del Radio Espectral Conjunto se reduce alcomputo del mismo en los bloques. Estos dos ultimos resultados permiten calcular el RadioEspectral Conjunto en forma sencilla para el caso de conjuntos de matrices con ciertaspropiedades:

Para Σ formado por matrices autoadjuntas

Para Σ formado por matrices de forma triangular superior

Para Σ formado por matrices que conmutan entre sı

ρ(Σ) = ρ(Σ) = supA∈Σ

ρ(A)

Si bien para la demostracion de la Formula generalizada de Gelfand se utilizo comoreferencia el artıculo de Elsner [14], el capıtulo culmina con los resultados mas importantesdel artıculo de Berger-Wang [2], incluyendo la demostracion de la validez de la Conjetura

5

Page 7: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

de Acotacion. Estos ultimos resultados pueden interpretarse como una generalizacion de lositems 1, 2 y 6 del Cuadro 1.1

El Capıtulo 3 esta dedicado completamente al artıculo [1], publicado en el ano 1998por Tsuyoshi Ando y Mau-Hsiang Shih, en el cual se estudian los conjuntos de matricescontractibles simultaneamente por alguna matriz invertible S. Segun la definicion tradicional,una matriz A es contractible si existe una matriz invertible S tal que

‖S−1AS‖sp < 1 .

Notar que esto es equivalente a que ρ(A) < 1. Para conjuntos Σ de matrices se define enforma similar la contractibilidad simultanea si existe una matriz invertible S tal que

sup{‖S−1AS‖sp : A ∈ Σ

}< 1 .

El principal resultado del artıculo Ando-Shih relaciona el Radio Espectral Conjunto conla contractibilidad simultanea; estableciendo que la condicion ρ(Σ) ∈ [0, 1

n) garantiza la

contractibilidad simultanea de los conjuntos acotados Σ ⊆ Cn×n. En la demostracion del

teorema se utiliza la Formula Generalizada de Gelfand y una version matricial, Teorema3.2.2, del Teorema Elipsoidal de John, publicado originalmente en el ano 1948 [16]. En elTeorema 3.2.2 se incluye, dado 1√

n≤ γ < 1, la construccion de un ejemplo de conjunto finito

Σ con ρ(Σ) = γ pero que no es simultaneamente contractible. Los resultados de la Seccion3.2 permiten generalizar los puntos 2, 4 y 5 del Cuadro 1.1. En la ultima seccion del capıtulose estudia la relacion entre ρ(Σ) = 0 y la triangularizacion simultanea de las matrices de Σ.La condicion ρ(Σ) = 0 garantiza que el conjunto Σ puede triangularizarse simultaneamentea traves de una matriz unitaria U . La contraccion en estos casos puede hacerse tan pequenacomo se quiera, en el sentido que dado cualquier ǫ > 0 existe una matriz invertible S tal que

sup{‖S−1AS‖sp : A ∈ Σ

}< ǫ .

En el Capıtulo 4 se aborda el problema del computo del Radio Espectral Conjunto.Contrariamente a su importancia en las aplicaciones, el calculo efectivo del Radio EspectralConjunto es sumamente difıcil; incluso para conjuntos de matrices de tamano 2 × 2. Podrıadecirse que hay dos lıneas diferenciadas relacionadas con este problema. Por un lado se buscanconjuntos de matrices con ciertas caracterısticas que permitan calcular de forma exactasu Radio Espectral Conjunto. Por otro lado existen numerosos trabajos que tratan sobrealgoritmos que permitan aproximar el Radio Espectral Conjunto en casos mas generales,buscando estimar la precision de la estimacion y/o las tasas de convergencia de los algoritmos.En las primeras dos secciones del capıtulo se desarrolla el artıculo de Bernhard Moßner[19] publicado en el ano 2009 cuyo principal resultado es el Teorema 4.1.5 para matricespalindromicas. Un par de matrices L y R se denominan palindromicas si estan relacionadaspor

L = PRP con P :=

(0 11 0

).

6

Page 8: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

El Teorema 4.1.5 establece que en estos casos se cumple

ρ(Σ) = ρ({L,R}) = max{ρ(L),√

ρ(LR)}.

En la ultima seccion se desarrolla el artıculo [5] (2004) de Vincent D. Blondel, YurriNesterov y Jacques Theys que introduce una aproximacion para el Radio Espectral Conjuntomediante normas elipsoidales definidas por

ρa(Σ) = ınfP>0

supA∈Σ

‖A‖P ,

donde el ınfimo esta tomado sobre todas las matrices P definidas positivas; y ‖ · ‖P es lanorma operador asociada a la matriz P a traves de la norma definida sobre C

n:

‖x‖P =√〈Px, x〉 =

√x∗Px

‖A‖P = sup {‖Ax‖P : ‖x‖P = 1} = supx 6=0

√x∗A∗PAx√

x∗Px.

La exactitud de esta aproximacion esta dada por la siguiente desigualdad

1√n

ρa(Σ) ≤ ρ(Σ) ≤ ρa(Σ) .

La demostracion original de [5] esta planteada solo para conjunto Σ finitos. Sin embargo, lademostracion puede generalizarse para conjuntos Σ acotados a traves de los resultados delos artıculos de Ando-Shih [1] y de Berger-Wang [2] de las secciones anteriores. El calculode la aproximacion ρa(Σ) puede realizarse en forma efectiva mediante los procedimientos deoptimizacion con restricciones. En el Apendice B se incluyen rutinas elaboradas en Matlabpara un ejemplo clasico: un par de matrices dependientes del parametro a

A :=

(1 2−2 1

), B :=

(1 2a

−2/a 1

).

Con estas rutinas se logro reproducir las graficas demostrativas presentadas en [5] dondepuede observarse la exactitud de la aproximacion ρa(Σ).

1.1. Aspectos preliminares

Se notara con Mn = Mn(C) a la C-algebra Cn×n de matrices cuadradas de tamano n con

coeficientes complejos. Se usara ‖A‖ para representar la norma asociada a la matriz A ∈ Mn.En la mayorıa de los casos, ‖A‖ sera la norma operador asociada a una respectiva norma‖x‖ sobre C

n. Siempre se mantendra esta convencion salvo que explıcitamente se indique locontrario. Se usaran las notaciones tradicionales para las distintas normas sobre C

n o sobreMn. En particular se usara la notacion ‖ · ‖sp para la norma espectral sobre Mn:

‖A‖sp = Norma Espectral = Norma operador asociada a la norma-2

= sup {‖Ax‖2 : ‖x‖2 = 1} .

7

Page 9: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Por tratarse de espacios vectoriales de dimension finita todas las normas son equivalentesentre sı. En particular se tiene, para todo x ∈ C

n

‖x‖∞ ≤ ‖x‖2 ≤ n1/2‖x‖∞ . (1.1)

Todas las normas operador son normas matriciales o normas submultiplicativas:

‖A.B‖ ≤ ‖A‖.‖B‖ .

Cualquier otra norma, no necesariamente norma operador, que cumpla con esta desigualdadse dira tambien norma matricial.

La norma ‖x‖22 = 〈x, x〉 = x∗x proviene del producto interno usual sobre C

n. En formamas general, se definen las normas elipsoidales, tomando cualquier matriz P definidapositiva

‖x‖P =√〈Px, x〉 = 〈x, x〉1/2

P =√

x∗Px . (1.2)

El Radio Espectral ρ(A) se define de la siguiente manera, tomando σ(A) como elEspectro de la matriz A,

ρ(A) = max{|λ| : λ ∈ σ(A)

}. (1.3)

Se utilizaran las notaciones habituales:

A ≥ 0: La matriz A es semidefinida positiva.

A > 0: La matriz A es definida positiva.

A ≥ B: Las matrices A y B son autoadjuntas y A − B ≥ 0.

A > B: Las matrices A y B son autoadjuntas y A − B > 0.

Tambien se utilizara la siguiente notacion para la enumeracion de los autovalores orde-nados de mayor a menor de una matriz A ≥ 0, y para los valores singulares de cualquierA ∈ Mn:

λ1(A) ≥ . . . ≥ λn(A) (1.4)

s1(A) ≥ . . . ≥ sn(A) . (1.5)

Con esta notacion se sabe que

‖A‖sp = s1(A) = ρ(AA∗)1/2 .

En particular, para matrices autoadjuntas se cumple1

‖A‖sp = ρ(A) .

A continuacion se presentan los resultados preliminares mas importantes que se utilizaran alo largo del trabajo, relacionados con el radio espectral y las normas.

1En general se cumple para matrices normales.

8

Page 10: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Proposicion 1.1.1. Para cualquier norma matricial ‖ · ‖ sobre Mn se cumple

ρ(A) ≤ ‖A‖ (1.6)

y en forma mas general, ρ(A) ≤ ‖Ak‖1/k.

Demostracion: Dado λ ∈ σ(A) y un correspondiente autovector v ∈ Mn, se construye lamatriz V ∈ C

n×n con todas sus columnas iguales al vector v. De modo que usando lasubmultiplicatividad de la norma

|λ|‖V ‖ = ‖λV ‖ = ‖AV ‖ ≤ ‖A‖‖V ‖ .

Y por lo tanto ρ(A) ≤ ‖A‖. Considerando que ρ(Ak) = ρ(A)k se obtiene la generalizacionρ(A)k ≤ ‖Ak‖. �

La desigualdad (1.6) representa una cota superior para el radio espectral. Una cota in-ferior, en terminos de la norma de la matriz, se obtiene como consecuencia del Teorema deCayley-Hamilton del algebra lineal.

Proposicion 1.1.2. Para cualquier norma matricial ‖ · ‖ sobre Mn se cumple

‖An‖ ≤ C.ρ(A).‖A‖n−1 con C = 2n − 1 . (1.7)

Demostracion: Sea p(z) = zn + an−1zn−1 + · · · + a1z + a0 el polinomio caracterıstico de A.

De la ecuacion p(A) = 0 se deduce

An = −(an−1A

n−1 + · · · + a1A + a0

)

‖An‖ ≤ ‖an−1An−1 + · · · + a1A + a0‖ ≤

n−1∑

i=0

|ai|‖A‖i . (1.8)

Los coeficientes ai pueden expresarse en terminos de los autovalores de A como unasuma/resta de

(ni

)terminos donde en cada termino hay un producto de n− i autovalores de

A. Por lo tanto se deduce que

|ai| ≤(

n

i

)ρ(A)n−i ≤

(n

i

)ρ(A)‖A‖n−i−1 para i = 0, . . . , n − 1 . (1.9)

De (1.8) y (1.9) se tiene

‖An‖ ≤n−1∑

i=0

(n

i

)ρ(A) ‖A‖n−i−1‖A‖i = ρ(A)‖A‖n−1(2n − 1) .

Las desigualdades (1.6) y (1.7) permiten deducir la formula de Gelfand para el RadioEspectral.

9

Page 11: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Teorema 1.1.3 (Formula de Gelfand para el Radio Espectral). Dada una norma cualquiera‖ · ‖ se cumple

ρ(A) = lımk−→∞

‖Ak‖1/k . (1.10)

Demostracion: Considerando que todas las normas son equivalentes se puede suponer que lanorma es submultiplicativa. Por lo tanto ‖Ak‖1/k ≤ ‖A‖. Esto muestra que el lımite superiorde la sucesion ‖Ak‖1/k existe:

r := lım supk→∞

‖Ak‖1/k .

Aplicando la cota inferior (1.7) a la matriz Ak y tomando la potencia 1/kn se tiene

‖(Ak)n‖ ≤ Cρ(Ak)‖Ak‖n−1

‖Akn‖1/kn ≤ C1/knρ(A)1/n‖Ak‖(n−1)/kn ,

tomando lımite superior a ambos lados con k → ∞

r ≤ ρ(A)1/nr(n−1)/n =⇒ r ≤ ρ(A) .

Ademas se cumple que ρ(A) ≤ ınfk≤i

‖Ai‖1/i para todo k ≥ 1. Y por lo tanto

ρ(A) ≤ lım infk→∞

‖Ak‖1/k .

Con lo cual

ρ(A) ≤ lım infk→∞

‖Ak‖1/k ≤ lım supk→∞

‖Ak‖1/k ≤ ρ(A) .

De la demostracion puede observarse que si bien en la Formula de Gelfand (1.10) apareceinvolucrado el lımite, se tiene que ρ(A) = ınf

k≥1‖Ak‖1/k. La formula permite interpretar al

radio espectral como la tasa de crecimiento de las potencias de la matriz,

‖Ak‖ ∼ ρ(Ak) para k → ∞ .

Ademas, considerando que ρ(A) = ρ(Ak)1/k para todo k ≥ 1, se tiene la identidad paracalcular el radio espectral de una matriz,

lımk→∞

ρ(Ak)1/k = ρ(A) = lımk→∞

‖Ak‖1/k . (1.11)

La siguiente proposicion indica caracterizaciones para las matrices con radio espectralmenor a 1.

10

Page 12: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Proposicion 1.1.4. Dada una matriz cualquiera A ∈ Mn, las siguientes afirmaciones sonequivalentes:

1. Ak → 0 para k → ∞ .

2. ρ(A) < 1 .

3. Existe una matriz H > 0 tal que A∗HA < H.

4. Existe una matriz H > 0 y 0 < γ < 1 tal que A∗HA ≤ γ2H.

5. Existe una matriz invertible S tal que ‖S−1AS‖sp < 1.

6. Existe una norma operador ‖ · ‖∗ tal que ‖A‖∗ < 1.

Demostracion:1 ⇒ 2: Dado λ ∈ σ(A) y x 6= 0 autovector asociado correspondiente. Se tiene que

Akx = λkx → 0 y por lo tanto |λ| < 1.2 ⇒ 3: Se toma ρ(A) < γ < 1. De la formula de Gelfand para A y para A∗ se deduce que

existe k0 ≥ 1 tal que para todo k ≥ k0 se cumple ‖Ak‖1/k < γ y ‖(A∗)k‖1/k < γ. De modoque la siguiente serie converge y puede definirse correctamente la matriz

H =∞∑

k=0

(A∗)kAk = In + A∗A + (A∗)2A2 + · · · .

Ası definida resulta H > 0 y tambien A∗HA < H; dado que

H − A∗HA =∞∑

k=0

(A∗)kAk −∞∑

k=0

(A∗)k+1Ak+1 = In > 0 .

3 ⇒ 4: En general se cumple que si A < B entonces se puede tomar γ ∈ (0, 1) tal queA ≤ γ2B.

4 ⇒ 5: Si H > 0 entonces H−1 = SS∗ para alguna matriz S invertible. Con lo cual

‖S−1AS‖2sp = ρ((S−1AS)∗(S−1AS)) = ρ(S∗A∗(S−1)∗S−1AS) = ρ(S∗A∗HAS) .

A su vez, la desigualdad A∗HA ≤ γ2H implica conjugando con S

A∗HA ≤ γ2H

S∗A∗HAS ≤ γ2S∗HS

S∗A∗HAS ≤ γ2In .

Y por lo tanto ‖S−1AS‖2sp = ρ(S∗A∗HAS) < γ2 < 1.

5 ⇒ 6: Tomando H = (S−1)∗S−1 > 0 se define la norma elipsoidal sobre Cn

‖x‖2H = 〈Hx, x〉 =

⟨S−1x, S−1x

⟩= ‖S−1x‖2 .

11

Page 13: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

La norma operador ‖ · ‖H sobre Mn asociada es una norma matricial y cumple

‖A‖2H = sup

‖x‖H=1

‖Ax‖2H = sup

‖S−1x‖2=1

‖S−1Ax‖22

= sup‖S−1x‖2=1

‖S−1ASS−1x‖22

≤ sup‖S−1x‖2=1

‖S−1AS‖2sp‖S−1x‖2

2

= ‖S−1AS‖2sp < 1 .

6 ⇒ 1: Se toma ‖A‖∗ < γ < 1; de modo que 0 ≤ ‖Ak‖∗ ≤ ‖A‖k∗ < γk < 1, y por lo tanto

Ak → 0 para k → ∞.�

En la siguiente seccion se define el Radio Espectral Conjunto y el Radio Espectral Gen-eralizado; se mostraran ejemplos y se demostraran algunas sus propiedades generales.

1.2. Radio Espectral Conjunto

La definicion formal de Radio Espectral Conjunto fue presentada por primera vez porRota y Strang en el ano 1960 en [22]. Posteriormente, en 1992, Daubechies y Lagarias en[11] la recuperaron al trabajar en el estudio de la convergencia de productos infinitos dematrices. Un producto infinito

∏∞i=1 Ai de matrices en Mn es convergente a derecha si

existe el lımite lımi→∞ A1 . . . Ai, y en ese caso se define

∞∏

i=1

Ai = lımi→∞

A1 . . . Ai .

Un conjunto Σ de matrices se dice que es convergente en producto a derecha (RCP de’right-convergent product’) o que tiene la propiedad de convergencia en producto a derecha,si todos lo productos infinitos formados por elementos de Σ son convergentes a derechasegun la definicion anterior. En el caso que Σ sea un conjunto finito, Σ = {A1, A2, . . . , Am},cualquier sucesion de elementos de Σ puede caracterizarse por una sucesion d = {dj}j≥1 deındices tomados del conjunto {1, 2, . . . ,m}. Si se denota con Sm al conjunto de las sucesionesde esta forma, y considerando un conjunto Σ finito y con la propiedad RCP se puede definirla funcion lımite MΣ(·) de la siguiente manera

MΣ(d) :=∞∏

i=1

Adi:= Ad . (1.12)

La notacion en la formula anterior (1.12) es utilizada muy frecuentemente; se puede usartanto para considerar productos a derecha como productos a izquierda (LCP ’left-convergentproduct’). El proposito de Daubechies y Lagarias en [11] es caracterizar a los conjuntos dematrices, finitos o infinitos, que posean la propiedad RCP. Y para ello estudian el RadioEspectral Conjunto y el Radio Espectral Generalizado. En el mismo ano 1992, Berger y Wang

12

Page 14: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

abordaron tambien el estudio de los conjuntos de matrices con propiedades de convergencia;incorporando algunos resultados adicionales en esta direccion.

Definicion 1.2.1. Sea Σ ⊆ Mn, se define Σk como el conjunto formado por todos los posiblesproductos de k factores tomados del conjunto Σ.

Dado Σ = {Ai}i∈I

Σk = {k∏

j=1

Aj : Aj ∈ Σ, j = 1 . . . k} para k ≥ 1

ρk(Σ) = supA∈Σk

ρ(A) y ρk(Σ) = supA∈Σk

‖A‖ .

N

La diferencia entre ρk(Σ) y ρk(Σ) esta en el uso del radio espectral tradicional ρ(A)o la norma ‖A‖ respectivamente. En esta ultima se toma una norma ‖ · ‖ cualquiera. Asabiendas de que el valor de ρk(Σ) cambiara segun la eleccion. En el caso que sea necesariose utilizara la notacion ρk(Σ, ‖ · ‖) para indicar explıcitamente la dependencia respecto a lanorma elegida. Aunque no es frecuente hacer esta salvedad dado que la definicion final parael Radio Espectral Conjunto queda independiente de la norma utilizada.

La siguiente desigualdad se utilizara continuamente, valida para normas matriciales

Proposicion 1.2.2. Dados Σ ⊆ Mn, ‖ · ‖ una norma matricial y k, l ≥ 1 numeros enterospositivos entonces

ρk+l(Σ) ≤ ρk(Σ).ρl(Σ) .

Demostracion: La demostracion es consecuencia de la definicion de los conjunto potencias deΣ dado que Σk+l ⊆ (Σk).(Σl), y de la propiedad submultiplicativa de las normas matriciales.

No pasa lo mismo para los ρk(Σ) dado que para el radio espectral no se cumple en generalla desigualdad ρ(A.B) ≤ ρ(A).ρ(B).

Definicion 1.2.3. Dado Σ ⊆ Mn se definen

Radio Espectral Conjunto:

ρ(Σ) = lım supk→∞

ρk(Σ)1/k = lım supk→∞

{supA∈Σk

‖A‖}1/k

.

Radio Espectral Generalizado:

ρ(Σ) = lım supk→∞

ρk(Σ)1/k = lım supk→∞

{supA∈Σk

ρ(A)

}1/k

.

N

13

Page 15: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Dado que todas la normas son equivalentes, la definicion de Radio Espectral Conjunto esindependiente de la norma elegida. Estas definiciones coinciden cuando Σ esta formado poruna unica matriz porque si Σ = {A} entonces Σk = {Ak} con lo cual,

ρ(Σ) = lım supk→∞

{supA∈Σk

‖A‖}1/k

= lım supk→∞

‖Ak‖1/k = ρ(A) .

ρ(Σ) = lım supk→∞

{supA∈Σk

ρ(A)

}1/k

= lım supk→∞

ρ(Ak)1/k = ρ(A) .

No se hace distincion en las definiciones de los casos en los que Σ sea un conjuntofinito o infinito; o sea acotado o no acotado. En todos los casos, las definiciones estan bienestablecidas aceptandose las posibilidades de que ρ(Σ) = ∞ o ρ(Σ) = ∞.

Ejemplos 1.2.4. Se presentan los siguientes casos para ejemplificar el calculo del RadioEspectral Conjunto y del Radio Espectral Generalizado con tres alternativas posibles:

Σ1 =

{(1 10 1

), . . . ,

(1 N0 1

)}

Σ2 =

{(1 10 1

), . . . ,

(1 n0 1

), . . .

}

Σ3 =

{(1 00 1

), . . . ,

(1 00 n

), . . .

}.

El primer caso Σ1 es un conjunto finito de matrices de 2×2. Los otros dos casos Σ2 y Σ3 sonconjuntos infinitos tambien de tamano 2×2. Para calcular los valores de ρ(Σ1), ρ(Σ2), ρ(Σ1)y ρ(Σ2) se utiliza la forma general de los productos de matrices con esta forma particular

(1 α0 1

)·(

1 β0 1

)=

(1 α + β0 1

).

Por lo tanto, para todo k ≥ 1 las matrices de los conjuntos Σk1 y Σk

2 son todas de la forma

(1 ∗0 1

).

Los Radios Espectrales Generalizados pueden ser calculados explıcitamente

ρ(Σ1) = lım supk→∞

{supA∈Σk

1

ρ(A)

}1/k

= lım supk→∞

((1 ∗0 1

))}1/k

= 1

ρ(Σ2) = de igual manera = 1 .

14

Page 16: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Para calcular los Radios Espectrales Conjuntos se elige la norma operador asociada a lanorma-1 sobre C

n, para la cual se sabe

‖A‖1 = sup‖x‖1=1

‖Ax‖1 = maxj

n∑

i=1

|aij| .

Considerando que α es algun numero entero positivo se tiene∥∥∥∥(

1 α0 1

)∥∥∥∥1

= 1 + α .

Y por lo tanto el supremo de las normas en Σk1 se alcanza al multiplicar k-veces la matriz

con la entrada α = N

ρk(Σ1) = supA∈Σk

1

‖A‖ =

∥∥∥∥(

1 kN0 1

)∥∥∥∥1

= 1 + kN

ρ(Σ1) = lım supk→∞

ρk(Σ1)1/k = lım sup

k→∞(1 + kN)1/k = 1 .

En este primer caso el Radio Espectral Conjunto y el Radio Espectral Generalizadocoinciden y valen 1. En cambio, Σk

2 no esta acotado en norma, por lo que ρk(Σ2) = ∞ paratodo k ≥ 1. Y en consecuencia ρ(Σ2) = ∞. En forma similar pero mas sencilla se puedecalcular ρ(Σ3) = ∞ y ρ(Σ3) = ∞ dado que los supremos tanto para ρ(A) o ‖A‖1 no estanacotados sobre Σk

3 para ningun valor de k. N

Observacion 1.2.5. De la propiedad ρ(AB) = ρ(BA) se deduce que ρ(Σ) y los ρk(Σ) resul-tan invariantes ante transformaciones similares. Lo mismo sucede para ρ(Σ) dado que puedeutilizarse alguna norma matricial que cumple ‖S−1AS‖ ≤ ‖S−1‖‖S‖‖A‖. Naturalmente losρk(Σ, ‖·‖) no son invariantes ante estos cambios con transformaciones similares; salvo que seutilice alguna norma con esas caracterısticas. Como por ejemplo la norma espectral ‖·‖sp quees invariante ante transformaciones con matrices unitarias. En resumen, si S es una matrizinvertible y U es una matriz unitaria

ρ(Σ) = ρ(S−1ΣS) , ρk(Σ) = ρk(S−1ΣS)

ρ(Σ) = ρ(S−1ΣS) , ρk(Σ, ‖ · ‖sp) = ρk(U∗ΣU, ‖ · ‖sp) .

Para el caso que se utilice una norma matricial generica se cumple(‖S‖.‖S−1‖

)−1.ρk(Σ, ‖ · ‖) ≤ ρk(S

−1ΣS, ‖ · ‖) ≤ ‖S‖.‖S−1‖.ρk(Σ, ‖ · ‖) ,

Lo cual puede corroborarse dado que para toda A = A1, . . . , Ak ∈ Σk se tiene

S−1AS = S−1A1SS−1A2S . . . S−1AkS ∈ (S−1ΣS)k .

y por lo tanto

‖A‖ = ‖SS−1ASS−1‖ ≤ ‖S‖‖S−1AS‖‖S−1‖sup{‖A‖ : A ∈ Σk} ≤ sup{‖A‖ : A ∈ (S−1ΣS)k}‖S−1‖‖S‖

ρk(Σ) ≤ ρk(S−1ΣS) ‖S−1‖‖S‖ .

N

15

Page 17: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

El resultado principal referido al Radio Espectral Conjunto es la Formula Generalizadade Gelfand (Teorema 2.1.16) que establece que para conjuntos Σ acotados se verifica siemprela igualdad ρ(Σ) = ρ(Σ).

En la siguiente proposicion se generaliza la desigualdad (1.6)

ρ(A) ≤ ‖Ak‖1/k

para normas matriciales. La demostracion se publico en [11] corregida posteriormente porlos mismos autores en [12]. No se hace diferencia entre conjuntos acotados o no acotados;aunque la tercer desigualdad solo es valida en general para normas matriciales.

Proposicion 1.2.6. Para cualquier conjunto Σ ⊆ Mn, y para cualquier norma matricial‖ · ‖

ρk(Σ)1/k ≤ ρ(Σ) ≤ ρ(Σ) ≤ ρk(Σ)1/k = ρk(Σ, ‖ · ‖)1/k . (1.13)

Demostracion:ρk(Σ)1/k ≤ ρ(Σ): Dados k,m ≥ 1 se cumple ρk(Σ)m ≤ ρkm(Σ). Esto es porque el conjunto

(Σk)m esta incluido en Σkm y porque ρ(Aj) = ρ(A)j para cualquier valor de j. Y por lo tanto

ρk(Σ)1/k ≤ {ρkm(Σ)}1/km ;

tomando lımite superior para m

ρk(Σ)1/k ≤ lım supm→∞

{ρkm(Σ)}1/km ≤ ρ(Σ) .

ρ(Σ) ≤ ρ(Σ): Dada A ∈ Σk se cumple ρ(A) ≤ ‖A‖. Y por lo tanto

ρk(Σ)1/k =

{supA∈Σk

ρ(A)

}1/k

≤{

supA∈Σk

‖A‖}1/k

= ρk(Σ)1/k

ρ(Σ) ≤ ρ(Σ) .

ρ(Σ) ≤ ρk(Σ, ‖ · ‖)1/k: En este caso la demostracion es mas extensa porque hay que con-templar los posibles casos en que ρ(Σ) sea ∞ pero alguno de los ρk(Σ, ‖ · ‖) no lo sea. Estoscasos solo son posibles cuando Σ es infinito; para Σ finito la demostracion puede resumirseconsiderablemente. Observar que la afirmacion ρk(Σ, ‖ · ‖) = ∞ significa que el conjunto Σk

no esta acotado en la norma ‖ · ‖ con la que se esta trabajando. Debido a la equivalenciaentre las todas la normas, la condicion de acotado de Σk es independiente de ‖ · ‖.

Paso 1: La desigualdad deseada se cumple si ρk(Σ, ‖ · ‖) = ∞ para todo k ≥ 1. Por lotanto se supondra que existe k ≥ 1 para el cual ρk(Σ, ‖ · ‖) < ∞.

Paso 2: Se vera que bajo la hipotesis de que ρk(Σ, ‖ · ‖) < ∞ para algun valor de kentonces existe un N ≥ 1 tal que para todo l ≥ N se cumple tambien ρl(Σ, ‖ · ‖) < ∞.Si esta afirmacion es verdadera para alguna norma en particular entonces es valida para

16

Page 18: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

cualquier otra norma; porque la condicion de acotacion es independiente de ‖ · ‖. Por estemotivo se trabajara con la norma espectral ‖ · ‖ = ‖ · ‖sp y se usara la notacion implıcitaρk(Σ); recordar que esta norma es la norma operador asociada a la norma-2 sobre C

n. Lademostracion de la afirmacion se hara por induccion sobre n, la dimension de las matrices.

Paso 2a: El caso n = 1 se deduce de que ‖a‖sp = |a|; y por lo tanto |ab| = |a||b|. Sea Cuna cota para Σk. De modo que |a| ≤ C1/k para todo a ∈ Σ. Y ası C l/k es una cota de Σl

para todo l ≥ 1.Paso 2b: Para el paso inductivo se supone entonces que n > 1 y que la afirmacion es

cierta para n − 1. Se supone ademas, sin perdida de generalidad que k es el menor enteropositivo para el cual Σk esta acotado. O sea, ρ1(Σ) = ρ2(Σ) = · · · = ρk−1(Σ) = ∞ yρk(Σ) < ∞. Primero se vera que las matrices en Σ pueden reducirse a matrices de la forma

(B v0 0

)con B ∈ Mn−1 y v ∈ C

n−1 . (1.14)

Para ello se define V = {R(A) : A ∈ Σ}; o sea, el subespacio generado por los rangosde las matrices A ∈ Σ. Por estar en dimension finita existe un subconjunto finito Σ′ ={A1, . . . , Am} ⊆ Σ tal que V = {R(A1), . . . , R(Am)}.

Paso 2c: V es un subespacio propio de Cn invariante por todas las A ∈ Σ.

Chequear que V es invariante es sencillo; al igual que chequear V 6= {0} dado que estosolo es posible si Σ = {0} con lo cual todo serıa trivial.

Dados x =m∑

i=1

Aixi ∈ V y A ∈ Σk−1 se tiene AAi ∈ Σk y por lo tanto

‖Ax‖2 = ‖m∑

i=1

AAixi‖2 ≤m∑

i=1

‖AAixi‖2 ≤m∑

i=1

‖AAi‖sp‖xi‖2 ≤ ρk(Σ)m∑

i=1

‖xi‖2 < ∞

y por lo tanto:sup

A∈Σk−1

‖Ax‖2 < ∞ .

Si V = Cn, el Principio de Acotacion Uniforme implica que

ρk−1(Σ) = supA∈Σk−1

‖A‖sp < ∞ .

Esto contradice la hipotesis inicial de que k era el menor valor para las distintas potenciasde Σ estan acotadas. Con lo cual V es un subespacio propio de C

n.Paso 2d: No necesariamente la dimension de V es n − 1, solo es necesario que sea

estrictamente menor a n. En todo caso se puede completar el subespacio para que coincidacon un hiperespacio de codimension igual a 1. A traves de una transformacion unitaria conuna matriz invertible U adecuada se puede suponer que las matrices de Σ son todas de la

17

Page 19: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

forma (1.14) de modo que al multiplicarse entre sı mantienen la forma y se cumple

A ∈ Σl ⇐⇒ A = A1 . . . Al con Ai ∈ Σ

=

(B1 v1

0 0

). . .

(Bl vl

0 0

)

=

(B1 . . . Bl B1 . . . Bl−1vl

0 0

)con B1 . . . Bl ∈ Mn−1.

De acuerdo a la Observacion 1.2.5 los ρl(Σ) se mantienen invariantes por la transformacionunitaria dado que se esta utilizando la norma espectral.

Se define ΣB = { Los bloques B ∈ Mn−1 correspondientes a las matrices A ∈ Σ}. Es unconjunto de matrices de (n− 1)× (n− 1). Por la forma triangular de las matrices A ∈ Σ, setienen que

ρk(Σ) = supA∈Σk

‖A‖sp < ∞ =⇒ supB∈Σk

B

‖B‖sp = ρk(ΣB) < ∞

Esto implica que se puede aplicar la hipotesis inductiva al conjunto ΣB. Existe N ≥ 1 talque para todo l ≥ N es ρl(ΣB) < ∞.

Pero ademas, la hipotesis ρk(Σ) < ∞ tambien implica que para cada v ∈ Cn−1 corre-

spondiente a la forma (1.14)

supB∈Σk−1

B

‖Bv‖2 < ∞ . (1.15)

De modo que para todo l > N + k se cumple

supB∈Σl

B

‖B‖sp < ∞ porque l > N

y dado que l − k + 1 > N y usando (1.15)

supB∈Σl−1

B

‖Bv‖2 <

(sup

B∈Σl−kB

‖B‖sp

).

(sup

B∈Σk−1B

‖Bv‖2

)< ∞ .

De donde se deduce que para todo l > N + k

ρl(Σ) = supA∈Σl

‖A‖sp < ∞ ,

terminando el paso inductivo.Paso 3: Se considera ahora una norma matricial cualquiera ‖ · ‖ y numeros enteros

k,N ≥ 1 tales que ρk(Σ) < ∞ y ρl(Σ) < ∞ para todo l ≥ N . Sea r ≥ N coprimo con k.Para cualquier m > kr existen numeros enteros p y q tales que m = pk + qr con p > 0 y

18

Page 20: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

0 ≤ q < k. Con estas definiciones iniciales se tiene, usando la Proposicion 1.2.2

supA∈Σm

‖A‖ ≤(

supA∈Σpk

‖A‖)(

supA∈Σqr

‖A‖)

ρm(Σ) ≤ ρpk(Σ).ρqr(Σ)

≤ ρk(Σ)p.ρr(Σ)q

= ρk(Σ)m−qr

k .ρr(Σ)q ,

tomando raız m-esima

ρm(Σ)1/m ≤ ρk(Σ)1k

m−qr

m .(ρr(Σ)q)1/m .

Dado que q esta acotado por k y que ni k ni r dependen de m, al tomar lımite superiorqueda

ρ(Σ) ≤ ρk(Σ)1/k .

Observacion 1.2.7. Esta ultima desigualdad permite afirmar que el lımite superior en ladefinicion de ρ(Σ) es de hecho un lımite. Y por lo tanto

ρ(Σ) = lım supk→∞

ρk(Σ)1/k = lımk→∞

ρk(Σ)1/k .

N

Ejemplo 1.2.8. No pasa lo mismo para ρ(Σ) dado que no esta garantizado que el lımiteinferior coincida con el lımite superior. En el siguiente ejemplo [7, 15] se considera el conjuntoΣ = {A,B} donde A y B se definen de la siguiente forma

A :=

(0 10 0

)y B :=

(0 01 0

)

que cumple

Σ2k =

{(0 00 0

),

(1 00 0

),

(0 00 1

)}para k ≥ 1

Σ2k+1 =

{(0 00 0

),

(0 10 0

),

(0 01 0

)}para k ≥ 1 ;

lo cual permite calcular

ρk(Σ) =

{1 para k par0 para k impar

(1.16)

y por lo tanto

lım infk→∞

ρk(Σ)1/k = 0 < 1 = lım supk→∞

ρk(Σ)1/k .

19

Page 21: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

N

Ejemplo 1.2.9. El mismo conjunto anterior sirve para comprobar que las desigualdadesen (1.13) no son monotonas, en el sentido que generalmente no hay una relacion de ordendirecta entre ρk(Σ)1/k y ρk+1(Σ)1/k+1; ni tampoco entre ρk(Σ)1/k y ρk+1(Σ)1/k+1.

En lo que respecta al radio espectral generalizado se puede ver de (1.16) que los ρk(Σ)tienen un comportamiento oscilatorio. En el caso del radio espectral conjunto se puedeproducir un comportamiento similar tomando alguna norma ‖·‖ de manera que los supremossobre los conjuntos Σ2k y Σ2k+1 sean tambien oscilatorios. Como alternativa se puede definirla norma ‖ · ‖∗ sobre C

n de la siguiente manera

∥∥∥∥(

xy

)∥∥∥∥∗

= |x| + 1

2|y| .

Ası definida la norma operador asociada sobre Mn cumple

∥∥∥∥(

0 10 0

)∥∥∥∥∗

= 2 y

∥∥∥∥(

0 01 0

)∥∥∥∥∗

=1

2∥∥∥∥(

1 00 0

)∥∥∥∥∗

= 1 y

∥∥∥∥(

0 00 1

)∥∥∥∥∗

= 1

y por lo tanto

ρk(Σ) =

{1 para k par2 para k impar.

N

20

Page 22: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Capıtulo 2

Teoremas principales

2.1. Formula Generalizada de Gelfand

En esta seccion se presenta la demostracion realizada por Elsner [14] para la FormulaGeneralizada de Gelfand. Esta formula afirma que el Radio Espectral Conjunto y el RadioEspectral Generalizado coinciden para los conjuntos Σ acotados:

ρ(Σ) = ρ(Σ) para Σ acotado.

Inicialmente esto fue conjeturado por Daubechies y Lagarias ([11] 1992) para conjuntosΣ finitos. Berger y Wang ([2] 1992) presentaron una primera demostracion. La demostracionen esta seccion, debida a Elsner, utiliza elementos de conjuntos convexos. Seran necesariosalgunos lemas previos; que iran presentando la demostracion del Teorema 2.1.16 para casosespeciales de conjuntos Σ hasta poder completar la demostracion para el caso general de Σacotado.

Algunas definiciones preliminares, dado que hay diferencia entre conjuntos acotados yconjuntos acotados en producto,

Definicion 2.1.1. Dado Σ ⊆ Mn. Con la notacion Σ0 = {In} se define S(Σ) como elsemigrupo generado por Σ; y SI(Σ) como el semigrupo generado por Σ aumentado con laidentidad In

S(Σ) =∞⋃

k=1

Σk y SI(Σ) =∞⋃

k=0

Σk

Por otro lado se denotara con A(Σ) al algebra sobre C generada por Σ. O sea, A(Σ) es elespacio vectorial generado por S(Σ).

El conjunto Σ se dice que es acotado en producto si el semigrupo S(Σ) es acotado ennorma. O sea, existe una constante M > 0 tal que para toda A ∈ S(Σ) se cumple ‖A‖ < M

N

Observacion 2.1.2. Un resultado que se utilizara muchas veces referente a los conjuntosde matrices acotados en producto es que para cada uno ellos existe una norma ‖ · ‖ sobre

21

Page 23: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Cn tal que ‖Ax‖ ≤ ‖x‖ para toda A ∈ Σ y para todo x ∈ C

n. Y por lo tanto, para la normaoperador asociada en Mn se cumple ‖A‖ ≤ 1. Una manera de definir esta norma deseada estomar

‖x‖ := sup{‖Ax‖2 : A ∈ SI(Σ)} < ∞ para todo x ∈ Cn .

Dado que Σ es acotado en producto y que In ∈ SI(Σ) se cumplen las condiciones para que ladefinicion anterior sea una norma. Ademas, se cumple la propiedad requerida ‖Ax‖ ≤ ‖x‖para toda A ∈ Σ y para todo x ∈ C

n. Lo cual implica que

ρ1(Σ) = supA∈Σ

‖A‖ ≤ 1 y por ende ρ(Σ) ≤ 1.

N

La siguiente proposicion permite caracterizar el Radio Espectral Conjunto de conjunto Σacotados; la demostracion puede verse en [14] (Lema 1), aunque fue publicada por primeravez directamente por Rota y Strang en el artıculo inicial de la definicion de Radio EspectralConjunto [22]. Para simplificar la notacion se nombrara como N al conjunto de las nor-mas operadores sobre C

n×n. Y utilizando la observacion anterior se puede calcular el RadioEspectral Conjunto de la siguiente forma,

Proposicion 2.1.3. Dado un conjunto acotado Σ ⊆ Mn se cumple

ρ(Σ) = ınfv∈N

supA∈Σ

v(A) . (2.1)

Demostracion: Sea α la expresion de la derecha en la igualdad anterior. Como Σ es acotadose cumple ρ(Σ) < ∞; y por lo tanto se puede tomar τ > ρ(Σ) y k0 ≥ 1 de modo tal queτ−kρk(Σ) < 1 para cualquier valor de k ≥ k0. Para los valores 1 ≤ k ≤ k0 se puede acotarτ−kρk(Σ) ≤ Mk0 ; donde M > 1 es alguna cota para Σ. Todo esto muestra que (1/τ)Σ esacotado en producto y por lo tanto, de acuerdo a la Observacion 2.1.2 existe una normaoperador v tal que

sup{v(A) : A ∈ (1/τ)Σ} ≤ 1 .

Con lo cual α ≤ τ y α ≤ ρ(Σ).Lo anterior implica tambien que α < ∞. Dado τ > α existe una norma operador v tal

que v(A) ≤ τ para toda A ∈ Σ. Por lo tanto ρ(Σ) ≤ τ y por ende ρ(Σ) ≤ α. �

Ejemplo 2.1.4. Conjuntos de matrices nilpotentes sirven como contraejemplo para mostrarque la condicion de conjunto acotado es necesaria para la validez de la igualdad (2.1). Con-sideremos

Σ =

{(0 n0 0

): n ≥ 1

}.

Claramente Σ es un conjunto no acotado y por lo tanto

ınfv∈N

supA∈Σ

v(A) = ∞ .

Sin embargo Σ2 = {0}, con lo cual ρ(Σ) = 0.

22

Page 24: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

N

Corolario 2.1.5. Dado un conjunto acotado Σ ⊆ Mn formado unicamente por matrices

autoadjuntas entonces

ρ(Σ) = ρ(Σ) = supA∈Σ

ρ(A) .

Demostracion: Usando la Proposicion 2.1.3, que ‖·‖sp es un elemento particular pertenecientea N , y que para matrices autoadjuntas A se cumple ‖A‖sp = ρ(A) se tiene

supA∈Σ

ρ(A) = ρ1(Σ) ≤ ρ(Σ) ≤ ρ(Σ) = ınfv∈N

supA∈Σ

v(A) ≤ supA∈Σ

‖A‖sp = supA∈Σ

ρ(A)

Otra propiedad general referida a ρ(Σ) y ρ(Σ) es la relacionada con los conjuntos Σformados por matrices triangulares por bloque (ver Lema II en [2]). Mas especıficamente

Proposicion 2.1.6. (Conjunto de Matrices en Bloque) Dado Σ ⊆ Mn conjunto acotado dematrices de la forma triangular superior en bloque

A =

A(1) ∗. . .

0 A(l)

con A(j) matrices cuadradas de nj × nj (2.2)

con nj ≥ 1, n1 + · · · + nl = n; y tomando Σ(j) ={A(j) : A ∈ Σ

}entonces

ρ(Σ) = max1≤j≤l

ρ(Σ(j)) (2.3)

ρ(Σ) = max1≤j≤l

ρ(Σ(j)) . (2.4)

Demostracion: Las matrices triangulares de la forma (2.2) se multiplican manteniendo laestructura triangular

A(1) ∗. . .

0 A(l)

.

B(1) ∗. . .

0 B(l)

=

A(1)B(1) ∗. . .

0 A(l)B(l)

.

Teniendo en cuenta esta forma de multiplicacion, se puede chequear la igualdad (2.3) paralos ρk(Σ) dado que los espectros de las matrices de esta forma es la union de los espectrosde las matrices A(1), . . . , A(l); de modo que queda

ρk(Σ) = max1≤j≤l

ρk(Σ(j)) .

La igualdad deseada (2.3) se obtiene luego tomando lımite superior a ambos lados.

23

Page 25: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Para la igualdad (2.4) se considerara la descomposicion A = DA + NA donde DA es lamatriz diagonal en bloque, y NA es la parte nilpotente correspondiente NA = A − DA.

DA =

A(1) 0. . .

0 A(l)

.

Tambien se considerara la norma ‖ · ‖1 sobre Mn. Que cumple las siguientes propiedades

‖DA‖1 ≤ ‖A‖1 (2.5)

‖DA‖1 = max1≤j≤l

‖A(j)‖1 . (2.6)

Si se toma ΣD = {DA : para cada A ∈ Σ} entonces (2.5) implica

supD∈Σk

D

‖D‖1 ≤ supA∈Σk

‖A‖1 ;

y por lo tanto ρ(ΣD) ≤ ρ(Σ). Por otro lado se tiene que para cada j = 1, . . . , l, los bloques(j) de las matrices en Σk

D son exactamente los mismos que las matrices de (Σ(j))k, con locual de (2.6) se deduce

supD∈Σk

D

‖D‖1 = max1≤j≤l

supA∈(Σ(j))k

‖A‖1

ρ(ΣD) = max1≤j≤l

ρ(Σ(j)) .

Con lo cual se concluye

max1≤j≤l

ρ(Σ(j)) ≤ ρ(Σ) . (2.7)

Para comprobar la otra desigualdad se considera como primer caso que alguno de losρ(Σ(j)) = +∞. Por lo que la igualdad deseada (2.4) se deduce de la desigualdad (2.7). En elsegundo se considera cualquier valor δ > 0 tal que

ρ(ΣD) = max1≤j≤l

ρ(Σ(j)) < δ . (2.8)

De acuerdo con la Proposicion 2.1.3 existe una norma operador v = vδ sobre Mn tal que

supD∈ΣD

v(D) ≤ δ .

Para cada A ∈ Σk se tiene: A = A1 . . . Ak = (D1 + N1) . . . (Dk + Nk). Al expandirse estaexpresion, muchos terminos se anulan debido a que los Ni son nilpotentes. En particular,para k suficientemente grande, y dado 0 ≤ i ≤ n− 1, existiran a lo sumo

(ki

)terminos con i

factores de los (Nj)kj=1 sin repeticiones. Considerando que v es una norma matricial

24

Page 26: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

v(A) = v(A1 . . . Ak) ≤n−1∑

i=0

(k

i

).

(sup

N∈ΣN

v(N)

)i

.

(sup

D∈ΣD

v(D)

)k−i

=n−1∑

i=0

(k

i

).

(sup

N∈ΣN

v(N)

)i

.

(sup

D∈ΣD

v(D)

)k

.

(sup

D∈ΣD

v(D)

)−i

=n−1∑

i=0

(k

i

).

supN∈ΣN

v(N)

supD∈ΣD

v(D)

i

.

(sup

D∈ΣD

v(D)

)k

≤n−1∑

i=0

(k

i

).Ci

1.

(sup

D∈ΣD

v(D)

)k

≤ C2.

(sup

D∈ΣD

v(D)

)k

.n−1∑

i=0

(k

i

)≤ C2.δ

k.kn−1 ,

donde C2 es una constante que no depende de k. Se ha supuesto que supD∈ΣD

v(D) 6= 0; porque

en caso contrario todas las matrices de Σ serıan nilpotentes y por ende Σn = {0}. Se tieneentonces que

supA∈Σk

v(A) ≤ C2.δk.kn−1

ρ(Σ) = lımk→∞

{supA∈Σk

v(A)

}1/k

≤ lımk→∞

C1/k2 .k

n−1k .δ = δ .

Recordando de (2.8) que δ es cualquier valor mayor que ρ(ΣD), la desigualdad anteriorimplica que ρ(Σ) es menor o igual que ρ(ΣD).

ρ(Σ) ≤ max1≤j≤l

ρ(Σ(j)) .

Corolario 2.1.7. Dado Σ ⊆ Mn acotado y formado por matrices todas de la forma triangularsuperior entonces

ρ(Σ) = ρ(Σ) = supA∈Σ

ρ(A) .

Demostracion: Para conjuntos de matrices de tamano 1 × 1 se cumple directamente queρ = ρ porque el radio espectral ρ(a) = |a| es una norma sobre C. Por lo tanto, utilizando laproposicion anterior donde los conjuntos Σ(j) corresponden a matrices de tamano 1 × 1, sededuce

ρ(Σ) = max1≤j≤n

ρ(Σ(j)) = max1≤j≤n

ρ(Σ(j)) = ρ(Σ) . (2.9)

25

Page 27: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Los proximos lemas seran necesarios para la demostracion de la Formula Generalizadade Gelfand en el Teorema 2.1.16.

Lema 2.1.8. Para toda norma ‖ · ‖ sobre Cn existe una constante C tal que para cualquier

z ∈ Cn, ‖z‖ = 1 y cualquier A ∈ Mn con ‖A‖ ≤ 1 se cumple

mıni

|1 − λi(A)| ≤ C‖Az − z‖1/n .

Demostracion: Como todas las normas son equivalentes alcanza demostrar la desigualdadpara alguna norma. En particular se utilizara la norma-2 sobre C

n. Sea µ un autovalor dealguna matriz B, y sean s1 ≥ · · · ≥ sn los valores singulares de A− µ In. Dado que B − µIn

es singular existe un vector x con ‖x‖2 = 1 tal que (B − µ In)x = 0. De modo que

sn = mın‖x‖2=1

‖(µ In − A)x‖2 ≤ ‖(µ In − A)x‖2 = ‖(µ In − A)x‖2 − ‖(B − µ In)x‖2

≤ ‖(µ In − A)x + (B − µ In)x‖2 ≤ ‖(B − A)x‖2 ≤ ‖B − A‖sp .

Ademas, si ≤ s1 = ‖A − µ In‖sp ≤ ‖A‖sp + ‖B‖sp para todo i = 1, . . . , n. Entonces

mıni

|λi(A) − µ|n ≤n∏

i=1

|λi(A) − µ| =n∏

i=1

|λi(A − µIn)|

=n∏

i=1

si ≤ ‖B − A‖sp(‖A‖sp + ‖B‖sp)n−1 ,

y por lo tanto

mıni

|λi(A) − µ| ≤ ‖B − A‖1/nsp (‖A‖sp + ‖B‖sp)

1−1/n . (2.10)

Sea z ∈ Cn, ‖z‖2 = 1 y B = A + (z − Az)z∗. Dado que Bz = z se tiene que µ = 1 es un

autovalor de B. Por lo tanto aplicando (2.10) queda

mıni

|1 − λi(A)| ≤ ‖B − A‖1/nsp (‖A‖sp + ‖B‖sp)

1−1/n

≤ ‖z − Az‖1/n2 (‖A‖sp + ‖A + (z − Az)z∗‖sp)

1−1/n

≤ ‖z − Az‖1/n2 (3 ‖A‖sp + ‖zz∗‖sp)

1−1/n

teniendo en cuenta la hipotesis ‖A‖sp ≤ 1

≤ 41−1/n‖z − Az‖1/n2

= C‖z − Az‖1/n2 con C = 41−1/n.

A continuacion se presenta una primera demostracion de la formula de Gelfand para uncaso particular. En la demostracion se utilizara un resultado conocido como Lema de Konig,cuya demostracion puede encontrarse en libros sobre teorıa de grafos [20].

26

Page 28: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Lema 2.1.9. (Lema de Konig) Un arbol de ramificacion finita con un numero infinito devertices tiene caminos de longitud infinita.

Lema 2.1.10. Dado Σ = {A1, . . . , Am} conjunto finito de matrices, acotado en producto ytal que ρ(Σ) = 1. Entonces ρ(Σ) = ρ(Σ) = 1.

Demostracion: Dado que por hipotesis Σ es acotado en producto entonces se puede tomaruna norma operador para la cual ‖Ai‖ ≤ 1 para todo i = 1, . . . ,m (Observacion 2.1.2). Porla propiedad submultiplicativa de las normas operador tambien se cumple que ‖A‖ ≤ 1 paratoda A ∈ Σk para cualquier valor de k ≥ 1.

Se define W = {d : |d| = w < ∞ y ‖Ad‖ = 1|}; donde se esta utilizando la notacionde la formula (1.12) pero considerando productos a izquierda y ademas |d| denota la longitudde la sucesion d:

Ad = Adw. . . Ad1 donde d = (d1, . . . , dw).

Para cada valor de k existe alguna sucesion d de tamano |d| = k tal que ‖Ad‖ = 1. Porquede lo contrario serıa ρk(Σ) < 1; y por lo tanto ρ(Σ) ≤ ρk(Σ)1/k < 1 contradiciendo una delas hipotesis. En particular W resulta ser un conjunto infinito. Aplicando el Lema de Koniga este conjunto W se puede afirmar que existe una sucesion infinita d = (d1, . . . , dn, . . .) talque los productos de los primeros n factores Tn := Ad1 . . . Adn

cumplen ‖Tn‖ = 1.Para cada Tn existe un xn ∈ C

n tal que ‖xn‖ = ‖Tnxn‖ = 1. La sucesion {xn}n≥1

es acotada y por lo tanto tiene una subsucesion convergente xni→ ξ con ‖ξ‖ = 1. La

sucesion {Tniξ}i≥1 tambien es acotada y por lo tanto se puede tomar una nueva subsucesion

convergente de modo que se cumplan las dos condiciones juntas

xni→ ξ y Tni

ξ → η .

De la igualdad Tniξ = Tnxni

+ Tni(ξ − xni

) se deduce que ‖η‖ = 1. Con lo cual paracualquier ǫ > 0 existen r = ni y s = ni+1 tales que

‖Tsξ − Trξ‖ < ǫ y ‖Trξ‖ ≥ 1

2. (2.11)

Ademas Ts = ATr para alguna A ∈ Σs−r. Se sabe que ‖A‖ ≤ 1, de modo que por el Lema2.1.8

mıni

|1 − λi(A)| ≤ C‖Az − z‖1/n para todo ‖z‖ = 1.

En particular para z = Trξ/‖Trξ‖ y usando (2.11)

mıni

|1 − λi(A)| ≤ C‖Az − z‖1/n < C(2ǫ)1/n .

O sea, puede elegirse k ≥ 1 y A ∈ Σk tales que mıni

|1 − λi(A)| sea tan pequeno como sea

necesario. Lo cual implica que ρ(Σ) ≥ 1 y por lo tanto ρ(Σ) = ρ(Σ) = 1.�

El proximo paso es generalizar el lema anterior para conjunto finitos eliminando lahipotesis de acotacion en producto.

27

Page 29: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Lema 2.1.11. Dado Σ ⊆ Mn acotado con ρ(Σ) = 1. Si Σ no es acotado en producto entoncesexiste una matriz invertible S tal que para toda A ∈ Σ

S−1AS =

(A2 ∗0 A1

)con A1 ∈ Mn1 para 1 ≤ n1 < n. (2.12)

Demostracion: Usando la Proposicion 2.1.3 para cada k ≥ 1 existe una norma ‖ · ‖k sobreC

n tal que

‖Ax‖k ≤ (ρ(Σ) +1

k)‖x‖k para A ∈ Σ y x ∈ C

n

‖Ax‖k ≤ (1 +1

k)‖x‖k .

Por equivalencia entre normas se puede tomar ‖x‖k ≤ Ck‖x‖2 y por ende

supx 6=0

‖x‖k

‖x‖2

= Ck < ∞ .

Esto permite normalizar las normas redefiniendo vk(·) = 1Ck‖·‖k de modo que se cumplan

simultaneamente

vk(Ax) ≤ (1 +1

k)vk(x) y sup

x 6=0

vk(x)

‖x‖2

= 1 . (2.13)

De la ecuacion (2.13) se deduce que {vk}k≥1 es un conjunto acotado de funciones equicon-tinuas sobre el conjunto compacto {x : ‖x‖2 ≤ 1}. Por el Teorema de Arzela-Ascoli existeuna subsucesion {vki

}i≥1 convergente

vki(x) → v(x) para i → ∞, x ∈ C

n.

La funcion lımite v(x) resulta una seminorma; a la vez que cumple 0 ≤ v(Ax) ≤ v(x)para toda A ∈ Σ y x ∈ C

n. Y la normalizacion de (2.13) muestra tambien que v(x) 6≡ 0. Elsubespacio nulo V = Nu(v) = {x : v(x) = 0} cumple con la siguientes propiedades:

V es un subespacio de Cn invariante por toda A ∈ Σ. Dado que la desigualdad 0 ≤

v(Ax) ≤ v(x) implica que Ax ∈ V para todo x ∈ V .

V 6= Cn dado que v no es identicamente nula.

La condicion de que Σ no sea acotado en producto es independiente de la norma. Demodo que si V = {0} entonces v es una norma y por lo tanto S(Σ) no esta acotadopara v. Pero esto contradice v(Ax) ≤ v(x). Con lo cual V 6= {0}.

Lo anterior implica que V es un subespacio propio de Cn invariante por las A ∈ Σ. De

modo que bajo una base adecuada de Cn todas las matrices A tendran la forma (2.12).

El proximo paso es probar la formula de Gelfand para el caso que Σ sea un conjuntofinito.

28

Page 30: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Teorema 2.1.12. Para cualquier conjunto finito Σ se cumple ρ(Σ) = ρ(Σ)

Demostracion: Si ρ(Σ) = 0 entonces se cumple la igualdad deseada dado que 0 ≤ ρ(Σ) ≤ ρ(Σ)segun (1.13). Para conjuntos finitos no puede suceder que ρ(Σ) = ∞, de modo que se puedesuponer ρ(Σ) = 1. Se procedera por induccion sobre n la dimension de las matrices. Elcaso inicial n = 1 se cumple dado que ρ(A) es una norma. Para el paso inductivo si Σes acotado en producto entonces la igualdad se cumple por estar en la situacion del Lema2.1.10. Si por el contrario Σ no es acotado en producto, se puede suponer que las matricesson todas de la forma (2.12) utilizando alguna transformacion similar S−1 de acuerdo al lemaanterior y considerando que ρ(Σ) y ρ(Σ) son invariantes ante este tipo de transformaciones.Las matrices correspondientes a cada bloque forman los conjuntos Σ1 = {A1 : A ∈ Σ} yΣ2 = {A2 : A ∈ Σ}; que son de dimension menor a n. Aplicando la hipotesis inductiva enambos casos se cumple que ρ(Σi) = ρ(Σi) para i = 1, 2. Y utilizando la Proposicion 2.1.6para matrices triangulares en bloque se concluye que ρ(Σ) = ρ(Σ).

Observacion 2.1.13. En todos los lemas anteriores se considero el caso general de matricescon coeficientes complejos. Para el proximo lema es necesario considerar matrices con coefi-cientes reales. Sin embargo esto no es una perdida de generalidad dado que las matrices deMn pueden verse como matrices actuando sobre vectores reales de dimension 2n. Tomando

Real(A) =A + A

2y Imag(A) =

A − A

2i

A ∈ Cn×n ⇐⇒

(Real(A) − Imag(A)Imag(A) Real(A)

)∈ R

2n×2n .

N

Observacion 2.1.14. (Conjuntos convexos) Para la demostracion del proximo lema se uti-lizan resultados de la teorıa de conjuntos convexos. Por tal motivo se presenta una brevedescripcion general de ellos [13].

Sea V un espacio vectorial sobre R de dimension finita. Un conjunto P se dice politopo

convexo si es la capsula convexa generada por algun conjunto finito de puntos. El Teorema33 en [13] dice que dado K ⊆ V un subconjunto compacto y convexo, y ǫ > 0 existenpolitopos P1 y P2 tales que P1 ⊆ K ⊆ P2. Estos dos politopos se construyen de tal maneraque P1 es una contraccion de P2 de factor (1 + kǫ)−1 respecto a un punto x0 cualquieraelegido previamente en el interior de K y donde k es una constante que depende de K.

Por otro lado, segun la caracterizacion de Caratheodory, todo punto perteneciente a lacapsula convexa generada por un conjunto es una combinacion convexa de una cantidadfinita de puntos pertenecientes al conjunto. N

Lema 2.1.15. Dado Σ conjunto acotado de matrices con coeficientes reales, entonces

ρ(Σ) = sup{ρ(Σ) : Σ ⊆ Σ, con Σ finito} .

29

Page 31: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Demostracion: Se toma ΣC la capsula convexa generada por Σ ∪ (−Σ). Considerando que‖A‖ = ‖ − A‖ y que (ΣC)k = (Σk)C se cumple

ρ(Σ) = ρ(Σ ∪ (−Σ)) = ρ(ΣC) . (2.14)

Tambien se cumple que (Σ)C = ΣC , donde Σ indica la clausura de Σ. Dado que 0 ∈ ΣC

se tiene que para todo δ > 0 se cumple (1 − δ)ΣC ⊆ ΣC y por lo tanto

(1 − δ)ρ(ΣC) ≤ ρ(ΣC) ≤ ρ(ΣC) ,

y usando (2.14)

(1 − δ)ρ(Σ) = (1 − δ)ρ(ΣC) = (1 − δ)ρ(ΣC) ≤ ρ(ΣC) = ρ(Σ) ≤ ρ(Σ) .

Se concluye entonces que ρ(Σ) = ρ(Σ) y es posible suponer que Σ y por lo tanto ΣC sonconjuntos cerrados.

Sea⟨ΣC⟩

el R-espacio vectorial generado por ΣC ; y sea {ei} ⊆ ΣC una base finita parael. Para la norma-1 ‖ · ‖1 asociada a esta base se cumple que B(0, 1) = {x ∈

⟨ΣC⟩

: ‖x‖1 =∑i |λi| < 1} es una bola abierta centrada en el origen contenida en ΣC ; y por lo tanto 0 es

un punto interior a ΣC .Dado ǫ > 0 es posible aplicar la Observacion 2.1.14 al conjunto ΣC . De modo que existen

politopos P1 y P2 tales que P1 ⊆ ΣC ⊆ P2. Construidos de tal manera que P = P1 es unacontraccion de P2 respecto al 0 (que es interior a ΣC). Tomando kǫ = ǫ queda

P ⊆ ΣC ⊆ (1 + ǫ)P . (2.15)

El politopo P es la capsula convexa generada por una cantidad finita de puntos B1, . . . , Bs

de ΣC . De acuerdo con la caracterizacion de Caratheodory cada uno de estos puntos Bi estambien combinacion convexa de una cantidad finita de puntos {Ci

j, . . . , Cimi} de Σ ∪ (−Σ);

que en total se pueden enumerar todos estos puntos como {C1, . . . , Cm} en Σ ∪ (−Σ). Si setoma P ′ como la capsula convexa generada por {C1, . . . , Cm} entonces cada Bi pertenece aP ′ y por lo tanto

P ⊆ P ′ ⊆ ΣC , (2.16)

con lo cual

ρ(P ) ≤ ρ(P ′) = ρ({C1, . . . , Cm}) ≤ ρ(ΣC) = ρ(Σ) . (2.17)

Tomando Ai = ±Ci de tal manera que Ai ∈ Σ y llamando Σ′ = {A1, . . . , Am} ⊆ Σ setiene, a partir de (2.15) y (2.17)

1

1 + ǫρ(Σ) ≤ ρ(P ) ≤ ρ(P ′) = ρ(Σ′) ≤ ρ(Σ) .

30

Page 32: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Teorema 2.1.16. (Formula Generalizada de Gelfand) Para cualquier conjunto acotado Σde matrices en Mn se cumple

ρ(Σ) = ρ(Σ) .

Demostracion: Dado ǫ > 0 se tiene

(1 − ǫ)ρ(Σ) ≤ ρ(Σ′) por Lema 2.1.15 para algun conjunto finito Σ′ ⊆ Σ

= ρ(Σ′) por Lema 2.1.12 para conjuntos finitos

≤ ρ(Σ) por inclusion.

Observacion 2.1.17. La condicion de conjunto acotado es necesaria, como lo muestra elconjunto Σ2 definido en el Ejemplo 1.2.4

Σ2 =

{(1 10 1

), . . . ,

(1 n0 1

), . . .

}

que sirve como contraejemplo para los casos de conjuntos no-acotados. Dado que

ρ(Σ2) = 1 < ρ(Σ2) = ∞ .

N

2.2. Conjetura de Acotacion

Para concluir el capıtulo se desarrollaran a continuacion los resultados mas importantesdel artıculo de Berger-Wang [2]; incluyendo la demostracion de la validez de la Conjetura deAcotacion propuesta inicialmente por Daubechies-Lagarias [11]. Se utilizaran las definicionesiniciales del capıtulo para conjuntos Σ convergentes en producto; con la salvedad de usarla notacion de Berger-Wang que trabajan con productos a izquierda (LCP) a diferencia deDaubechies-Lagarias que trabajan con la notacion de productos a derecha (RCP):

∞∏

i=1

Ai = lımk→∞

Ak . . . A1 . (2.18)

Se define tambien el conjunto Σ∞ formado por todos los posibles lımites formados porproductos de la forma (2.18).

Teorema 2.2.1. (Conjetura de Acotacion) Si Σ es un conjunto acotado con la propiedadLCP entonces es acotado en producto. O sea, el semigrupo S(Σ) generado por Σ es acotadoen norma. Ademas ρ(Σ) ≤ 1.

31

Page 33: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Demostracion: Sea ‖ · ‖ una norma sobre Cn y X el subespacio definido por

X =

{x ∈ C

n : supA∈S(Σ)

‖Ax‖ < ∞}

Ası definido resulta que X es invariante por cada A ∈ Σ. De modo que puede considerarseel conjunto S(Σ)|X formado por las mismas matrices A ∈ S(Σ) pero como operadores deX → X. Por la definicion de X y por el Principio de Acotacion Uniforme existe una constanteM > 1 tal que

supA∈S(Σ)|X

‖A‖ < M < ∞ (2.19)

Suponiendo, por el absurdo, que X 6= Cn se encontrara una sucesion de matrices en Σ

que no converge en producto; contradiciendo la hipotesis de que Σ es LCP.Afirmacion 1: Para todo x /∈ X existe A ∈ Σ tal que Ax /∈ X.Dado x /∈ X se tiene

‖Ax‖ ≤ ‖A‖.‖x‖ ≤ ρ1(Σ).‖x‖ para toda A ∈ Σ. (2.20)

Suponiendo que para toda A ∈ Σ se cumple Ax ∈ X se tiene

‖Am . . . A1x‖ ≤ ‖(Am . . . A2)

∈X︷︸︸︷A1x ‖

≤ M.‖A1‖.‖x‖≤ M.ρ1(Σ).‖x‖ para Ai ∈ Σ con m ≥ 2. (2.21)

De (2.20) y (2.21) se deduce que x ∈ X; por lo tanto debe existir una A ∈ Σ tal que Ax /∈ X.Afirmacion 2: Para todo x /∈ X y todo C > 0 existe A = Am . . . A1 ∈ S(Σ) con Ai ∈ Σ

tal que

Ax /∈ X y ‖Ax‖ > C (2.22)

Aplicando la afirmacion 1 se tiene que existe A1 ∈ Σ tal que

A1x /∈ X.

Por definicion de X aplicado a A1x se tiene que existe A′ = Am . . . A2 ∈ Σm con Aj ∈ Σ ym ≥ 2 tal que

‖A′A1x‖ > max{1,M.ρ1(Σ)}.C ≥ C . (2.23)

En lo anterior se tiene en cuenta que ρ1(Σ) < ∞ dado que por hipotesis Σ es acotado.Puede suceder que A′A1x ∈ X o A′A1x /∈ X. Si A′A1x /∈ X entonces se toma simplementeA = A′A1 ∈ S(Σ) para comprobar que la afirmacion 2 es verdadera. Si A′A1x ∈ X se tiene

{Am . . . A1x ∈ X

A1x /∈ X

32

Page 34: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Puede elegirse entonces 1 ≤ i < m tal que

Ai . . . A1x /∈ X pero Ai+1 . . . A1x ∈ X

Si i + 1 = m se tiene, dado que M ≥ 1

‖Am . . . A1x‖ ≤ ‖Am‖.‖Ai . . . A1x‖≤ ρ1(Σ)‖Ai . . . A1x‖≤ M.ρ1(Σ)‖Ai . . . A1x‖ (2.24a)

Si i + 1 < m se tiene, recordando la definicion de M

‖Am . . . A1x‖ ≤ ‖(Am . . . Ai+2)Ai+1 . . . A1x‖≤ M.‖Ai+1 . . . A1x‖≤ M.‖Ai+1‖.‖Ai . . . A1x‖≤ M.ρ1(Σ).‖Ai . . . A1x‖ . (2.24b)

De (2.23) y (2.24) se tiene que ‖Ai . . . A1x‖ ≥ C. En este caso se toma A = Ai . . . A1

para comprobar que la afirmacion 2 es verdadera.Lo anterior muestra dado un x1 /∈ X existe una B1 ∈ S(Σ) tal que B1x1 /∈ X y ‖B1x1‖ >

1. Para x2 = B1x1 /∈ X existe B2 ∈ S(Σ) tal que B2B1x1 /∈ X y ‖B2B1x1‖ > 2. Ası puedeir generandose una sucesion {Bi}i ⊆ S(Σ) tal que

‖B1x1‖ > 1

‖B2.B1x1‖ > 2

‖B3.B2.B1x1‖ > 3

...

‖Bk . . . B1x1‖ > k

que muestra que la sucesion {Bi}i no converge en producto a izquierda. Esta sucesion enS(Σ) define otra sucesion en Σ formada por los respectivos Ai que factorizan cada Bk, conlo cual Σ no es LCP.

Se vera a continuacion que necesariamente debe ser ρ(Σ) ≤ 1. Si por el contrario ρ(Σ) > 1se toma 1 < α < ρ(Σ) de modo que para todo k ≥ 1 se tiene

1 < α < ρ(Σ) ≤ ρk(Σ)1/k

1 < αk < ρk(Σ)

donde ρk(Σ) = supA∈Σk ‖A‖. Por lo tanto para cada k ≥ 1 existe Ak ∈ Σk tal que ‖Ak‖ > αk

con α > 1. La sucecion {Ai}i ⊆ S(Σ) no esta acotada; lo cual es una contradiccion dado queΣ es acotado en producto.

33

Page 35: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Ejemplo 2.2.2. La condicion de acotacion sobre Σ es necesaria para la validez del teoremacomo lo muestra el conjunto Σ correspondiente al Ejemplo (2.1.4)

Σ =

{(0 n0 0

): n ≥ 1

}.

Es un conjunto LCP (dado que es nilpotente) y sin embargo no es acotado en producto.

Corolario 2.2.3. Dado Σ conjunto acotado entonces, Σ es LCP con Σ∞ = {0} si y solo siρ(Σ) < 1.

Demostracion: Supongamos primero que Σ un conjunto acotado con ρ(Σ) < 1. Por definicionde lımite superior se tiene que existe algun k0 ≥ 1 tal que

ρ(Σ) ≤ ρk0(Σ)1/k0 < 1 .

Dada una sucesion cualquiera {Ai}i de matrices de Σ, cada producto finito de m factorespuede descomponerse de la forma m = k0.q + r donde 0 ≤ r < k0 quedando

‖Am . . . A1‖ ≤ ρk0(Σ)q.ρ1(Σ)r ≤ ρk0(Σ)q. max{1, ρ1(Σ)k0} = ρk0(Σ)q.C ;

donde C es una constante. De modo que si ρk0(Σ) < 1 y m → ∞ entonces ‖Am . . . A1‖ → 0.Lo cual muestra que todos los productos convergen a 0 y que Σ∞ = {0}.

Se considera ahora la otra implicacion. Para ello se toma un conjunto acotado Σ que esLCP; y se mostrara que ρ(Σ) ≥ 1 implica una contradiccion.

Por el Teorema 2.2.1, el conjunto Σ es acotado en producto, de modo que puede tomarse

∆ ≥ 1 una cota para S(Σ). (2.25)

Tambien puede tomarse para cada k ≥ 1 un producto de k factores Ck = A(k)k . . . A

(1)k con

A(j)k ∈ Σ tal que ‖Ck‖ ≥ 1. El supra-ındice (j) indica la posicion de los factores en el producto

1 ≤ (j) ≤ k. Se construira un producto infinito a izquierda

A =∞∏

j=1

Aj ,

de modo que los productos finitos cumplan

‖m∏

j=1

Aj‖ ≥ 1

2∆para todo m ≥ 1; (2.26)

lo cual mostrara que la matriz lımite A no es la matriz nula, en contradiccion con la hipotesisΣ∞ = {0}.

Para empezar la construccion, dado que la sucesion A(1)k para k ≥ 1 esta acotada, con-

sideremos un punto de acumulacion P1 para tal sucesion. Existe una subsucesion A(1)k(1,i) tal

que para todo i ≥ 1

‖A(1)k(1,i) − P1‖ ≤ 2−3∆−3 .

34

Page 36: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Para el segundo paso de la construccion se considera que la sucesion A(2)k(1,i) para i ≥ 1,

por los mismos argumentos anteriores, tiene un punto de acumulacion P2 y una subsucesionA

(2)k(2,i) tales que

‖A(2)k(2,i) − P2‖ ≤ 2−4∆−3 ,

pero k(2, i) es una subsucesion de k(1, i) de modo que tambien se cumple

‖A(1)k(2,i) − P1‖ ≤ 2−3∆−3 .

Siguiendo este modo de construccion repetidamente se encuentran sucesiones anidadask(m, i) que son subsucesiones de k(j, i) para todo 1 ≤ j ≤ m; que cumplen

‖A(j)k(m,i) − Pj‖ ≤ 2−j−2∆−3 para 1 ≤ j ≤ m y para todo i ≥ 1. (2.27)

Entonces se define ahora Aj = A(j)k(j,1). Para cada m se puede tomar k = k(m,m) ≥ m de

modo que se cumple para 1 ≤ j ≤ m

‖Aj − A(j)k ‖ = ‖A(j)

k(j,1) − A(j)k(m,m)‖

= ‖A(j)k(j,1) − Pj + Pj − A

(j)k(m,m)‖

≤ ‖A(j)k(j,1) − Pj‖ + ‖Pj − A

(j)k(m,m)‖ usando (2.27) dado que j ≤ m

≤ 2−j−2∆−3 + 2−j−2∆−3

= 2−j−1∆−3 . (2.28)

Por otro lado dado que ‖ · ‖ es una norma matricial y ∆ es una cota superior para la normade los elementos del conjunto S(Σ),

1 ≤ ‖Ck‖ = ‖A(k)k . . . A

(1)k ‖ ≤ ‖A(k)

k . . . A(m+1)k ‖.‖A(m)

k . . . A(1)k ‖

≤ ∆‖A(m)k . . . A

(1)k ‖ . (2.29)

Por otro lado,

Am . . . A1 − A(m)k . . . A

(1)k = Am . . . A2

(A1 − A

(1)k

)+

+m−1∑

j=2

[Am . . . Aj+1

(Aj − A

(j)k

)A

(j−1)k . . . A

(1)k

]+

+(Am − A

(m)k

)A

(m−1)k . . . A

(1)k .

35

Page 37: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Por lo tanto, aplicando (2.28) y usando la acotacion de S(Σ) se tiene que

‖Am . . . A1 − A(m)k . . . A

(1)k ‖ ≤ ‖Am . . . A2‖.‖A1 − A

(1)k ‖+

+m−1∑

j=2

‖Am . . . Aj+1‖.‖Aj − A(j)k ‖.‖A(j−1)

k . . . A(1)k ‖+

+ ‖Am − A(m)k ‖.‖A(m−1)

k . . . A(1)k ‖

≤ ∆.2−2.∆−3 +m−1∑

j=2

∆.2−j−1.∆−3.∆ + ∆.2−m−1.∆−3

porque ∆ ≥ 1 (2.25) → ≤ 2−2∆−1 +m−1∑

j=2

2−j−1.∆−1 + 2−m−1.∆−1

=m∑

j=1

2−j−1.∆−1

≤ ∆−1

∞∑

j=1

2−j−1 =1

2∆−1 . (2.30)

Combinando (2.30) y (2.29) se puede demostrar lo pretendido (2.26)

‖m∏

i=1

Ai‖ ≥ ‖A(m)k . . . A

(1)k ‖ − ‖Am . . . A1 − A

(m)k . . . A

(1)k ‖

≥ 1

∆− 1

2∆=

1

2∆.

Por ultimo, el siguiente teorema resume en forma explıcita la relacion existente entre laProposicion 2.1.3, el Corolario 2.2.3 y los puntos 1, 2 y 6 de la Proposicion 1.1.4; en el sentidoque las afirmaciones propuestas son equivalentes entre sı para conjuntos Σ acotados.

Teorema 2.2.4. Dado Σ ⊆ Mn conjunto acotado, las siguientes afirmaciones son equiva-lentes:

1*: Σ es LCP y Σ∞ = {0}.

2*: ρ(Σ) < 1 .

6*: Existe una norma operador v tal que: supA∈Σ

v(A) < 1.

36

Page 38: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Capıtulo 3

Contractibildad Simultanea

En el presente capıtulo se desarrollaran los resultados del artıculo publicado [1] por Andoy Shih en el ano 1998. Se desarrolla la relacion entre la contractibilidad simultanea de unconjunto de matrices y su Radio Espectral Conjunto. Recordemos que, segun la Proposicion1.1.4, para una unica matriz A, ρ(A) < 1 equivale a la existencia de una matriz inversible Stal que ‖SAS−1‖sp < 1, i.e. SAS−1 es contractible. El resultado principal de este capıtulo,

Teorema 3.2.3, prueba que para conjuntos acotados de matrices Σ ⊂ Mn, ρ(Σ) ∈[0, 1√

n

)

implica la existencia de un inversible S tal que SAS−1 es contractible para todo A ∈ Σ. Masaun, tal intervalo es optimo, en el sentido que existen conjuntos acotados no contractiblescuyo Radio Espectral Conjunto es α, para todo α ≥ 1√

n.

3.1. Introduccion

Definicion 3.1.1. Un conjunto Σ ⊆ Mn se dice simultaneamente contractible si existe unamatriz S invertible tal que

sup{‖S−1AS‖sp : A ∈ Σ

}< 1 .

N

Lema 3.1.2. Dado Σ ⊆ Mn, los siguientes enunciados son equivalentes:

1. Σ es simultaneamente contractible.

2. Existe una matriz H > 0 y 0 < γ < 1 tales que A∗HA ≤ γ2H para toda A ∈ Σ.

Demostracion:1 ⇒ 2: Se toma S, la matriz que permite la contractibilidad simultanea del conjunto Σ,

y definimosγ := sup

{‖S−1AS‖sp : A ∈ Σ

}∈ [0, 1)

H := (SS∗)−1 > 0 .

37

Page 39: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

En el caso γ = 0 se tiene que Σ = {0} y por lo que se puede tomar γ = 1/2 para cumplir2.

Queda entonces el caso 0 < γ < 1. Hay que chequear que para toda A ∈ Σ se cumpla

A∗HA ≤ γ2H .

Sabiendo que 1γS−1AS es una contraccion se tiene

(1

γS−1AS

)∗(1

γS−1AS

)≤ In

S∗A∗ (S−1)∗

S−1AS ≤ γ2In

A∗ (SS∗)−1 A ≤ γ2 (SS∗)−1

A∗HA ≤ γ2H .

2 ⇒ 1: Dada H > 0 se toma S = H−1/2 matriz invertible. De la desigualdad A∗HA ≤ γ2Hse deduce en forma similar a lo anterior que

(1

γS−1AS

)∗(1

γS−1AS

)≤ In ,

y por lo tanto 1γS−1AS es una contraccion.

Luego‖S−1AS‖sp ≤ γ < 1 para toda A ∈ Σ.

Observacion 3.1.3. Algunas consideraciones generales:

1. Si Σ es contractible simultaneamente entonces es acotado.

‖A‖sp = ‖SS−1ASS−1‖sp ≤ ‖S‖sp‖S−1AS‖sp‖S−1‖sp ≤ ‖S‖sp‖S−1‖sp .

2. Si Σ es contractible simultaneamente a traves de una matriz invertible S, entoncesel semigrupo multiplicativo S(Σ) y la capsula convexa generada por Σ son tambiencontractibles simultaneamente con la misma matriz S.

3. Si Σ es contractible simultaneamente entonces ρ(Σ) < 1. De hecho, dada S matrizinvertible tal que

sup{‖S−1AS‖sp : A ∈ Σ} = γ < 1 ;

entonces, dado k ≥ 1 y A ∈ Σk se tiene: A = A1 . . . Ak con Ai ∈ Σ y

‖A‖sp = ‖SS−1A1S . . . S−1AkSS−1‖sp

≤ ‖S‖sp‖S−1‖sp‖S−1A1S‖sp . . . ‖S−1AkS‖sp

≤ ‖S‖sp‖S−1‖spγk .

38

Page 40: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Y por lo tanto

{supA∈Σk

‖A‖sp

}1/k

≤(‖S‖sp‖S−1‖sp

)1/kγ

ρ(Σ) = lım supk→∞

{supA∈Σk

‖A‖sp

}1/k

≤ lım supk→∞

(‖S‖sp‖S−1‖sp

)1/kγ < 1 .

Observacion 3.1.4. El Lema 3.1.2 y el punto 3 de la Observacion 3.1.3 generalizan, enalgun sentido, los puntos 2, 3 y 5 del Cuadro 1.1. Existe equivalencia entre los siguientespuntos.

3*: Existe una matriz H > 0 y 0 < γ < 1 tales que A∗HA ≤ γ2H para toda A ∈ Σ.

5*: Existe una matriz S invertible tal que

sup{‖S−1AS‖sp : A ∈ Σ

}< 1 .

Sin embargo, la condicion ρ(Σ) < 1 es una condicion necesaria para los puntos 3 y 5.No es una condicion suficiente. Como se vera en el Teorema 3.2.3 para cada n ≥ 1 existenconjuntos Σ finitos con ρ(Σ) = 1/

√n que no son contractibles simultaneamente. Solo la

condicion ρ(Σ) ∈[0, 1√

n

)garantiza la contractibilidad simultanea. N

3.2. Rango optimo para contractibilidad simultanea

El principal resultado del artıculo, Teorema 3.2.3, establece que el intervalo 0 ≤ ρ(Σ) <1√n

garantiza la contractibilidad simultanea de conjuntos acotados de matrices de tamano

n×n. Y por el contrario, si ρ(Σ) ≥ 1√n

se puede construir un conjunto de matrices de n×n queno es contractible simultaneamente. Para la demostracion del teorema se utiliza una versionmatricial para el Teorema Elipsoidad de John, publicado originalmente en el ano 1948 [16].La version que presenta el artıculo de Ando-Shih es el Teorema 3.2.2. Previamente hacefalta demostrar el siguiente lema; cuyo mayor proposito es mostrar que puede construirseuna matriz T con ciertas propiedades respecto a otra matriz A pero que en cuya construccionno interviene directamente esta matriz A.

Lema 3.2.1. Dada A ∈ Mn, con n > 1, tal que In ≥ A ≥ 0 y sea 0 ≤ α < 1n. Si para algun

vector unitario e1 se cumple que〈Ae1, e1〉 ≤ α ;

entonces tomando el proyector de rango 1, P1 = e1e∗1 se define

T = nαP1 +n(1 − α)

n − 1(In − P1) . (3.1)

39

Page 41: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Esta matriz T satisfaceT ≥ A y det(T ) < 1 .

Demostracion: Los proyectores P1 y In−P1 son ortogonales, a la vez que In = P1 +(In−P1).De modo que existe una matriz unitaria U tal que

U∗P1U =

(1 00 0n−1

)y U∗(In − P1)U =

(0 00 In−1

)

Con lo cual,

U∗TU =

(nα 0

0 n(1−α)n−1

In−1

).

De esta manera se puede calcular el determinante de T

det(T )1/n = det(U∗TU)1/n =

(nα ×

(n(1 − α)

n − 1

)n−1)1/n

.

Usando la desigualdad de las medias aritmeticas y geometricas

det(T )1/n <nα + n(1 − α)

n= 1 .

La desigualdad es estricta, porque para que se cumpla la igualdad debe ser nα = n(1−α)n−1

y por lo tanto nα = 1.Ahora hace falta probar que

〈Tx, x〉 ≥ 〈Ax, x〉 para todo x ∈ Cn .

Sea x0 ∈ Cn un vector fijo. Y sea e2 vector unitario ortogonal a e1 tal que x0 ∈ {e1, e2}.

Sea P2 = e2e∗2 y P = P1 + P2.

Para chequear 〈Ax0, x0〉 ≤ 〈Tx0, x0〉 es suficiente ver que

PTP ≥ PAP dado que Px0 = x0 . (3.2)

Las matrices PAP y PTP pueden considerarse como matrices de 2 × 2 con una repre-sentacion

PAP =

(a cc b

)y PTP =

(nα 0

0 n(1−α)n−1

).

Donde se cumple, segun las hipotesis

a ≥ 0, b ≥ 0, ab − |c|2 ≥ 0 porque A ≥ 0 (3.3a)

1 − a ≥ 0, 1 − b ≥ 0, (1 − a)(1 − b) − |c|2 ≥ 0 porque A ≤ In (3.3b)

a ≤ α porque 〈Ae1, e1〉 = a ≤ α (3.3c)

1 − nα ≥ 0 porque 0 ≤ α ≤ 1

n. (3.3d)

40

Page 42: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Para demostrar (3.2) es suficiente ver que

nα − a ≥ 0,n(1 − α)

n − 1− b ≥ 0 (3.4a)

(nα − a)

(n(1 − α)

n − 1− b

)− |c|2 ≥ 0 . (3.4b)

Dado que n ≥ 1 y de (3.3c) se tiene

nα − a ≥ α − a ≥ 0 .

Por (3.3b) y (3.3d)

n(1 − α)

n − 1− b = 1 +

1 − nα

n − 1− b > 1 − b ≥ 0 .

Con lo cual queda probado (3.4a). Para ver (3.4b) se separan dos casos:Caso 1: b ≤ 1 − α.

(nα − a)

[n(1 − α)

n − 1− b

]− |c|2 = (nα − a)

[1 − b +

1 − nα

n − 1

]− |c|2

por (3.3a) → ≥ (nα − a)

[1 − b +

1 − nα

n − 1

]− ab

por (3.3c) → ≥ (nα − α)

[1 − b +

1 − nα

n − 1

]− αb

por Caso 1 → ≥ α(n − 1)

[α +

1 − nα

n − 1

]− α(1 − α)

= α(n − 1)α + α(1 − nα) − α(1 − α)

= α2n − α2 + α − nα2 − α + α2 = 0 .

Caso 2: b > 1 − α.

(nα − a)

[n(1 − α)

n − 1− b

]− |c|2 = (nα − a)

[1 − b +

1 − nα

n − 1

]− |c|2

= (nα − a)(1 − b) + (nα − a)1 − nα

n − 1− |c|2

por (3.3c) → ≥ (nα − a)(1 − b) + α(1 − nα) − |c|2por (3.3b) → ≥ (nα − a)(1 − b) + α(1 − nα) − (1 − a)(1 − b)

= [(nα − a) − (1 − a)] (1 − b) + α(1 − nα)

= (nα − 1)(1 − b) + α(1 − nα)

por Caso 2 → = (1 − nα)(b − 1 + α) ≥ 0 .

Con esto mostramos que PAP ≤ PTP y por lo tanto 〈Ax0, x0〉 ≤ 〈Tx0, x0〉. �

41

Page 43: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Teorema 3.2.2 (Version matricial del Teorema elipsoidal de John). Sea {Aλ : λ ∈ I} unconjunto acotado de matrices definidas positivas de tamano n × n tal que

supλ∈I

〈Aλx, x〉 > 0 para todo x 6= 0.

Entonces existe una matriz H0 ≥ 0 tal que

1

n〈H0x, x〉 ≤ sup

λ∈I〈Aλx, x〉 ≤ 〈H0x, x〉 para todo x ∈ C

n . (3.5)

Demostracion: Supongamos, sin perdida de generalidad, que Aλ ≤ In, para todo λ ∈ I, dado

que el conjunto es acotado. Por hipotesis , la aplicacion x →(

supλ∈I

〈Aλx, x〉)1/2

es una norma

sobre Cn. Dado que todas las normas son equivalentes, existen 0 < δ < β ≤ 1 tales que

δ 〈x, x〉 ≤ supλ∈I

〈Aλx, x〉 ≤ β 〈x, x〉 . (3.6)

Sea M = {H ≥ 0 : det(H) ≤ 1 y H ≥ Aλ ∀ λ ∈ I}. Se vera que M es un conjunto novacio y compacto.

M 6= ∅ : Simplemente porque βIn ∈ M

M compacto : Para ver que es un conjunto cerrado se puede proceder usando suce-siones, teniendo en cuenta que son todas desigualdades inclusivas. Para comprobar quees acotado consideramos los autovalores de una matriz H ∈ M ordenados segun laconvencion habitual λ1(H) ≥ λ2(H) ≥ · · ·λn(H) y e un autovector unitario correspon-diente al autovalor λn(H).

λn(H) = λn(H) 〈e, e〉 = 〈λn(H)e, e〉 = 〈He, e〉 ≥ 〈Aλe, e〉 .

Por lo tantoλn(H) ≥ sup

λ∈I〈Aλe, e〉 ≥ δ 〈e, e〉 = δ > 0 . (3.7)

Esto muestra que todas las matrices H ∈ M son invertibles (H > 0). Con lo cual sepuede hacer

‖H‖sp = λ1(H) ≤ λ1(H)λ2(H)

λn(H). . .

λn(H)

λn(H)=

det(H)

λn(H)n−1≤ βn

δn−1.

Se tiene entonces demostrado que M es un conjunto compacto y no vacio. La aplicaciondet es continua y por lo tanto alcanza un valor mınimo para algun H0 ∈ M . O sea, existeH0 ∈ M para el cual det(H0) ≤ det(H) para toda H ∈ M . Se vera que esta matriz H0

cumple con lo necesario del teorema.

Por (3.7) se tiene que H0 > 0.

42

Page 44: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

La segunda desigualdad de (3.5) se cumple por la definicion del conjunto M .

Para corroborar la primera desigualdad de (3.5) se puede considerar lo siguiente: para

cada λ ∈ I se define Bλ = H−1/20 AλH

−1/20 . Con lo cual se tiene

0 ≤ Bλ ≤ In .

La desigualdad deseada de (3.5) escrita en terminos de las Aλ es equivalente a lasiguiente desigualdad escrita en terminos de las Bλ

1

n〈x, x〉 ≤ sup

λ∈I〈Bλx, x〉 para todo x ∈ C

n. (3.8)

Supongamos, por el absurdo, que existe un vector unitario e1 que no cumple la de-sigualdad (3.8)

supλ∈I

〈Bλe1, e1〉 = α <1

n〈e1, e1〉 =

1

n. (3.9)

O sea, el vector e1 cumple para cada λ ∈ I,

〈Bλe1, e1〉 ≤ α con 0 ≤ α <1

n.

De acuerdo al Lema 3.2.1, se puede construir la matriz T definida por (3.1) solo de-pendiente de α y de e1 y en forma independiente de los Bλ que cumple

T ≥ Bλ (3.10a)

0 < det(T ) < 1 . (3.10b)

Se vera que la matriz H1 = H1/20 TH

1/20 ∈ M y det(H1) < det(H0); lo que contradice la

definicion de H0. De modo que la desigualdad (3.8) debe ser cierta para todo x ∈ Cn.

Por un lado se tiene, usando (3.10b)

det(H1) = det(H1/20 TH

1/20 ) = det(H0T ) = det(H0) det(T ) < det(H0) .

Y usando (3.10a)

T ≥ Bλ

H1/20 TH

1/20 ≥ H

1/20 BλH

1/20

H1 ≥ Aλ .

A continuacion se desarrolla la demostracion del Teorema 3.2.3

43

Page 45: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Teorema 3.2.3. El rango optimo del Radio Espectral Conjunto para garantizar la con-tractibilidad simultanea de un conjunto acotado de matrices de tamano n× n es el intervalo[0, 1√

n

).

Observacion 3.2.4. Recordar del punto 3 en la Observacion 3.1.3 que si ρ(Σ) ≥ 1 entoncesΣ no es contractible simultaneamente.

Demostracion:Primer caso: Sea Σ un conjunto acotado de matrices de n × n con ρ(Σ) < 1√

n, entonces

Σ es contractible simultaneamente.Se toma ρ(Σ) < γ < 1√

n, y en pos de la definicion de ρ(Σ), un k > 1 para el cual

supA∈Σk

‖A‖sp ≤ γk . (3.11)

Usando que Σ es acotado, se puede definir una norma ‖| · ‖| sobre Cn de la siguiente

manera. Para los fines de la demostracion no es necesario considerar sus propiedades comonorma. Solo que esta bien definida y las propiedades (3.12) y (3.13) que se chequearan acontinuacion.

‖| x ‖| 2 := sup

{‖x‖2

2 +1

γ2‖B1x‖2

2 + · · · + 1

γ2(k−1)‖Bk−1x‖2

2 : Bi ∈ Σi, i = 1, . . . , k − 1

}.

Dado un A ∈ Σ se tiene

‖| Ax ‖| 2 = ‖Ax‖22 + sup

B1∈Σ

‖B1Ax‖22

γ2+ · · · + sup

Bk−1∈Σk−1

‖Bk−1Ax‖22

γ2(k−1)

= γ2

[‖Ax‖2

2

γ2+ sup

B1∈Σ

‖B1Ax‖22

γ4+ · · · + sup

Bk−2∈Σk−2

‖Bk−2Ax‖22

γ2(k−2)+2+

+ supBk−1∈Σk−1

‖Bk−1Ax‖22

γ2(k−1)+2

];

en cada caso se puede considerar BiA ∈ Σi+1 y por lo tanto los supremos aumentan

≤ γ2

[supB1∈Σ

‖B1x‖22

γ2+ · · · + sup

Bk−1∈Σk−1

‖Bk−1x‖22

γ2(k−1)+ sup

Bk∈Σk

‖Bkx‖22

γ2k

]

44

Page 46: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

usando la definicion de k en (3.11) al ultimo termino

≤ γ2

[supB1∈Σ

‖B1x‖22

γ2+ · · · + sup

Bk−1∈Σk−1

‖Bk−1x‖22

γ2(k−1)+ sup

Bk∈Σk

‖Bkx‖22

γ2k

]

≤ γ2

[supB1∈Σ

‖B1x‖22

γ2+ · · · + sup

Bk−1∈Σk−1

‖Bk−1x‖22

γ2(k−1)+ ‖x‖2

2

]

= γ2 ‖| x ‖| 2 .

Por lo tanto‖| Ax ‖| ≤ γ ‖| x ‖| . (3.12)

Si se considera el conjunto{

In +k−1∑

i=1

1

γ2iB∗

i Bi : Bi ∈ Σi

}= {Aλ : λ ∈ I}

se tiene

〈Aλx, x〉 =

⟨(In +

k−1∑

i=1

1

γ2iB∗

i Bi

)x, x

⟩=

⟨x +

k−1∑

i=1

1

γ2iB∗

i Bix, x

= 〈x, x〉 +k−1∑

i=1

1

γ2i〈B∗

i Bix, x〉 = 〈x, x〉 +k−1∑

i=1

1

γ2i〈Bix,Bix〉

= ‖x‖22 +

1

γ2k

k−1∑

i=1

‖Bix‖22 .

Y por lo tanto‖| x ‖| 2 = sup

λ∈I〈Aλx, x〉 . (3.13)

Se vera a continuacion que la familia {Aλ : λ ∈ I} cumple con las hipotesis del Teorema3.2.2

Aλ son semidefinidas positivas

Si se toma a K como cota para Σ respecto de la norma ‖ · ‖sp entonces se puede verque el conjunto de las Aλ tambien es acotado

‖Aλ‖sp ≤ 1 +k−1∑

i=1

1

γ2i‖B∗

i Bi‖sp ≤ 1 +k−1∑

i=1

1

γ2i‖Bi‖2

sp ≤ 1 +k−1∑

i=1

1

γ2iK2 .

45

Page 47: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Y por ultimosupλ∈I

〈Aλx, x〉 = ‖| x ‖| 2 6= 0 para todo x 6= 0 .

Por lo tanto, existe H > 0 tal que

1

n〈Hx, x〉 ≤ ‖| x ‖| 2 ≤ 〈Hx, x〉 .

Tomando H0 = 1nH

〈H0x, x〉 ≤ ‖| x ‖| 2 ≤ n 〈H0x, x〉 para todo x ∈ Cn . (3.14)

Considerando Ax ∈ Cn, y las desigualdades (3.12) y (3.14)

〈H0Ax,Ax〉 ≤ ‖| Ax ‖| 2 ≤ γ2 ‖| x ‖| 2 ≤ γ2n 〈H0x, x〉 para todo x ∈ Cn .

En consecuencia, por el Lema 3.1.2, Σ es contractible simultaneamente

A∗H0A ≤ γ2nH0 para toda A ∈ Σ con γ2n <1

nn = 1 .

Segundo caso: Para todo α ∈ [ 1√n, 1) existe un conjunto Σ = {A1, . . . , An} de matrices de

tamano n × n tal que ρ(Σ) = α y Σ no es contractible simultaneamente.Sea {e1, . . . , en} la base canonica de C

n y sea e = e1 + · · · + en.Sea

Ej = e.e∗j =

1...1

(0 · · · 1 · · · 0

)=

0 · · · 1 · · · 0...

... 1...

...0 · · · 1 · · · 0

.

Sea ω = e2πin , raız n-esima de la unidad y W = diag(ω, ω2, . . . , ωn).

Con estas definiciones se cumplen las siguientes propiedades:

EjWm = ωjmEj (3.15)

EjEm = Em (3.16)

ρ(WmEj) = ρ(EjWm) = ρ(ωjmEj) = ρ(Ej) = 1 . (3.17)

Se define entonces

Aj = αW jEj para j = 1, . . . , n y Σ = {A1, . . . , An} . (3.18)

ρ(Σ) = α

Dado A ∈ Σk se tiene

A = Aj1Aj2 . . . Ajk

= αkW j1Ej1Wj2Ej2 . . . W jkEjk

= αkW j1ωj1j2ωj2j3 . . . ωjk−1jkEjkpor (3.15) aplicado varias veces

= αkωj1j2+···+jk−1jkW j1Ejk.

46

Page 48: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Y por lo tanto

ρ(A) = αkρ(W j1Ejk) = αk

ρ(Σ) = lım supk→∞

{supA∈Σk

ρ(A)

}1/k

= α .

Y de acuerdo a la Formula Generalizada de Gelfand: ρ(Σ) = ρ(Σ) = α.

Σ no es contractible simultaneamente.

Por el contrario, supongamos que existe H > 0 tal que

A∗jHAj < H para todo j = 1, . . . , n .

Con lo cual

0 <⟨(

H − A∗jHAj

)ej, ej

⟩= 〈Hej, ej〉 − 〈HAjej, Ajej〉= hjj − α2

⟨HW je,W je

= hjj − α2

n∑

r=1

n∑

s=1

hrsω(s−r)j .

Sumando para j = 1, . . . , n

0 <n∑

j=1

hjj − α2

n∑

j=1

n∑

r=1

n∑

s=1

hrsω(s−r)j

= tr(H) − α2

n∑

r=1

n∑

s=1

hrs

[n∑

j=1

ω(s−r)j

]= (∗) .

La suma en j es una suma geometrica

n∑

j=1

ω(s−r)j =

n∑

j=1

1 = n si ω(s−r) = 1

ω(s−r)(ω(s−r)n − 1)

ω(s−r) − 1= 0 si ω(s−r) 6= 1 .

Dado que ω es una raız n-esima de la unidad, el caso ω(s−r) = 1 se cumple si y solo sis − r es multiplo de n. Para cada r = 1, . . . , n existe un y solo un s = 1, . . . , n tal ques − r es multiplo de n. De modo que

0 < (∗) = tr(H) − α2n

n∑

r=1

hrr

= tr(H) − α2.n.tr(H) ≤ 0 dado que α ∈ [1√n

, 1) y H > 0 .

47

Page 49: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Observacion 3.2.5. En el ejemplo anterior, son iguales la dimension de las matrices yel cardinal del conjunto Σ. De modo que sirve para mostrar tambien que para cualquierm ≥ 1 y para α ≥ 1√

m, existe un conjunto Σ de m matrices con ρ(Σ) = α que no es

contractible simultaneamente. Recıprocamente, si Σ es un conjunto cualquiera de m matricescon ρ(Σ) < 1√

mentonces Σ es contractible simultaneamente. Para corroborar esta observacion

se toma

H = In +∞∑

k=1

A∈Σk

A∗A .

Observacion 3.2.6. El Teorema 3.2.3 y la observacion anterior permiten cerrar, de algunamanera, el ciclo de las generalizaciones para el Cuadro 1.1 en el sentido que establecen lascondiciones suficientes para que un conjunto acotado de matrices sea contractible simultanea-mente.

3.3. Conjuntos con ρ(Σ) = 0

En los conjuntos Σ donde ρ(Σ) = 0, todos los radios espectrales individuales de lasmatrices A ∈ Σ son nulos tambien.

0 ≤ ρ(A) ≤ ρ1(Σ) ≤ ρ(Σ) ≤ ρ(Σ) = 0 .

Mas generalmente se puede obtener el siguiente resultado; recordar de la Definicion 2.1.1que A(Σ) es el algebra sobre C generada por Σ.

Proposicion 3.3.1. Dado un conjunto cualquiera Σ ⊆ Mn. Si ρ(Σ) = 0 entonces ρ(A) = 0para toda A ∈ A(Σ).

Demostracion: Como A(Σ) es de dimension finita, existen Bi ∈ Σki (i = 1, . . . , N) lineal-mente independientes que generan A(Σ).

Sean

p := mın1≤i≤N

ki y q := max1≤i≤N

ki . (3.19)

Cada A ∈ A(Σ) tiene una unica representacion A =N∑

i=1

αiBi. Por lo tanto

Am =

(N∑

i=1

αiBi

)m

=

(N∑

i=1

αiBi

).

(N∑

i=1

αiBi

). . .

(N∑

i=1

αiBi

)

= (α1B1 + · · · + αNBN).(α1B1 + · · · + αNBN) . . . (α1B1 + · · · + αNBN)

= en total Nm terminos de la forma αj1 . . . αjmBj1 . . . Bjm

con ji = 1, . . . , N .

48

Page 50: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Cada termino es de la forma αj1 . . . αjmBj1 . . . Bjm

. Cada Bj1 . . . Bjmes un producto de m

factores. Cada factor es un Bi, donde el Bi ∈ Σki . De acuerdo con (3.19), en cada productohay un mınimo de m.p factores y un maximo de m.q factores. O sea,

‖Bj1 . . . Bjm‖ ≤ max

mp≤k≤mq

{sup

B∈Σk

‖B‖}

.

Si se toma α = maxi=1,...,N

|αi|, queda finalmente

‖Am‖ ≤ Nm.αm. maxmp≤k≤mq

{sup

B∈Σk

‖B‖}

‖Am‖1/m ≤ N.α. maxmp≤k≤mq

{sup

B∈Σk

‖B‖1/m

}. (3.20)

La hipotesis de ρ(Σ) = 0 implica que para cada 0 < ǫ < 1 existe m0 ≥ 1 tal que

supB∈Σk

‖B‖1/k ≤ ǫ si k ≥ m0 .

Entonces para k ≥ m.p y m ≥ m0

supB∈Σk

‖B‖1/m ≤ ǫk/m ≤ ǫp .

Y por lo tanto, usando (3.20), para m ≥ m0

‖Am‖1/m ≤ N.α. maxmp≤k≤mq

{sup

B∈Σk

‖B‖1/m

}

≤ N.α. maxmp≤k

{sup

B∈Σk

‖B‖1/m

}

≤ N.α.ǫp .

Esto es para cualquier 0 < ǫ < 1. Con lo cual

ρ(A) = lımm→+∞

‖Am‖1/m = 0 .

Lema 3.3.2. Dado Σ ⊆ Mn (no necesariamente acotado). Si ρ(Σ) = 0 entonces Σ es trian-gulizable simultaneamente a matrices triangulares superior por una misma matriz unitaria.

O sea, existe U ∈ Mn, matriz unitaria, tal que U∗AU es triangular superior para todamatriz A ∈ Σ.

49

Page 51: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Demostracion: La demostracion se hace por induccion sobre n, la dimension de las matrices.Para n = 1 son matrices de 1×1. Todo conjunto de matrices es triangulizable simultanea-

mente por U = (1) segun lo requerido.Se supone entonces que n > 1 y que el lema es cierto para los casos de matrices con

dimension menor que n.Segun la Proposicion 3.3.1, el radio espectral ρ(A) = 0 para toda A ∈ A(Σ). Se consid-

erara el caso no trivial de A(Σ) 6= {0}. De modo que existen

A 6= 0, A ∈ A(Σ) y x0 6= 0 ∈ Cn tales que Ax0 6= 0 . (3.21)

DefnimosN = A(Σ)x0 = {Ax0 : A ∈ A(Σ)} .

.Este conjunto N resulta ser un subespacio no trivial de C

n invariante por toda A ∈ A(Σ).

Que N es un subespacio es trivial.

Que N es invariante por toda A ∈ A(Σ) se debe a que A(Σ) es un algebra.

De (3.21) se deduce que N 6= {0}.

Es necesario chequear que N 6= Cn (o sea, no coincide con todo el espacio).

Supongamos que N = Cn, y por lo tanto

x0 ∈ N =⇒ x0 = Ax0 para alguna A ∈ A(Σ) .

Con lo cual x0 es un autovector de A, 1 ∈ σ(A), y ρ(A) ≥ 1. Que contradice ρ(Σ) = 0.

Sea entonces k = dim(N ). Se tiene que 1 ≤ k ≤ n − 1. Existe una matriz unitaria V talque para toda A ∈ A(Σ) se tiene

V ∗AV =

(A11 A12

0 A22

).

La matriz V es independiente de cada A dado que se define en funcion de N .Llamamos

Σ1 = {A11 ∈ Mk : A ∈ Σ} y Σ2 = {A22 ∈ Mn−k : A ∈ Σ} .

Son conjuntos de matrices de tamano k×k y (n−k)×(n−k) respectivamente. Y ademas,por la Proposicion 2.1.6, queda

0 ≤ ρ(Σi) ≤ ρ(Σ) = 0 para i = 1, 2 .

Tomando la hipotesis inductiva, existen matrices unitarias V1 ∈ Ck×k y V2 ∈ C

(n−k)×(n−k)

tales queV ∗

1 A11V1 y V ∗2 A22V2 ,

50

Page 52: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

son matrices triangulares superiores para todas las A11 ∈ Σ1 y A22 ∈ Σ2.Si tomamos U = V.(V1⊕V2) entonces resulta que U∗AU es una matriz triangular superior

para toda A ∈ Σ.�

Lema 3.3.3. Sea Σ un conjunto acotado de matrices complejas de n×n. Si Σ es trianguliz-able simultaneamente a matrices triangulares superior por una matriz invertible, entoncespara cada ǫ > 0 existe una matriz invertible S tal que

sup{‖S−1AS‖sp : A ∈ Σ

}≤ sup {ρ(A) : A ∈ Σ} + ǫ

Demostracion: Siendo Q, matriz invertible, que trianguliza simultanemente a Σ se tiene

Q−1AQ =

a11 a12 · · · a1n

0 a22 · · · a2n...

. . ....

0 · · · 0 ann

es triangular superior con aii los autovalores de A.Dado ǫ > 0, tomamos 0 < δ < ǫ y definimos

D =

1 0 · · · 00 δ . . . 0...

. . ....

0 . . . 0 δn−1

.

Entonces

D−1Q−1AQD =

1 0 · · · 00 δ−1 . . . 0...

. . ....

0 . . . 0 δ−(n−1)

a11 a12 · · · a1n

0 a22 · · · a2n...

. . ....

0 · · · 0 ann

1 0 · · · 00 δ . . . 0...

. . ....

0 . . . 0 δn−1

=

a11 a12 · · · a1n

0 δ−1a22 · · · δ−1a2n...

. . ....

0 · · · 0 δ−(n−1)ann

1 0 · · · 00 δ . . . 0...

. . ....

0 . . . 0 δn−1

=

a11 δa12 · · · δn−1a1n

0 a22 · · · δn−2a2n...

. . ....

0 · · · 0 ann

= (tij) .

51

Page 53: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Con

tii = aii autovalores de Atij = δj−1aij 1 ≤ i < j ≤ ntij = 0 1 < j < i < n .

En general, para toda matriz T = (tij) y para cualquier norma ‖ · ‖ se tiene

‖T‖ ≤ ‖ diag(tii)‖ + ‖T − diag(tii)‖ ≤ C1‖ diag(tii)‖sp + C2‖T − diag(tii)‖2

donde C1 y C2 son constantes positivas correspondientes a la equivalencia de la norma ‖ · ‖con las normas ‖ · ‖sp y ‖ · ‖2 respectivamente.

Por lo tanto, tomando S = QD, matriz invertible, y el caso particular de la normaespectral

‖S−1AS‖sp = ‖T‖sp ≤ ‖ diag(tii)‖sp + C2‖T − diag(tii)‖2 ; (3.22)

dado que los tii son los autovalores de A,

= ρ(A) + C2

[∑

1≤i<j≤n

|δj−iaij|2]1/2

considerando que todos los terminos tienen un δ como factor,

= ρ(A) + δC2

[∑

1≤i<j≤n

|δj−i−1aij|2]1/2

y en el caso que δ < 1

≤ ρ(A) + δC2

[∑

1≤i<j≤n

|aij|2]1/2

≤ ρ(A) + δC2‖A‖2 .

Considerando que Σ es acotado con ‖A‖2 ≤ M y δ < ǫMC2

‖S−1AS‖sp ≤ ρ(A) + ǫ para toda A ∈ Σ

sup{‖S−1AS‖sp : A ∈ Σ

}≤ sup {ρ(A) : A ∈ Σ} + ǫ .

Observacion 3.3.4. Si en (3.22) se considera una norma cualquiera ‖ · ‖ el resultado puedegeneralizarse a

sup{‖P−1AP‖ : A ∈ Σ

}≤ C1 sup {ρ(A) : A ∈ Σ} + ǫ

donde C1 es la constante correspondiente para la equivalencia de las normas ‖ · ‖ y ‖ · ‖sp.

52

Page 54: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

N

Combinando los dos lemas anteriores 3.3.2 y 3.3.3 y la Observacion 3.3.4, se tiene elsiguiente teorema.

Teorema 3.3.5. Dado Σ conjunto acotado de matrices complejas de n× n y con ρ(Σ) = 0.Entonces para todo ǫ > 0 existe una matriz invertible S tal que S−1AS es triangular superiorpara toda A ∈ Σ y

sup{‖S−1AS‖ : A ∈ Σ

}< ǫ .

Corolario 3.3.6. Si Σ es un semigrupo multiplicativo acotado de matrices nilpotentes den × n, entonces para cada ǫ > 0 existe una matriz invertible S talque

sup{‖S−1AS‖ : A ∈ Σ

}< ǫ .

Demostracion: Para cada A ∈ Σ se tiene ρ(A) = 0 porque las matrices son nilpotentes.Ademas, considerando que Σ es multiplicativo se tiene Σk ⊆ Σ y por lo tanto

ρ(Σ) = ρ(Σ) = lım supk→∞

{supA∈Σk

ρ(A)

}1/k

≤ lım supk→∞

{supA∈Σ

ρ(A)

}1/k

= 0 .

Y por lo tanto se puede aplicar el Teorema 3.3.5. �

Otro ejemplo de conjunto de matrices que pueden triangulizarse en forma simultanea sonlos conjuntos de matrices que conmutan. La demostracion se hace por induccion; consideran-do que si AB = BA entonces A y B comparten los autovectores.

En particular se tiene,

Proposicion 3.3.7. Si Σ es un conjunto acotado y conmutativo de matrices entonces

ρ(Σ) = ρ(Σ) = sup {ρ(A) : A ∈ Σ} .

Demostracion: En general, se cumple siempre que

sup {ρ(A) : A ∈ Σ} ≤ supk≥1

{ρ(A) : A ∈ Σk

}1/k.

Y por lo tanto,

sup {ρ(A) : A ∈ Σ} ≤ lımm→∞

supk≥m

{ρ(A) : A ∈ Σk

}1/k= ρ(Σ) = ρ(Σ) .

En el caso que Σ sea conmutativo se tiene que σ(A) ⊆ σ(A1).σ(A2) . . . σ(Ak) para todaA = A1.A2 . . . Ak ∈ Σk. Y por lo tanto

ρ(A) = sup{|λ| : λ ∈ σ(A)} ≤ sup{|λ1| : λ1 ∈ σ(A1)} . . . sup{|λk| : λk ∈ σ(Ak)}= ρ(A1) . . . ρ(Ak)

≤ sup{ρ(A) : A ∈ Σ}k .

53

Page 55: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Con lo cual, para todo k ≥ 1

sup{ρ(A) : A ∈ Σk

}1/k ≤ sup{ρ(A) : A ∈ Σ}

ρ(Σ) = ρ(Σ) ≤ sup{ρ(A) : A ∈ Σ} .

Quedan ası demostradas las dos desigualdades necesarias. �

Observacion 3.3.8. Los conjuntos acotados y conmutativos son el tercer y ultimo tipo deconjuntos acotados de matrices para los cuales el radio espectral conjunto puede calcularsecomo el supremo de los radios espectrales tradicionales de las matrices involucradas. Segunresultados de la seccion anterior, los corolarios 2.1.5 y 2.1.7 muestran que lo mismo puedeafirmarse para conjuntos acotados formados por matrices autoadjuntas o conjuntos acotadosformados por matrices de la forma triangular superior.

Teorema 3.3.9. El rango optimo para el Radio Espectral Conjunto para garantizar la con-tractibilidad simultanea en el caso de conjuntos acotados y conmutativos es el intervalo [0, 1).

Demostracion: Segun la definicion, la contractibilidad simultanea se caracteriza por la exis-tencia de una matriz invertible S tal que

sup{‖S−1AS‖sp : A ∈ Σ} < 1 .

De modo que si Σ es un conjunto acotado y conmutativo con ρ(Σ) < 1 se tiene losiguiente,

Σ es triangulizable simultaneamente (por ser conmutativo Prop. 3.3.7).

Dado que Σ es acotado, por Lema 3.3.3, para todo ǫ > 0 existe P invertible tal que

sup{‖P−1AP‖sp : A ∈ Σ} ≤ sup{ρ(A) : A ∈ Σ} + ǫ .

Si por hipotesis ρ(Σ) < 1, tomando ǫ > 0 tal que ρ(Σ) + ǫ < 1, por Prop. 3.3.3 y Prop. 3.3.7

sup{‖S−1AS‖sp : A ∈ Σ} ≤ sup{ρ(A) : A ∈ Σ} + ǫ = ρ(Σ) + ǫ < 1 .

54

Page 56: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Capıtulo 4

Calculo exacto y calculo aproximado

del Radio Espectral Conjunto

Contrariamente a su importancia en las aplicaciones, el calculo efectivo del radio espectralconjunto es sumamente difıcil; incluso para conjuntos simples, del menor tamano posible2 × 2. Existe dos caminos principales para tratar con este problema. Uno es la busqueda declases especiales de matrices, para las cuales el radio espectral conjunto puede calcularse atraves de una formula explıcita. El otro camino es la aproximacion mediante algoritmos quepermitan una tasa de convergencia adecuada. En el presente capıtulo se abordaran ambosenfoques siguiendo los artıculos siguientes: Bernhard Moßner [19] (2009) para el primer caso;y Vincent D. Blondel, Yurri Nesterov y Jacques Theys [5] (2004) para el segundo caso.

En este capıtulo se utilizaran unicamente matrices con coeficientes reales.

4.1. Matrices palindromicas de orden 2

En esta primer seccion se estudiaran conjuntos formados por dos matrices palindromicasde orden 2× 2 con coeficientes reales. Un par de matrices R y L se dicen palindromicas siestan relacionadas por

L = PRP con P :=

(0 11 0

).

De este modo, la operacion PLP es una doble transposicion de la matriz L a lo largo dela diagonal principal y de la diagonal principal invertida.

L :=

(a bc d

)=⇒ PLP =

(d cb a

)= R .

El principal resultado de la seccion es el Teorema 4.1.5 que establece que para conjuntosΣ = {L,R} de matrices palindromicas de orden 2×2 con coeficientes reales el radio espectralconjunto esta dado por

ρ(Σ) = ρ({L,R}) = max{ρ(L),√

ρ(LR)} .

55

Page 57: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Para la demostracion se utilizaran los siguientes lemas. Los 2 primeros lemas forman parte dela idea principal de la demostracion del teorema porque muestran que bajo ciertas condicionespuede construirse una norma tal que ‖A‖ ≤ 1 para las matrices A ∈ Σ. Y por lo tanto resultaque ρ(Σ) ≤ 1. El tercer lema calcula ρ({A,B}) = 1 para un par muy particular de matricesA y B imponiendo condiciones sobre sus autovalores y autoespacios. En la siguiente secciondel capıtulo se generaliza la tecnica utilizada en el Lema 4.1.4 utilizando menos restriccionessobre las matrices.

Lema 4.1.1. Sea K ⊆ Rn un conjunto cerrado, convexo y simetrico respecto al origen que

cumple Br(0) ⊆ K ⊆ BR(0) para 0 < r < R < ∞. Entonces

‖x‖K = ınf{α > 0 :x

α∈ K} es una norma sobre R

n.

La norma ‖·‖K se conoce como funcional de Minkowski [23] para conjuntos convexos bal-anceados y absorventes; que generalmente es una semi-norma pero para el caso de conjuntosacotados, K ⊆ BR(0), se garantiza que es una norma.

Lema 4.1.2. Dado un par de matrices A1 y A2 y K ⊆ Rn como en el Lema 4.1.1 tal que

AiK ⊆ K para i = 1, 2. Entonces ρ({A1, A2}) ≤ 1.

Demostracion: Dado que K es cerrado se tiene que: ‖x‖K ≤ 1 ⇔ x ∈ K. Por lo tanto, lacondicion AiK ⊆ K implica que ‖Ai‖K ≤ 1 para la norma operador asociada a la norma‖ · ‖K sobre R

n. Con lo cual

ρ({A1, A2}) ≤ ρ1({A1, A2}, ‖ · ‖K) ≤ 1 .

Observacion 4.1.3. En particular se utilizara K como la region encerrada por una elipse.Que se define como los puntos que cumplen

p(x, y) := x2 + txy + sy2 − 1 ≤ 0 con s, t ∈ R

K := {(x, y) : p(x, y) ≤ 0} . (4.1)

Segun la caracterizacion de las ecuaciones cartesianas de segundo orden el conjunto Kesta limitado por una elipse si y solo si su discriminante es negativo:

t2 − 4.1.s < 0

t2 < 4s . (4.2)

El siguiente lema involucra un caso particular de matrices palindromicas de orden 2, conun 0 fuera de la diagonal y con igual radio espectral igual a 1.

Lema 4.1.4. Sean

A = α

(1 a0 λ

), B = α

(λ 0a 1

)

dos matrices reales con ρ(A) = ρ(B) = |α| = 1 y ρ(AB) ≤ 1. Entonces ρ({A,B}) = 1.

56

Page 58: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Demostracion: Primero se comienza evaluando las condiciones sobre los autovalores segunlas hipotesis del lema. De ρ(A) = 1 y |α| = 1 se tiene |λ| ≤ 1. Por otro lado

AB = |α|2(

1 a0 λ

)(λ 0a 1

)=

(λ + a2 a

aλ λ

)

det(xIn − AB) = 0

det

(x − λ − a2 −a

−aλ x − λ

)= 0

(x − λ − a2)(x − λ) − a2λ = 0

x2 − (2λ + a2)x + λ2 = 0 .

Si los autovalores de AB son reales entonces (2λ + a2)2 − 4λ2 ≥ 0 y los autovalores son:

x1 =2λ + a2 +

√(2λ + a2)2 − 4λ2

2

x2 =2λ + a2 −

√(2λ + a2)2 − 4λ2

2.

La condicion ρ(AB) = max{|x1|, |x2|} ≤ 1 implica

|2λ + a2| +√

(2λ + a2)2 − 4λ2

2≤ 1

√(2λ + a2)2 − 4λ2 ≤ 2 − |2λ + a2|(2λ + a2)2 − 4λ2 ≤ (2 − |2λ + a2|)2

(2λ + a2)2 − 4λ2 ≤ 4 − 4|2λ + a2| + (2λ + a2)2

4|2λ + a2| ≤ 4 + 4λ2

|2λ + a2| ≤ 1 + λ2 .

Si los autovalores de AB no son reales entonces (2λ + a2)2 − 4λ2 < 0. Y por lo tanto

0 ≤ (2 − |2λ + a2|)2

0 ≤ 4 − 4|2λ + a2| + (2λ + a2)2

4|2λ + a2| ≤ 4 + (2λ + a2)2

4|2λ + a2| ≤ 4 + 4λ2

|2λ + a2| ≤ 1 + λ2 .

En ambos caso se concluye que |2λ + a2| ≤ 1 + λ2 lo cual implica

a2 ≤ (1 − λ)2 . (4.3)

Algunos casos particulares. Si a = 0 entonces A y B son diagonales y queda en formasencilla que ρ({A,B}) = 1. Si λ = 1 entonces (4.3) implica a = 0 que es el caso anterior. Sia2 = (1 − λ)2 entonces los vectores

(a

λ − 1

)y

(λ − 1

a

)

57

Page 59: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

son linealmente dependientes. Pero estos vectores son autovectores de A y B respectivamentecorrespondientes al autovalor λ. Y por lo tanto las matrices tienen un subespacio propioinvariante que permite realizar un cambio de base para que queden en forma triangularsuperior simultaneamente, lo cual implica nuevamente que ρ({A,B}) = 1.

Se considera ahora el caso general con

−1 ≤ λ < 1 (4.4)

0 < a2 < (1 − λ)2 . (4.5)

Para lo cual se definira un polinomio cuadratico de modo que el conjunto K definido por(4.1) permita definir una norma ‖ · ‖K y utilizar ası el Lema 4.1.2. Con las condicionesmencionadas se define

p(x, y) = x2 + txy + y2 − 1 con t :=2a

1 − λ. (4.6)

La condicion (4.3) garantiza que el conjunto K definido por los puntos p(x, y) ≤ 0 estanencerrados por una elipse porque se cumple (4.2). Se vera ahora que AK ⊆ K.

Para λ 6= 0, el conjunto imagen AK son los puntos tales que

pA(x, y) = x2 +1

λ(−2a + t)xy +

1

λ2(a2 − at + 1)y2 − 1 ≤ 0 . (4.7)

Lo cual puede corroborarse directamente con la sustitucion correspondiente x = α(x + ay),y = αλy. Tambien en este caso se cumple (4.2) de modo que AK esta delimitada por otraelipse:

1

λ2(−2a + t)2 − 4.

1

λ2(a2 − at + 1) =

1

λ2

[4a2 − 4at + t2 − 4a2 + 4at − 4

]

=1

λ2

[t2 − 4

]< 0 .

Para comprobar que AK ⊆ K se toma (x, y) tal que pA(x, y) = 0 y se evalua el signoque tiene p(x, y) reemplazando x2 − 1

x2 + txy + y2 − 1 = txy + y2 − 1

λ(−2a + t)xy − 1

λ2(a2 − at + 1)y2 − 1

=1

λ(λt − t + 2a)xy +

1

λ2(λ2 − a2 + at − 1)y2 ;

de (4.6) se tiene que λt − t + 2a = 0

=y2

λ2(λ2 − a2 + at − 1) .

58

Page 60: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

El signo de p(x, y) esta dato por el factor (λ2 − a2 + at − 1). Reemplazando t queda

(λ2 − a2 + at − 1) = λ2 − a2 +2a2

1 − λ− 1

= λ2 − 1 +2a2 − a2(1 − λ)

1 − λ

= λ2 − 1 +a2(1 + λ)

1 − λpor (4.4) y (4.5)

≤ λ2 − 1 +(1 − λ)2(1 + λ)

1 − λ= 0 .

Para λ = 0 queda a2 ≤ 1 y la matriz A es una proyeccion sobre el eje x con

α

(1 a0 0

)(xy

)=

(α(x + ay)

0

)

de modo que la imagen por A de los puntos tales que x2 + 2axy + y2 − 1 ≤ 0 quedan sobreel eje x con

(α(x + ay))2 = x2 + 2axy + a2y2 ≤ 1 − y2 + a2y2 ≤ 1

de modo que |α(x + ay)| ≤ 1.El segmento [−1, 1] del eje x esta incluido en K. Un desarrollo similar permite comprobar

que tambien BK ⊆ K y por lo tanto ρ({A,B}) ≤ 1. Por otro lado, las condiciones ρ(A) =ρ(B) = 1 implican 1 ≤ ρ1({A,B}) ≤ ρ({A,B}) = ρ({A,B}).

En el siguiente teorema se contempla el caso general de matrices palindromicas de orden2 reduciendo el problema al caso especial del Lema 4.1.4.

Teorema 4.1.5. Dadas

L =

(l11 l12l21 l22

), R =

(l22 l21l12 l11

)

un par de matrices reales palindromicas. Entonces

ρ({L,R}) = max{ρ(L),√

ρ(LR)} .

Demostracion: Al intercambiar entre sı las filas de L o intercambiar entre sı las columnas deR se obtiene la misma matriz. O sea, si se define

M =

(l12 l11l22 l21

)y P =

(0 11 0

),

entonces L = MP y R = PM . Ademas se cumple ρ(LR) = ρ(MPPM) = ρ(M2) = ρ(M)2.Por lo tanto

max{ρ(L),√

ρ(LR)} = max{ρ(MP ), ρ(M)} . (4.8)

59

Page 61: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Por otro lado usando la identidad P 2 = In se tiene

LL = MP · MP = M · PMP

LR = MP · PM = M · MRL = PM · MP = PMP · PMP

RR = PM · PM = PMP · M .

De lo que se deduce que todos los productos con una cantidad par de factores de ele-mentos de {L,R} puede reescribirse como un producto con la misma cantidad de factoresde elementos de {M,PMP}; y recıprocamente.

ρ({L,R}) = lımk→∞

ρk({L,R})1/k = lımk→∞

ρ2k({L,R})1/2k

ρ({M,PMP}) = lımk→∞

ρk({M,PMP})1/k = lımk→∞

ρ2k({M,PMP})1/2k

ρ({L,R}) = ρ({M,PMP}) . (4.9)

Esta ultima igualdad (4.9) permite hacer intercambios entre M y MP sin perdida de gener-

alidad. En el sentido que si se define M := MP se cumple MP = M y PM = PMP

ρ({MP,PM}) = ρ({M,PMP}) = ρ({MP, PM}) = ρ({M, PMP})max{ρ(MP ), ρ(M)} = max{ρ(M), ρ(MP )} .

A continuacion se mostrara que

max{ρ(M), ρ(MP )} = 1 =⇒ ρ({M,PMP}) = 1 . (4.10)

Sea entonces max{ρ(M), ρ(MP )} = 1. De acuerdo a lo dicho anteriormente no se pierdegeneralidad si se supone que 1 = ρ(M) ≥ ρ(MP ). Si los autovalores de M son reales entoncesalguno de ellos vale 1 o −1. Si por el contrario, los autovalores de M no son reales cumplenx1 = x2 y 1 = ρ(M) = |x1| = |x2|. Entonces det(MP ) = − det(M) = −x1x2 = −|x1| = −1.Para calcular los autovalores de MP se toma

det(MP − xIn) = x2 − tr(L)x + det(L) = x2 − (l11 + l22)x − 1

x1,2 = − l11 + l222

±√(

l11 + l222

)2

+ 1 .

La unica manera para que |x1,2| ≤ 1 es que l11 + l22 = 0 y por lo tanto x1,2 = ±1. Demodo que alguna de las dos matrices M o MP tiene como autovalor a 1 o −1. Haciendoun intercambio entre ellas se puede suponer que M tiene un autovalor +1 o −1. Se toma elautovector correspondiente

v :=

(ef

)y la matriz T :=

(e ff e

). (4.11)

60

Page 62: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Si T no es invertible entonces e = f o e = −f y por lo tanto Pv = v o Pv = −v.Lo cual implica que v es un autovector comun entre L y R, y pueden llevarse a la formatriangular superior en forma simultanea de modo que por la Proposicion 2.1.6 se concluyeque ρ({L,R}) = 1 y por (4.9) se obtiene lo deseado en (4.10).

Si T es invertible se definen las matrices A y B de la siguiente manera utilizando el hechode que tanto T como T−1 conmutan con P

A := T−1MT = α

(1 a0 λ

)

B := T−1PMPT = PT−1MTP = PAP = α

(λ 0a 1

)con α = ±1.

Dado que |α| = 1 se tiene ρ(A) = ρ(B) = |α| = 1; a la vez que

ρ(AB) = ρ(T−1MPMPT ) = ρ(MP )2 ≤ 1 .

Por Lema 4.1.4 se tiene ρ({A,B}) = 1 y dado que el cambio de base por matrices similaresno modifica el Radio Espectral Conjunto se tiene tambien que ρ({M,PMP}) = 1. Lo quese proponıa demostrar en (4.10).

Comenzando desde el principio del teorema se toman L y R segun las hipotesis. Para elcaso especial max{ρ(L),

√ρ(LR)} = 0 se tiene que L tiene al 0 como unico autovalor. Si v

es un autovector de L y si se define T como en (4.11) se puede tomar

A := T−1LT =

(0 a0 b

)=

(0 a0 0

).

Donde b = 0 es consecuencia de que L tiene al 0 como unico autovalor. Tomando la matrizpalindromica B := PAP = T−1RT queda

0 = ρ(LR) = ρ(AB) = ρ

((0 a0 0

)(0 0a 0

))= ρ

((a2 00 0

))= a2 .

Y por lo tanto a = 0, L = R = 0 y ρ({L,R}) = 0.

Para el caso general max{ρ(L),√

ρ(LR)} = v > 0 se define L := L/v, R := R/v. Y

con estas definiciones queda max{ρ(L),

√ρ(LR)} = 1. Lo cual implica ρ({L, R}) = 1 por

(4.10). Finalmente tambien se cumple ρ({L/v,R/v}) = ρ({L,R})/v. Y con esto se terminala demostracion de la igualdad deseada

ρ({L,R}) = max{ρ(L),√

ρ(LR)} .

Ejemplo 4.1.6. Para el par de matrices

L =

(1 0ω ω

), R =

(ω ω0 1

)

61

Page 63: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

dependientes de un parametro ω ∈ R se tiene

LR =

(ω ωω2 ω2 + ω

)= ω

(1 1ω ω + 1

);

de modo que los autovalores de LR son

x1,2 = ωω + 2 ±

√4ω + ω2

2=

1

4(ω ±

√ω2 + 4ω)2

ρ(LR) =1

4(ω +

√ω2 + 4ω)2 .

Por otro lado es ρ(L) = max{1, |ω|}. Por el Teorema 4.1.5 queda

ρ({L,R}) = max{ρ(L),√

ρ(LR)} =

|ω| para ω ≤ −11 para −1 ≤ ω ≤ 1/2ω+

√ω2+4ω2

para 1/2 ≤ ω.

4.2. Matrices con igual Radio Espectral

La tecnica utilizada en la demostracion del Lema 4.1.4 puede generalizarse para casosespeciales de matrices con igual radio espectral.

Teorema 4.2.1. Sean

A = α

(1 a0 λ

), B = β

(µ 0b 1

)

dos matrices reales con ρ(A) = |α| = ρ(B) = |β|, ab ≥ 0 y ρ(AB) ≤ ρ(A)2. Entoncesρ({A,B}) = ρ(A).

Demostracion: El caso particular ρ(A) = ρ(B) = 0 implica A = B = 0. Tomando ρ(A) > 0y escalando con 1/α se puede asumir que ρ(A) = ρ(B) = 1, con lo cual |α| = |β| = 1. Lascondiciones en las hipotesis sobre los autovalores de A y B implican que

|λ|, |µ| ≤ 1 (4.12)

Calculando los autovalores de AB al igual que en la demostracion del Lema 4.1.4 se puedesuponer en primer lugar que son autovalores reales de la forma

x1,2 =±(µ + λ + ab) ±

√(µ + λ + ab)2 − 4λµ

2.

62

Page 64: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Con lo cual ρ(AB) ≤ ρ(A)2 = 1 implica

∣∣∣∣∣±(µ + λ + ab) ±

√(µ + λ + ab)2 − 4λµ

2

∣∣∣∣∣ ≤ 1

|µ + λ + ab| +√

(µ + λ + ab)2 − 4λµ ≤ 2√

(µ + λ + ab)2 − 4λµ ≤ 2 − |µ + λ + ab|(µ + λ + ab)2 − 4λµ ≤ 4 − 4|µ + λ + ab| + (µ + λ + ab)2

4|µ + λ + ab| ≤ 4 + 4λµ

|µ + λ + ab| ≤ 1 + λµ .

Si los autovalores de AB no son reales entonces (µ + λ + ab)2 − 4λµ < 0 se toma

0 ≤ (2 − |µ + λ + ab|)2

0 ≤ 4 − 4|µ + λ + ab| + (µ + λ + ab)2

4|µ + λ + ab| ≤ 4 + 4λµ

|µ + λ + ab| ≤ 1 + λµ .

En ambos casos se concluye que |µ + λ + ab| ≤ 1 + λµ, que junto con (4.12) implica

ab ≤ (1 − λ)(1 − µ) . (4.13)

Si λ = 1 o µ = 1 entonces ab = 0 y por lo tanto alguna de las dos matrices A o B esdiagonal. Cualquiera de las dos que lo sea respeta la forma triangular superior/inferior de laotra y por ende ρ({A,B}) = 1 como se desea. Otra opcion especial es que ab = (1−λ)(1−µ);en este caso los vectores

(a

λ − 1

)y

(µ − 1

b

)

son linealmente dependientes. Cada uno de los cuales es un autovector de A y B correspon-dientes a los autovalores λ y µ respectivamente. O sea, A y B tienen al menos un autovectoren comun y por lo tanto se puede concluir nuevamente que ρ({A,B}) = 1.

En el caso general se asume λ, µ 6= 1 y 0 < ab < (1 − λ)(1 − µ). Y se define el conjuntoK como los puntos que verifican p(x, y) ≤ 0 con

p(x, y) = x2 + txy + sy2 − 1 con s :=a(1 − µ)

b(1 − λ), t :=

2a

1 − λ. (4.14)

Para λ 6= 0 la imagen por A del conjunto K queda encerrada por los puntos pA(x, y) ≤ 0con

pA(x, y) = x2 +1

λ(t − 2a)xy +

1

λ2(a2 − ta + s)y2 − 1 . (4.15)

63

Page 65: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Para chequear que AK ⊆ K se toma (x, y) tales que pA(x, y) = 0 y analiza el signo dep(x, y) sustituyendo x2 − 1

x2 + txy + sy2 − 1 = txy + sy2 − 1

λ(t − 2a)xy − 1

λ2(a2 − ta + s)y2

=1

λ(λt − t + 2a)xy +

1

λ2(λ2s − a2 + ta − s)y2 ;

de (4.14) se tiene que λt − t + 2a = 0

=y2

λ2(λ2s − a2 + ta − s) .

El signo de p(x, y) esta dado por el factor (λ2s − a2 + ta − s). Reemplazando t queda

(λ2s − a2 + ta − s) = λ2s +2a2

1 − λ− a2 − s

= s(λ2 − 1) +2a2 − a2(1 − λ)

1 − λ

= s(λ2 − 1) +a2(1 + λ)

1 − λ

= s(λ2 − 1) + sa2(1 + λ)

s(1 − λ)

= s(λ2 − 1) + sab(1 − λ)(1 + λ)

(1 − µ)(1 − λ)por (4.12) y (4.13)

≤ s(λ2 − 1) + s(1 − λ2) = 0 .

Para λ = 0 queda ab ≤ (1 − µ) y la matriz A es una proyeccion sobre el eje x con

α

(1 a0 0

)(xy

)=

(α(x + ay)

0

),

de modo que la imagen por A de los puntos tales que x2 +2axy + a(1−µ)b

y2 ≤ 1 quedan sobreel eje x con

(α(x + ay))2 = x2 + 2axy + a2y2 ≤ 1 − a(1 − µ)

by2 + a2y2 ≤ 1

de modo que |α(x + ay)| ≤ 1.El segmento [−1, 1] del eje x esta incluido en K. Para comprobar que BK ⊆ K se procede

de la misma manera. Y por lo tanto ρ({A,B}) ≤ 1.�

A continuacion se presentan dos ejemplos para mostrar que las condiciones sobre losautovalores de las A, B y AB son necesarias y no pueden obviarse. Porque de lo contrariono se cumple la igualdad deseada ρ({A,B}) = ρ(A).

64

Page 66: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Ejemplo 4.2.2. Para

A =

(1 −10 1

), B =

(1 01 1

)

no se cumple la condicion ab ≥ 0. Todas las demas condiciones se cumplen dado que

AB =

(0 −11 1

)y σ(AB) = {1/2 ± i

√3/2}

y por lo tanto ρ(AB) = 1. Calculando todos los autovalores de T ∈ {A,B}k se puede ver queρ(T ) = 1 para k = 1, . . . 4. Sin embargo para A3B2 ∈ {A,B}5 resulta ρ(A3B2) = 2+

√3 > 1.

En el Apendice A estan calculadas todas las matrices T ∈ {A,B}k mencionadas.

N

Ejemplo 4.2.3. Un segundo ejemplo se puede tomar

A =

(1 10 1

), B = β

(1 01 1

)para 0 < β < 1.

Son matrices con diferente radio espectral ρ(A) = 1 y ρ(B) = β < 1. Y se cumple

AkB = β

(1 k0 1

)(1 01 1

)= β

(1 + k k

1 1

)y σ(AkB) =

2(k + 2 ±

√k2 + 4k)

}.

Esto muestra que para 0 < β < 2/(3 +√

5) se tiene ρ(AB) = ρ(A1B) ≤ 1. Ademasde cumplirse la condicion ab ≥ 0. Sin embargo tomando k suficientemente grande se puedehacer

ρ(AkB) =β

2(k + 2 +

√k2 + 4k) > 1

de modo que

ρ({A,B}) = ρ({A,B} ≥ ρk+1({A,B})1/k+1 ≥ ρ(AkB)1/k+1 > 1 .

N

4.3. Aproximacion para el Radio Espectral Conjunto

El calculo exacto del Radio Espectral Conjunto puede ser complicado incluso para casossencillos de matrices de 2 × 2 con caracterısticas especiales como se desarrollo en seccionesanteriores. Para el calculo aproximado del Radio Espectral Conjunto se puede usar la de-sigualdad (1.13)

ρk(Σ)1/k ≤ ρ(Σ) ≤ ρ(Σ) ≤ ρk(Σ)1/k .

Si Σ ⊆ Mn es un conjunto acotado entonces ρ(Σ) y ρ(Σ) coinciden y por lo tanto paravalores de k suficientemente grande los valores de ρk(Σ)1/k y ρk(Σ)1/k dan una aproximaciontan precisa de ρ(Σ) como se quiera. Sin embargo, los calculos de los ρk(Σ) y ρk(Σ) puedenser demasiado costosos y largos. Implican calcular todos los autovalores de las matricesproductos involucradas en Σk.

65

Page 67: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Ejemplo 4.3.1. La siguiente grafica muestra el calculo de ρk(Σ) y ρk(Σ) para k = 8 en elcaso de una matriz A fija y otra matriz B dependiente del parametro a

A :=

(1 2−2 1

), B :=

(1 2a

−2/a 1

).

Para realizar la grafica se utilizo un programa en Matlab para computar los 28 productospertenecientes a Σ8, junto con sus autovalores, radios espectrales ρ(T ) y normas espectrales‖T‖sp. Las rutinas de Matlab utilizadas estan transcriptas en el Apendice B.

N

En [5] se desarrollan aproximaciones facilmente calculables para conjuntos finitos dematrices con coeficientes reales. Una de ellas utiliza normas elipsoidales y satisface

1√n

ρa(Σ) ≤ ρ(Σ) ≤ ρa(Σ) , (4.16)

donde ρa(Σ) es la aproximacion que utiliza normas elipsoidales y n es la dimension de lasmatrices.

Definicion 4.3.2. Dado Σ ⊆ Mn un conjunto de matrices con coeficientes complejos, sedefine la aproximacion por normas elipsoidales para el Radio Espectral Conjunto por

ρa(Σ) = ınfP>0

supA∈Σ

‖A‖P .

N

O sea, para cada matriz P definida positiva se considera la norma elipsoidal asociada‖ · ‖P sobre C

n segun la Definicion 1.2 y la norma operador correspondiente ‖ · ‖P sobre Mn

‖x‖P =√〈Px, x〉 =

√x∗Px

‖A‖P = sup {‖Ax‖P : ‖x‖P = 1} = supx 6=0

√x∗A∗PAx√

x∗Px.

Usando la Proposicion 2.1.3 se tiene que para conjuntos acotados la aproximacion ρa(Σ)es mayor o igual que ρ(Σ), dado que el ınfimo sobre todas las normas matriciales es siempremenor o igual al ınfimo sobre las normas matriciales elipsoidales. La definicion anteriorimplica

√x∗A∗PAx ≤ ‖A‖P

√x∗Px para todo x

x∗A∗PAx ≤ ‖A‖2P x∗Px

x∗(A∗PA − ‖A‖2P .P )x ≤ 0 ;

66

Page 68: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

y por lo tanto A∗PA−‖A‖2P .P ≤ 0. El numero ‖A‖P puede pensarse como el menor escalar

γ ≥ 0 para el cual A∗PA − γ2P ≤ 0. Y la aproximacion ρa(Σ) como el menor escalar γ ≥ 0tal que A∗PA − γ2P ≤ 0 para toda A ∈ Σ para alguna P > 0:

ρa(Σ) = ınf{γ ≥ 0 : ∃P > 0 tal que A∗PA − γ2P ≤ 0 para toda A ∈ Σ} .

Ası planteado, el calculo de ρa(Σ) puede resolverse en forma eficiente como un problemade optimizacion convexa con restricciones generales.

Ejemplo 4.3.3. Retomando el Ejemplo 4.3.1 se considera el conjunto Σ = {A,B} para Ay B matrices con coeficientes reales de tamano 2 × 2. El problema de optimizacion convexacon restricciones generales en este caso se plantea de la siguiente forma

Minimizar γ

sujeto a lasrestricciones

P > 0γ2P − AT PA ≥ 0γ2P − BT PB ≥ 0

La condicion γ2P − AT PA ≥ 0 equivale a 3 restricciones de desigualdad

det(γ2P − AT PA) ≥ 0 −→ r1 ≤ 0

(γ2P − AT PA)11 ≥ 0 −→ r2 ≤ 0

(γ2P − AT PA)22 ≥ 0 −→ r3 ≤ 0

Y en forma similar para γ2P − BT PB ≥ 0 equivale a otras 3 restricciones de desigualdadr4 ≤ 0, r5 ≤ 0 y r6 ≤ 0. A estas 6 restricciones hay que agregarles las correspondiente quederivan de P > 0

P =

(x yy z

)> 0 ⇐⇒

y2 − xz < 0 −→ r7 ≤ 0x < 0 −→ r8 ≤ 0z < 0 −→ r9 ≤ 0

Estas ultimas 3 restricciones deberıa ser desigualdades estrictas; sin embargo pueden es-cribirse de la forma ri + ǫ ≤ 0 para valores de ǫ > 0 tan pequenos como sea necesario.Algunas de las restricciones son de la forma denominadas restricciones de caja; aunque lamayorıa son no-lineales. El planteo del problema queda entonces

Minimizar γ

s.a.{

ri ≤ 0 para i = 1, . . . , 9

El Matlab ofrece una rutina para la resolucion numerica de este tipo de problemas con re-stricciones genericas: la rutina fmincon. En el Apendice B estan desarrolladas las definicionespara poder utilizar esa rutina que permite revolver el problema de optimizacion considerandoel caso del conjunto de matrices Σ = {A,B} del Ejemplo 4.3.1. En la siguiente grafica semuestra el calculo de ρk(Σ) y ρk(Σ) para k = 8 como en el ejemplo mencionado, junto con

67

Page 69: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

el resultado obtenido del problema de optimizacion. Esta grafica es similar a la presentadaen la pagina 107 del artıculo de Blondel-Nesterov-Theys [5].

Retomando la definicion de la aproximacion por normas elipsoidales, la precision men-cionada en (4.16) es resultado del siguiente teorema. En el artıculo original [5] de Blondel-Nesterov-Theys se propone la acotacion valida para conjuntos finitos con coeficientes reales;y utiliza para la demostracion una adaptacion del Teorema Elipsoidal de John en su ver-sion para R

n. Aprovechando la version matricial de este teorema, Teorema 3.2.2, publicadapor Ando-Shih en [1], y todo lo desarrollado en la Seccion 3 se puede establecer la mismaacotacion como valida para conjuntos acotados con coeficiente complejos.

Teorema 4.3.4. Dado Σ ⊆ Mn, conjunto acotado de matrices con coeficientes complejos; ydada ρa(Σ) la aproximacion elipsoidal para el Radio Espectral Conjunto segun la Definicion4.3.2, entonces

1√n

ρa(Σ) ≤ ρ(Σ) ≤ ρa(Σ) .

Demostracion: La segunda desigualdad es consecuencia de la caracterizacion para el calculodel Radio Espectral Conjunto dada por la Proposicion 2.1.3, dado que en para ρ(Σ) se tomael ınfimo sobre el conjunto N de todas las normas operadores; conjunto mas grande que elcorrespondiente a solo las normas operador generadas por normas elipsoidales.

Para la primera desigualdad se toma ρ(Σ) < τ , de modo que Σ = 1τ√

nΣ es un conjunto

acotado con Radio Espectral Conjunto pertenece al intervalo [0, 1√n). Por el Teorema 3.2.3,

Σ es simultaneamente contractible. De modo que existen H > 0 y 0 < γ < 1 tales que

A∗HA ≤ γ2H para toda A ∈ Σ.

Y por ende

ρa(Σ) ≤ γ < 1

1

τ√

nρa(Σ) < 1

ρa(Σ)√n

< τ para todo τ > ρ(Σ).

Lo cual muestra la desigualdad deseada. �

Ejemplo 4.3.5. La precision estipulada en el teorema anterior es exacta en el sentido queno puede mejorarse mas; dado que existen conjuntos Σ para los cuales se cumplen una u otrade las igualdades en (4.16). Por un lado se tiene que para conjuntos Σ formados unicamentepor matrices autoadjuntas se cumple la igualdad en el lado derecho, ver Corolario 2.1.5

ρ(Σ) = ρa(Σ) = supA∈Σ

ρ(A) .

Por otro lado, tomando Σ como (3.18) para el caso particular de α = 1/√

n correspondienteal segundo paso de la demostracion del Teorema 3.2.3. En la demostracion se comprueba

68

Page 70: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

que Σ es un conjunto acotado de n matrices con coeficiente complejos, no simultaneamentecontractible, con ρ(Σ) = 1/

√n.

Dado que Σ no es simultaneamente contractible se deduce que para cualquier 0 < γ < 1no existe P > 0 que cumpla A∗PA ≤ γ2P para toda A ∈ Σ. De modo que ρa(Σ) ≥ 1. Y porende

ρa(Σ)√n

≥ 1√n

= ρ(Σ) .

N

69

Page 71: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Apendice A

Matrices con igual Radio Espectral

En el Ejemplo 4.2.2 se hace referencia al calculo de los autovalores para todas las matricesen {A,B}, {A,B}2, {A,B}3 y {A,B}4 con

A =

(1 −10 1

), B =

(1 11 0

).

En todos los casos resulta ser que ρ(T ) = 1 para cualquier T .Para k = 1

{A,B}k σ(T ) ρ(T )A σ(A) = {1} ρ(A) = 1B σ(B) = {1} ρ(B) = 1

Para k = 2

{A,B}k σ(T ) ρ(T )

A2 =

(1 −20 1

)σ(A2) = {1} ρ(A2) = 1

AB =

(0 −11 1

)σ(AB) = {1/2 ± 1/2

√3i} ρ(AB) = 1

BA =

(1 −11 0

)σ(BA) = {1/2 ± 1/2

√3i} ρ(BA) = 1

B2 =

(1 02 1

)σ(B2) = {1} ρ(B2) = 1

Para k = 3

{A,B}k σ(T ) ρ(T )

A3 =

(1 −30 1

)σ(A3) = {1} ρ(A3) = 1

A2B =

(−1 −21 1

)σ(A2B) = {±i} ρ(A2B) = 1

ABA =

(0 −11 0

)σ(ABA) = {±i} ρ(ABA) = 1

AB2 =

(−1 −12 1

)σ(AB2) = {±i} ρ(AB2) = 1

70

Page 72: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Para k = 3 (continuacion)

{A,B}k σ(T ) ρ(T )

BA2 =

(1 −21 −1

)σ(BA2) = {±i} ρ(BA2) = 1

BAB =

(0 −11 0

)σ(BAB) = {±i} ρ(BAB) = 1

B2A =

(1 −12 −1

)σ(B2A) = {±i} ρ(B2A) = 1

B3 =

(1 03 1

)σ(B3) = {1} ρ(B3) = 1

Para k = 4

{A,B}k σ(T ) ρ(T )

A4 =

(1 −40 1

)σ(A4) = {1} ρ(A4) = 1

A3B =

(−2 −31 1

)σ(A3B) = {−1/2 ± 1/2

√3i} ρ(A3B) = 1

A2BA =

(−1 −11 0

)σ(A2BA) = {−1/2 ± 1/2

√3i} ρ(A2BA) = 1

A2B2 =

(−3 −22 1

)σ(A2B2) = {−1} ρ(A2B2) = 1

ABA2 =

(0 −11 −1

)σ(ABA2) = {−1/2 ± 1/2

√3i} ρ(ABA2) = 1

ABAB =

(−1 −11 0

)σ(ABAB) = {−1/2 ± 1/2

√3i} ρ(ABAB) = 1

AB2A =

(−1 02 −1

)σ(AB2A) = {−1} ρ(AB2A) = 1

AB3 =

(−2 −13 1

)σ(AB3) = {−1/2 ± 1/2

√3i} ρ(AB3) = 1

BA3 =

(1 −31 −2

)σ(BA3) = {−1/2 ± 1/2

√3i} ρ(BA3) = 1

BA2B =

(−1 −20 −1

)σ(BA2B) = {−1} ρ(BA2B) = 1

BABA =

(0 −11 −1

)σ(BABA) = {−1/2 ± 1/2

√3i} ρ(BABA) = 1

BAB2 =

(−1 −11 0

)σ(BAB2) = {−1/2 ± 1/2

√3i} ρ(BAB2) = 1

B2A2 =

(1 −22 −3

)σ(B2A2) = {−1} ρ(B2A2) = 1

B2AB =

(0 −11 −1

)σ(B2AB) = {−1/2 ± 1/2

√3i} ρ(B2AB) = 1

71

Page 73: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Para k = 4 (continuacion)

{A,B}k σ(T ) ρ(T )

B3A =

(1 −13 −2

)σ(B3A) = {−1/2 ± 1/2

√3i} ρ(B3A) = 1

B4 =

(1 04 1

)σ(B4) = {1} ρ(B4) = 1

Al continuar con el procedimiento para k = 5 se observa que ρ(A3B2) =√

7.Para k = 5

{A,B}k σ(T ) ρ(T )

A5 =

(1 −50 1

)σ(A5) = {1} ρ(A5) = 1

A4B =

(−3 −41 1

)σ(A4B) = {−1} ρ(A4B) = 1

A3BA =

(−2 −11 0

)σ(A3BA) = {−1} ρ(A3BA) = 1

A3B2 =

(−5 −32 1

)σ(A3B2) = {−2 ±

√3i} ρ(A3B2) =

√7

72

Page 74: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Apendice B

Rutinas en Matlab utilizadas

Para la elaboracion de la grafica ?? en la Seccion 4.3 se utiliza la siguiente rutina general,que incluye la subrutina Skpara2matrices descripta luego a continuacion.

Algorithm B.1: Rutina General para Grafica ??

1 A=[1. 2.;-2. 1.];2 k=8 ; // cantidad de productos

3 a=.1:.1:10 ; // variacion del parametro en la matriz B

4 for jj = 1:length(a) do

5 B=[1 2*a(jj);-2/a(jj) 1]; // Generacion de la matriz B

6 S =Skpara2matrices(k,A,B) ; // genera el conjunto Sk

7 for jjj = 1 : 2k do

8 vnorma(jjj)=norm(S(:,:,k,jjj)) ; // las normas en Sk

9 [x,auto]=eig(S(:,:,k,jjj)); auto=diag(auto);10 vradio(jjj)=max(abs(auto)) ; // radios espectrales en Sk

11 end

12 rck(jj)=(max(vnorma ))1/k ; // rck = para Radio Espectral Conjunto

13 rgk(jj)=(max(vradio ))1/k; // rgk = para Radio Espectral Generalizado

14 end

15 plot(a,rck,a,rgk), grid;16 h = legend(’rck’,’rgk’); set(h,’Interpreter’,’none’)

73

Page 75: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Algorithm B.2: Subrutina Skpara2matrices

1 Function [S ]=Skpara2matrices(k,L,R);; // k = cantidad de productos

; // S(:,:,1,:)= conjunto de R y L = [R L]

; // S(:,:,2,:)= S2 = [RR RL LR LL]

; // Los productos se construyen usando la numeracion binaria:

; // el j-esimo elemento de S(:,:,k,:)=Sk se construye multiplicando

; // L y R segun la notacion binaria de ’j-1’. Donde L=1 R=0

; // Ejemplo: Para k=4 se tiene que j va de 0 a 15

; // j = 14 = 8+4+2 = 1110 = 1110 ===>S(:,:,4,14) = LLLR

; // j = 3 = 2+1 = 11 = 0011 ===>S(:,:,4,3) = RRLL

2 for j=1 : 2k do

3 S(:,:,k,j)=[1 0;0 1] ; // Inicializando S(:,:,k,j)

4 n=j-1;; // rem(n,2)= resto de dividir n por 2

5 for jj=1 : k do

6 if rem(n,2)==1 then

7 S(:,:,k,j)=L*S(:,:,k,j)8 else

9 S(:,:,k,j)=R*S(:,:,k,j)10 end

11 n=(n-rem(n,2))/2;

12 end

13 end

Para la elaboracion de la grafica ?? se utilizaron las siguientes rutinas y subrutinas. Larutina general es muy similar a la primera presenta en estos apendices. Utiliza tambien lasubrutina Skpara2matrices; ademas utiliza las subrutinas mingenerico, resgen

74

Page 76: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Algorithm B.3: Rutina General para Grafica ??

1 A=[1. 2.;-2. 1.];2 k=8 ; // cantidad de productos

3 a=.1:.1:10 ; // variacion del parametro en la matriz B

4 for jj = 1:length(a) do

5 B=[1 2*a(jj);-2/a(jj) 1]; // Generacion de la matriz B

6 S =Skpara2matrices(k,A,B) ; // genera el conjunto Sk

7 for jjj = 1 : 2k do

8 vnorma(jjj)=norm(S(:,:,k,jjj)) ; // las normas en Sk

9 [x,auto]=eig(S(:,:,k,jjj)); auto=diag(auto);10 vradio(jjj)=max(abs(auto)) ; // radios espectrales en Sk

11 end

12 rck(jj)=(max(vnorma ))1/k ; // rck = para Radio Espectral Conjunto

13 rgk(jj)=(max(vradio ))1/k; // rgk = para Radio Espectral Generalizado

14 [elnorma1(jj) x y z]=mingenerico(A,B);; // norma elipsoidal de S minimizando el gamma

15 end

16 plot(a,rck,a,rgk,a,elnorma1), grid;17 h = legend(’rck’,’rgk’,’elnorm1’); set(h,’Interpreter’,’none’)

Algorithm B.4: Subrutina mingenerico

1 Function [m,x,y,z]=mingenerico(A,B);2 x0=[10 10 10 10];3 ff = @(xx) resgen(xx,A,B);4 AA=[]; bb=[];5 options=optimset(’Display’,’off’);6 [r,rval]=fmincon(@fobjetivo,x0,AA,bb,[],[],[],[],ff,options);7 m=rval;8 x=r(2); y=r(3); z=r(4);9 end

75

Page 77: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Algorithm B.5: Funcion resgen

1 Function [cc,ceq]=resgen(xx,A,B) ; // a,b,c,d,e,f,g,h

2 r=xx(1);3 x=xx(2);4 y=xx(3);5 z=xx(4);6 P=[xx(2) xx(3);xx(3) xx(4)];7 EC1 =r2 ∗ P − A′ ∗ P ∗ A;8 EC2 =r2 ∗ P − B′ ∗ P ∗ B;9 r1=-det(EC1);

10 r2=-EC1(1,1);11 r3=-EC1(2,2);12 r4=-det(EC2);13 r5=-EC2(1,1);14 r6=-EC2(2,2);15 r7=-det(P);16 r8=-x;17 r9=-z;18 r10=-r;19 cc=[r1 r2 r3 r4 r5 r6 r7 r8 r9 r10];20 ceq=[];21 end

Algorithm B.6: Funcion fobjetivo

1 Function f=fobjetivo(x) ;2 f=x(1);3 end

76

Page 78: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

Bibliografıa

[1] T. Ando, M.-H. Shih, Simultaneous contractibility, SIAM J. Matrix Anal. Appl. 19 (2)(1998), pp. 487-498

[2] M. A. Berger, Y. Wang, Bounded semigroups of matrices, Linear Algebra Appl. 166(1992), pp. 21-27

[3] R. Bhatia, Matrix Analysis, Springer-Verlag New York Inc. (1997)

[4] V. Blondel, The birth of the joint spectral radius: An interview with Gilbert Strang,Linear Algebra and Its Applications 428 (2008) pp. 2261-2264

[5] V. Blondel, Y. Nesterov, J. Theys. On the accuracy of the ellipsoid norm approximationof the joint spectral radius, Linear Algebra and Its Applications 394 (2005) pp. 91-107

[6] V. Blondel, J. Theys, A. Vladimirov, An elementary counterexample to the finitenessconjecture, SIAM J. Matrix Anal. Appl. 24 (4) (2003), pp. 963-970

[7] J. Bochi, Inequalities for numerical invariants of sets of matrices, Linear Algebra Appl.368 (2003) pp. 71-81

[8] T. Bousch, J. Mairesse, Asymptotic height optimization for topical IFS, tetris heaps andthe finiteness conjecture, J. Amer. Math. Soc. 15 (2002), pp. 77-111

[9] I. Daubechies, J. C. Lagarias, Two scale difference equation I. Existence and globalregularity of solutions, SIAM J. Math. Anal. 22 (1991), pp. 1388-1410

[10] I. Daubechies, J. C. Lagarias, Two scale difference equation II. Local regularity, infiniteproducts of matrices and fractals, SIAM J. Math. Anal. 23 (1992), pp. 1031-1079

[11] I. Daubechies, J. C. Lagarias, Sets of matrices all infinite products of which converge,Linear Algebra Appl. 161 (1992), pp. 227-263

[12] L. Daubechies, J. C. Lagarias Corrigendum/addendum to: Sets of matrices all infiniteproducts of which converge, Linear Algebra Appl. 327 (2001), pp. 69-83

[13] H. G. Eggleston, Convexity, Cambridge U.P. 1958

77

Page 79: Departamento de Matem´aticas Facultad de Ciencias Exactasdemetrio/Apuntes/De Alumnos/9. Radio Esp… · Paralelamente, se fueron desarrollando t´ecnicas para aproximar el Radio

[14] L. Elsner The generalized spectral radius theorem: An analityc-geometric proof, LinearAlgebra Appl. 220 (1995), pp. 151-159

[15] G. Gripenberg, Computing the joint spectral raius, Linear Algebra Appl. 234 (1996), pp.43-60

[16] F. John, Studies and essays, Intersciencie, New York (1948), pp. 184-204. Reimpreso enCollected papers Vol. 2 J. Moser ed. Birkauser, Boston, MA (1985), pp. 543-560

[17] V. Kozyakin, On accuracy of approximation of the spectral radius by the Gelfand for-mula, Linear Algebra Appl. 431 (2009) pp. 2134-2141

[18] J. C. Lagarias, Y. Wang, The finiteness conjectures for the generalized spectral radiusof a set of matrices, Linear Algebra and Its Applications 214 (1995), pp. 17-42

[19] B. Moßner, On the joint spectral radius of matrices of order 2 with equal spectral radius,Advances in Computational Mathematics 33 (2009) pp. 243-254

[20] C. J. A. Nash-Williams, Infinite graphs - a survey, J. Combin Theory 3 (1967), pp.286-301

[21] G.-C. Rota, On models for linear operators, Comm. Pure Appli. Math. 13 (1960), pp.469-472

[22] G.-C. Rota, W.-G. Strang, A note on the joint spectral radius, Proc. Netherlands Acade-my 22 (1960), pp. 379-381

[23] W. Rudin, Functional analysis, McGraw-Hill

[24] M.-H. Shih, J.-W. Wu, C.-T. Pang, Asymptotic stability and generalized Gelfand spectralradius formula, Linear Algebra Appl. 252 (1997), pp. 61-70

78