376
PRINCIPIOS MATEM ´ ATICOS PARA CIENCIAS EX ´ ACTAS Y TECNOLOG ´ IA AVANZADA Tonatiuh Matos (1) Petra Wiederhold (2) (1) Departamento de F´ ısica, Centro de Investigaci´ on y de Estudios Avanzados del IPN, A.P. 14-740, 07000 M´ exico D.F., M´ exico. E-mail address, 1: [email protected] URL: http://www.fis.cinvestav.mx/~tmatos (2) Departamento de Control Autom´ atico, Centro de Investigaci´ on y de Estudios Avanzados del IPN, A.P. 14-740, 07000 M´ exico D.F., exico. E-mail address, 2: [email protected] A nuestra pasi´on: Ursula y Tiuh

PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

PRINCIPIOS MATEMATICOS

PARA CIENCIAS EXACTAS

Y TECNOLOGIA AVANZADA

Tonatiuh Matos(1)

Petra Wiederhold(2)

(1) Departamento de Fısica, Centro de Investigacion y de Estudios

Avanzados del IPN, A.P. 14-740, 07000 Mexico D.F., Mexico.

E-mail address, 1: [email protected]: http://www.fis.cinvestav.mx/~tmatos

(2) Departamento de Control Automatico, Centro de Investigacion

y de Estudios Avanzados del IPN, A.P. 14-740, 07000 Mexico D.F.,

Mexico.

E-mail address, 2: [email protected] nuestra pasion:

Ursula y Tiuh

Page 2: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1991 Mathematics Subject Classification. Curso de Matematicas

Abstract. Curso de Matematicas para estudiantes de ciencias exactas y tec-nologıa avanzada.

Page 3: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

Contents

1. Prefacio vi2. Nomenclatura viii

Part 1. PRELIMINARES 13. Conjuntos 24. Mapeos 45. Producto Cartesiano y Relaciones 86. Operaciones 117. El Conjunto Ordenado ℜ 12

Part 2. ALGEBRA 17

Chapter 1. ESTRUCTURAS ALGEBRAICAS BASICAS 191. Grupos y Semigrupos 192. Homomorfismos 213. Subgrupos y Grupos cociente 224. Anillos y Campos 245. Ideales y Anillos Cociente 26

Chapter 2. ESPACIOS VECTORIALES 291. El Espacio Vectorial ℜn 292. Definicion de Espacio Vectorial 303. Subespacios Vectoriales 314. Homomorfismos 325. Independencia Lineal y Bases 346. Transformaciones Lineales 377. Algebras 38

Chapter 3. MATRICES 411. Mapeos Lineales y Matrices 412. Isomorfismos 433. Ecuaciones Lineales 474. Transpuesta e Inversa de Matrices 49

Chapter 4. DETERMINANTES 531. Definicion 532. Matrices Similares 573. Invariantes de Matrices Similares (Vectores y Valores Propios) 58

Chapter 5. FORMAS CANONICAS 63

iii

Page 4: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

iv CONTENTS

1. Introduccion 632. Forma Canonica de Jordan 693. Forma Canonica Natural 73

Part 3. VARIABLE COMPLEJA 77

Chapter 6. EL PLANO COMPLEJO 791. Los Numeros Complejos 792. Funciones en el Plano Complejo 803. La Derivada en el Plano Complejo 844. Funciones Armonicas 885. La Integral en el Plano Complejo 906. La Integral de Cauchy 98

Chapter 7. SERIES 1031. Series en el Plano Complejo 1032. Series de Taylor en el Plano Complejo 1053. Series de Laurent 1074. Polos y Residuos 1115. Evaluacion de Integrales 118

Chapter 8. GEOMETRIA DEL PLANO COMPLEJO 1251. Transformaciones Conformes 1252. Superficies de Riemann 130

Part 4. ANALISIS 133

Chapter 9. ESPACIOS METRICOS Y UNITARIOS 1351. Estructuras sobre ℜ y ℜn 1352. Espacios Metricos. 1403. Espacios Normados 1454. Espacios Euclideanos. 1505. Espacios Unitarios 153

Chapter 10. ESPACIOS DE HILBERT Y BANACH 1571. Sistemas Ortonormales Completos. 1572. Operadores Adjuntos. 164

Chapter 11. ESPACIOS CON MEDIDA 1731. Medida 1732. Integracion en espacios con Medida 1773. Espacios Lp 1814. Desarrollo de Fourier en L2 1835. Funciones Especiales 184

Part 5. ECUACIONES DIFERENCIALES 191

Chapter 12. ECUACIONES DIFERENCIALES ORDINARIAS 1931. Metodos de Solucion 1932. Transformadas Integrales 1993. Metodo de Series 204

Page 5: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CONTENTS v

Chapter 13. ECUACIONES DIFERENCIALES PARCIALES 2091. Metodos de Solucion 2092. Separacion de Variables 2103. Metodo de series de Fourier 2204. Funciones de Green 221

Part 6. TOPOLOGIA 227

Chapter 14. ESPACIOS TOPOLOGICOS 2291. Definicion y Ejemplos 2292. Cerradura, Interior y Frontera 2333. Funciones Continuas 2384. Topologıa cociente 2415. Espacios Compactos 2436. Espacios Conexos 248

Chapter 15. VARIEDADES DIFERENCIALES 2511. Variedades 2512. Funciones suaves 2563. Vectores Tangentes. 2584. Uno formas 260

Chapter 16. TENSORES Y P-FORMAS 2731. Tensores 2732. p-Formas 2783. Diferenciacion e integracion en variedades 2794. Derivada de Lie y Derivada Covariante 2935. El Tensor Metrico y el Tensor de Curvatura 300

Chapter 17. HACES FIBRADOS 3111. Haces 3112. Espacios G 3133. Haces Fibrados Principales 3154. Haces Vectoriales 319

Chapter 18. GRUPOS DE LIE 3231. Campos Invariantes por la Izquierda 3232. La Funcion Exponencial 3263. La representacion Adjunta y la Forma de Maurer Cartan. 3284. Representacion de Grupos y Algebras de Lie 332

Part 7. APLICACIONES 335

Chapter 19. APLICACIONES 3371. Ecuaciones Quirales 3372. Geometrizacion de Teorias de Norma 344

Chapter 20. Indice Analitico 353

Page 6: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

vi CONTENTS

1. Prefacio

Este trabajo es el resultado de la imparticion durante 20 anos de las materiasde Matematicas y de Metodos Matematicos en los Departamentos de Fısica, deIngenierıa Electrica y de Control Automatico del Centro de Investigacion y de Es-tudios Avanzados del IPN (Cinvestav), ası como en el Instituto de Fısica y Matematicas de la Universidad Michoacana, en Mexico. Tambien se ha impartido parte delmaterial, incluyendo la parte de topologıa en cursos especiales de geometrıa difer-encial en las anteriores instituciones y en el Astronomisch-Physikalisches Institut dela Friederich-Schiller-Universitet de Jena, Alemania, en el Institut fer TheoretischePhysik, de la Technische Universite Wien y en el Departament of Physics of theUniversity of British Columbia, en Vancouver, Canada. El temario es basicamenteel correspondiente al de la mayorıa de las instituciones donde se imparte la carrerade Fısica y Tecnologıa avanzada en Mexico, como son el CINVESTAV, la UNAMo la UAM, la Universidad Michoacana, la Veracruzana, etc. y estoy seguro que enotros paıses de Ispanoamerica. Este material tiene como objetivo suplir la terribledeficiencia de no haber un curso en espanol, que corresponda a los temarios de lasinstituciones de habla ispana, hablado en lenguage espa nol.

El objetivo del libro es multiple. El principal es dar al estudiante la ideafundamental de lo que son las matematicas: las matematicas son la herramientaque nos ayuda a pensar. Es por eso que el objetivo de estos cursos no ha sidoinformativo, sino mas bien formativo. Con estos cursos nosotros pretendemos queel estudiante adquiera una formacion mınima de matematicas para la investigacionen las ciencias y las ingenierıas. El avance de las ciencias naturales y de la ingenierıahace cada vez mas necesario que el estudiante no solo aprenda a calcular en lasramas de las matematicas que se utilizan en su campo, sino que aprenda a utilizarlos teoremas y los resultados emanados de la matematica en toda su connotacion.Es por eso que el libro inicia con definiciones muy elementales, pero necesariaspara entender el resto del material. Sin embargo, el libro no esta pensado paraque el estudiante se convierta en matematico profesional. Esta es la razon por laque para los teoremas que nosotros consideramos demasiado largos de demostrar,no se incluye su demostracion, solo se enuncian sus postulados con sus premisasy se utilizan. El libro no pretende ser un compendio completo de matematicas,ni siquiera de las matema ticas que se utilizan en alguna rama en especial. Cadacapıtulo de este libro podrıa extenderse a ser un libro gigante de cada tema. Eseno es el objetivo del libro. Mas bien pretende introducir al estudiante a cadatema, para que cuando necesite de este, pueda recurrir a libros especializados deltema particular, pero pueda entender este libro especializado con un mınimo dedificultad. Los temas tocados por el libro son los temas basicos tıpicos de un cursode matematicas: Algebra, Analisis, Variable Compleja, Ecuaciones Diferencialesy Topologıa, que son los topicos mınimos que un matematico deberıa dominar.Esta experiencia en la ensenanza de las matematicas es la que se utiliza en estelibro, para que el estudiante adquiera un mınimo de formacion en matematicaspara su investigacion en ciencias o en ingenierıa. La parte de topologıa diferencialo variedades diferenciales se agrega, ya que esta area de las matematicas se haconvertido en una excelente herramienta para la mecanica clasica, la mecanicacuantica, la termodinamica, el control automatico, entre otras ramas de la cienciay la tecnologıa.

Page 7: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. PREFACIO vii

La compresion de este libro requiere de cursos previos de matematicas. Elmaterial aquı contenido esta pensado para tres semestres de mas o menos 40 horasde los cursos avanzados en las carreras de ciencias o para las maestrıas en cienciase ingenierıas. El ultimo tema, topologıa, podrıa ser un curso optativo en algunasde estas maestrıas.

Las matematicas son por lo general sencillas. Toda la dificultad de entenderlasradica en el hecho de como estudiarlas. A diferencia de otras materias de la escuela,el aprendizaje de las matematicas es un proceso lineal, no se puede entender unmaterial si no se ha comprendido y estudiado con cuidado todo el material ante-rior. Generalmente, la razon por la que las matematicas se dificultan es porqueno entendemos un concepto y generalmente este no-entendimiento viene porqueno entendimos algun concepto anterior. Generalmente no nos damos cuenta deesto. Nosotros recomendamos leer la introduccion de este libro con mucho cuidado.Parecera que todo es facil, hasta trivial. Pero las bases firmes ayudaran al es-tudiante a comprender el resto del material. Nosotros hemos optado por dar lasideas claras con toda su abstraccion, estamos seguros que a la larga este metodofacilita mucho el entendimiento de las matematicas, en vez de dar conceptos in-tuitivos. Nuestra experiencia es que la acumulacion de conceptos intuitivos crealagunas de conocimiento cada vez mas grandes y por lo tanto a una incomprensionde las matematicas cada vez mayor. Tambien hemos evitado mucho material que anuestro parecer se deriva facilmente del material estudiado aquı. Por eso pensamosque el material contenido en este libro es el mınimo necesario para entender unagran cantidad de temas matematicos, de ninguna forma el material es completo.Es preferible que el estudiante este preparado para aprender mas a futuro a que unestudiante “lo sepa todo” de un tema dado. La profundidad de su conocimiento enalgun tema estara determinado mas bien por las necesidades de su investigacion.Es muy comun que en los cursos de matematicas se toquen temas con mucha pro-fundidad que en nuestras investigaciones nunca necesitamos.

La necesidad de que los estudiantes de ciencias e ingenierıa tengan una for-macion mınima en matematicas es cada vez mas imperiosa. Vivimos la revolucioncientıfico-tecnologica y estos cambios tan vertiginosos en nuestro medio, en nues-tras vidas requieren de una preparacion mas profunda y mas especializada, perosin perder de vista lo general. Es por eso que el libro pretende reducir cada temade las matematicas al mınimo, pero dando una panoramica general de los temas demayor importancia de las matematicas que nos ayudaran en nuestras investigacionescientıficas y tecnologicas, es decir, tocando los temas basicos que nos ayudaran apensar.

Queremos agradecer a todos los estudiantes que nos hicieron el favor de leer eltexto y pasarnos correcciones y sugerencias que ayudaron notablemente a mejorar eltexto. Especialmente queremos agradecer a Nayeli Azusena Rodrıguez Briones y aAlberto Vazquez por las correcciones que amablemente nos hicieron llegar, muchasgracias a todos.

Mexico D.F., 2008Tonatiuh Matos y Petra Wiederhold

Page 8: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

viii CONTENTS

2. Nomenclatura

2.1. Conjuntos.

Definicion 0.1. .La union de A con B : A ∪BLa interseccion entre A y B : A ∩BConjunto vacio φA es subconjunto de B: A ⊂ BEl complemento del conjunto A: Ac

La diferencia entre A y B : A \BEl conjunto potencia de A: P(A)

2.2. Mapeos.

Definicion 0.2. .Mapeo o funcion f de E en F : f : E → FDominio de definicion de f : Df

Dominio de valores de f : VfComposicion de mapeos: (g f)(x) = g(f(x))Mapeo inverso: f−1

Imagen del conjunto X : f(X)Imagen inversa: f−1(Y )

2.3. Producto Cartesiano y Relaciones.

Definicion 0.3. .Producto cartesiano: A×BRelacion entre dos conjuntos: (a, b) ∈ R o aRb o a ∼ bClase de equivalencia de x : [x]El conjunto de todas las clases de equivalencia: EConjunto cociente: E =E / ∼Operacion binaria: ϕ : E × E E

Ejemplo 0.4. ϕ(x, y) = x+y, ϕ(x, y) = x ·y, ϕ(x, y) = x−y, x, y ∈ E,etc.

2.4. Conjuntos Especiales.

Definicion 0.5. .Los numeros Naturales: NLos numeros Enteros: ZLos numeros Racionales: QLos numeros Reales: ℜLos numeros Complejos: C2.5. En los reales ℜ.Definicion 0.6. .Conjunto parcialmente ordenado: (A,≤)Los Reales positivos: ℜ+ = x ∈ ℜ : x > 0Los Reales negativos: ℜ− = x ∈ ℜ : x < 0.El mınimo de A: minAEl maximo de A: maxAEl supremo de x: supxEl ınfimo de x: inf x

Page 9: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. NOMENCLATURA ix

2.6. Algebra.

Definicion 0.7. .Grupo o Semigrupo: (A, ·)Grupo Cociente: E/HAnillo: (A,+, ·)Espacio Vectorial: (K,V,+, ·) o simplemente V

Algebra: (A,+, ·, )Espacios isomofos: V1

∼= V2

Subespacios: V1 ⊂sub V1

Cerradura lineal de X : L(X)Linealmente independiente: l.i.La Dimension de V : dim V = nEl conjunto de las Transformaciones lineales o mapeos lineales: L(V1, V2) :=

Hom(V1, V2)El nucleo de f : ker fEl Rango de f : Rgf := dim f(V1)

2.7. Matrices.

Definicion 0.8. .La transpuesta de A: AT

El Rango de A : RgALa inversa de una matriz A : A−1

La matriz identidad: I =

1 0. . .

0 1

El determinante de A : detALa Traza de la matriz A: TrADelta de Kronecker: δkj = (I)ijMatriz caracteristica de A: A− λIPolinomio carateriztico de A: det (A− λI)Ecuacion caracteristica de A: det (A− λI) = 0.Matrix polinomial: U(λ)

2.8. Variable Compleja.

Definicion 0.9. .Parte Real de z: Re(z)Parte imaginaria: Im(z)Modulo de z: |z|Complejo conjugado: zLımite de f : limz→z1 f(z) = z2La derivada de f en z: df

dz

Funcion armonica: ∇2u = 0

2.9. Espacios Unitarios y Metricos.

Definicion 0.10. .Espacio Euclidiano o Espacio Unitario: (E, (·, ·))Espacio normado: (E, ‖ · ‖)Norma de x: ‖ x ‖

Page 10: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

x CONTENTS

x es perpendicular u ortogonal a y: x ⊥ yComplemento ortogonal de H: H⊥

Espacio metrico: (X, ρ)Distancia entre x y y: ρ (x, y)Bola de centro x ∈ X y radio r > 0 : Br (x)Una sucesion: (xn) o xnConvergencia de una sucesion: lim

n→∞xn = x o xn → x

Definicion 0.11. .El conjunto de funciones continuas en [a, b] : C ([a, b])El espacio de polinomios definidos en [a, b] : Pn ([a, b])Conjunto de las funciones trigonometricas: T ([−π, π])Polinomio de grado n: pn o pn(x).Polinomios de Legendre: Pn o Pn(x)Polinomios de Bessel JnPolinomios de Hermite: Hn o Hn(x)Polinomios de Laguerre: LnPolinomios de Tchebichef de primera clase: TnPolinomios de Tchebichef de segunda clase: UnPolinomios de Jacobi: P ν,µnPolinomios de Gegenbauer: CλnEl espacio de las funciones periodicas en [a, b] : Fp ([a, b])Espacio Pseudo-Euclidiano o Espacio de Lorentz: L

Grupo de isometrias del espacio metrico (X, ρ) : Iso (X, ρ)

2.10. Espacios de Hilbert y Banach.

Definicion 0.12. Sistema ortonormal: xii∈ISerie de Fourier:

∑iǫI (x, xi) xi

Operador adjunto de A: A∗

Operador hermitiano de A: A†

2.11. Espacios con Medida.

Definicion 0.13. Algebra o Algebra-σ sobre Ω: FConjuntos de Borel: EEspacio Medible: (Ω,F)Medida: µ o mEspacio con Medida: (Ω,F , µ)Medida de Dirac: δxFuncion indicadora: χA

2.12. Ecuaciones Diferenciales.

Definicion 0.14. .La ecuacion del oscilador armonico y′′ + ω2y = 0.Ecuacion diferencial de Legendre:(1− x2

)d2

dx2Pn − 2x ddxPn + n (n+ 1)Pn = 0

Ecuacion diferencial de Bessel: x2 d2

dx2Jn + x ddxJn +

(x2 − n2

)Jn = 0

Ecuacion diferencial de Hermite: d2

dx2Hn − 2x ddxHn + 2nHn = 0

Ecuacion diferencial de Laguerre: x d2

dx2Ln + (1− x) ddxLn + nLn = 0

Page 11: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. NOMENCLATURA xi

La transformada integral: F (s) = (eq, xs).La transformada de Fourier: xk = exp(ikx)La transformada de Laplace: xs = exp(as)La convolucion de f con g: f ∗ g =

∫∞−∞ f(u)g(x− u)du

2.13. Operadores Diferenciales y Coordenadas.

Definicion 0.15. .

Operador Nabla: ∇ =(∂∂x ,

∂∂y ,

∂∂z

)

Operador Laplaciano: ∇2

Operador d’Alabertiano: = ∇2 − v2∂2/∂t2

Elemento de linea: dr = (dx, dy, dz) = dx ex + dy ey + dz ezCoordenadas esfericas

x = r sin(θ) cos(ϕ), y = r sin(θ) sin(ϕ), z = r cos(θ)

dr = dr er + rdθ eθ + r sin (θ) dϕ eϕ

∇ =

(∂

∂r,1

r

∂θ,

1

r sin (θ)

∂ϕ

)

∇ ·A =1

r2∂(r2Ar

)

∂r+

1

r sin(θ)

∂ (sin(θ)Aθ)

∂θ+

1

r sin(θ)

∂Aϕ∂ϕ

∇2 =1

r2∂

∂r

(r2∂

∂r

)+

1

r2 sin(θ)

∂θ

(sin(θ)

∂θ

)+

1

r2 sin2(θ)

∂2

∂ϕ2

Coordenadas cilindricas

x = ρ cos(ϕ), y = ρ sin(ϕ), z = z

dr = dρ eρ + ρdϕ eϕ + dz ez

∇ =

(∂

∂ρ,1

ρ

∂ϕ,∂

∂z

)

∇ ·A =1

ρ

∂ (ρAρ)

∂ρ+

1

ρ

∂Aϕ∂ϕ

+∂Aρ∂z

∇2 =1

ρ

∂ρ

(ρ∂

∂ρ

)+

1

ρ2

∂2

∂ϕ2+

∂2

∂z2

Coordenadas nulas ξ = x+ vt y η = x− vtFuncion de Green G(x,y)Delta de Dirac δ (x)

La ecuacion de onda u = ∇2u− v2 ∂2u∂t2 = ρ(x, y, z)

La ecuacion de Difusion ∂u∂t = ∇ · (D∇u)

La ecuacion de Poisson ∇2u = ρ(x, y, z)

2.14. Topologıa.

Definicion 0.16. .Topologıa de X: τXUna Vecindad de x: UxUna Cubierta: UEl lımite: xi x o limxi = x.La topologıa relativa o inducida: τALa clausura de A: A

Page 12: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

xii CONTENTS

El interior de A: ALa frontera de A: ∂AEl conjunto de funciones continuas: Map(X,Y ) = C0(X,Y )Las proyecciones de X × Y : Πx

La inclusion de A en X: i : A → X

Espacios topologicos homeomorfos: Xhom∼ Y

El grupo de automorfismos: (Aut(X), )Camino o trayectoria: cReparametrizacion de c: ϕ∗(c)

2.15. Variedades Diferenciales.

Definicion 0.17. .Variedad real de dimension n: (Mn, τMN )Carta sobre Mn: cα = (Uα, ψα, Vα)Dominio de la carta: UαSistema de coordenadas sobre Uα: (Uα, ψα)Parametrizacion de Uα:

(ψ−1α , Vα

)

Imagen de la carta cα: Vα = ψα (Uα)i-esima funcion coordenada sobre ℜn: rii-esima funcion coordenada del sistema de coordenadas xiα := ri ψαFunciones de transicion: ψαβ := ψβ ψ−1

α

Funciones suaves sobre Mn: C∞ (Mn,ℜ)Funciones suaves en la vecindad de x: C∞ (Mn, x,ℜ)Imagen recıproca o “Full-back” de F : F ∗

Variedades difeomorficas: Mmdif∼= Nn

Espacio tangente en x: TxMn

Vector en TxMn: ∂

∂xi

∣∣x

tal que ∂∂xi

∣∣x

(f) := ∂∂ri

(f ψ−1

)∣∣ψ(x)

Base coordenada de TxMn:

∂∂xi

∣∣x

i=1,··· ,n

2.16. 1-Formas.

Definicion 0.18. .La diferencial de F en x: dFx = Fx∗Espacio cotangente en x: T ∗

xMn

Campos vectoriales en Mn: TMn

1-formas en Mn: T ∗Mn

Producto o parentesis de Lie: [X,Y ]ϕ-relacionados: dϕx(Xx) = Yϕ(x)

X ϕ-invariante o invariante bajo ϕ : X ϕ∗ = ϕ∗ X , o dϕx(Xx) = Xϕ(x)

Imagen reciproca o “pull-back”: F ∗y

Page 13: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

Part 1

PRELIMINARES

Page 14: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. Conjuntos

Toda construccion matematica inicia con elementos basicos fundamentales, ax-iomas y postulados que se aceptan de antemano. Estos elementos son la base detoda la estructura matematica que vamos a construir aquı. Para nosotros, la basede nuestra construccion van a ser los conjuntos y suponemos que el lector estafamiliarizado con los conceptos basicos de la teorıa de conjuntos. Sin embargo,para especificar la notacion que usaremos a lo largo del libro, vamos a recordaralgunos conceptos basicos, sin detenernos mucho en ellos. Nombramos, por lo gen-eral, conjuntos mediante letras mayusculas y elementos mediante letras minusculas.Recordamos que si A y B son conjuntos, entonces:

* a ∈ A denota que el elemento a pertenece al conjunto A;* a 6∈ A denota que el elemento a no pertenece al conjunto A;* El conjunto A ∪B = a | a ∈ A o a ∈ B es la union de A y B;* El conjunto A ∩B = a | a ∈ A y a ∈ B es la interseccion de A y B;* φ denota el conjunto vacio, el conjunto que no tiene ningun elemento;* A ⊂ B, al igual que A j B, denotan que el conjunto A es subconjunto del

conjunto B, lo cual significa que para cualquier elemento x ∈ A implica que x ∈ B;* A ⊂ B puede tambien denotar que A j B, con A 6= B, es decir, A es un

subconjunto propio de B;* A y B son iguales, A = B, siempre cuando A ⊂ B y B ⊂ A;* Sea E el conjunto que denota el conjunto universo, es decir, el conjunto

de todos los elementos existentes (o de interes). Entonces, para cualquier conjuntoA (siendo entonces un subconjunto de E), Ac = x ∈ E | x 6∈ A es el conjuntocomplementario (o conjunto complemento) de A;

* El conjunto A \B = x ∈ A | x 6∈ B es el conjunto diferencia entre A yB.

* El conjunto P(A) = B | B ⊂ A es el conjnto de todos los subconjuntosde A, y se le llama el conjunto potencia de A.

Cuando se trabaja con conjuntos es siempre muy util la representacion de losconjuntos mediante los Diagramas de Venn, vean por ejemplo la figura 1. Cadaconjunto se representa por una figura en el plano, por ejemplo un cırculo o unaelipse, entendiendo que los elementos del conjunto quedan representados por puntospertenecientes a la figura. Por ejemplo, el caso de dos conjuntos que se intersectanse refleja entonces por el hecho de que las figuras correspondientes tienen puntos encomun. A continuacion vamos a resumir algunas de las reglas fundamentales paratrabajar con conjuntos.

Proposicion 0.19. Sean E un conjunto universo, y A, B, C subconjuntos deE. Entonces vale lo siguiente:

1) Ec = φ, φc = E,2) (Ac)c = A,3) A ∪Ac = E, A ∩Ac = φ,4) A ∩A = A, A ∪A = A,5) A ∪ E = E, A ∩ E = A,6) A ∪ φ = A, A ∩ φ = φ,7) A ∩B = B ∩A, A ∪B = B ∪A,8) (A ∪B)c = Ac ∩Bc,9) (A ∩B)c = Ac ∪Bc.10) A ∪ (B ∩A) = A, A ∩ (B ∪A) = A.

Page 15: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. CONJUNTOS 3

Figure 1. Diagramas de Venn para la union A⋃B, la inter-

seccion A⋂B, el complemento Ac y la resta de conjuntos A \ B.

Estos diagramas son muy utilizados para explicar graficamente laspropiedades de conjuntos.

11) Si A ∪B = E y A ∩B = φ , entonces A = Bc y B = Ac.12) (A \B) ∩ C = (A ∩ C) \ (B ∩ C).

Todas estas propiedades establecen igualdades entre conjuntos. Las propiedades8) y 9) son llamadas las Reglas de Morgan. Por lo general hay diferentes formasde proceder para demuestran proposiciones con conjuntos. Por ejemplo, si M y Nson conjuntos, para demostrar que M = N , tenemos dos posibilidades:

1. Demostrar que M y N tienen exactamente los mismos elementos, es decir,mostrar que x ∈M sı y solo sı x ∈ N ;

2. O, usando el hecho que M = N sı y solo sı A ⊂ B y B ⊂ A, hacer lademostracion en dos pasos: Primero se muestra que x ∈ M implica que x ∈ N , ydespues se muestra que x ∈ N implica que x ∈M .

Ejemplo 0.20. Demostremos, por ejemplo, la regla de Morgan (A ∪ B)c =

Ac ∩Bc:Sea x ∈ (A ∪ B)c. Eso significa que x 6∈ (A ∪ B), ası que, es falso el hecho

que x ∈ A o x ∈ B. Por lo tanto, x 6∈ A y x 6∈ B, es decir, x ∈ Ac ∩ Bc,lo cual demuestra que (A ∪ B)c ⊂ Ac ∩ Bc. Para mostrar la inclusion contraria,Ac ∩Bc ⊂ (A ∪B)c, tomemos un elemento x ∈ Ac ∩Bc, eso significa que x 6∈ A ya la vez x 6∈ B, lo cual implica que x 6∈ A ∪B, ası que, x ∈ (A ∪B)c, completandola demostracion.

Ejercicio 0.21. Demuestre, con todo detalle, la proposicion 0.19.

Page 16: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4

4. Mapeos

Los mapeos son la estructura matematica que asocia elementos entre conjuntos.Vamos a definir los mapeos porque los vamos a utilizar intensivamente durante todoel texto y porque el concepto del mapeo es fundamental en matematicas. En laliteratura se usan como conceptos sinonimos al de mapeo tambien aplicacion ofuncion. La definicion de mapeo es la siguiente:

Definicion 0.22. Sean E y F conjuntos. Un mapeo o funcion f de E en F(denotado por f : E → F ),asocia a cada elemento de E, un unico elemento de F .Vean la figura 2.

Figure 2. Representacion grafica de un mapeo. Este mapeo vadel conjunto E al conjunto F y asocia a cada elemento de E ununico elemento de F . Si salieran dos flechas de E o algun elementode E no tuviera flecha, entonces f no serıa mapeo.

Notacion 0.23. f tambien se puede ver como un conjunto de pares ordenados(a, b), donde a ∈ E y b ∈ F , o como el subconjunto f = (a, b) | a ∈ E y b ∈ Fque cumple siempre que cuando (a, b) ∈ f y (a, b′) ∈ f se sigue que b = b′. Comoes bien sabido, en lugar de (a, b) ∈ f se usa tambien la notacion f(a) = b.

Ejemplo 0.24. Sea f : ℜ → ℜ tal que para cada x ∈ ℜ se asocie x → x2, esdecir, la funcion sera, a cada numero real le asociamos su cuadrado, tenemos lafuncion f(x) = x2. Sin embargo, la asociacion contraria f : ℜ+→ ℜ tal que paracada x ∈ ℜ se asocie su raız cuadrada f(x) =

√x, no es un mapeo, ya que a cada

numero real le estamos asociando dos numeros (ya no es unico), la raız positivay la raız negativa. Para que f sea mapeo hay que especificar cual raız es la queasociamos, por ejemplo: f(x) = +

√x.

Definicion 0.25. Sea f : E → F una funcion.· El conjunto Df = x ∈ E | existe y ∈ F tal que y = f(x) se llama el

dominio de definicion de f o simplemente dominio de f .· El conjunto Vf = y ∈ F | existe x ∈ E con f(x) = y se llama el dominio

de valores de f o simplemente codominio de f .

Page 17: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. MAPEOS 5

Ejemplo 0.26. Para el mapeo f(x) = x2, el dominio es el conjunto de losnumeros reales y el codominio es el conjunto de los numeros reales positivos unionel cero.

Ejemplo 0.27. Para el mapeo f(x) = +√x (asignacion del resultado positivo

solamante), el dominio y el codominio son los numeros reales no negativos.

Definicion 0.28. Una funcion f : E → F se llama· suryectiva o sobre si Vf = F , esto es, si para todo y ∈ F existe x tal que

f(x) = y;· inyectiva o 1-1 si para todo x, y ∈ Df vale que f(x) = f(y) implica x = y;· biyectiva si f es 1-1 y sobre.

Para los ejemplos que siguen vamos a necesitar la siguiente notaci’on.

Notacion 0.29. Al conjunto de los reales positivos lo denotamos como ℜ+ =x ∈ ℜ : x > 0 y al de los reales negativos como ℜ− = x ∈ ℜ : x < 0.

Ejemplo 0.30. La funcion f : ℜ→ ℜ+ tal que f(x) = x2 es sobre, pues, paratodo x ∈ ℜ+, su raiz cuadrada es un numero real cuyo cuadrado es igual a x. Sinembargo, la funcion f : ℜ→ ℜ tal que f(x) = x2 no es sobre, pues, para todox ∈ ℜ−, no existe un numero real cuyo cuadrado es igual a x < 0. Este mapeo noes 1-1, ya que por ejemplo f(2) = f(−2).

Ejemplo 0.31. La funcion f : ℜ+→ ℜ, x → x2 (f(x) = x2, con x ∈ ℜ+) esuna funcion cuyo dominio de definicion es ℜ+, su dominio de valores tambien esℜ+. Analogamente, la funcion f : ℜ+→ ℜ+ es 1-1 y sobre, ası que es una biyeccion.

Existe una serie de operaciones muy importantes entre funciones. Como ver-emos mas adelante, estas operaciones en algunos casos tienen estructuras, ya seaalgebraica o topologica, que hacen muy rico el trabajo matematico con mapeos.A continuacion repasamos algunas operaciones con funciones, las cuales son deimportancia en el trabajo matematico con ellas.

a) Restriccion de mapeos

Definicion 0.32. Si f : A→ B y g : A→ B son mapeos, entonces g se llamala restriccion de f si Dg ⊂ Df y g(x) = f(x) para toda x ∈ Dg.

b) Composicion de mapeos

Definicion 0.33. Sean f : E F y g : F G mapeos tales que Vf ⊆ Dg. Elmapeo (g f) : E G. definido por (g f)(x) = g(f(x)) para x ∈ Df , se llama lacomposicion o la concatenacion de f y g. Ver figura 3.

Observen que la concatenacion es una operacion asociativa entre mapeos, esdecir, para mapeos g, f, h, (g f)h = g (f h). Es claro que la misma operacion,en general, no es conmutativa, veamos un ejemplo:

Ejemplo 0.34. Sean f y g funciones reales (es decir, de los reales a los reales)tales que f(x) = x+ 1 y g(x) = x2. Entonces f g(x) = f(g(x)) = f(x2) = x2 + 1.Por otro lado g f(x) = g(f(x)) = g(x+ 1) = (x+ 1)2, que es claramente diferentea x2 + 1. Es decir, f y g no conmutan con la operacion

Otra operacion de mucha importancia entre funciones biyectivas es el mapeoinverso. Hay que tomar en cuenta que esta operacion solo vale entre funcionesbiyectivas y no en general. Veamos su definicion:

c) Mapeo inverso

Page 18: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

6

Figure 3. Composicion de funciones. Aquı se ve la composicionde la funcion f con g, o sea g(f(a)). El elemento a de E es mapeadoal elemento g(f(a)) de G, pasando por F .

Definicion 0.35. Sea f : E → F un mapeo 1-1 y sobre. Un mapeo f−1 :F E definido por f−1(y) = x sı y solo sı f(x) = y, con y ∈ Vf y x ∈ Df , sellama mapeo inverso de f . Ver figura 4.

Figure 4. El mapeo inverso mapea un elemento f(a) de F , enun elemento a de E, tal que si f(a) = b, se tiene que f−1(b) = a.Para que f este bien definida, la funcion tiene que ser biyectiva.

Observemos que si f−1 es el mapeo inverso de f , entonces Df−1 = Vf y Vf−1 =Df .

Notacion 0.36. Una funcion con inversa tambien se llama invertible o nosingular.

Ejemplo 0.37. La funcion f : ℜ → ℜ, con f(x) = x2 no tiene inverso, porqueel mapeo f−1(x2) tiene asociados dos elementos, x y −x, por lo que f−1 no esfuncion (f no es 1-1). Sin embargo, la funcion f : ℜ+→ ℜ+ con f(x) = x2 tienecomo inverso a f−1(x) = +

√x.

Page 19: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. MAPEOS 7

Ejercicio 0.38. Sean f : E → F y g : F → G mapeos invertibles tales queVf ⊆ Dg. Demuestre que entonces el mapeo g f es un mapeo 1-1 de E en G , y(g f)−1 = f−1 g−1.

d) Imagen de un conjunto bajo una funcionAhora vamos a definir la forma en que no solo un elemento, sino todo un

conjunto de elementos puede ser proyectado o mapeado por una funcion. Primerovamos a definir la forma directa, es decir, como se mapea un conjunto del dominioal codominio. La definicion es la siguiente:

Definicion 0.39. Sea f = E F una funcion y X ⊆ Df . El conjuntof(X) = f(x) | x ∈ X se llama la imagen del conjunto X bajo f.

Es claro que f(X) = y ∈ F | existe x ∈ X tal que f(x) = y, ası que,la imagen del conjunto X bajo f es un subconjunto del codominio de la funcion.Si el codominio de la funcion coincide con la imagen de su dominio de definicion,entonces la funcion es sobre.

e) Imagen inversa de un conjunto bajo una funcionDe la misma forma ahora podemos ver cual es el conjunto correspondiente en

el dominio, de un conjunto del codominio. A este conjunto se le llama la imageninversa y es importante senalar que la imagen inversa existe independientementede que la funcion tenga o no inversa. Formalmente la definicion es:

Definicion 0.40. Sea f : E F una funcion y Y ⊂ F. El conjunto f−1(Y ) =x ∈ Df | f(x) ∈ Y se llama la imagen inversa del conjunto Y bajo f .

Observen que la imagen inversa se define para funciones sin exigir que estassean 1-1, ası que, la definicion de la imagen inversa, de entrada, no necesariamenteesta relacionada con la definicion del mapeo inverso. La imagen inversa existesin importar si la funcion tiene o no inversa. A continuacion se resumen algunaspropiedades importantes de la imagen y de la imagen inversa de conjuntos.

Lema 0.41. Sea f : E F una funcion, X1 y X2 subconjuntos de Df , y Y1

y Y2 subconjuntos de F . Entonces:1) f(X1 ∪X2) = f(X1) ∪ f(X2)2) f(X1 ∩X2) j f(X1) ∩ f(X2)3) f−1(Y1 ∪ Y2) = f−1(Y1) ∪ f−1(Y2)4) f−1(Y1 ∩ Y2) = f−1(Y1) ∩ f−1(Y2)

En la segunda propiedad, en general vale solamente la desigualdad, como mues-tra el siguiente ejemplo:

Ejemplo 0.42. Considerese los conjuntos X = a, b, c, d, Y = d, e, h, g,M = l,m, n, o , y un mapeo f : X ∪ Y M dado por

f = (a, l), (b, l), (c,m), (d, l), (e, n), (h,m), (g, o).Tenemos f(X) = l,m , f(Y ) = M , ası que f(X) ∩ f(Y ) = l,m, pero

f(X ∩ Y ) = f(d) = l lo cual es un subconjunto propio de l,m.Ejercicio 0.43. Demuestre, con todo detalle, las propiedades del lema 0.41.

Ejercicio 0.44. Sea f : A → B tal que x → f(x) = 1/x. Diga si f es mapeopara

1) A = ℜ, B = ℜ, donde ℜ son los numeros reales.2) A = ℜ\0, B = ℜ,

Page 20: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

8

3) A = ℜ, B = ℜ\0,4) A = ℜ\0, B = ℜ\0,5) A = ℜ, B = ℜ ∪ zapato,6) A = ℜ, B = S1, donde S1 es el cırculo.

5. Producto Cartesiano y Relaciones

En esta seccion vamos a estudiar el producto cartesiano entre dos o mas conjun-tos. Este concepto es importante porque es la base para definir dimension, espaciosvectoriales, etc. Con este concepto tambien vamos a definir relacion y relacion deequivalencia, la cual sera usada multiples veces en lo que sigue e incluso, se puededar una definicion alternativa de funicion. Entonces la definicion de producto carte-siano es como sigue:

Definicion 0.45. Si E1, E2, ..., En son conjuntos, entonces el producto carte-siano n-esimo de estos conjuntos se define como el conjunto de todas las n-uplas(ordenadas) (e1, e2, ..., en) donde para cada i ∈ 1, ..., n, ei es un elemento delconjunto Ei, es decir:

E1 × E2 × ...× En = (e1, e2, ..., en) | e1 ∈ E1, . . . , ei ∈ Ei, . . . , en ∈ EnEjemplo 0.46. El producto cartesiano de dos conjuntos A y B, es el conjunto

de pares ordenados de elementos de A y B:

A×B = (a, b) | a ∈ A, b ∈ B,Alternativamente, un mapeo puede entenderse tambien como un producto

cartesiano de dos conjuntos desde las primeras entradas representan el dominionde la funcion y la segunda entrada el codominio. Un caso especial del productocartesiano es cuando todos los conjuntos son iguales, E = E1 = E2 = · · · = En.Entonces, el producto cartesiano E × E × · · · × E se denota por En, y se nombrala potencia n-esima del conjunto E : En = (e1, e2, ..., en) | ei ∈ E.

Ejemplo 0.47. El Espacio Vectorial Euclidiano ℜn es un ejemplo bien conocidode la potencia de un conjunto, ℜn = ℜ× · · · × ℜ = (a1, . . . , an) | ai ∈ ℜ para todoi ∈ 1, . . . , n. En particular, tenemos el Plano Euclidiano ℜ2 = ℜ×ℜ = (a, b) |a, b ∈ ℜ.

Partiendo ahora del concepto de producto cartesiano podemos definir el im-portante concepto de relacion, el cual es basico para el algebra. Una relacion esbasicamente un subconjunto del producto cartesiano, formalmente se define como:

Definicion 0.48. Sean E1, . . . , En, conjuntos y E = E1 × E2 × · · · × En elconjunto cartesiano de estos. Una relacion sobre E es un subconjunto de E.En particular, si todos los conjuntos E son los mismos, para un conjunto E =E×E×...×E, cualquier subconjunto de la potencia n-esima de E se llama relacionn-aria sobre E. Ver figura 5.

El caso mas importante es el caso n = 2, la relacion se llama entonces relacionbinaria sobre E. Si denotamos la relacion por R, entonces R ⊂ E ×E, ası que Res un conjunto de pares ordenadas (a, b) con a, b ∈ E. En lugar de (a, b) ∈ R seusa tambien la notacion aRb o, se usa un sımbolo apropiado, por ejemplo a ∼ b oa ≤ b o a ‖ b o a ≡ b.

Page 21: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. PRODUCTO CARTESIANO Y RELACIONES 9

Figure 5. Una relacion es representada aquı de dos formas.La relacion representada es una relacion entre numeros que estadada por (0,2), (1,1), (2,0), (2,2), (3,4), (6, 6), (7,6), (7,8), (7,9).Observese que a diferencia de los mapeos, una relacion es muygeneral y no guarda reglas especiales.

Notacion 0.49. En lo que sigue vamos a denotar una relacion indistintamentecomo R o ∼. Ası, a esta relacionado con b, se denota como aRb o a ∼ b.

Ejemplo 0.50. Tomemos el conjunto R de los reales y sean a, b ∈ R. Decimosque a y b estan relacionados a ∼ b si a es menor que b. En vez de a ∼ b escribimosa < b y a ∼ lo denotamos por <.

Por otro lado, existe una clasificacion de las relaciones dada por sus propiedades.Esta clasificacion es:

Definicion 0.51. Una relacion binaria R sobre un conjunto E se llama· reflexiva si (x, x) ∈ R , para todo x ∈ E;· antireflexiva si no existe x ∈ E tal que (x, x) ∈ R ;· simetrica si, para x, y ∈ E, (x, y) ∈ R implica (y, x) ∈ R ;· antisimetrica si, para x, y ∈ E, cuando (x, y) ∈ R y (y, x) ∈ R entonces

se sigue x = y ;· transitiva si, para x, y, z ∈ E, cuando (x, y) ∈ R y (y, z) ∈ R entonces se

sigue (x, z) ∈ R ;· relacion de equivalencia si es reflexiva, simetrica y transitiva.

Ejemplo 0.52. La relacion en R dada por <, no es reflexiva, ya que un numerono puede ser menor a si mismo, esto es, < es antireflexiva. Tampoco es simetrica,ya que si a < b, se sigue que b no puede ser menor que a. < no puede ser anti-simetrica porque no es antireflexiva, pero ≤ si es antisimetrica. < y ≤ son transi-tivas.

Page 22: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

10

Las relaciones de equivalencia tienen una gran importancia, debido a que danlugar a una descomposicion del conjunto en donde se definen en clases. Esta descom-posicion separa los conjuntos en subconjuntos disjuntos dando ası una clasificacionnatural del conjunto con esta propiedad. Es por eso que las clases de equivalenciason muy importantes en matematicas. Por ejemplo, esta descomposicion es la basede la construccion de estructuras cocientes. Veamos esto en la siguiente definicion.

Definicion 0.53. Sea ∼ una relacion de equivalencia sobre E. Para x ∈ E, laclase de equivalencia de x se define como [x] = y ∈ E | x ∼ y. El conjunto Ede todas las clases de equivalencia se llama el conjunto cociente de E, el cual sedenota tambien por E/ ∼, vean la figura 6:

Figure 6. Una relacion de equivalencia separa los conjuntos ensubconjuntos disjuntos, solo relacionados por la relacion de equiv-alencia. Es una manera de clasificar conjuntos en sus partes.

E = E/ ∼= [x] | x ∈ E = y ∈ E | y ∼ x | x ∈ EDebido a la reflexividad de una relacion de equivalencia ∼ sobre E, la clase

[x] es un conjunto no vacıo pues contiene a x. Es evidente que toda clase [x] esun subconjunto de E. Por lo tanto, la union de todas las clases de equivalenciaes igual al conjunto E. Aplicando la simetrıa de ∼, es claro que, para x, y ∈ E,x ∼ y implica que tanto x ∈ [y] como tambien y ∈ [x]. Tomando en cuenta ademasla transitividad de la relacion, es facil deducir que [x] = [y] sı y solo sı x ∼ y.Observese tambien que clases distintas de equivalencia son disjuntas entre sı, enresumen podemos escribir esto en el siguente lema.

Lema 0.54. Si ∼ es una relacion de equivalencia sobre E, y [x] es la clase deequivalencia de x, para x ∈ E, entonces

a) x ∈ [x];b) x ∼ y sı y solo sı [x] = [y] , para x, y ∈ E;c) si [x] 6= [y] entonces [x] ∩ [y] = φ, para x, y ∈ E.

Page 23: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

6. OPERACIONES 11

Como consecuencia de estas propiedades, el conjunto cociente E/ ∼ es unadescomposicion del conjunto E, es decir, E/ ∼= [x] | x ∈ E es un conjunto desubconjuntos de E, los cuales son disjuntos por parejas y cuya union es igual a E.

Ejercicio 0.55. Demuestra con detalle el lema 0.54.

Ejemplo 0.56. Sea x, y ∈ Z , el conjunto de los numeros enteros, y sea ∼5

la relacion dada por x ∼5 y si x/5 y y/5 tienen el mismo residuo, formalmentesi existen representaciones x = k · 5 − r , y = l · 5 − r, con numeros enterosk y l ( r es el residuo). Tenemos por ejemplo 0 ∼5 5 ∼5 10 ∼5 20 ∼5 −15;3 ∼5 13 ∼5 −2 ∼5 23 ∼5 588. Es facil ver que ∼5 es una relacion de equivalencia.Entonces, cada clase de equivalencia de esta relacion tiene una forma [r] = x | x/5deja el residuo r, lo cual es el conjunto de todos los numeros enteros representablescomo k·5r, para algun numero entero apropiado k. Resulta que solamente hay cincoclases de equivalencia, dadas por [0], [1], [2], [3], [4]. En particular, la clase [0] es elconjunto de todos los numeros enteros que son multiples de 5.

6. Operaciones

El algebra abstracta se basa en propiedades de operaciones entre los elementosde un conjunto. Por eso, aquı repasamos y formalizamos conceptos elementalesrelacionados con operaciones.

Definicion 0.57. Sea E un conjunto. Una operacion (binaria) sobre E esun mapeo ϕ : E × E E, con Dϕ = E × E.

Notacion 0.58. Para denotar una operacion, usualmente se usa un sımboloapropiado, por ejemplo +,×, ·, −.

Las operaciones son clasificadas segun sus propiedades. Estas propiedades sonfundamentales y definen muchas veces a la operacion misma. Segun las propiedadesde las operaciones se van a definir las estructuras algebraicas. Estas propiedadesson:

Definicion 0.59. Una operacion ϕ se llama· Asociativa si ϕ(ϕ(a, b), c) = ϕ(a, ϕ(b, c)), a, b, c ∈ E· Conmutativa si ϕ(a, b) = ϕ(b, a) a, b ∈ E· Con elemento neutro si existe e ∈ E tal que ϕ(a, e) = ϕ(e, a) = a para

toda a ∈ E· Invertible por la izquierda si para todo b, c ∈ E, existe a ∈ E tal que

ϕ(a, b) = c· Invertible por la derecha si para todo b, c ∈ E, existe a ∈ E tal que

ϕ(b, a) = c

Ejemplo 0.60. Tomemos de nuevo los numeros reales ℜ. La operacion + :ℜ× ℜ → ℜ, con +(a, b) = a+ b, es tal que para todo a, b, c ∈ ℜ, se tiene que +:· Es Asociativa ya que +(+(a, b), c) = +(a+ b, c) = (a+ b) + c = a+ (b+ c) =

ϕ(a, ϕ(b, c)), a, b, c ∈ E· Es Conmutativa ya que +(a, b) = +(b, a)· Existe 0, elemento neutro tal que +(a, 0) = +(0, a) = a· Es Invertible por la izquierda y por la izquierda ya que existe siempre un

numero tal que +(a, b) = +(b, a) = c

Page 24: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

12

Comentario 0.61. .a) Cada operacion binaria, tiene maximalmente un elemento neutro. Para

demostrar esto, supongamos que ϕ tiene dos elementos neutros e1 y e2. Entoncesϕ(e1, e2) = e1 y ϕ(e2, e1) = e2, pero debido a que e1 y e2 son neutros, se obtienee1 = e2.

b) Otra manera de entender que significa que ϕ es invertible por la izquierdaes la siguiente. Sean b, c ∈ E y consideremos a x como una incognita. Entonces ϕes invertible por la izquierda si la ecuacion ϕ(x, b) = c siempre se puede resolver.En particular esto sucede para el caso especial c = e (para el neutro de ϕ), ası quepara cualquier b ∈ E, existe a ∈ E tal que ϕ(a, b) = e. Al elemento a se le llama elelemento inverso izquierdo de b.

c) Analogamente, ϕ es invertible por la derecha significa que la ecuacion ϕ(b, x) =c, con b, c ∈ E para una incognita x, siempre se puede resolver. O sea, existe a ∈ Etal que ϕ(b, a) = e. A este elemento a se le llama el elemento inverso derecho de b.

Si la operacion es invertible (por la izquierda en este caso), implica que existex = b−1 que cumple con esta identidad. b−1 es la expresion que se acostumbra paradenotar el inverso de b.

7. El Conjunto Ordenado ℜEn esta seccion veremos a los numeros reales como un conjunto ordenado, el

orden en estos numeros es de suma importancia, por eso que les dedicamos unaseccion especial. Los numeros reales son conjuntos ordenados y las operaciones enℜ se “portan bien” con respecto al orden. Para comenzar, daremos la definicion deque significa ordenado. Es un concepto que utilizamos mucho, pero necesita unadefinicion formal. Veamos esto:

Definicion 0.62. Si A es un conjunto y ≤ es una relacion binaria, reflexiva,antisimetrica y transitiva sobre A, entonces ≤ se llama orden parcial sobre A, y(A,≤) se llama conjunto parcialmente ordenado.

Como vemos, esta definicion se puede aplicar a cualquier conjunto no necesari-amente de numeros, el orden parcial es un concepto muy general. En los numerosnaturales, enteros, racionales, y reales, con su orden parcial ≤ en ℜ definido porx ≤ y sı y solo sı existe k ∈ ℜ, k ≥ 0 tal que x + k = y, todos los numeros estanralacionados entre si, es decir, para cualesquiera dos numeros x, y , o vale x ≤ y obien y ≤ x.

Definicion 0.63. Un orden parcial sobre A se llama orden (lineal) si paratodo a, b ∈ A se sigue a ≤ b o b ≤ a.

Notacion 0.64. Para efectuar calculos en (ℜ,+, ·,≤), usaremos la notacion:x < y sı y solo sı x ≤ y y x 6= y.

Comentario 0.65. Obsevemos que ℜ+ ∪ ℜ− ∪ 0 es una descomposicion deℜ.

Comentario 0.66. N ⊂ ℜ+ y ℜ+ es cerrado bajo las dos operaciones de(ℜ,+, ·).

Lema 0.67. Para todo a, b, c ∈ ℜ, a ≤ b implica a+ c ≤ b+ c , y a ≤ b y c ≥ 0implica que a ·c ≤ b ·c. (“Monotonıa” de + y ·; por eso (ℜ,+, ·,≤) se llama campoordenado.)

Page 25: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

7. EL CONJUNTO ORDENADO ℜ 13

Ejercicio 0.68. Demostrar el lema anterior.

Ejercicio 0.69. Demostrar para a, b, c ∈ ℜ:a) a ≤ b, c ≤ d implica a+ c ≤ b+ d (adicion de desigualdades);b) 0 ≤ a ≤ b, 0 ≤ c ≤ d implica a · c ≤ b · d (multiplicacion de desigualdades);c) a ≤ b implica −a ≥ −b;d) a 6= 0 implica a2 > 0.

Aplicando estas sencillas leyes de calculo y el principio de induccion completa,se pueden demostrar muchas formulas que valen para los numeros naturales oreales. Vamos a ver un ejemplo representativo para recordar el uso de la induccionmatematica.

Ejemplo 0.70. Demostramos que, para todo numero natural n vale

(0.1)

n∑

i=1

= 1 + 2 + 3 + · · ·+ n = 1/2 · n · (n+ 1).

Vamos a demostrarlo por induccion matematica.Primer paso: demostramos que la formula es verdad para n = 1 (inicio de la

induccion): Pues claro,∑1

i=1 = 1, y por el otro lado 1/2 · 1 · 2 = 1, 1 = 1.Segundo paso: Suponemos que la formula es verdadera para n = k (hipotesis

de induccion) y asumimos ahora n = k + 1. Hay que demostrar que la formulaes verdad para este n (demostracion de la induccion), aplicando la hipotesis deinduccion.

Entonces tenemos la hipotesis∑k

i=1 i = 1/2 · k · (k + 1), y

k+1∑

i=1

i =

k∑

i=1

i+ (k + 1) por la hipotesis

= 1/2 · k · (k + 1) + (k + 1)

= (k + 1)(1

2k + 1) =

1

2(k + 1)(k + 2),

lo cual completa la demostracion.

Ejercicio 0.71. Demostrar por induccion que:a) para todo n ∈ N y x ∈ ℜ, x > −1, (1 + x)n ≥ 1 + nx ( desigualdad de

Bernoulli);b) para todo n ∈ N y x, a ∈ ℜ, 0 ≤ a ≤ 1, (1 + a)n ≤ 1 + (2n − 1)a.

En un conjunto ordenado es posible definir un elemento que es mayor a todos oun elemento que es menor a todos. Estos conceptos son los que definen el maximoy el mınimo. Su definicion formal es:

Definicion 0.72. Sea a ∈ A, A ⊂ (ℜ,≤). Se define el mınimo y el maximode A como

a = minA sı y solo sı a ≤ b para todo b ∈ A,a = maxA sı y solo sı b ≤ a para todo b ∈ A.

Lema 0.73. Para cualquier A ⊂ ℜ, si minA [maxA] existe, entonces es unico.

Demostracion 0.74. Suponemos a = minA, y que existe a′ ∈ A tal quea′ = minA. Entonces a ≤ b para toda b ∈ A y a′ ≤ b para toda b ∈ A, en particulara, a′ ∈ A, ası que a ≤ a′ y a′ ≤ a, lo cual implica por la antisimetrıa de ≤ quea = a′.

Page 26: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

14

Notacion 0.75. Recordamos la notacion de intervalos en ℜ: si a, b ∈ ℜ, en-tonces

[a, b] = x ∈ ℜ | a ≤ x ≤ b,(a, b) = x ∈ ℜ | a < x < b,[a, b) = x ∈ ℜ | a ≤ x < b,(a, b] = x ∈ ℜ | a < x ≤ b.Ademas se define usualmente[a,∞) = x ∈ ℜ | a ≤ x,(a,∞) = x ∈ ℜ | a < x,(−∞, b) = x ∈ ℜ | x < b,(−∞, b] = x ∈ ℜ | x ≤ b.Notemos que ∞ es un sımbolo que en este caso significa muy grande, mas

grande de lo que yo necesito, mas grande de lo que yo quiero, tan grande como seanecesario. Pero ∞ es solo eso, un sımbolo, no es un numero que pertenezca a losreales.

Ejercicio 0.76. Determinar (si existen) los mınimos y maximos de los seguientessubconjuntos de ℜ:

M1 = [−230, 500),M2 = M1 ∩ Z,M3 = (−∞, 0] ∪ [3, 4] ∪ (45, 2000],

M4 = (0,√

2] ∩ Z,

M5 = [0,√

2) ∩ Z,

M6 = [0,√

2] ∩ Z,

M7 = (0,√

2) ∩ Z,M8 = [−1,∞).

Otros conceptos importantes en un conjunto ordenado son el de cota supe-rior y el de cota inferior. Estos conceptos estan intimamente relacionados con losanteriores de maximo y mınimo. Su definicion formal es:

Definicion 0.77. Sea S ⊂ ℜ, S 6= φ y x ∈ ℜ.x se llama cota superior de S si y ≤ x par toda y ∈ S.x se llama cota inferior de S si y ≥ x para toda y ∈ S.S se llama acotado por arriba [por abajo] si S tiene cota superior [inferior].S se llama acotado si S tiene cota inferior y cota superior.

Notacion 0.78. Denotamos OS = x ∈ ℜ | x es cota superior de S, US =x ∈ ℜ | x es cota inferior de S.

Resumen 0.79. De una forma analoga a la definicion de cota superior y cotainferior, tambien podemos definir, supremo e ınfimo del conjunto S, y denotarloscomo supS y inf S, los cuales se definen como:

x = supS sı y solo sı x ∈ ℜ tal que y ≤ x para toda y ∈ S, y ademas, paratodo z ∈ OS (es decir, z ∈ ℜ tal que s ≤ z para toda s ∈ S) se sigue x ≤ z.

x = inf S sı y solo sı x ∈ ℜ tal que y ≥ x para toda y ∈ S, y ademas, para todoz ∈ US (es decir, z ∈ ℜ tal que s ≥ z para toda s ∈ S) se sigue x ≥ z.

Comentario 0.80. Algunas observaciones sobre este tema nos ayudaran aordenar conceptos:

- Cotas superiores e inferiores pueden no existir

Page 27: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

7. EL CONJUNTO ORDENADO ℜ 15

- Aunque supS y inf S existen, pueden no pertenecer a S- Si maxS [minS] existe, entonces existe supS [inf S] y supS = maxS ∈ S

[inf S = minS ∈ S].

Ejercicio 0.81. Investigar si los siguientes conjuntos tienen cotas superi-ores/inferiores, y si los tienen decir cuales son y determinar, si existen, supremose infimos:

C1 = [1,∞),C2 = (1,∞),C3 = 1

n | n ∈ N.Ejercicio 0.82. Demuestrar que, si S ⊂ ℜ y p es una cota superior de S tal

que p ∈ S, entonces p = supS.

Page 28: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 29: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

Part 2

ALGEBRA

Page 30: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 31: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 1

ESTRUCTURAS ALGEBRAICAS BASICAS

La primera parte de nuestro estudio esta dedicada a las estructuras algebraicas.En esta parte vamos a iniciar agregandole a los conjuntos operaciones. Primero una,luego dos y ası, varias operaciones. Cuando estas operaciones tienen determinadaspropiedades, estos conjuntos con operaciones definidas en el conjunto reciben difer-entes nombres. Vamos a iniciar con la estructura mas simple, un conjunto mas unaoperacion, llamada semigrupo. Como esta estructura es tan pobre, (pero impor-tante), la siguiente sera una estructura con una operacion, pero con inverso y unelemento especial, llamado identidad. A esta estructura se le llama grupo. De estaforma, los conjuntos se van enriqueciendo con operaciones formando estructruascada vez mas ricas e interesantes. Luego agregaremos dos, tres y mas operaciones,aunque aquı solo nos limitaremos a las estructuras mas conocidas y las mas usadasen las ciencias exactas y en la ingenierıa.

1. Grupos y Semigrupos

Los grupos han adquirido suma importancia en muchos campos de aplicacionde las matematicas. En fısica y quımica la estructura de grupo es fundamentaltanto para entender las simetrıas en teorıas de campo, en teorıas de partıculaselementales, como para resolver ecuaciones diferenciales no lineales. Los gruposson estructuras basicas de las matematicas. Vamos a iniciar con la definicion desemigrupo para a partir de esta definicion, dar la definicion de grupo.

Un grupo es un conjunto provisto de una operacion con ciertas propiedades,las cuales generalizan de forma abstracta operaciones que nos son familiares desdeninos para calcular con numeros. Antes de definir un grupo, consideramos entoncesun concepto todavıa mas simple, el de semigrupo:

Definicion 1.1. Un semigrupo es un conjunto E provisto de una operacionbinaria asociativa · sobre E, se donota por (E, ·).

El hecho que · es una operacion binaria sobre E significa que, siempre cuandoa, b ∈ A, entonces a · b ∈ A. Veamos unos ejemplos:

Ejemplo 1.2. Sea A = f : A A el conjunto de todos los mapeos delconjunto A en sı mismo, y consideramos la operacion de composicion (concate-nacion) entre mapeos, entonces (A, ) es un semigrupo. Observamos que (A, )ademas tiene un elemento especial: un elemento neutro, el mapeo identidad IAdefinido por IA(x) = x para todo x ∈ A, pues, definitivamente IA f = f IA paracualquier f ∈ A.

Notacion 1.3. Si un semigrupo E tiene un elemento identidad, es decir, sitiene un elemento e ∈ E tal que e · a = a para todo a ∈ E, el semigrupo se llamamonoide.

19

Page 32: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

20 1. ESTRUCTURAS ALGEBRAICAS BASICAS

Ejemplo 1.4. Sea A un conjunto arbitrario (por ejemplo, de ”letras y cifras”).Una secuencia finita de elementos de A la llamamos una palabra sobre A, es decir,una palabra tiene la forma (a1, a2, a3, ..., an), con n ≥ 1, n natural, ai ∈ A paratodo i. El numero n es llamado longitud de la palabra. Adicionalmente se considerala palabra vacıa, denotada por φ y definida como la secuencia de longitud cero (lacual no contiene ningun elemento). Entonces el conjunto de palabras sobre A estadado por E = (ai)ni=1, n ∈ N, ai ∈ A para toda i = 1, ..., n ∪ φ. Definimosahora la adicion de palabras como:

(a1, a2, a3, ..., ak) + (b1, b2, b3, ..., bl) = (a1, a2, a3, ..., ak, b1, b2, b3, ..., bl)

Es evidente que (E,+) es un semigrupo, llamado el semigrupo de las palabras, elcual tiene importancia basica en teorıas de la computacion. La adicion + aquidefinidida es claramente no conmutativa y tiene un elemento neutro: la palabravacıa.

Con esto ya estamos listos para la definicion de grupo.

Definicion 1.5. Un grupo (E, ·) es un semigrupo con elemento neutro y ele-mentos inversos, es decir:

1) (E, ·) es semigrupo2) Existe e ∈ E tal que e · a = a3) Para todo a ∈ E existe x ∈ E tal que x · a = e. A x se le denota por a−1.

Notacion 1.6. En caso de que la operacion · sea ademas conmutativa, (E, ·)se llama grupo Abeliano o grupo conmutativo.

Antes de considerar unos ejemplos de grupos, observamos los siguientes detallesy propiedades elementales:

Comentario 1.7. Sea E grupo y a ∈ E. Segun la definicion, existe x ∈ E talque x·a = e, es decir, x es un “inverso por la izquierda” de a. Pero x·a·x = e·x = x.Por otro lado, existe y ∈ E tal que y · x = e. Eso significa (y · x)a · x = y · x, enconsecuencia e · a · x = e, entonces a · x = e , es decir, x es a la vez ”inverso porla derecha” de a. El elemento x se llama inverso de a y se denota por a−1.

Comentario 1.8. En un grupo:* Para cada a ∈ E existe a−1 ∈ E tal que a−1 ·a = a ·a−1 = e, lo cual significa

que las ecuaciones x · a = e y a · x = e, con a ∈ E, x incognita, siempre se puedenresolver.

* Para cada a ∈ E, su inverso a−1 es determinado de manera unica.* El elemento neutro tambien es determinado de manera unica. Ademas, segun

la definicion, el neutro primero es un ”neutro por la izquierda”. Sin embargo, cone · a = a tenemos tambien a · e = a · (a−1 · a) = (a · a−1) · a = e · a = a, ası que, ees a la vez un neutro ”por la derecha”. En consecuencia:

* Para toda a ∈ E, se tiene que e · a = a · e = a.* Para a, b, c ∈ E, a · c = b · c implica que a = b, lo cual es facil de deducir.* Para a, b ∈ E, (a · b)−1 = b−1 · a−1 , puesto que (b−1 · a−1) · (a · b) =

b−1 · (a−1 · a) · b = e.

Ahora analizamos unos ejemplos :

Ejemplo 1.9. (Z,+) el conjunto de los numeros enteros con la suma ordinaria,es un grupo abeliano. Su neutro es el numero 0; para cada entero a, su inverso es

Page 33: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. HOMOMORFISMOS 21

el numero −a. Asimismo, los numeros racionales Q, los reales R, y los complejosC, cada uno con la suma ordinaria, son grupos abelianos.

Ejemplo 1.10. (Z, ·), el conjunto de los enteros con el producto ordinario, esun semigrupo conmutativo, cuyo neutro es el numero 1. Sin embargo, no es ungrupo, puesto que para cualquier entero a diferente de 1, su inverso multiplicativoserıa el numero a−1 = 1

a , el cual no es entero y el 0 no tiene inverso.

Ejemplo 1.11. El conjunto Q de los racionales, igualmente como el de losreales R y el de los complejos C, con el producto ordinario ·, son semigruposconmutativos con el neutro 1, pero no son grupos. Eso se debe a que el numero 0,el cual es el neutro aditivo, no tiene inverso multiplicativo, puesto que 1

0 no es unnumero. Por otro lado, es evidentemente que (Q \ 0, ·), (R \ 0, ·) y (C \ 0, ·)son grupos abelianos.

Ejemplo 1.12. Sea A un conjunto y F = f : A A, biyectiva, el conjuntode los mapeos biyectivos de A en sı mismo. Entonces (F , ) con la operacion dela composicion, es un grupo, en general este grupo no es abeliano. El neutro deeste grupo (su unidad) es el mapeo identico IA : A A definido por IA(x) = xpara toda x ∈ A. El elemento inverso para cada f ∈ F es el mapeo inverso f−1,cuya existencia esta asegurada para cualquier biyeccion. (F , ) se llama el grupode permutaciones del conjunto A, cada f ∈ F es llamado una permutacion de A.

Ejercicio 1.13. .1) Demuestre que Z2 = (1,−1, ·) es un grupo.2) Sea el conjunto A = a, b, c. Defina un producto + en A de tal forma que

(A,+) sea un grupo.3) ¿Se puede definir + de tal forma que (A,+) sea abeliano?

Ejercicio 1.14. Sea O(n) = O | O es matriz n × n con OT = O−1. De-muestre que este conjunto es un grupo con la multiplicacion de matrices.

Ejercicio 1.15. Sea el conjunto SU(2) = U | U es matriz 2 × 2 compleja

U =

(a bc d

), con d = a∗ y c = −b∗ , donde * significa complejo conjugado.

Demuestre que SU(2) es un grupo con el producto entre matrices. Observe quedetU = 1.

2. Homomorfismos

Las estructuras algebraicas suelen tener semejanzas entre ellas. Estas semejan-zas se representan en matematicas utilizando el concepto de mapeos muy epecialesllamados morfismo. Los morfismos nos sirven para relacionar conjuntos con estruc-turas entre sı, de tal forma que con estos morfismo, uno puede estudiar propiedadesde algun conjunto usando otro, en donde estas propiedades sean mas simples deentender. En esta seccion daremos solo la definicion de estos morfismos para grupos.

Definicion 1.16. Sean (E, ·) y (F, ·) grupos y f : E F . f se llama homo-morfismo si f(a · b) = f(a) · f(b) para toda a, b ∈ E

Un homomorfismo se llama· monomorfismo si f es mapeo 1− 1· epimorfismo si f es mapeo sobre· isomorfismo si f es biyectiva· automorfismo de E si f es isomofismo y f : E E.

Page 34: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

22 1. ESTRUCTURAS ALGEBRAICAS BASICAS

Ejemplo 1.17. Sea el conjunto Z2 = k0, k1 con el producto + definido pork0 + k0 = k0, k0 + k1 = k1, k1 + k0 = k1 y k1 + k1 = k0. Es facil ver que (Z2,+) esun grupo. Ahora tomemos la funcion f : Z2 → Z2, tal que f(k0) = 1 y f(k1) = −1.Entonces se tiene que

f(k0 + k0) = f(k0) = 1 = 1 · 1 = f(k0) · f(k0)

f(k0 + k1) = f(k1) = −1 = 1 · (−1) = f(k0) · f(k1)

f(k1 + k0) = f(k1) = −1 = (−1) · 1 = f(k1) · f(k0)

f(k1 + k1) = f(k0) = 1 = (−1) · (−1) = f(k1) · f(k1)

Por lo que f es un homomorfismo entre los grupos (Z2,+) y (Z2, ·). Ademas es unhomomorfismo 1-1, por lo que es un monomorfismo, y es sobre, entonces tambienes un epimorfismo, por lo que f es un isomorfismo entre estos dos grupos.

3. Subgrupos y Grupos cociente

Los subconjuntos de un conjunto A con estructura de grupo, no necesariamenteson grupos. Eso es facil verlo, ya que si, por ejemplo, un subconjunto de A nocontiene el neutro o no tiene los inversos de todos los elementos del subconjunto, esteno sera grupo. Sin embargo, si en este subconjunto se tiene tambien la estructura degrupo con la misma operacion binaria que el original, entonces se sigue la siguientedefinicion.

Definicion 1.18. Sea A ⊂ B. Se dice que A es un subgrupo de (B, ·) si (A, ·)tambien es grupo, si (B, ·) conserva el mismo elemento neutro de (A, ·)

Comentario 1.19. El producto del grupo (A, ·) y (B, ·) podrıan no ser elmismo, si no lo especificamos ası. Sin embargo, en este texto siempre sobre en-tenderemos que ambos grupos conserven la misma operacion binaria.

Notacion 1.20. Si el conjunto A es subgrupo del conjunto B, lo vamos adenotar como A ⊂gr B.

Ahora vamos a introducir un concepto muy importante en los grupos que de-spues extederemos para los anillos, es el concepto de grupo cociente. Primero vamosa introducir una ralacion de equivalencia en el grupo, con ella, el conjunto se separaen clases de equivalencia formando el conjunto de las clases. Luego podemos definiren ciertas ocaciones una operacion en el conjunto de las clases y con este fomar denuevo un grupo. A este grupo lo llamaremos grupo cociente. Vamos a hacerloformalmente.

Definicion 1.21. Sea (E, ·) grupo y H subgrupo de E es decir H ⊂gr E y seana, b ∈ E. La relacion ∼H se define como

a ∼H b⇔ a · b−1 ∈ HLema 1.22. ∼H es una relacion de equivalencia.

Demostracion 1.23. Chequemos que se cumple la definicion de relacion deequivalencia.

1) e ∈ H porque H es subgrupo de E. Ademas si a ∈ H esto implica quea−1 ∈ H por lo mismo. Se sigue que e ∈ H sii a · a−1 ∈ H, esto implica quea ∼H a o sea ∼H es reflexiva.

Page 35: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. SUBGRUPOS Y GRUPOS COCIENTE 23

2) Sean a ∼H b, por definicion esto es sii a · b−1 ∈ H. Por ser subgrupo sesigue que (a · b−1)−1 ∈ H y esto es sii b · a−1 ∈ H, lo que implica que b ∼H a, esdecir ∼H es simetrica.

3) Sean a ∼H b y b ∼H c. Esto implica que a · b−1 ∈ H y b · c−1 ∈ H. Pero Hes cerrado bajo ·, por lo que (a · b−1) · (b · c−1) = a · e · c−1 = a · c−1 ∈ H es decira ∼H c, lo que implica que ∼H es transitiva.

Corolario 1.24. ∼H genera una descomposicion de E en clases de equivalen-cia. Es decir E/ ∼H= [a] | a ∈ E.

Notacion 1.25. Vamos a denotar a estas clases de equivalencia como: [a] =not

ka y al conjunto de clases de equivalencia como: E/ ∼H=not K = ka | a ∈ EEjemplo 1.26. Unos ejemplos muy interesantes son los siguientes:1) ke = b ∈ E | e ∼H b⇔ e · b−1 = b−1 ∈ H = H2) ka = b ∈ E | a ∼H b⇔ b · a−1 = h ∈ H= b ∈ E | b = ha = h · a ∈ E | h ∈ H =not H · adonde la ultima identidad es la notacion que usaremos para este conjunto.

Para poder definir una estructura de grupo en el conjunto de las clases, esnecesario que el grupo original tenga una propiedad mas. Esta propiedad es lasiguiente.

Definicion 1.27. Un subgrupo H ⊂ E tal que a ·H = H · a para toda a ∈ Ese llama subgrupo normal de E.

Observemos primero que si el grupo original es abeliano, entonces todos susubgrupos son normales. Pero si el grupo no es abeliano, hay que enteder concuidado la definicion anterior. El hecho de que a ·H = H ·a implica que si tomamosel elemento a ·h, siendo h ∈ H , tiene que haber algun elemento en h1 ∈ H ·a, dondeh1 no necesariamente es h1 = h ·a, pero tal que a ·h = h1. Y viceversa, si tomamosh ·a, entonces existe h2 ∈ a ·H tal que h ·a = h2. Si siempre existen estos elementosh1 y h2 para todo h ∈ H , el grupo es normal. Entonces podemos dar la estructurade grupo al conjunto K de las clases usando la siguiente definicion:

Definicion 1.28. Sean ka, kb ∈ K clases de E generadas por ∼H. Se define elproducto

ka kb = x · y | x ∈ ka ∈ K, y ∈ kb ∈ Kcomo el producto entre clases de equivalencia.

Con este producto se pueden definir a la vez una estructura de grupo en elconjunto de las clases de equivalencia, usando la siguiente proposicion.

Proposicion 1.29. Sea E grupo y H un subgrupo normal de E. Sean ka ∈ Klas clases generadas por ∼Hcon a ∈ E. Con el producto ka kb = ka·b, se sigue que(E/ ∼H , ) es grupo i.e. (K,) es un grupo.

Demostracion 1.30. Chequemos que se cumple la definicion de grupo.a)ka kb ⊂ K ya que (H · a) · (H · b) = H · (a ·H) · b = H ·H · a · b = H · a · b

(ya que H ·H = H), se sigue que. ka kb = ka·b ∈ Kb)(ka kb) kc = (H · a ·H · b) ·H · c = H · a · (H · b ·H · c)c) ke ∈ K y es el neutro del grupo, ya queka ke = ka·e = kad) ka ka−1 = ka·a−1 = ke

Page 36: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

24 1. ESTRUCTURAS ALGEBRAICAS BASICAS

Notacion 1.31. Al grupo K se le denota como K = E/H y se le llama el grupocociente de E por H.

El siguiente ejemplo nos dara mayor claridad sobre las definiciones anteriores.

Ejemplo 1.32. Sea (Z,+) y H = 2n | n ∈ Z, el grupo de los enteros pares.Entonces (H,+) es subgrupo normal de (Z,+). Veamos esto con detalle.

Observemos que la relacion ∼H para los elementos a, b ∈ Z es tal que si a ∼H b,se tiene que a+ (−b) ∈ H, lo cual implica que a− b debe estar en H, es decir, debeser par. Pero esto solo pasa si ambos a y b son pares o ambos son impares. Vamosa definir las clases de equivalencia de los pares y las clases de equivalencia de losimpares en los enteros como:

k0 = b ∈ Z | b ∼H 0 = H

k1 = b ∈ Z | b ∼H 1 = 2n+ 1, n ∈ Zk2 = H

es decir, K = k0, k1. Observemos que con la suma (el producto de grupo)

k0 ⊕ k1 =

⊕ k0 k1

k0 k0 k1

k1 k1 k2 = k0

(K, ⊕) es un grupo. Pero ya habiamos visto en el ejemplo 1.17 que este grupo esisomorfo a Z2, por lo que Z/H = Z2 = Z/2n | n ∈ Z.

Ejercicio 1.33. Construir Z3 = Z/multiplos de 3 y Z4 = Z/multiplos de 4.

4. Anillos y Campos

Otras estructuras algebraicas de mucha importancia son los anillos y los cam-pos. En esta seccion veremos la definicion de estos.

Definicion 1.34. Sea A conjunto y · ,+ operaciones binarias sobre A es decir· : A×A A y + : A×A A.

A la triada (A,+, ·) se le llama anillo si1) (A,+) es grupo abeliano2) (A, ·) es semigrupo3) + y · son distributivos

Comentario 1.35. Explıcitamente, un conjunto con las operaciones + y · esun anillo, si se cumple lo siguiente

1) Para toda a, b ∈ A, a+ b ∈ A es asociativo.2) Existe e tal que e+ a = a+ e = a para toda a ∈ A.A e tambien se le llama

el cero de A y se le denota por e = 03) Para toda a ∈ A existe −a tal que a+ (−a) = 04) a+ b = b+ a para todos a, b ∈ A5) a, b ∈ A, se sigue que a · b ∈ A, es decir, el producto es asociativo6) Para toda a, b, c ∈ A se tiene que el producto es distributivo por la izquierda

con la suma, es decir c · (a+ b) = c · a+ c · b7) Analogamente por la derecha, esto es (a+ b) · c = a · c+ b · cEjemplo 1.36. (0,+, ·) es un anillo trivial(Z,+, ·) es el anillo de los enteros(ℜ,+, ·) es el anillo de los reales

Page 37: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. ANILLOS Y CAMPOS 25

Ejercicio 1.37. Demuestre que (Z,+, ·) y (ℜ,+, ·) son anillos.

Entre mas ricas sean las estructuras algebraicas, mas propiedades tienen. Ahoraveremos algunas de las propiedades mas interesantes de los anillos.

Sea (A,+, ·) anillo y 0 el neutro de la operacion binaria +. Entonces se siguenlos siguientes lemas.

Lema 1.38. Para todo a ∈ A implica que a · 0 = 0 · a = 0

Demostracion 1.39. Como a ·0 = a ·(0+0) = a ·0+a ·0, y 0 = −(a ·0)+a ·0 =−(a · 0) + a · 0 + a · 0, entonces 0 = a · 0

Lema 1.40. (−a) · b = −(a · b) y a · (−b) = −(a · b)

Demostracion 1.41. Ya que (a · b) + (−a) · b = (a+ (−a)) · b = 0 · b = 0

Lema 1.42. (−a) · (−b) = a · b

Demostracion 1.43. Analogo.

Las propiedades anteriores son bien conocidas en los numeros reales, pero secumplen en cualquier anillo. Algunos de los tipos especiales de anillos mas usadosen la literatura son los siguientes

Sea (A,+, ·) anillo

Definicion 1.44. Un anillo (A,+, ·) se llama:· Anillo conmutativo, si · es conmutativo· Anillo con unidad, si A tiene al menos 2 elementos y · tiene elemento

neutro (llamado 1).· Anillo sin divisores de cero, si A tiene al menos 2 elementos y a 6= 0 y

b 6= 0 implica que a · b 6= 0 para todos a, b ∈ A· Dominio integral, si A es anillo conmutativo, con unidad, sin divisores de

cero.· Campo si A es anillo sin divisores de cero cuyo semigrupo multiplicativo

(A\0, ·) es grupo abeliano.· Semicampo si A es anillo sin divisores de cero cuyo semigrupo multiplicativo

(A\0, ·) es grupo no abeliano.

Ejercicio 1.45. .1) Exprese explıcitamente todas la propiedades de un campo.2) Demuestre que (Z,+, ·), (Q,+, ·), (ℜ,+, ·), (C,+, ·), son anillos conmutativos

con unidad sin divisores de cero.3) Demuestre que (Q,+, ·), (ℜ,+, ·) y (C,+, ·), son campos.4) Demuestre que (2n | n ∈ Z,+, ·) es anillo conmutativo sin unidad sin

divisores de cero.

De forma analoga a como definimos subgrupo, se puede definir subanillo.

Definicion 1.46. Sea E ⊆ A. (E,+, ·) es un subanillo de A, si E es anillocon el mismo neutros multiplicativo y aditivo de A.

Page 38: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

26 1. ESTRUCTURAS ALGEBRAICAS BASICAS

5. Ideales y Anillos Cociente

En una seccion anterior definimos los grupos cociente. Analogamente vamos adefinir ahora los anillos cociente y algunas de sus propiedades mas interesantes.

Sean (A,+, ·) anillo y (H,+, ·) un subanillo de A. Claramente se tiene que(H,+) tiene que ser subgrupo abeliano de (A,+). Pero si (H,+) es abeliano, estoimplica que (H,+) es un subgrupo normal de (A,+). Entonces podemos construir(A,+)/∼H = A/H = K. Si ka, kb ∈ K, se tiene que

ka ⊕ kb = m+ n | m ∈ ka, n ∈ kb = ka+b

Analogamente definimos en el semigrupo (H, ·)

ka ⊙ kb = m · n | m ∈ ka, n ∈ kb= m · n | m ∈ H + a, n ∈ H + b= (k1 + a) · (k2 + b) = k1 · k2 + k1 · b+ a · k2 + a · b, k1, k2 ∈ H

Proposicion 1.47. Sea (A,+, ·) anillo y H ⊂ A subanillo de A y sean a ∈ Ay h ∈ H. Entonces la triada (A/∼H ,⊕,⊙) es un anillo si a ·h ∈ H y h ·a ∈ H, con

ka ⊕ kb = ka+b

ka ⊙ kb = ka·b = h+ a · b, h ∈ H = H + ab

Ejercicio 1.48. Probar la proposicion formalmente.

Notacion 1.49. Al anillo (A/H,+, ·) se le llama anillo cociente y a H se lellama un ideal en A.

Ejemplo 1.50. Sea el anillo (Z,+, ·). El conjunto H = (3n | n ∈ Z,+, ·) esun ideal de Z. Para ver esto, primero veamos que H es un subanillo de Z :

1) H es cerrado para la suma, ya que 3n+ 3m = 3(n+m) ∈ H.2) Con inversos, ya que −(3n) = 3(−n) ∈ H.3) H es cerrado para el producto, ya que 3n · 3m = 3(3nm) ∈ H.Entonces H es subanillo de Z. Ademas: + y · son asociativos. El neutro de la

suma es 0 = 3 · 0Comentario 1.51. (H,+, ·) es anillo conmutativo sin divisores de cero, pero

no tiene unidad, ya que (1 6= 3n).

Ejemplo 1.52. Ahora chequemos que H es ideal. Para ver esto, falta ver queel producto de un elemento de H con cualquier elemento de Z pertenece a H. Peroesto es asi, ya que (3n) · m = 3(nm) ∈ H. Entonces Z3 = (Z/H,+, ·) es unanillo cociente. Ahora veamos como se ve este anillo cociente. Los elementos ka sepueden escribir como: a, b ∈ Z, a ∼H b ssi a− b ∈ H, es decir ssi a− b es multiplode 3 y esto es ssi a y b dejan el mismo resto en sus divisores entre 3, es decir, sia = 3l1 + r, y b = 3l2 + r. Entonces se tiene que,

k0 = H

k1 = 3n+ 1 | n ∈ Zk2 = 3n+ 2 | n ∈ Zk3n = k0, k3n+1 = k1, k3n+2 = k2

Page 39: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. IDEALES Y ANILLOS COCIENTE 27

Si las operaciones entre las clases de equivalencia estan dadas por

ka ⊕ kb = ka+b

ka ⊙ kb = ka·b

se tiene entonces que la suma y el producto estan dados respectivamente por

ka ⊕ kb =

⊕ k0 k1 k2

k0 k0 k1 k2

k1 k1 k2 k0

k2 k2 k0 k1

y

ka ⊙ kb =

⊙ k0 k1 k2

k0 k0 k0 k0

k1 k0 k1 k2

k2 k0 k2 k1

Por lo que H es un ideal.

Ejercicio 1.53. Respondan sin pruebas explicitas a las siguientes preguntas.1) ¿Cuales de los anillos Z2,Z3,Z4 no tienen divisores de cero?2) ¿Cuales si tienen division entre cero?3) ¿Cuales son campos?

Ejercicio 1.54. Construya explicitamente los ideales de Z4

Page 40: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 41: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 2

ESPACIOS VECTORIALES

Los espacios vectoriales son la estructura mas rica que vamos a ver aquı condetalle. Los espacios vectoriales son tan importantes en fısica, quımica, ingenierıa,etc. que les vamos a dedicar un capitulo completo a ellos solos. Los espaciosvectoriales mas conocidos son los que se construyen sobre ℜn. En este capıtulovamos a repasar estos espacios y despues vamos a generalizarlos a espacio vectorialesarbitrarios. Estamos suponiendo que el lector esta familiarizado con ℜn, pero parainiciar el tema, vamos a dar un resumen de sus propiedades mas importantes.

1. El Espacio Vectorial ℜn

Resumen 2.1. Recordemos que el espacio vectorial ℜn, o escrito explicitamente(ℜn, · ,+ ,⊙), es una estructura algebraica, definida sobre los reales, tal que:

X(ℜ,+, ·) es un campo que con la operacion + es grupo Abeliano, con neutro0ℜ y distributividad entre + y ·, y con la operacion ·, (ℜ\0ℜ, ·) es grupo Abeliano,con neutro 1ℜ sin divisores de cero: a 6= 0ℜ, b 6= 0ℜ ⇒ a · b 6= 0ℜ

X(ℜn,+,⊙) es espacio vectorial sobre (ℜ,+, ·) tal que (ℜn,+) son gruposAbelianos con neutro 0ℜn

X(ℜn,⊙) es un mapeo de ℜ⊙ℜn en ℜn (es un nuevo tipo de multiplicacion); ⊙es distributiva con + y asociativa con ·, es decir, si se tiene que, a, b ∈ ℜ, x,y ∈ ℜnentonces:

a⊙ (x + y) = (a⊙ x) + (a⊙ y)(a+ b)⊙ x = (a⊙ x) + (b⊙ x)(a · b)⊙ x = a⊙ (b⊙ x)X⊙ tiene neutro representado por 1ℜ y cumple que 1ℜ⊙x = x para todo x ∈ V.En otras palabras, (ℜn, · ,+ ,⊙) es un espacio vectorial sobre el campo (ℜ,+, ·),

donde para x,y ∈ ℜn, x = (x1, x2, · · · , xn), y = (y1, y2, · · · , yn) se tiene:

(1) x + y = (x1 + y1, x2 + y2, · · · , xn + yn),(2) 0ℜn = (0, 0, · · · , 0),(3) −(x1, x2, · · · , xn) = (−x1,−x2, · · · ,−xn),(4) ⊙ es la “multiplicacion de escalares con vectores”, para k ∈ ℜ, k ⊙

(x1, x2, · · · , xn) = (k · x1, k · x2, · · · , k · xn).

Otros conceptos importantes a recordar de espacios vectoriales son:XUn subespacio vectorial H de ℜn es un espacio vectorial tal que H ⊂ ℜn, y

(H, ·,+,⊙) mismo es un espacio vectorial.XLa interpretacion geometrica de un punto en ℜn se suele dar de la forma

siguiente. Un punto x ∈ ℜn es un vector de traslacion, determinado por valor ydireccion y representado por una flecha.

XLos Homomorfismos son mapeos lineales entre espacios vectoriales (ℜn, ·,+,⊙)y (ℜm, ·,+,⊙) sobre el mismo campo ℜ:

29

Page 42: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

30 2. ESPACIOS VECTORIALES

XSean (ℜn, ·1,+1,⊙1) y (ℜm, ·1,+2,⊙2) espacios vectoriales y f : ℜn → ℜmuna funcion entre estos espacios. f se llama homomorfismo si f(x+1 y) = f(x)+2

f(y) y f(a ⊙1 x) = a ⊙2 f(x), para cualesquiera x,y ∈ ℜn, a ∈ ℜ. f se llamaisomorfismo si es homomorfismo y biyeccion.

XIndependencia y bases en (ℜn,+,⊙) sobre el campo ℜ. Si X ⊂ ℜn, entonces

L(X) = m∑

i=1

ai ⊙ xi| ai ∈ ℜ,x1, · · · ,xm elementos distintos de ℜn,m ∈ N

se llama cerradura lineal de X. L(X) es el subespacio mas pequeno de ℜn quecontiene a X. X se llama linealmente independiente si para cualesquiera ele-mentos distintos x1, · · · ,xm de X,

0V =

m∑

i=1

ai ⊙ xi con ai ∈ K implica a1 = a2 = · · · = am = 0K .

X se llama base de ℜn si X es linealmente independiente y L(X) = ℜn.Cada espacio vectorial ℜn tiene una base y cualesquiera dos bases tienen el

mismo numero n de elementos. Este numero n se llama dimension (vectorial)de ℜn. Por ejemplo dim(ℜn) = n. La base canonica de ℜn es

(1, 0, · · · , 0, 0), (0, 1, · · · , 0, 0), · · · , (0, 0, · · · , 0, 1, 0), (0, 0, · · · , 0, 1)Hasta aquı hemos recordado las propiedades mas importantes de ℜn, en ade-

lante hablaremos de los espacios vectoriales en general.

2. Definicion de Espacio Vectorial

Los espacios vectoriales son de las estructuras algebraicas mas utilizadas entodas las ramas de la ciencia. En fısica e ingenierıa se utilizan intensamente paramodelar el espacio, las funciones periodicas, soluciones de ecuaciones lineales ydiferenciales, los polinomios, etc. Debido a su rica estructura algebraica, los espaciosvectoriales son tambien muy interesantes para estudiarse desde el punto de vistamatematico puro. En este capitulo estudiaremos los espacios vectoriales y suspropiedades mas importantes. Empecemos entonces con su definicion.

Definicion 2.2. Sea (K,+, ·) campo y V conjunto. Sean ⊕ : V × V → V y⊙ : K × V → V operaciones binarias asociativas y distributivas, i.e., se tiene quepara todo a, b ∈ K y x, y ∈ V .

a) (a · b)⊙ x = a⊙ (b⊙ x)b) (a+ b)⊙ x = (a⊙ x)⊕ (b⊙ x).c) a⊙ (x⊕ y) = (a⊙ x)⊕ (a⊙ y)Un espacio vectorial es el ordenamiento (K,V,⊕,⊙) tal que (V,⊕) es grupo

abeliano y la identidad 1K de K es tal que 1K ⊙ x = x para toda x ∈ V .

El ejemplo mas conocido y mas utilizado por todos es sin duda el espaciovectorial ℜn. Sin embargo, un caso mas general se puede construir con el productocartesiano del campo sobre el que se define el espacio vectorial.

Ejemplo 2.3. Sea V = Kn = K ×K × · · · ×K = (a1, · · · , an) | ai ∈ K paratoda i = 1, · · · , n. Si x = (a1, · · · , an) y y = (b1, · · · , bn), se pueden definir

la suma ⊕ como x⊕ y = (a1 + b1, · · · , an + bn)el producto ⊙ como a⊙ x = (a · a1, · · · , a · an)

Page 43: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. SUBESPACIOS VECTORIALES 31

entonces (V,⊕) es grupo abeliano con neutro 0V = (0, · · · , 0) e inverso (−x) =(−a1, · · · ,−an).

Uno de los espacios vectoriales mas usados y mas importantes que se utiliza entodas las areas de la ingenierıa, fısica, matematicas, etc. son los polinomios. Comoespacios vectoriales estos se pueden definir como seigue.

Ejemplo 2.4. Sea Pn = a0 + a1x + a2x2 + · · · + anx

n | ai ∈ K para todoi = 1, · · · , n el conjunto de los polinomios sobre el campo K. Si se define lasuma ⊕ entre polinomios x,y ∈ Pn, con x = a0 + a1x + a2x

2 + · · · + anxn y

y = b0 + b1x+ b2x2 + · · ·+ bnx

n como:

x⊕ y = (a0 + b0) + (a1 + b1)x+ · · ·+ (an + bn)xn

el producto ⊙ como

a⊙ x = a · a0 + a · a1x+ · · ·+ a · anxn

entonces (K,Pn,⊕,⊙) es un espacio vectoral.

Notacion 2.5. En lo que sigue, generalmente vamos a denotar las operaciones⊕ y ⊙ en el espacio vectoral, simplemente como + y · respectivemente y al espaciovectorial simplemente como V .

Ejemplo 2.6. El conjunto de funciones periodicas Fp, con la suma y el productode funciones, tambien es un espacio vectorial.

Ejercicio 2.7. Demuestre con todo detalle que Kn es espacio vectorial.

Ejercicio 2.8. Sea P = p(x) |polinomio de grado n. Demuestre que P esun espacio vectorial con las operaciones estandard entre polinomios.

Ejercicio 2.9. Sea H1 = h(t) | h(t) = a1 cos(ωt) + a2 cos2(ωt) + · · · +an cosn(ωt). Demuestre que H2 es un espacio vectorial con las operaciones es-tandard entre polinomios.

Ejercicio 2.10. Sea H2 = h(t) | h(t) = a1 cos(ωt) + a2 cos(2ωt) + · · · +an cos(nωt). Demuestre que H2 es un espacio vectorial con las operaciones es-tandard entre polinomios.

3. Subespacios Vectoriales

En la misma forma como hemos definido subgrupos y subanillos, se puededefinir subespacios vectoriales. Este concepto sera el tema de esta seccion. Sudefinicion formal es como sigue.

Definicion 2.11. Sea V un espacio vectorial sobre un campo K y H ⊆ V.H es un subespacio Vectorial de V, si H es espacio vectorial con las mismasoperaciones binarias.

Para demostrar que un espacio vectorial es subespacio de otro, afortunadamenteno es necesario probar todas las propiedades de espacio vectorial del subconjunto,es suficiente con ver que las dos operaciones del subconjunto son cerradas, estoes debido a que las operaciones ya cumplen con todas las propiedades de espaciovectorial de entrada. Esta propiedad la enunciaremos como el siguiente lema.

Page 44: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

32 2. ESPACIOS VECTORIALES

Lema 2.12. Sea V espacio vectorial sobre un campo K y H ⊆ V . H es sube-spacio Vectorial de V si

1) Para todos h1, h2 ∈ H implica que h1 + h2 ∈ H2) Para todos a ∈ K, h ∈ H implica que a · h ∈ HDemostracion 2.13. Se cumplen todas las propiedades de espacio vectorial.

Ejemplo 2.14. Sea el plano ℜ2 y H1 = (a, b) ∈ ℜ2 | b = ma con m ∈ ℜuna recta que pasa por el origen. Veamos que una recta que pasa por el origenes subespacio vectorial del plano. Usemos el lema anterior. Entonces (a1, b1) +(a2, b2) = (a1 + a2, ma1 + ma2) = (a1 + a2,m(a1 + a2)) ∈ H1. Es decir, escerrado para la suma. Por otro lado se tiene que a · (a1, b2) = (a · a1, a · b1) =(a ·a1, a · (m · a1)) = (a ·a1,m · (a · a1)) ∈ H1, por lo que la recta tambien es cerradapara el producto. Entonces esta recta es un subespacio de ℜ2.

Ejemplo 2.15. Sea H2 = (a, b) ∈ ℜ2 | b = ma + n, con m,n ∈ ℜ perom ·n 6= 0 una recta que no pasa por el origen. ¿Es H2 ⊆ ℜ2 un subespacio vectorialdel plano? Veamos esto, si (a1, b1) + (a2, b2) = (a1 + a2,m(a1 + a2) + 2n) /∈ H2,este punto no esta en la misma recta. Entonces una recta que no pasa por el origenno es subespacio vectorial de plano.

Ejemplo 2.16. Sea H3 = (a, b) ∈ ℜ2 | b = na ¿Es H1 ∪ H3 ⊆ ℜ2 unsubespacio vectorial del plano? Para ver esto, sean x1 = (a1, b1) ∈ H1 y x2 =(a2, b2) ∈ H3, entonces se tiene que x1 + x2 = (a1 + a2,ma1 + na2) /∈ H1 ∪ H3,el cual no esta en la union. Por lo tanto H1 ∪ H3 no es subespacio vectorial delplano.

Generalmente la union de espacios vectoriales no siempre es un espacio vecto-rial, pero la interseccion sı, ya que si

1) x,y ∈ H1 ∩H2 esto implica que x,y ∈ H1 y x,y ∈ H2 y esto implica quex + y ∈ H1 ∩H2

2) a ∈ K y x ∈ H1 ∩H2 esto implica que a · x ∈ H1 y a · x ∈ H2 esto implicaque a · x ∈ H1 ∩H2

Entonces podemos escribir el siguiente

Lema 2.17. La interseccion de espacios vectoriales, es espacio vectorial.

Ejercicio 2.18. Digan si el plano P1 = (x, y, z) | 3x+2y−3z = 0 y el planoP2 = (x, y, z) | 3x+ 2y − 3z = 1 son subespacios de ℜ3.

4. Homomorfismos

Los homomorfismos son una herramienta de mucha ayuda en espacios vectori-ales. Para estudiar las propiedades de espacio vectorial, el espacio ℜn es sin dudael mas estudiado y el mas simple. Basta entonces relacionar todos los espacioshomomorfos e isomorfos con el plano n-dimensional para haberlos estudiado todos.Pero la sorpresa es que todos los espacios vectoriales de la misma dimension, sonisomorfos. Esta es la razon por cual el plano n-dimensional es tan interesante. Paraver esto, iniciemos con la siguiente definicion:

Definicion 2.19. Sean (V1, ·,+1,⊙1) y (V2, ·,+2,⊙2) espacios vectoriales sobreK. Un homomorfismo entre V1 y V2 es un mapeo que preserva las operaciones, es

Page 45: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. HOMOMORFISMOS 33

decir f : V1 V2 se llama homomorfismo si

f(x +1 y) = f(x) +2 f(y)

f(a⊙1 x) = a⊙2 f(x) para toda x,y ∈ V1 y a ∈ KComo siempre, f se llama:· isomorfismo, si f es homomorfismo y biyeccion· automofismo, si f es homomorfismo y V1 = V2

Notacion 2.20. Dos espacios vectoriales se llaman isomorfos, si existeun isomorfismo entre ellos, se escribe V1

∼= V2

Un ejemplo sencillo e ilustrativo usando planos n-dimensionales es el siguiente.

Ejemplo 2.21. Sea V1 = ℜn, y V2 = ℜn+1. El mapeo f : ℜn ℜn+1 tal quef((a1, · · · , an)) = (a1, · · · , an, 0) es un homomorfismo 1 − 1 pero no sobre, ya queningun (a1. · · · , an, an+1) con an+1 6= 0 es imagen de algun x ∈ ℜn.

Algunas de las propiedades generales de los homomorfismos es que estos mapeanel cero en el cero y los inversos en los inversos, veamos esto.

Comentario 2.22. Sean V1 y V2 espacios vectoriales y f : V1 V2 unhomomorfismo entre ellos, entonces

f(0V1) = 0V2 , ya que f(0 · x) = 0 · f(x)

f(−x) = −f(x) para toda x ∈ V1 ya que f(x− x) = f(x) + f(−x)

Otra propiedad importante de los espacios vectoriales, es que bajo homomor-fismos se conservan las propiedades de subespacio, esto es

Comentario 2.23. f(V1) es subespacio de V2.

Incluso si H es subespacio de V1, se tiene que f(H) es subespacio de V2, ya quesi x2, y2 ∈ f(H), y a ∈ K, esto implica que existen x1, y1 ∈ H con f(x1) = x2 yf(y1) = y2, tal que x2 + y2 = f(x1 + y1) ∈ f(H) y a · x2 = f(a · x1) ∈ f(H). Estoda pie al siguiente

Lema 2.24. Sean V1 y V2 espacios vectoriales. Sea H ⊂ V1 y f : V1 V2

homomorfismo. Entonces f(H) ⊂ V2

Una relacion muy importante entre espacio vectoriales es la relacion de serisomorficos, esta relacion es una relacion de equivalencia y por tanto separa losespacios vectoriales en clases de equivalencia en el conjunto de espacios vectoriales.Esta separacion es muy importante porque al separar este espacio en clases, limitael estudio de los espacios vectoriales a solo estudiar un representante de cada clasede estos. Para esto tenemos el siguiente lema:

Lema 2.25. Sean V1, V2 y V3 espacios vectoriales y f : V1 V2 y g : V2 V3

isomorfismos. Entoncesa) f−1 es isomorfismob) f g es isomorfismo.

Ejercicio 2.26. Demostrar el lema.

Lema 2.27. Sean V1 y V2 espacios vectoriales. La relacion V1 ∼ V2 sii V1∼= V2

son isomorfos, es una relacion de equivalencia.

Page 46: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

34 2. ESPACIOS VECTORIALES

Demostracion 2.28. Veamos que ∼ cumple la definicion de relacion de equiv-alenca.

1) V1 ∼ V1, ya que la identidad en V1 es un isomorfismo.2) Si V1 ∼ V2, si usamos la inversa del isomorfismos se tendra que V2 ∼ V1.3) Si V1 ∼ V2 y V2 ∼ V3, usando la composicion de isomorfismo, tendremos

que V1 ∼ V3.

Ejercicio 2.29. Digan en que casos las siguientes funciones son homomofis-mos:

1.- f : ℜ3 → ℜ2, tal que f((x, y, z)) = 2(x, y).2.- f : ℜ3 → ℜ2, tal que f((x, y, z)) = (x− z, y + z).3.- f : ℜ2 → ℜ2, tal que f((x, y)) = (x2, y).

5. Independencia Lineal y Bases

El concepto de independencia lineal se basa en el simple hecho de como poderescribir un conjunto de vectores en terminos del mınimo posible de vectores de otroconjunto. La pregunta que esta detras de este concepto es ¿cual es el mınimo numerode vectores con el que yo puedo representar todos los vectores de algun espacio osubespacio vectorial? Entonces, el primer problema que tenemos, es encontrar estenumero y luego encontrar un conjunto mınimo de vectores. Cuando esto se puedehacer, podremos trabajar en muchas ocasiones solo con estos vectores, sin tomaren cuenta todo el espacio. Vamos a iniciar con la siguiente definicion:

Definicion 2.30. Sea V espacio vectorial sobre el campo K y X ⊆ V . Engeneral X no necesariamente subespacio vectorial de V . Un elemento de V de laforma

x =

m∑

i=1

ai · xi, ai ∈ K, x, xi ∈ X todos distintos

se llama combinacion lineal de los elementos x1, · · · ,xm de X.

Con esta definicion podemos construir un subespacio vectorial. Para eso defi-namos la cerradura lineal de un conjunto de vectores.

Definicion 2.31. Al conjunto de todas las combinaciones lineales de un con-junto, es decir, al conjunto

L(X) := x =

n∑

i=1

ai · xi | ai ∈ K, xi ∈ X elementos distintos

se le llama cerradura lineal de X

Lema 2.32. Sea V espacio vectorial y X ⊂ V . L(X) es un subespacio de V .

Demostracion 2.33. Sean x =∑n

i=1 aixi y y =∑n

i=1 bi · xi, con xi ∈ X yai, bi ∈ K. Entonces x+y =

∑ni=1 ai ·xi+

∑ni=1 bi ·xi =

∑ni=1(ai+ bi) ·xi ∈ L(X)

ya que ai + bi ∈ K. Ademas a ·x = a ·∑ni=1 ai ·xi =

∑ni=1 a · ai ·xi ∈ L(X) ya que

a · ai ∈ K. Entonces x + y y a · x ∈ L(X) para todos los vectores x,y ∈ L(X), cona ∈ K. Esto implica que L(X) es el subespacio mınimo de V que contiene a X.

Corolario 2.34. Sea V espacio vectorial y X ⊂ V . Si X es subespacio de V,se sigue entonces que L(X) = X.

Page 47: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. INDEPENDENCIA LINEAL Y BASES 35

Demostracion 2.35. X ⊆ L(X) ya que si x ∈ X, esto implica que x =a1 · x1 + · · · + an · xn = 1 · x ∈ L(X). Por otro lado, si x ∈ L(X), se tiene quex = a1 · x1 + · · · + an · xn con xi ∈ X y como X es subespacio, se sigue quea1 · x1 + · · ·+ an · xn ∈ X.

Vamos a ver algunos ejemplos de lo anterior.

Ejemplo 2.36. .a) H1 = (a, b) ∈ ℜ2 | a, b ∈ ℜ, b = am una recta que pasa por cero en ℜ2.

Se tiene:

L(H1) = x = a1(a, am) | a,m, a1 ∈ ℜ = H1

b) H2 = (a, b) ∈ ℜ2 | a, b ∈ ℜ, b = am+ n,m · n 6= 0 una recta que no pasapor el origen. Entonces:

L(H2) = x = a1(a, am+ n) | a1b,m, n ∈ ℜ= x = (a1a, a1am+ a1n) | a1, b,m, n ∈ ℜ = ℜ2

Por lo que, una recta que no pasa por el origen, no es un subespacio, genera ℜ2.

Con esto ya podemos introducir el concepto de independencia lineal.

Definicion 2.37. Sea V espacio vectorial sobre el campo K y X ⊂ V unsubconjunto arbitrario de V . X se llama linealmente independiente si paracualquiera elementos distintos x1,x2, · · · ,xn ∈ X se tiene que 0V =

∑ni=1 ai · xi,

ai ∈ K, implica que necesariamente a1 = a2 = · · · = an = 0K.

X se llama linealmente dependiente si X no es linealmente independiente.Es decir, si 0V =

∑ni=1 ai ·xi implica que al menos un aj 6= 0. En tal caso 0V = aj ·

xj+∑ni=1,i6=j ai ·xi de donde podemos despejar xj como xj = −a−1

j

∑ni=1,i6=j ai ·xi.

O sea, xj depende de todas los demas vectores en forma lineal.

Notacion 2.38. Cuando un conjunto de vectores sean linealmente independi-entes, diremos que son l.i.

Al numero minimo de vectores con los que podemos escribir todos los vectoresde algun espacio o subespacio, se le llama base. Su definicion es como sigue.

Definicion 2.39. Sea V espacio vectorial sobre el campo K y X ⊂ V . X sellama base de V si

1) L(X) = V2) X es linealmente independiente.

Esto es ası ya que 1) asegura la representatividad de cada x ∈ V por combi-nacion lineal de los elementos de X. Es decir, L(X) ⊂ V implica que x ∈ L(X),lo podemos escribir como x =

∑ni=1 ai · xi con cada xi ∈ X y cada ai ∈ K, pero

ademas x ∈ V. Por otro lado, V ⊆ L(X) implica que si x ∈ V entonces x ∈ L(X),esto es, x se puede escribir como x =

∑ni=1 ai · xi ∈ L(X) siempre.

2) asegura que la representacion es unica, ya que x =∑n

i=1 ai · xi y x =∑ni=1 bi · xi, entonces x− x = 0V =

∑ni=1(ai − bi) · xi lo que implica que ai = bi

Vamos a ver un ejemplo muy representativo.

Page 48: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

36 2. ESPACIOS VECTORIALES

Ejemplo 2.40. V = Kn Si definimos

e1 = (1K , 0K , · · · , 0K)

e2 = (0K , 1K , · · · , 0K)

...

en = (0K , 0K , · · · , 1K)(2.1)

es una base en Kn. Es decir, el conjunto E = e1, · · · , en genera todo el espacioKn = L(E), ya que x = (a1, · · · , an) = a1 · e1 + · · ·+an · en ∈ L(E). Por otro lado,E es linealmente independiente, ya que 0V = a1 ·e1 + · · ·+ an ·en = (a1, · · · , an) =(0K , · · · , 0K) implica ai = 0, para toda i. Entonces Kn siempre tiene una base. Alconjunto (2.1) se le llama base canonica de Kn y su dimension es n.

Ejemplo 2.41. Sea Pn el espacio vectorial de los polinomios de grado n. En-tonces, una base de Pn es En = 1, x, x2, · · · , xn. Claramente la dimension delespacio Pn es n+ 1.

Ejemplo 2.42. En el espacio de las funciones periodicas Fp, el conjunto Ep =1, cos(θ), cos(2θ), cos(3θ), · · · , es una base de este espacio vectorial. La dimensiondel espacio Fp es infinita.

En todo espacio vectorial es posible definir una base. La base canonica es, desdemuchos puntos de vista, la mas simple. Este hecho lo ponemos en el siguiente lema.

Lema 2.43. Todo espacio vectorial contiene una base.

La demostracion de este lema la dejaremos para libros mas especializados. Aunmas fuerte que este lema (y tambien enunciaremos sin demostracion), es el hechode que para todo espacio vectorial siempre existe una base de este y el numero devectores de dos bases diferentes es siempre el mismo.

Proposicion 2.44. Sea V espacio vectorial sobre K y sean X ⊆ V y Y ⊆ Vdos bases de V . Si X es finito, implica que Y es finito y tiene el mismo numero deelementos que X.

En base a esta proposicion, es posible entonces hacer la siguiente definicion:

Definicion 2.45. La dimension de un espacio vectorial V es el numero deelementos de la base de V .

Notacion 2.46. La dimension de V se denota como dimV = n.

El concepto de dimension esta basado entonces en la existencia de un espaciovectorial y por tanto, del numero de vectores de su base. Vamos a ver algunosejemplos para dejar mas claro este concepto.

Ejemplo 2.47. dimKn = n pues se necesitan n elementos eini=1 para repre-sentar todo el espacio.

Ejemplo 2.48. Sea H1 = (a, am) ⊆ ℜ2. Una base de H1 es X = (1,m),entonces se tiene que dimX = 1. Esto implica a su vez que dimH1 = 1.

Ejemplo 2.49. Sea V = 0V , se tiene que dimV = 0

Ejercicio 2.50. Sean los planos del ejercicio 2.18. Encuentre una base vecto-rial para el plano que es subespacio de ℜ3.

Page 49: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

6. TRANSFORMACIONES LINEALES 37

Ejercicio 2.51. Den una base para el espacio P del ejercicio 2.8.

Ejercicio 2.52. Den una base para el espacio H1 del ejercicio 2.9 y otra parael espacio H2 del ejercicio 2.10.

Ejercicio 2.53. Demuestren que H1 = H2. De una formula para representarlas bases de los dos conjuntos hasta n = 5.

6. Transformaciones Lineales

Los homomorfismos entre espacios vectoriales son de tal importancia, que in-cluso reciben un nombre especial. En esta seccion veremos estos homomorfismos,sus propiedades mas importantes y algunos ejemplos representativos de homomor-fismos entre espacios vectoriales.

Definicion 2.54. Sean V1 y V2 espacios vectoriales sobre el mismo campo K.Se define el conjunto Hom(V1, V2) = f : V1 V2 | f es homomorfismo

Notacion 2.55. A los homomorfismo entre espacios vectoriales se les llamatransformaciones lineales o mapeos lineales y se denotan por L(V1, V2) :=Hom(V1, V2)

Vamos a escribir explıcitamente el concepto de transformacion lineal. Sea f ∈L(V1, V2), esto implica que la suma y el producto en los espacios se conservanbajo f , esto es f(x + y) = f(x) + f(y) para todos los vectores x,y ∈ V1 yf(k ·x) = k · f(x) para todo k ∈ K, x ∈ V2. Si ahora tomamos como conjunto baseal conjuto de todas las transformaciones lineales, podemos introducir en L(V1, V2)la estructura de espacio vectorial. Vamos a definir entonces la suma y el productocomo

(f ⊕ g)(x) = f(x) + g(x)

(k ⊙ f)(x) = k · f(x) k ∈ K, x ∈ V1

y observemos que (f ⊕ g) ∈ L(V1, V2), ya que + esta definida en V2. Ası mismo(k ⊙ f) ∈ L(V1, V2) ya que · esta definido en K × V2 → V2. Entonces se tiene que

f⊕g y k⊙f son mapeos de V1 en V2. Este es un resultado muy importante, porquecon el tenemos el siguiente lema.

Lema 2.56. Sean V1 y V2 espacios vectoriales. Entonces (L(V1, V2), ·,⊕,⊙) esun espacio vectorial sobre K

Ejercicio 2.57. Demostrar el lema.

La pregunta que surge inmediatamente despues de definir los mapeos lineales, essi la composicion de mapeos lineales es tambien lineal y forma un espacio vectorial.Para ver esto, sean f ∈ L(V1, V2) y g ∈ L(V2, V3) y g f : V1 V3 Para ver sig f ∈ L(V1, V3), hay que checar las propiedades de espacio vectorial, dado quef y g son lineales. Sean x,y ∈ V1 entonces la suma cumple con (g f)(x + y) =g(f(x) + f(y)) = g f(x) + g f(y), por la propiedades de linearidad de ambasfunciones. Analogamente, sean x ∈ V1, k ∈ K, entonces (gf)(k ·x) = g(f(k ·x)) =g(k · f(x)) = k · (g f)(x), por lo que ambas propiedades se cumplen.

Otro caso interesante es cuando ambos espacios, el de salida y el de llegada sonel mismo, i.e., cuando V1 = V2 = V , entonces, claramente L(V, V ) es un espaciovectorial sobre K con las operaciones + y · sobre V . Ademas, si f, g ∈ L(V, V )implica que f g ∈ L(V, V ). Algunas propiedades de estos espacios son:

Page 50: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

38 2. ESPACIOS VECTORIALES

a) Sea k ∈ K, y f, g ∈ L(V, V ) entonces k · (g f) = (k · g) f = g (k · f) yaque para para toda x ∈ V se tiene que

[k · (g f)](x) = k · (g f)(x) = k · g(f(x)) = (k · g) · (f(x)) = [(k · g) f ](x)

= g(k · f(x)) = g((k · f)(x)) = [g (k · f)](x)

b) Como es asociativo para todo mapeo, entonces es asociativo para lastransfomaciones lineales.

c) (g + h) f = g f + h f es distributiva, para f, g, h ∈ L(V, V ).b), c) y la cerradura para implican que (L(V, V ),+, ) es un anillo.

7. Algebras

La ultima estructura algebraica que veremos aquı es la de algebra. Las algebrasson mas ricas en estructura que los espacios vectoriales, ya que en estas se definentres operaciones binarias. Para definir las algebras usaremos el concepto de modulo.Al igual que en los espacios vectoriales, los modulos se definen usando dos opera-ciones binarias definidas en el conjunto con propiedades especiales. La definicionde un modulo es la siguiente.

Definicion 2.58. Sea K anillo. (V,⊕,⊗) se llama modulo sobre K si:1) (V,⊕) grupo abeliano2) ⊗ es mapeo de K × V en V, y para toda a, b ∈ K, y para toda x,y ∈ V se

tiene:a) (a · b)⊗ x = a⊗ (b⊗ x) es asociativa,b) a⊗ (x⊕ y) = (a⊗ x) ⊕ (a⊗ y)c) (a+ b)⊗ x = (a⊗ x)⊕ (b⊗ x) son distributivos.

Es decir, un modulo consiste de un anillo K, de un grupo abeliano y de unaoperacion que combina elementos de K y V . Con este concepto es mas sencillodefinir algebra. Es mas, un espacio vectorial, es un modulo muy particular, setiene:

Corolario 2.59. Un modulo (V,⊕,⊗) es un espacio vectorial, si se cumpleque:

a) K es un campo o semicampo.b) 1K ⊗ x = x para toda x ∈ V.

Usando la definicion de modulo, podemos definir el concepto de algebra.

Definicion 2.60. Una estructura (A,+, ·, ) sobre K se llama algebra si1) K es anillo conmutativo con unidad2) (A,+, ·) modulo sobre K, con 1K · x = x, para toda x ∈ A3) es mapeo de A×A en A con las propiedades

a) k · (x y) = (k · x) y = x (k · y) para toda k ∈ K x,y ∈ A(asociatividad).

b) z(x+y) = zx+zy; (x+y)z = xz+yz, para todos x,y, z ∈ A(distributividad).

Ejemplo 2.61. Sea V espacio vectorial sobre el campo K, x ∈ V y k ∈ K.L = (L(V, V ),+, ·, ) es un algebra sobre el campo K con las siguientes operacionesen L(V, V ).

+ : L(V, V )× L(V, V ) L(V, V )

(f, g) → (f + g)(x) = f(x) + g(x),

Page 51: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

7. ALGEBRAS 39

· : K × L(V, V ) L(V, V )

(k, g) → (k · f)(x) = k · f(x),

: L(V, V )× L(V, V ) L(V, V )

(f, g) → (f g)(x) = f(g(x)).

para todas las f, g ∈ L(V, V ).

Corolario 2.62. L es una algebra asociativa ( es asociativa), no-conmutativa( no es conmutativa), con unidad ( tiene unidad, el mapeo identidad).

Ejemplo 2.63. Sea K campo y(K3,+, ·

)su espacio vectorial asociado. En-

tonces el espacio vectorial K3, con el producto cruz entre vectores definido por:x × y = (a2b3 − a3b2, a3b1 − a1b3, a1b2 − a2b1) para x = (a1, a2, a3), y =

(b1, b2, b3), es un algebra no conmutativa, asociativa.

Ejercicio 2.64. Demostrar con todo detalle que(K3,+, ·,×

), donde × es el

producto cruz entre vectores, es una algebra.

Ejercicio 2.65. Sea o(2) = o | o es matriz 2 × 2 con o =

(0 −rr 0

)con

r ∈ ℜ. Demuestre que este conjunto es una algebra con las operaciones de matrices.

Ejercicio 2.66. Sea su(2) = u | u es matriz 2× 2 con u =

(r zz∗ −r

)con

r ∈ ℜ y z numero complejo. Demuestre que este conjunto es una algebra con lasoperaciones de matrices.

Page 52: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 53: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 3

MATRICES

1. Mapeos Lineales y Matrices

En esta seccion vamos a introducir los arreglos matriciales. Las matrices sonarreglos que se usan en muchas areas de la fısica, quımica, las matematicas, lacomputacion, etc. Muchas cantidades en todas estas areas son arreglos que puedenser representados como matrices. El uso mas importante que se le ha dado a lasmatrices es porque los sistemas de ecuaciones lineales pueden ser representadosen forma matricial, y las matrices son una herramienta perfecta para ayudar aresolverlos. Una matriz puede ser definida por sı misma, sin necesidad de ser basadaen otras definiciones. La existencia de estos arreglos es independiente del algebralineal, sin embargo nosotros les daremos un sentido muy claro introduciendoloscomo representaciones naturales de los mapeos lineales. Con esta analogıa sera masfacil introducir despues conceptos que se usan en matrices como rango, dimension,etc. Iniciemos entonces con este concepto.

Sean V1 y V2 espacios vectoriales de dimension finita bajo un campo K, talque dimV1 = m y dim V2 = n, entonces existen bases tales que x1,x2, · · · ,xmes base de V1 y y1,y2, · · · ,yn es base de V2. Sea f ∈ L(V1, V2) con x ∈ V1 yf(x) = y ∈ V2 , con

x =

m∑

j=1

ajxj

siendo, ademas, la representacion unica de x en esa base, con aj ∈ K para todoj = 1, · · · ,m. Si mapeamos linealmente al elemento x al espacio vectorial V2,encontramos que

(3.1) f(x) =

m∑

j=1

ajf(xj).

Por otro lado, tambien y =∑n

i=1 biyi tiene una representacion unica en V2

en terminos de los numeros bi ∈ K con i = 1, · · · ., n. Como esta representaciones unica, se tiene entonces que hay una relacion directa entre los numeros aj y bi.Para ver esta relacion, mapeamos linealmente el elemento base xk al espacio V2. Setiene que f(xk) ∈ V2 entonces

(3.2) f(xk) =n∑

i=1

cikyi

En terminos de estos numeros cik ∈ K podemos escribir el elemento x susti-tuyendo la expresion (3.2) en (3.1), se obtiene

41

Page 54: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

42 3. MATRICES

f(x) =

m∑

j=1

aj

(n∑

i=1

cijyi

)=

n∑

i=1

biyi = y

= a1

(n∑

i=1

ci1yi

)+ a2

(n∑

i=1

ci2yi

)+ · · ·+ am

(n∑

i=1

cimyi

)

=n∑

i=1

m∑

j=1

ajcijyi =

m∑

j=1

ajc1j

y1 +

m∑

j=1

ajc2j

y2 + · · ·+

m∑

j=1

ajcnj

yn

= b1y1 + b2y2 + · · ·+ bnyn,

pero como la representacion es unica, se debe tener que bi =∑m

j=1 cijaj , es decir,los coeficientes de y son totalmente determinados por los coeficientes de ak y loscoeficientes cik ∈ K. Estos coeficientes cik los podemos ordenar en la forma masconveniente

C =

c11 c12 · · · c1mc21 c22 · · · c2m...cn1 cn2 · · · cnm

y se llama matriz asocidada al mapeo f ∈ L(V1, V2). Noten que estos coeficientesdependen fuertemente de las bases usadas, pero cada par de bases en V1 y V2 fijan

y determinan unicamente el arreglo (matriz) C, del tipo C = (cik)k=1···mi=1···n , del

tipo (n,m), (n renglones o lıneas y m columnas). Analogamente, cada matriz Cdetermina unicamente el mapeo f ∈ L(V1, V2). Por eso vamos a describir mapeoslineales con matrices y vamos a asocior a cada matriz un mapeo lineal.

Si escribimos

x =

a1

a2

...am

y y =

b1b2...bn

entonces Cx = y y f(x) = y corresponden a la aplicacion del mepeo lineal fa x, siendo ambas expresiones equivalentes. Transportemos las operaciones entremapeos a operaciones entre matrices. Vamos a ver esto con detalle.

Sean f, g ∈ L(V1, V2), k ∈ K y x ∈ V1, tal que

x =

a1

...am

,

Entonces se tiene:1.- La suma de mapeos se traduce a la suma de matrices, es decir (f + g)(x) =

f(x) + g(x), si a f corresponde la matriz C y a g la matriz D, se tiene que af + g corresponde a la matriz C +D. (C +D)(x) = Cx +Dx con la suma entrematrices dada por (C +D) = cij + dij , donde ckj y dij son los coeficientes de C yD repectivamente.

Page 55: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. ISOMORFISMOS 43

2.- Al producto de un numero por el mapeo lineal, corresponde el producto deun numero por la matriz que representa al mapeo de la forma (kf)(x) = k · f(x).Si B corresponde a (kf), entonces Bx = k ·Cx con el producto dado por bij = kcij

3.- Sean f ∈ L(V1, V2) y g ∈ L(V2, V3), esto implica que g f ∈ L(V1, V3). A lacomposicion de mapeos corresponde el producto entre matrices, es decir (gf)(x) =g(f(x)) corresponde a B ·C = D entre matrices, con dij =

∑nk=1 bikckj , donde bik,

ckj y dij son los coeficientes de B, C y D repectivamente.

Ejercicio 3.1. Demuesten los puntos 1.-, 2.- y 3.- anteriores.

2. Isomorfismos

En esta seccion, trataremos particularmente con los mapeos lineales uno a unoy sobre, los isomorfismo. Estos mapeos son muy importantes porque de ellos sedesprenden teoremas que pueden ser traducidos directamente a las matrices, que asu vez se traducen en teoremas que serviran para resolver sistemas de ecuacioneslineales. Estos sistemas son uno de los objetivos de este capitulo. Asi que veamoslas proposiciones correspondientes a isomorfismos. Empecemos por definir el Kernelo nucleo de un mapeo lineal. En lo que sigue V1 y V2 son espacios vectoriales sobreun cuerpo K.

Definicion 3.2. Sea f ∈ L(V1, V2) (no necesariamente biyectiva). El nucleode f es el conjunto ker f = x ∈ V1 | f(x) = 0V2

Lema 3.3. Sea f ∈ L(V1, V2). Si ker f es subespacio vectorial de V1, entoncesf(V1) es subespacio vectorial de V2.

Ejercicio 3.4. Demostrar el lema.

El lema anterior es valido para cualquier mapeo. Si especializamos este lema alos isomorfismos, se tiene este otro lema.

Lema 3.5. Sea f ∈ L(V1, V2). Si f es isomorfismo implica que ker f = 0V1.Demostracion 3.6. Es claro que 0V1 ∈ ker f , ya que f(0V1) = f(x − x) =

f(x)− f(x) = 0V2 , con x ∈ V1. Por otro lado, cualquier elemento x ∈ ker f cumplecon f(x) = 0V2 . Si hubiera un elemento x ∈ V1 con x 6= 0V1 tal que x ∈ ker f ,entonces f(x) = f(0V1) = 0V2 , lo cual contradice que f es un mapeo inyectivo.

Comentario 3.7. Si el ker f = 0V1, ya sabemos entonces que dim ker f = 0

En lo que sigue vamos a ver una proposion que nos ayudara a demostrar algunosresultados posteriores.

Proposicion 3.8. Sean V1 y V2 espacios vectoriales sobre el campo K. Seax1, · · · ,xm base de V1 y sea f ∈ L(V1, V2).

i) Si f es sobre, implica que V2 = L(f(x1), f(x2), · · · , f(xm))ii) Si f es isomorfismo, implica que f(x1), · · · , f(xm) es base de V2

Demostracion 3.9. Denotamos a M = f(x1), · · · , f(xm)i) ⊆: Sea y ∈ V2, f sobre implica que existe x ∈ V1, tal que f(x) = y, pero

x =∑mi=i aixi implica que y = f(x) =

∑mi=i aif(xi) ∈ L(M).

⊇: Sea y ∈ L(M) se tiene y =∑m

i=i aif(xi) ∈ V2 pues V2 es espacio vectorial.ii) En particular f sobre implica que V2 = L(M), ya queM ⊆ V2. Demostremos

que M es linealmente independiente. Sea 0V2 =∑r

i=i aiyi con elementos distintos

Page 56: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

44 3. MATRICES

y1, · · · ,yr, de M, con r ≤ m. f sobre implica que existe xi ∈ V1 tal que yi = f(xi),y f mapeo implica que los x1, · · · ,xr tambien son distintos (xi = xj implica f(xi) =f(xj)). Entonces 0V2 =

∑ri=i aif(xi) = f(

∑ri=1 aixi), por lo que

∑ri=1 aixi ∈

ker f esta en el nucleo de f . f uno a uno implica que 0V1 =∑r

i=1 aixi es unarepresentacion del 0 en V1 con distintos x1, · · · ,xr con r ≤ m. Pero x1, · · · ,xmes una base, entonces se tiene que ai = 0 para toda i = 1, · · · , r.

Corolario 3.10. Sea f ∈ L(V1, V2) con dimV1 = n. Entonces f es isomor-fismo sı y solo sı dim f(V1) = n

Demostracion 3.11. f isomorfismo implica que f es 1-1 y sobre. Sea x1, . . . ,xnuna base de V1. Entonces f(a1x1 + · · · + anxn) = a1f(x1) + · · · + anf(xn) = 0implica que a1 = · · · = an = 0, y como f es un isomorfismo, esto implica quef(x1), . . . , f(xn) son todos diferentes y forman una base de f(V1), por lo quedim f(V1) = n.

El corolario anterior nos da un criterio para saber si un mapeo es isomorfismo ono. Este criterio tambien lo podemos obtener usando otra definicion util para esto.

Definicion 3.12. El Rango de un mapeo lineal f ∈ L(V1, V2) se define como

Rgf := dim f(V1)

Podemos traducir el corolario anterior a esta terminologıa. Se tiene que fes isomorfismo sı y solo sı Rgf = dimV1. El problema de saber si un mapeo esisomorfismo o no, se reduce entonces a determinar el rango del mapeo. Vamos adeterminar Rgf. Para esto tenemos la siguiente proposicion.

Proposicion 3.13. Sea f ∈ L(V1, V2) y X una base de V1. Entonces el Rgf =Rg(f(X)) = dimL(f(X)).

Demostracion 3.14. Como X es base de V1, se tiene que si X = x1, . . . ,xn,se sigue que f(X) = f(x1), . . . , f(xn) existen al menos m < n elementos de f(X)que son l.i., es decir, dim f(X) = m. Sea u ∈ f(V1), implica que existe v = a1x1 +· · · + anxn ∈ V1, tal que u = f(v) = a1f(x1) + · · · + anf(xn), de donde aparecenal menos m componentes diferentes en la suma. Por lo que dim f(V1) = m =dim f(X). De aqui se sigue que Rgf = dim f(V1) = dim f(X). Tambien se tieneque L(f(X)) = f(V1), entonces por definicion Rgf = dim f(V1) = dimL(f(X))

Aquı estamos usando de una manera analoga la definicion de rango del conjuntode vectores M como Rg (M) := dimL(M), la dimension de la cubierta lineal.Entonces, para saber el rango de una transformacion, es suficiente con determinarel rango del conjunto de vectores de alguna base de V1.

Ahora vamos a mostrar un metodo para calcular el rango de f. Sea V espaciovectorial sobre un campo K y M ⊆ V . El metodo consiste en escribir la matrizde representacion del mapeo. Como el rango del mapeo es el mismo que el de sucubierta lineal, se tiene que Rg (M) = dimL(M) = n ya que L(M) es subespaciode V . Entonces podemos escoger cualquier elemento de la cubierta, el rango serael mismo. Escojamos entonces un elemento de la cubierta que nos de una lecturarapida del rango. Para poder escoger este elemento, observemos primero que existenun conjunto de acciones posibles que no cambian al conjunto L(M), estas son:

a) intercambiar elementos de M.b) multiplicar elementos de M por k ∈ K.

Page 57: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. ISOMORFISMOS 45

c) sumar m ∈M a k · x con k ∈ K, x ∈M.d) eliminar un elemento m ∈M con m = 0.Llevando a cabo cualquiera de las acciones enumeradas arriba, el conjunto

L(M) seguira siendo el mismo. Estas acciones se pueden traducir a la matrizcorrespondiente, estas serian:

a) Intercambiar renglones de la matriz de transformacion.b) Multiplicar renglones de la matriz por k ∈ K.c) Sumar renglones por un multiplo de otro renglon.d) Eliminar un renglon de la matriz igual a cero.O hacer lo mismo cambiando la palabra renglon por columna.La receta, entonces, para encontrar el rengo de una transformacion lineal, es

escribir la matriz de transfomacion y reducirla con estas operaciones, hasta ponerlaen una manera conveniente para poder leer su rango. Vamos a ver un ejemplos deeste proceso.

Ejemplo 3.15. Sea f ∈ (ℜ2,ℜ3) y sea la base

x1 =

(10

),x2 =

(01

) ⊂ ℜ2

y1 =

100

,y2 =

010

,y3 =

001

⊂ ℜ3

La transformacion

f → A =

2 11 3−1 0

es tal que f(xk) =

2 11 3−1 0

xk

k = 1, 2, esto es, los elementos de la base se mapean como

f(

(10

)) =

21−1

y f(

(01

)) =

130

por lo que, cualquier elemento de ℜ2 se leera en ℜ3 como

f(

(a1

a2

)) = f(a1

(10

)+a2

(01

)) = a1

21−1

+a2

130

=

2 11 3−1 0

(a1

a2

)

Este mismo proceso no cambia si usamos vectores renglon en vez de vectores columna,lo que se haga para cada columna es analogo para cada renglon. Ahora vamos areducir la matriz de representacion utilizando las operaciones que enunciamos an-teriormente. Vamos a indicar arriba o abajo de cada matriz la operacion que se vaa efectuar para pasar a la siguiente matriz. Se tiene:

A =

2 11 3−1 0

×2 +

−1 2−3 10 −1

1 03 −50 −1

+ ×3/5

Page 58: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

46 3. MATRICES

· · · ×1/5

1 00 −5−3/5 −1

1 00 1−3/5 1/5

El rango de A es de hecho el numero de columnas linealmente independientes de A.Esto implica que Rg (A) = 2 y por tanto el rengo de f es tambien 2.

Ejercicio 3.16. Digan el rango de las siguientes transfomaciones lineales:1.-

f(

(10

)) =

(12

), f(

(01

)) =

(11

)

2.-

f(

100

) =

121

, f(

010

) =

11−2

, f(

001

) =

0−10

3.-

f(

100

) =

12−1

, f(

010

) =

450

, f(

001

) =

212

Ejercicio 3.17. Encuentren el nucleo de las siguientes transformaciones lin-eales.

1.-

f(

100

) =

121

, f(

010

) =

11−2

, f(

001

) =

0−10

2.-

f(

100

) =

120

, f(

010

) =

11−1

, f(

001

) =

0−1−1

Ejercicio 3.18. Utilizando transformaciones de invariancia, reduzca las sigu-ientes matrices a una forma diagonal.

1.- (1 24 5

)

2.-

1 2 −14 5 02 0 −2

3.-

1 2 −14 5 02 1 2

4.-

1 2 −1 14 5 0 −12 1 2 2−2 4 −2 1

Page 59: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. ECUACIONES LINEALES 47

Ejercicio 3.19. Digan con solo ver las matrices diagonalizadas del ajercicioanterior, cual es la dimension del nucleo, el rango y cual de las tranformaciones esbiyectiva.

3. Ecuaciones Lineales

Todo lo aprendido hasta ahora en el capitulo de algebra lineal, lo vamos aaplicar en la resolucion de sistemas de ecuaciones lineales. A partir de aquı usaremosla matriz de representacion de un mapeo para representar al mapeo mismo. SeaA ∈ L(V1, V2) con dimV1 = m y dim V2 = n. Sea A matriz del tipo (n,m) y seab ∈ V2. Usaremos aquı a la letra b para representar un vector conocido, esto nosayudara para escribir el sistema de ecuaciones lineales con la notacion estandard,utilizada en la seccion anterior.

Problema 3.20. Resolver el sistema de ecuaciones lineales

a11l1 + · · ·+ a1mlm = b1

a21l1 + · · ·+ a2mlm = b2...

...

an1l1 + · · ·+ anmlm = bn(3.3)

en donde los numeros li ∈ K son desconocidos y los coeficientes aij y bj son cono-cidos.

Observe que encontrar una solucion al sistema, es encontrar el conjunto denumeros li ∈ K que hagan todas las identidades del sistema verdaderas. Vamos adefinir el conjunto de vectores x,b y la matriz A como

x =

l1...lm

, b =

b1...bn

y A =

a1n · · · a1m

......

an1 · · · anm

El problema Ax = b escrito explicitamente, se ve como en (3.3). Entonces elproblema que nos hemos planteado es equivalente al problema de trasfomacioneslineales o matrices.

Problema 3.21. Encontrar x ∈ V , tal que Ax = b

A Ax = b se le llama ecuacion lineal en x. De este problema surgen muchaspreguntas:

a) ¿Cuantas soluciones hay?b) ¿La solucion es unicamente determinada?c) ¿Como escribir el conjunto de soluciones?La existencia de una solucion lo podemos resolver con ayuda del siguiente lema.

Lema 3.22. Si representamos el mapeo f como A(V1) = L(Ax1, · · · , Axm),usando la base x1, · · · ,xm de V1, tenemos que Ax = b tienen solucion sii b ∈L(Ax1, · · · , Axm) y esto se cumple sii L(Ax1, · · · , Axm) = L(Ax1, · · · , Axm,b).

Demostracion 3.23. De la proposicion 3.8 se sigue el resultado.

Esto implica la igualdad de la dimension de los dos espacios, es decir

Rg(Ax1, · · · , Axm) = Rg (Ax1, · · · , Axm,b)

Page 60: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

48 3. MATRICES

Estos resultados quedaran mas claros con algunos ejemplos.

Ejemplo 3.24. Vamos a determinar si el sistema

4l1 + 5l2 + 6l3 = 2

−2l1 + 2l2 + l3 = −10

l1 + l2 + l3 = 1

tiene soluciones. Hagamos

A =

4 5 6−2 2 11 1 1

y b =

2−101

entonces

Ae1 =

4−21

, Ae2 =

521

, Ae3 =

611

Hay que determinar una base simple de L (Ae1, Ae2, Ae3) para determinardimL (Ae1, Ae2, Ae3) = Rg (A)

Ejercicio 3.25. Llevar la matriz A a su forma diagonal, usando las opera-ciones invariates de la cerradura lineal.

4 −2 15 2 16 1 1

1 0 00 1 00 0 1

Por lo tantoRg (A) = Rg (Ae1, Ae2, Ae3) = 3, ademas b ∈ L (Ae1, Ae2, Ae3) .Es facil ver que L (Ae1, Ae2, Ae3,b) = L (Ae1, Ae2, Ae3) por lo tanto el sis-tema tiene solucion.

Un metodo muy eficiente para encontrar la solucion de un sistema de ecuacioneslineales es el metodo de Gauβ-Jordan. El metodo se basa en las operaciones quedejan invariante la cerradura lineal. Estas se traducen en las siguientes operacionesen el sistema.

El sistema no cambia sıa) Se intercambian ecuacionesb) Se multiplica una ecuacion por una constante del campo diferente de cero.c) Se suma un multiplo de una ecuacion con otra.d) Se elimina una ecuacion de ceros.

Ejercicio 3.26. Resolver el sistema anterior usando el metodo de Gauβ-Jordan.

La solucion de un sistema sera unica sı la matriz tiene propiedades muy espe-ciales. Estas propiedades son importantes ya que en tal caso no solo sabremos quela solucion existe, sino ademas cual es. Veamos.

Proposicion 3.27. Six es solucion de Ax = b,

x esta unicamente deter-

minada sı y solo sı A es mapeo uno a uno y sı y solo sı kerA = 0V1

Demostracion 3.28. ⇒) Seax unica. Sean x,y ∈ V1 con Ax = Ay. Entonces

Ax − Ay = 0V2 , o sea A (x− y) = 0V2 . Como Ax = b, entonces se cumple

que A(x + (x− y)

)= A

x + A (x− y) = b. Por lo que se tiene tambien que

Page 61: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. TRANSPUESTA E INVERSA DE MATRICES 49

x + x − y es solucion. Pero

x es unica, por lo que

x =

x + (x− y), se sigue que

x = y. Implica entonces que A es uno a uno.

⇐) Sea A uno a uno,x es solucion y sea

∧x tambien solucion. A

x = A

∧x = b.

Pero A uno a uno implica quex =

∧x.

ademas A uno a uno implica que el kerA = OV2 .

Ejercicio 3.29. Demostrar que A =

4 5 6−2 2 11 1 1

tiene una solucion

unica.

Con estas proposiciones ya es entonces posible obtener la solucion del sistemade ecuaciones. La solucion se construye usando la siguiente proposicion.

Proposicion 3.30. Seax una solucion al sistema Ax = b. El conjunto de

todas las soluciones del sistema es x + h | h ∈ kerA =not x + kerA.

Demostracion 3.31. i) Sea y ∈ x + kerA, esto implica que y =

x + h, con

h ∈ kerA es solucion ya que A(x + h

)= b + 0 = b.

ii) Sea y solucion, entonces y =x +

(y −

x). Sı escribimos h = y −

x, se

tiene que y =x + h. Pero Ah = A

(y −

x)

= Ay − Ax = b − b = 0. Por lo que

h ∈ kerA. Por lo tanto y ∈ x + kerA.

En el caso de que el nucleo de la transformacion sea solo el conjunto con elcero, se tiene que la transformacion correspondiente es biyectiva. Solo en este casola solucion del sistema correspondiente es unica, ya que le podemos sumar a lasolucion solo el vector cero. En terminos del rango, esto quiere decir lo siguiente.

Proposicion 3.32. Sea A matriz del tipo (n,m). Supongamos que Ax = b

tiene solucionx, entonces

x es unicamente determinada sı y solo sı Rg (A) = m.

Vamos a resumir todos los resultados sobre soluciones de un sistema de ecua-ciones. Podemos poner los diferentes casos en una tabla como sigue.

Resumen 3.33. Sea A del tipo (n,m), con Ax = b sistema de ecuaciones. Setiene que

A matriz (n,m) Ax = b (inhomogeneo) Ax = 0 (homogeneo)

Rg (A,b) 6= Rg (A) no hay solucion solo la solucion trivialx = 0

Rg (A, b) = Rg (A) = rr = m

solucion unica solo la solucion trivial

r < m mas de una solucion soluciones no triviales

4. Transpuesta e Inversa de Matrices

En esta seccion vamos a definir dos matrices derivadas de una matriz cualquiera,la transpuesta y la inversa. Ambas son de mucha utilidad en problemas concre-tos y seran utilizadas mas adelante, aquı daremos su definicion y algunas de suspropiedades mas importantes.

Page 62: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

50 3. MATRICES

Definicion 3.34. Sea A matriz del tipo (n,m) . La transpuesta de A, es lamatriz AT tal que si

A =

a11 · · · a1m

...an1 · · · anm

se tiene que AT =

a11 · · · an1

...a1m · · · anm

y es del tipo (m,n) , es decir, se cambian renglones por columnas.

Cuando calculamos el rango de una matriz, las operaciones que hacemos conlos renglones las podemos igualmente hacer con la columnas de la matriz, por loque si cambiamos renglones por columnas el rango no cambia. Por esta razon sesigue la siguiente proposicion

Proposicion 3.35. Rg (A) = Rg(AT)

Ejercicio 3.36. Probar la proposicion anterior.

La matriz tanspuesta tiene una serie de propiedades que la hacen muy intere-sante, las mas iportantes las podemos resumir como sigue.

Propiedades de la transpuesta de Matrices.

1)(AT)T

= A

2) (A ·B)T

= BT · AT3) (A+B)

T= AT +BT

4) Si x ∈ K, se cumple (x ·A)T

= x ·AT

Comentario 3.37. Como veremos mas adelante, las propiedades 1) y 2) separecen a propiedades analogas a las de la inversa de una matriz. Pero la transpuestasiempre existe, la inversa no necesariamente.

Ahora veamos las propiedades de la inversa de matrices.

Definicion 3.38. La inversa de una matriz A (n, n) es la matriz A tal que

A ·A−1 = A−1 · A =

1 0. . .

0 1

Notacion 3.39. De aquı en adelante usaremos a notacion

I =

1 0. . .

0 1

Las propiedades mas importantes de la inversa de una matriz se resumen en lasiguiente proposicion.

Proposicion 3.40. Sea A matriz del tipo (n, n)Las siguientes condiciones son equivalentes.1) Existe la matriz A−1 de tipo (n, n) tal que A−1 ·A = A · A−1 = I2) Sea f el mapeo correpondiente a A, entonces f es sobre3) kerA = 04) Rg (A) = n5) El mapeo f correspondiente a A es uno a uno.

Page 63: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. TRANSPUESTA E INVERSA DE MATRICES 51

Demostracion 3.41. Para demostrar esta proposicion, vamos a demostrar delpaso 1) al 5) y luego el 5) al 1).

1) ⇒2): Sea f ∈ L (V1, V2) , tal que dim V1 = dimV2 = n. Sea y ∈ V2, tal quey = Iy, con I la matriz identidad. Se sigue que y =

(A · A−1

)y = A

(A−1y

).

Entonces sı existe un x ∈ V1 tal que Ax = y pues x = A−1y.2) ⇒3): Esto se sigue del hecho que n = dimA (V1) + dimkerA, entonces

dimkerA = 0.3) ⇒4): Esto se sigue del hecho que Rg (A) = dimA (V1) = n4) ⇒5): Rg(A) = n implica que no existen columnas o renglones de ceros, esto

hace al mapeo correspondiente uno a uno.5) ⇒1): f uno-uno implica que existe f−1, por tanto A−1 es la matriz asociada

a f−1.

Ahora veremos un metodo para encontrar la inversa. De nuevo usamos las op-eraciones invariantes de la cerradura lineal. Supongamos que A−1 existe y aplique-mos el metodo de Gauβ−Jordan a la matriz extendida (A, I), lo que debemosobtener al final es (I, A−1), es decir

a11 · · · a1n

... 1 · · · 0...

.... . .

an1 · · · ann... 0 · · · 1

pasos de∼

Gauβ-Jordan

(A

... I

)

1 0... a−1

11 · · · a−11n

. . ....

...

0 1... a−1

n1 · · · a−1nn

(I

... A−1

)

donde estamos usando la notacion a−1ij = (aij)

−1.

Definicion 3.42. Una matriz A del tipo (n, n) se llama regular sı Rg(A) = n.Se llama singular si Rg(A) 6= n.

Es decir, A regular implica que existe su inversa A−1 y ademas Rg (A) = n.

Comentario 3.43. Si A es regular la solucion de Ax = b es x = A−1b y esunica.

Ejercicio 3.44. Sean las matrices

M =

1 −1 22 3 −11 −1 0

N =

0 −1 22 0 −11 −1 0

S =

1 −1 22 −2 21 −1 0

Usando el metodo de Gauβ-Jordan, encuentre la inversa de M , N y S.

Ejercicio 3.45. Sean el vector

b =

1−12

Page 64: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

52 3. MATRICES

Resuelva los sistemas Mx = 0, Nx = 0 y Sx = 0 asi como Mx = b, Nx = by Sx = b usando el metodo de Gauβ-Jordan y usando la inversa de las matricesM y N . Diga cuantas soluciones tiene cada sistema.

Page 65: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 4

DETERMINANTES

1. Definicion

Al igual que los grupos y los anillos, el conjunto de las matrices puede separarseen clases. Las matrices son objetos matematicos de cierta complejidad, es por esoque es muy interesante analizar cantidades que sean invariantes en las diferentesclases de las matrices. Como veremos mas adelante, los determinantes son canti-dades invariantes en las clases y pertenecen al campo en donde se definieron lasmatrices. Estas cantidades se le pueden asociar a las matrices cuadradas. Comoveremos en la siguiente seccion, los determinantes tambien son muy utiles paracalcular las soluciones de sistemas de ecuaciones lineales. Por ahora daremos sudefinicion y algunas de sus propiedades.

Sea A matriz cuadrada sobre el campo K del tipo (n, n), asociada al mapeolineal f ∈ L (V1, V2)

A =

a11 · · · a1n

......

an1 · · · ann

Definicion 4.1. Se asocia a A de manera unica, un numero de K llamado eldeterminante de A, definido como

detA =

∣∣∣∣∣∣∣

a11 · · · a1n

......

an1 ann

∣∣∣∣∣∣∣=∑

P

(sgnP )a1i1a2i2 · · · anin ,

donde la suma se lleva a cabo sobre todas las posibles permutaciones

P =

(1 2 · · · ni1 i2 · · · in

)

de los numeros 1, 2, · · · , n.Observemos entonces que la suma que calcula el determinante de la matriz

A, tiene n! terminos. El sgnP es el signo de la permutacion de P. ¿Y como secalculan los determinantes? El calculo de los determinantes suele ser un procesomuy largo y tedioso, sobre todo para matrices de dimension grande. Sin embargoexisten algunos metodos para calcular el determinante que suelen ayudar y reducirmucho el trabajo del calculo. Para el caso de dimensiones bajas, n = 2, 3 se usa laregla de ”Sarras”. Aplicando la definicion de determinante para una matriz (2, 2),se llega facilmente a la formula

det

∣∣∣∣a bc d

∣∣∣∣ = ad− bc

53

Page 66: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

54 4. DETERMINANTES

Para el caso de una matriz (3, 3) tambien existe una formula simple. De ladefinicion de determinante se obtiene

det

∣∣∣∣∣∣

a b cd e fg h i

∣∣∣∣∣∣= aei+ bfg + cdh− ceg − bdi− afh

Para n > 3 el ploblema se complica mucho y es conveniente usar el teoremade Laplace, que consiste en lo siguiente. Para calcular el determinante de la matriz

A = (A)j = aij que es (n, n), primero se calculan los determinantes Clk, donde los

Clk son los subdeterminantes (n− 1, n− 1) generados por medio de quitar la l-esimalinea y la k-esima columna del detA, tal que detA = Σni=1 aikCik = Σni=1akiCkipara k ∈ 1, 2, · · · , n, donde los determinantes Clk = (−1)l+k Clk se llaman loscofactores de A, es decir

Cik = (−1)i+k

∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣

a11 a12 · · · a1k−1 a1k+1 · · · a1n

a21 a22 · · · a2k−1 a2k+1 · · · a2n

......

ai−1 1 ai−1 2 · · · · · · ai−1n

ai+11 ai+12 · · · · · · a1+1n

......

an1 an2 · · · · · · ann

∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣∣

El teorema de Laplace consiste en reducir detA en n subdeterminantesCik de una dimension menor y despues aplicar la formula de Laplace detA =Σni=1 aikCik . Entonces se aplica sucesivamente este proceso hasta llegar a un de-terminante de 3 o 2 lineas, cuya formula es ya conocida. Por supuesto este procesopuede llegar a ser muy largo para determinantes de dimension grande. Para calcularestos determinantes, a veces ayudan otros metodos. A continuacion presentaremosuno de ellos que es muy util para estos determinantes. Este metodo esta basado enalgunas propiedades de los determinantes. Para explicar estas propiedades, escribi-mos las lineas de detA como n -uplas o vectores V1, V2, · · · , Vn. Entonces detAse puede ver como una funcion del conjunto de estos vectores, al campo K, es decirD : V1, V2, · · · , Vn K , tal que D (V1, · · · , Vn) = detA, donde Vi es la linea ide A. Las propiedades del determinate en terminos de esta funcion son

1)D (V1, · · · , Vi−1, Vi, · · ·Vn) = −D (V1, · · · , Vi, Vi−1, · · · , Vn), intercambiar doslineas cambia el signo del determinante.

2)a) Seam ∈ K, entoncesmD (V1, · · · , Vi, · · · , Vn) = D(V1, · · · ,mVi, · · · , Vn),

el producto del determinate por una constante es igual al producto de una lineapor la constante.

b)D(V1, · · · , Vk, · · · , Vn)+D(V1, · · · , V 1k , · · · , Vn) = D(V1, · · · , Vk+V 1

k , · · · , Vn),la suma de dos determinantes con una k-esima linea diferente, es igual al determi-nante de la matriz con la suma de las k-esimas lineas. Estas dos propiedasdes hacenal determinante lineal en cada argumento, es decir, D es una funcion multilineal.

3) D(V1, Vn) = 0 sii V1, Vn son linealmente dependientes.4) detA = detAT

5) det (A ·B) = (detA) (detB) = det (B ·A)

Page 67: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. DEFINICION 55

El determinante es muy util para saber si una matriz es regular. Esto se lograusando el siguiente lema.

Lema 4.2. Sea A matriz del tipo (n, n). A es regular sı y solo sı detA 6= 0

Demostracion 4.3. =⇒) A regular implica que existe A−1, entonces A ·A−1 = I, pero det

(A · A−1

)= (detA)

(detA−1

). Como det I = 1, se sigue que

(detA)(detA−1

)= 1, por lo que detA 6= 0.

Ejercicio 4.4. Demuestre la otra direccion ⇐=) del lema.

Corolario 4.5. A regular implica que det A−1 = (detA)−1

Existe un metodo muy usado para calcular la inversa de una matriz, usandolos cofactores. Para ver esto, primero definamos la matriz adjunta.

Definicion 4.6. La matriz adjunta se define como

adj (A) = (adj (A))ij = Cij

donde los Cij son los cofactores de la matriz A

Recordemos que el determinante de A se calcula como detA = Σni=1 aikCik.Vamos a introducir una proposicion, sin demostracion, que generaliza esta ultimaexpresion.

Proposicion 4.7. Se puede generalizar la expresion para detA como detAδkj =Σni=1 aikCij donde δkj es la delta de Kronecker definida por

δkj =

1 si k = j0 si k 6= j

la cual tambien puede ser representada por la matriz identidad I, i.e. (I)kj = δkj

Es por eso que en terminos de la matriz adjunta, el determinante se escribeentonces como (detA) I = Σni=1 aikCij = A (adj (A)). Esta ultima formula nos daun metodo para calcular la inversa, esto es

A−1 = (detA)−1

(adj (A))

Finalmente, ya vimos que detA 6= 0 implica que A es regular y ademas queRg (A) = n. Entonces implica que existe una unica solucion del sistema Ax = b.Existe tambien un metodo que usa determinantes para resolver este sistema. Aeste metodo se le conoce como Teorema de Cramer, el cual enunciaremos aquı sindemostracion.

Teorema 4.8. de Cramer. Sea A matriz de tipo (n, n) y Ax = b sistema deecuaciones lineales.

A =

a11 · · · a1n

......

an1 ann

b =

b1...bn

si detA = |A| 6= 0 entonces la solucion al sistema

x =

l1...ln

Page 68: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

56 4. DETERMINANTES

es unicamente determinada y tiene la forma

lj =

∣∣∣∣∣∣∣

a11 · · · a1j−1 b1 a1j+1 · · · a1n

...an1 · · · anj−1 bn anj+1 ann

∣∣∣∣∣∣∣detA

El numerador de la solucion lj , es el determinante de la matriz Aj generadapor substituir la j-esima columna de A por el vector b. Para entender mejor estaformula, vamos a ver algunos ejemplos.

Ejemplo 4.9. Sea Ax = b

A =

4 5 6−2 2 11 1 1

b =

2−101

,

el determinante de A lo calculamos usando el teorema de Laplace

detA = 4

∣∣∣∣2 11 1

∣∣∣∣− (2)

∣∣∣∣5 61 1

∣∣∣∣+ 1

∣∣∣∣5 62 1

∣∣∣∣ = 4 (1) + (−1) + 1 (−7) = −5

Entonces la solucion del sistema esta dado por

l1 = −1

5

∣∣∣∣∣∣

2 5 6−10 2 11 1 1

∣∣∣∣∣∣= 3, l2 = −1

5

∣∣∣∣∣∣

4 2 6−2 −10 11 1 1

∣∣∣∣∣∣= −2,

l3 = −1

5

∣∣∣∣∣∣

4 5 2−2 2 +101 1 1

∣∣∣∣∣∣= 0

Ejercicio 4.10. Resolver por el metodo de Gauβ-Jordan, por el metodo de lamatriz inversa y por el metodo de Kramer, los siquientes sistemas de ecuaciones.

1)

3l1 + 2l2 − l3 = 1

l1 − l2 + 3l3 = 9

4l1 − 6l2 + l3 = 2

2l1 + 3l2 − 4l3 = −8

2)

3l1 + 2l2 − l3 = 1

l1 − l2 + 3l3 = 9

2l1 + 3l2 − 4l3 = −8

3)

3l1 + 2l2 − l3 = 0

l1 − l2 + 3l3 = 0

2l1 + 3l2 − 4l3 = 0

Page 69: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. MATRICES SIMILARES 57

4)

3l1 + 2l2 − l3 = 0

l1 − l2 + 3l3 = 0

4l1 − 6l2 + l3 = 0

5)

3l1 + 2l2 − l3 = 1

l1 − l2 + 3l3 = −2

4l1 − 6l2 + l3 = 2

2l1 + 3l2 − 4l3 = −8

2. Matrices Similares

El conjunto de matrices se puede separar en clases de equivalencia. Esta sepa-racion es muy conveniente ya que en muchas ocaciones va a ser suficiente trabajarcon algun elemento de la clase y no con una matriz en general. A la relacion quesepara a las matrices en clases, se le llama similaridad y es de lo que nos ocuparemosen esta seccion.

Definicion 4.11. Dos matrices A,B del tipo (n, n, ) se llama similares sıexiste una matriz regular U del tipo (n, n) tal que A = UBU−1.

Notacion 4.12. A la transformacion B UBU−1 se le llama transfor-macion de similaridad.

La transformacion de similaridad es una relacion de equivalencia y es justo estehecho lo que da a esta transformacin su importancia. Esta afirmacion la pondremosen la siguiente proposicion.

Proposicion 4.13. La similaridad en el conjunto de todas las matrices (n, n)es una relacion de equivalencia.

Demostracion 4.14. Veamos que la relacion es1) reflexiva: A es similar a A pues U = I es regular.2) simetrica: A = UBU−1 implica que B = U−1AU3) transitiva: A = UBU−1 y B = SCS−1 con U y S regulares, entonces

existe W = US tal que A = UBU−1 = U(SCS−1

)U−1 = (US)CS−1U−1 =

USC (US)−1 .

Ahora vamos a ver algunas de las propiedades mas interesantes de matricessimilares. Para esto, supongamos que tenemos una matriz que es la suma de muchasmatrices. Para transformar esta matriz a su similar, es suficiente en conocer lasimilaridad de cada sumando y luego sumarlas todas. Esta propiedad la podemosenunciar como un lema.

Lema 4.15. Para transformar una suma de matrices en su similar, se sumanlas similares de cada matriz.

Demostracion 4.16. Se tiene U (A1 + · · ·+An)U−1 = UA1U−1 + · · · +

UAnU−1.

De la misma forma, podemos transformar potencias de matrices

Page 70: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

58 4. DETERMINANTES

Lema 4.17. El similar de la potencia de una matriz es la potencia del similar.

Demostracion 4.18. Se tiene UAnU−1 = UAU−1UAU−1 · · ·UAU−1 =(UAU−1

)n.

Por lo tanto, se tiene la siguiente proposicion,

Lema 4.19. La matriz similar de una matriz polinomial es el polinomio de lamatriz similar .

Demostracion 4.20. Por los lemas anteriores se tiene que Upn(A)U−1 =pn(UAU

−1) para todo polinomio pn de grado n.

El siguinte paso es determinar representantes convenientes de cada clase deequivalencia.

3. Invariantes de Matrices Similares (Vectores y Valores Propios)

El problema que nos enfrentamos ahora es el de saber si una matriz esta enalguna clase de equivalencia del conjunto de matrices conocidas. Las clases de equiv-alencia poseen algunos inveriantes, numeros o vectores que caracterizan la clase oson un criterio para saber si alguna matriz esta en alguna clase determinada. Enesta seccion veremos algunos invariates, sus propiedades y lo metodos mas comunespara calcularlos. La primera propiedad esta dada por la siguiente proposicion

Proposicion 4.21. Matrices similares realizan la misma transformacion lin-eal, usando diferentes bases del espacio vectorial.

Demostracion 4.22. Veamos primero una idea de la demostracion. Sea latransformacion lineal f ∈ L (V, V ), esta transformacion tendra asociada una ma-triz A en la base xii=1,··· ,n. En otra base yii=1,··· ,n, relacionada con la basexii=1,··· ,n por yi =

∑nj=1 uijxj , que se puede representar matricialmente por

y = Ux, la transformacion lineal tendra otra matriz de representacion B. En-tonces, un vector v ∈ V podra escribirse en cualquiera de las dos bases comov =

∑ni=1 rixi =

∑nj=1 sjyj =

∑nj=1

∑nk=1 sjujkxk, por lo que encontramos la

relacion matricial r = Us. Se debe cumplir que Av = Bv, o sea Arx = Bsy, esdecir, AUsx = BsUx, de donde se sigue que U−1AU = B.

Ejercicio 4.23. Mostrar los detalles de la proposicion anterior.

Entonces tenemos el siguiente problema ¿Como reconocer matrices similares?¿Que propiedades se mantienen iguales cuando transformamos una matriz en otrapor medio de una transformacion de similaridad? La siguiente proposicion nos darauna idea para resolver estas preguntas.

Proposicion 4.24. Sean A y B matrices similares. Entoncesa) Rg (A) = Rg (B)b) detA = detB

Demostracion 4.25. Sean A,B del tipo (n, n) y A = UBU−1, con U regular.b) detA = det

(ABU−1

)= detU detB detU−1 = detB

Ejercicio 4.26. Demostrar a) de la proposicion anterior.

Page 71: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. INVARIANTES DE MATRICES SIMILARES (VECTORES Y VALORES PROPIOS) 59

Ahora ya tenemos un primer criterio para saber cuando dos matrices pertenecena la misma clase, con esta proposicion, al menos sabemos que si detA 6= detB oRg (A) 6= Rg (B) entonces A y B no son similares. Vamos a introcir otro criteriopara saber si dos matrices no son similares. Para esto iniciamos con la siguientedefinicion.

Definicion 4.27. Sea A la matriz que representa al automorfismo f ∈ L (V, V )con dimV = n. A cada x ∈ V , con x 6= 0V , que cumple Ax = λx para algunλ ∈ K, se le llama vector propio (eigen vector) de A y λ se le llama valorpropio (eigen valor) asociado a x.

El sistema Ax = λx puede ser escrito de la manera mas conveniente como

(4.1) (A− λI)x = O

donde I es la matriz identidad y O es la matriz con ceros en todas las entradas.(4.1) es un sistema homogeneo de ecuaciones lineales que en principio podemosresolver con caulquiera de los metodos que ya hemos expuesto. Observemos que elsistema (4.1) tiene soluciones no triviales, diferentes de cero, si Rg (A− λI) < n,pero esto sucede si det (A− λI) = 0K . Este hecho da pie a la siguiente definicion.

Definicion 4.28. A la matriz A − λI se le llama la matriz caracteristicade A. Al polinomio det (A− λI) se le llama polinomio carateriztico de laecuacion (4.1). det (A− λI) = 0 se le llama la ecuacion caracteristica de A.

Una de las propiedades mas importantes de los polinomios caracteristicos es lasiguiente

Teorema 4.29 (Cayley-Hamilton). Toda matriz es raiz de su polinomio car-acteristico.

Demostracion 4.30. Sea A matriz y P = A − λI. Sea B la matriz adjuntade P , por lo que det(P )I = P (adj(P )), es decir

| A− λI | I = (A− λI)B.Como B es una matriz polinomial de grado n− 1 y det(P ) es un polinomio de

grado n, se tiene que la ecuacion anterior se puede reescribir como

(a0 + a1λ+ · · ·+ anλn) I = (A− λI)

(B0 +B1λ+ · · ·+Bn−1λ

n−1)

donde det(P ) = a0+a1λ+· · ·+anλn es el polinomio caracteristico y las matrices Bi,con i = 1, · · · , n− 1 son las matrices que forman la matiz polinomial B. Igualemoscoeficientes de igual grado en λ de ambos lados de la ecuacion anterior, de dondese obtiene

a0I = AB0;

a1I = AB1 −B0;

a2I = AB2 −B1;

...

an−1I = ABn−1 −Bn−2;

anI = −Bn−1.

Page 72: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

60 4. DETERMINANTES

Ahora multipliquemos la segunda igualdad de la lista anterior por A, la terceraigualdad por A2, y asi susesivamente hasta que la ultima la multiplicamos por An

y sumemos todo de ambos lados. El resultado es

a0I + a1A+ · · ·+ anAn = 0

En lo que sigue, daremos un metodo para calcular los valores propios y losvectores propios de una matriz A.

Paso 1. Usando la ecuacion caracteristica, se calculan los valores caracterisiticosλ1, · · · , λn como raices del polinomio caracteristico.

Paso 2. Para cada autovalor encontrado, se soluciona la ecuacion

(A− λI)x =

a11 − λ a12 · · · aina21 a22 − λ · · · ann...an1 an2 · · · ann − λ

l1l2...ln

= 0.

El metodo es simple, para verlo con mas claridad vamos a ver un ejemplo.

Ejemplo 4.31. Sea V = R2 y K = R, y sea A la matriz A =

(3 12 4

).

Entonces el polinomio caracteristico de A es

det (A− λI) = (3− λ) (4− λ)− 2 = 12− 3λ− 4λ+ λ2 − 2 = λ2 − 7λ+ 10 = 0

Las raices del polinomio caracteristico son, λ1,2 = 72 ±

√494 − 40

4 = 72 ± 3

2 , es

decir λ1 = 2 y λ2 = 5. Entonces los valores propios son 2 y 5.Los vectores propios asociados a λ1 se encuentran resolviendo

(A− λ1I)x = 0 =

(3− 2 1

2 4− 2

)(l1l2

)=

(00

)

La solucion de esta ecuacion matricial se reduce a la solucion del sistema

l1 + l2 = 0

2l1 + 2l2 = 0

que conduce a la solucion l1 = −l2. Esto es, los vectores propios asociados a este

valor propio son de la forma

(r−r

)con r ∈ R. Los vectores propios asociados a

λ2 se encuentran resolviendo la ecuacion

(A− λ2I)x = 0 =

(3− 5 1

2 4− 5

)(l1l2

)=

(00

)

la ecuacion matricial se reduce a

−2l1 + l2 = 0

2l1 − l2 = 0

cuya solucion esta dada por l2 = 2l1, entonces los vectores propios estan dados por(s2s

), con s ∈ R.

Page 73: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. INVARIANTES DE MATRICES SIMILARES (VECTORES Y VALORES PROPIOS) 61

Observemos la siguiente importante propiedad. Sean A y B matrices similares,i..e. A = UBU−1. Entonces se sigue que det (A− λI) = det

(U−1BU − λI

)=

det(U−1BU − λU−1IU

)= det

(U−1 (B − λI)U

)=(

detU−1)det (B − λI) detU = det (B − λI) o sea det (A− λI) = det (B − λI).

Esta es una propiedad muy importante de las matrices similares, es decir:

Proposicion 4.32. Matrices similares tiene el mismo polinomio caracteristicoy por lo tanto los mismos valores y vectores propios.

Con este ultimo resultado ya tenemos tres criterios para decidir si dos matricesno son similares. Si su rango o su determinante o sus valores o vectores propios noson los mismos, de entrada las matrices no son similares. Para que dos matricessean similares, deben tener al menos el mismo rango, el mismo determinante y losmismo valores propios.

Vamos a introducir una definicion muy importante que consiste en la sumade los elementos de la diagonal de una matriz, a esta suma se le llama la traza.Formalmente se define como sigue.

Definicion 4.33. La traza de A esta definida por

TrA = Σni=1aii

es decir, es la suma de los elementos de la diagonal de A

Comentario 4.34. Otras propiedades de los valores y vectores propios, son lassiguientes.

1) Si λ1, λ2, · · · , λn son los valores propios de la matriz A, se tiene que

detA = Πni=1λi, y

TrA = Σni=1λi

2) Como consecuencia de 1) se sigueSi detA = 0, esto es sı y solo sı existe algun valor propio de A que es cero,

λj = 0.A regular, sı y solo sı ningun valor propio de A tiene el valor 0, es decir, sı y

solo sı 0 no es valor propio de A.3) Si λ1, λ2, · · · , λn son los valores propios de A y son todos distintos, im-

plica que el conjunto de vectores propios x1, · · · ,xn donde xi es el vector propioasociado a λi, es linealmente independiente en V.

4) Si K = R y V = Rn, los valores propios son en general complejos. Pero siA = AT los valores propios son reales.

5) Si A ∈ O (n) =A | A es (n, n) y AT = A−1

, entonces todos los valores

propios tienen el valor 1.

Ejercicio 4.35. Demostrar las propiedades 1) a 5)

Estas propiedades de los valores y vectores propios vuelven a estos de sumaimportancia en el estudio de matrices y en general en el algebra lineal.

Page 74: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 75: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 5

FORMAS CANONICAS

1. Introduccion

Ya hemos separado al conjunto de matrices en clases de equivalencia. Ahorabuscaremos representantes diversos que sean simples en estas clases de equivalen-cia. Ya sabemos que estos representantes puede ser cualquier miembro de la clase.Sin embargo, los representantes mas simples para trabajar seran siempre los quecontengan un mayor numero de ceros en sus componentes. Estos representantessimples son generalmente diagonales o cuasidiagonales. Para obtener estos repre-sentantes hay que tomar varias cosas en cuenta. Ya sabemos que invariantes dematrices similares son, entre otros, el rango, el determinante y los valores propios.Sin embargo, estos invariantes sirven para saber cuando dos matrices no son sim-ilares. Por ejemplo, si Rg(A) 6= Rg(B), esto implica que A y B no son similares.Sin embargo, si Rg(A) = Rg(B), esto no implica que A y B son similares.

Para ver si dos matrices estan en la misma clase de equivalencia con la relacionde similaridad, se encuentra un representante simple de la clase y se compara estecon las matrices que deben ser similares. Si cada una es similar al representante,las matrices son similares. En otras palabras, sean por ejemplo A y B, ¿son A ∼ Bsimilares? Si [C] es un representante de una clase tal que A ∼ [C], se ve si B ∼ [C].A estos representantes simples se les llama formas canonicas. Para introducir lasformas canonicas, vamos primero a dar algunas definiciones utiles.

Definicion 5.1. Las matrices pueden ser· Una matriz diagonal, si solo tiene terminos de cero en los elementos diag-

onales esto es

C =

c11 0 · · · 00 c22 0...

. . .

0 0 · · · cnn

· Una matriz es triagonal, si es de la forma

C =

c11 c12 · · · c1n0 c22 c2n...

. . ....

0 cnn

, o C =

c12 0 · · · 0c21 c22...

. . .

cn1 cn2 · · · cnn

63

Page 76: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

64 5. FORMAS CANONICAS

· Una matriz es cuasidiagonal, si es hecha de bloques no diagonales en ladiagonal, de la forma

C =

[ ] 0

⌈ ⌉...

... ⌊ ⌋0 [ ]

Si la matriz es polinomial, como es el caso de la matriz caracteristica, es muyconveniente hacer la siguiente definicion.

Definicion 5.2. Una matriz polinomial U(λ) se llama forma canonicadiagonal, si todo elemento diagonal pi(λ) divide al elemento siguiente pi+1(λ) y siel elemento principal de todos los polinomios p1(λ), · · · , pn(λ) diferente de cero es1, es decir, una matriz en su forma canonica diagonal tiene la estructura

C =

1 0 · · ·. . . 0

0 1p1(λ)

.... . .

...pn(λ)

0 0 0. . .

· · · 0 0

donde pi(λ) con i = 1, · · · , n son polinomios, tales que p2/p1, · · · , pn/pn−1 sonpolinomios. A los polinomios pi(λ) se les llama los factores invariantes de lamatriz.

Siempre es posible llevar a una matriz polinomial a su forma canonica diagonal,usando transformaciones elementales. Para ver esto veamos un ejemplo:

Ejemplo 5.3. Sea la matriz polinomial

x3 − 2x+ 1 3x4 + 2x x2

2x2 − x 0 13x2 + 1 −2x3 x

El primer paso para llevar esta matriz a su forma canonica diagonal, es ponerel polinomio de la matriz de menor grado diferente de cero, en la esquina superiorizquierda. En este caso el polinomio de menor grado es el 1. Entonces, cambiandola tercera columna por la primera y luego el segundo renglon por el primero, seobtiene

1 0 2x2 − xx2 3x4 + 2x x3 − 2x+ 1x −2x3 3x2 + 1

Ahora multiplicamos el primer renglon por x2 y lo restamos con el segundo,lo ponemos como segundo renglon. Analogamente, multiplicamos el primer renglon

Page 77: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. INTRODUCCION 65

por x y lo restamos con el tercero, colocandolo en el tercer renglon. Se obtiene:

1 0 2x2 − x0 3x4 + 2x −2x4 + 2x3 − 2x+ 10 −2x3 −2x3 + 4x2 + 1

Entonces multiplicamos la primera columna por 2x2 − x y la restamos de latercera columna, la ponemos en vez de la tercera columna, para obtener

1 0 00 3x4 + 2x −2x4 + 2x3 − 2x+ 10 −2x3 −2x3 + 4x2 + 1

El resultado es que tenemos una matriz cuasidiagonal. Volvemos a empezar elproceso, pero ahora con la matriz 2×2 de la diagonal inferior. Pongamos de nuevoel polinomio de menor grado (y mas simple) en la esquina superior izquierda. Estose logra cambiando el segundo por el tercer renglon. Se obtiene

1 0 00 −2x3 −2x3 + 4x2 + 10 3x4 + 2x −2x4 + 2x3 − 2x+ 1

Lo que sigue es analogo al proceso anterior, hay que diagonalizar este bloque.Vamos a multiplicar el segundo renglon por 3x4 +2x y restarlo con el tercer renglonmultiplicado por −2x3. Se obtiene

1 0 00 −2x3 −2x3 + 4x2 + 10 0

(−2x4 + 2x3 − 2x+ 1

) (−2x3

)−(−2x3 + 4x2 + 1

) (3x4 + 2x

)

Finalmente, multiplicamos la tercera columna por −2x3 y se la restamos a lasegunda columna multiplicada por −2x3 +4x2 +1 y la ponemos en vez de la terceracolumna, obtenemos:

1 0 00 1 00 0 10x7 − 16x6 + 5x4 − 10x3 − 2x

donde hemos dividido el segundo renglon entre −2x3, para obtener en la diagonalun polinomio que divida al ultimo de la diagonal. Observemos que el determinantede la matriz original es justamente ±

(10x7 − 16x6 + 5x4 − 10x3 − 2x

), como era

de esperarse.

Cuando representamos una transformacion lineal con su matriz, generalmenteutilizamos elementos arbitrarios del dominio de la funcion. Como vamos a veradelante, los valores y vectores propios son muy convenientes para representar latransformacion linea, porque la matriz que le corresponde en esta representacion esdiagonal. Vamos a ver esto en la siguiente proposicion.

Proposicion 5.4. Sea V espacio vectorial de dimension finita n y f ∈ L (V, V ).f es representable por una matriz diagonal, sii existe una base x1, · · · ,xn de Vy numeros del campo λ1, λ2, · · · , λn ∈ K tales que f (xi) = λixi. Entonces losnumeros λ1, · · · , λn son los elementos de la diagonal de esta matriz.

Page 78: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

66 5. FORMAS CANONICAS

Demostracion 5.5. Sea A la matriz que representa a f . Como f(x1) =λ1x1, · · · , f(xn) = λnxn, esto es sii se tiene que

A =

λ1 0. . .

0 λn

Esta proposicion es muy importante porque reduce el problema de encotrar unarepresentacion simple de la clase a encontrar la base en la cual esta representaciones diagonal. Es mas, los valores propios de la transformacion lineal son raices delpolinomio caracteristico de la matriz de representacion, esto es:

Teorema 5.6. Sean V espacio vectorial, f ∈ L (V, V ), A la matriz repre-sentacion de f y k ∈ K. Entonces k es un valor propio de f sii k es una raiz delpolinomio caracteristico de A.

Demostracion 5.7. Sea k valor propio de f , del vector propio x. EntoncesAx = kx, esto es sii (A− kI)x = 0. Pero este sistema de ecuaciones lineales solotiene solucion no trivial sii det (A− kI) = 0.

Esto es, si queremos encontrar la base en la cual una transformacion lineal tieneuna representacion diagonal, basta con encontrar sus valores y vectores propios. Siestos vectores propios son l.i., esta base es la apropiada. Si los vectores propios noson l.i., entonces debemos buscar alguna representacion similar adecuada. Vamosa ver esto. Para poder ver si dos matrices son similares, se utiliza la definicion dematrices equivalentes, esta es:

Definicion 5.8. Dos matrices polinomiales A (λ) y B (λ) son equivalentes,si existen U y V de determinantes no nulos que no dependen de λ, tal que

A (λ) = UB (λ)V

La relacion entre matrices similares y matrices equivalentes es que dos matricesson similares si sus matrices caracteristicas son equivalentes, esto lo vemos en elsiguiente teorema.

Teorema 5.9. Sean A y B definidas en un cuerpo conmutativo K. A y B sonsimilares sı y solo sı A− λI y B − λI son equivalentes.

Demostracion 5.10. =⇒) Si A = UBU−1 entonces A−λI = U (B − λI)U−1

⇐=) Sean A−λI y B−λI equivalentes, entonces A− Iλ = S (B − Iλ)R, paraS y R matrices que no dependen de λ. Como B tampoco depende de λ, igualandocoeficientes del mismo orden, se tiene I = SR y A = SBR, ambas identidadesimplican que A = SBS−1.

Un metodo para determinar la semejanza de las matrices A y B es el siguiente.Se forma la matriz caracteristica de cada una de las matrices A− Iλ y B− Iλ y sereducen a su forma canonica diagonal con pasos elementales. Si despues de reducirambas matrices caracteristicas a su forma mas elemental, las dos formas coinciden,entonces A y B son similares. Veamos un ejemplo.

Page 79: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. INTRODUCCION 67

Ejemplo 5.11. Sean

A =

5 3 3−3 −1 −3−3 −3 −1

y(5.1)

B =

−1 −3 36 8 −66 6 −4

(5.2)

mostremos que estas dos matrices son similares. Primero notemos que sus determi-nantes son iguales, i.e., detA = detB = −4. Si esto no fuera asi, A y B no puedenser similares. Tambien notemos que A y B tienen la misma traza trA = trB = 3.Entonces si pueden ser similares. El determinante y la traza nos dan una guiapara ver si las dos matrices son similares, pero no es suficiente. Las dos matri-ces pueden tener incluso el mismo polinomio caracteristico, pero aun asi no sersimilares. Vamos a ver si A− λI y B − λI son equivalentes. Se tiene

A− λI =

5− λ 3 3−3 −1− λ −3−3 −3 −1− λ

−3 −3 −1− λ−3 −1− λ −35− λ 3 3

1 0 00 2− λ −2 + λ0 3− (5− λ) 3− 1/3 (1 + λ) (5− λ)

1 0 00 2− λ 00 0 3− 1/3 (1 + λ) (5− λ) + λ− 2

1 0 00 2− λ 00 0 − (1 + λ) (2− λ)

Page 80: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

68 5. FORMAS CANONICAS

y

B − λI =

−1− λ −3 36 8− λ −66 6 −4− λ

6 6 −4− λ6 8− λ −6−1− λ −3 3

1 0 00 2− λ −2 + λ0 −3 + 1 + λ 3− 1/6 (4 + λ) (1 + λ)

1 0 00 2− λ 00 0 3− 1/6 (4 + λ) (1 + λ)− 2 + λ

1 0 00 2− λ 00 0 − (−2 + λ) (1 + λ)

es decir, ambas tienen la misma reduccion usando operaciones elementales, por loque las dos matrices son similares.

Observen como el elemento central de la diagonal divide al ultimo. Esto esmuy interesante, en este caso se puede demostrar que A y B son ceros (raices) delpolinomio (1 + λ) (2− λ). Por el teorema de Cayley-Hamilton sabemos que A y B

son ceros de su polinomio caracteristico (1 + λ) (2− λ)2, pero en este caso hay unpolinomio de grado menor (1 + λ) (2− λ) con esa cararteristica. Esto da pie a lasiguiente definicion.

Definicion 5.12. Sea A matriz y m(x) polinomio. m se llama polinomiomınimo de A, si m es el polinomio con menor grado que existe, tal que m(A) = 0.

Existe una relacion muy interesante entre los polinomios caracteristico y mınimo,ya que este ultimo divide al primero. Esta afirmacion la podemos ver en la siguienteproposicion.

Proposicion 5.13. El polinomio minimo de una matriz divide siempre a supolinomio caracteristico.

Demostracion 5.14. Sea P (x) el polinomio caracteristico de la matriz A y mes su polinomio mınimo, se debe tener que P (x) = p1(x)m(x) + p2(x), donde p1(x)y p2(x) son polinomios. Esto implica que P (A) = p1(A)m(A) + p2(A) = 0, perocomo m(A) = 0, se sigue que p2(A) = 0.

Es claro entonces que si el polinomio caracteristico es de la forma P (x) =(x− λ1)

n1(x− λ2)n2 · · · (x − λs)ns , el polinomio minimo tiene que ser de la forma

m(x) = (x− λ1)m1(x− λ2)

m2 · · · (x− λs)ms , con mi ≤ ni para todo i = 1, · · · , s.La pregunta que sigue es, ¿si dos matrices son similares, como encuentro la

matriz que las relaciona? Ya vimos que las matrices A y B de los ejercicios 5.11anteriores son similares, estas deben estar relacionadas entre si, tal que debe deexistir alguna matriz no sigular U que cumpla A = UBU−1. Esta pregunta es la

Page 81: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. FORMA CANONICA DE JORDAN 69

que nos va a ocupar en la seccion siguiente, pero por ahora encontremos la matrizde relacion de forma directa en un ejercicio.

Ejercicio 5.15. Encontrar los valores propios y los vectores propios de lasmatrices A y B ((5.1) y (5.2)) del ejemplo 5.11. Ver si sus vectores propios son l.i.En caso que si, construir la matriz diagonal de la clase correspondiente. Encontrarlas matrices U que relacionan a A y B con la matriz diagonal. Encontrar entoncesla matriz U que relaciona a A y B.

Ejercicio 5.16. Mostrar que si λ es valor propio de f y f es invertible, en-tonces λ−1 es valor propio de f−1.

Ejercicio 5.17. Mostrar que una matriz y su transpuesta tienen el mismopolinomio caracteristico.

Ejercicio 5.18. Sea A matriz cuadrada 2× 2. Mostrar que el polinomio car-acteristico de A esta dado por

x2 − (trA) x+ detA

donde trA =∑n=2i=1 (A)ii es la traza de A. (Ayuda: Mostrar primero que para todo

polinomio ax2+bx+c con raices x1, x2, se tiene que x1+x2 = −b/a y x1x2 = c/a.)

Ejercicio 5.19. Sea A matriz cuadrada 3× 3. Mostrar que el polinomio car-acteristico de A esta dado por

x3 − (trA) x2 +1

2

[(trA)

2 −(trA2

)]x− detA

Ejercicio 5.20. Sea A matriz cuadrada 4× 4. Mostrar que el polinomio car-acteristico de A esta dado por

x4−(trA) x3+1

2

[(trA)

2 −(trA2

)]x2−1

6

[(trA)

3 − 3(trA2

)(trA) + 2

(trA3

)]x−detA

2. Forma Canonica de Jordan

Veremos solo dos de las formas canonicas mas utilizadas en la literatura, laforma canonica de Jordan y la forma canonica natural. La primera es muy con-veniente porque es cuasidiagonal, pero tiene el problema de que el campo de lasmatrices deben ser el de los complejos o algun campo cerrado, entonces el repre-sentante de la clase no siempre pertenece al campo donde estan las matrices. Estoimplica que esta forma canonica es conveniente solo para matrices sobre camposcerrados. En cambio la forma canonica natural siempre conserva el campo donde setrabaja, aunque tiene el inconveniente de que no es cuasidiagonal. Veamos primerola forma canonica de Jordan.

Definicion 5.21. Una celula de Jordan es una matriz n× n de la forma

J =

l 1 0 · · · 00 l 1 · · · 0...

. . ....

0 · · · l 10 · · · 0 l

= lI +Nn

Page 82: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

70 5. FORMAS CANONICAS

donde

Nn =

0 1 0 · · · 00 0 1 · · · 0...

. . ....

0 · · · 0 10 · · · 0 0

Las matrices Nn son matrices n × n y tienen la asombrosa propiedad deser nilpotentes de grado n, es decir, (Nn)

n = 0. Esta propiedad es crucialpara definir la forma canonica de Jordan. Pero primero observemos la siguienteproposicion.

Proposicion 5.22. El polinomio cararteristico de las celulas de Jordan n× nson de la forma (l − x)n.

Demostracion 5.23. Se puede ver por calculo directo que det(J − xI) =(l − x)n.

Antes de ver el teorema de Jordan, vamos a observar una propiedad muy in-teresante de las matrices.

Lema 5.24. El determinante de una matriz cuasidiagonal A es igual al productode los determinantes de las matrices de su diagonal.

Demostracion 5.25. Sea

A =

A1 0 · · · 0

0 A2

......

. . .

0 · · · As

entonces A se puede escribir como

A =

A1 0 · · · 0

0 I...

.... . .

0 · · · I

I 0 · · · 0

0 A2

......

. . .

0 · · · I

· · ·

I 0 · · · 0

0 I...

.... . .

0 · · · As

donde las matrices I son matrices identidad de dimension conveniente. Se sigueque detA = detA1 detA2 · · · detAs

Con esta propiedad ya podemos definir la forma canonica de Jordan a travesdel siguiente

Teorema 5.26. Sea A matriz cuadrada de orden n sobre el cuerpo de losnumeros complejos, (o sobre un cuerpo algebraicamente cerrado) con polinomiocaracteristico P (x) = (x− λ1)

n1 · · · (x− λs)ns , con n = n1 + · · ·+ ns, y polinomiominimo m(x) = (x−λ1)

m1 · · · (x−λs)ms . Entonces A es similar a una matriz deJordan, de la forma.

J =

J11 0 · · · 0

0 J12

......

. . .

0 · · · Jsk

Page 83: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. FORMA CANONICA DE JORDAN 71

donde cada λi, con i = 1, · · · , s es representada por las celulas de Jordan Jik conk = 1, · · · , ti tal que

1.- Existe al menos una celula de Jordan de orden mi y las demas tendranordenes menores o iguales que mi.

2.- La suma de los ordenes de las celulas Jik es ni.3.- El numero de celulas de Jordan Jik, es unicamente determinado para cada

matriz A.

Demostracion 5.27. Vamos a ver solo una idea de la demostracion. Con-struyamos la representacion de Jordan de A. Como el polinomio mınimo de A esm, se tiene que m(A) = (A−λ1I)

m1 · · · (A−λsI)ms = 0. Podemos definir matricesAi con i = 1, · · · , s tales que (A1 − λ1I)

m1 = 0, · · · , (As − λsI)ms = 0 y escribir

det

A1 0 · · · 0

0 A2

......

. . .

0 · · · As

− xI

= (x − λ1)m1 · · · (x− λs)ms

Definamos las matrices Ni = Ai − λiI. Claramente las matrices Ni son nilpo-tentes tales que (Ni)

mi = 0. Una representacion de estas matrices esta dada porlas matrices nilpotentes

Ni =

0 1 0 · · · 00 0 1 · · · 0...

. . ....

0 · · · 0 10 · · · 0 0

Entonces podemos representar a la matriz A por una matriz de Jordan. La repre-sentacion quedara determinada al reducir la matriz de Jordan y la matriz A a suforma equivalente. Ademas se sigue que:

1.- El orden de Ai es mi, al menos una vez.2.- La suma de los ordenes de las celulas Jik es ni, debido a que J y A tienen

el mismo polinomio caracteristico.3.- El numero de celulas de Jordan Jik, es unicamente determinado para cada

matriz A ya que A y J son similares.

Ejemplo 5.28. Tomemos de nuevo la matriz A (5.1) del ejemplo 5.11

A =

5 3 3−3 −1 −3−3 −3 −1

ya sabemos que su polinomio caracteristico esta dado por (1 + λ) (2− λ)2 y su poli-nomio mınimo por (1 + λ) (2− λ). Entonces, siguiendo la regla del teorema, setiene que, segun el polinomio caracteristico, el valor propio 1 aparece una vez en ladiagonal y el valor propio 2 aparece dos veces. Ademas, segun el polinomio mınimo,los dos valores propios tiene una celula de Jordan de grado 1. Ası, su forma deJordan sera

(5.3) J =

2 0 00 2 00 0 −1

Page 84: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

72 5. FORMAS CANONICAS

Ejemplo 5.29. Sea ahora A la matriz

(5.4) A =

6 3 4−3 −1 −3−4 −3 −2

El determinante de esta matriz es −4 y su traza es 3. Su polinomio caracteristico esde nuevo (1 + λ) (2− λ)2 y ahora el polinomio mınimo es tambien (1 + λ) (2− λ)2,como puede verse de tomar

(I +A) (2I −A) =

3 0 30 0 0−3 0 −3

6= 0.

Entonces la matriz de Jordan correspondiente tendra al menos una celula de Jordande grado 2 del valor propio 2, esto es:

(5.5) J =

2 1 00 2 00 0 −1

Hay una forma alternativa de encontrar la forma canonica de Jordan de unamatriz. Observemos lo siguiente. En una matriz diagonal, digamos 3 × 3, con sustres valores propios iguales, la forma canonica diagonal de su matriz caracteristicaserıa

x− λ 0 00 x− λ 00 0 x− λ

ya que el polinomio superior de la diagonal divide al siguiente. Si solo dos valorespropios fueran iguales, su matriz canonica diagonal serıa

1 0 00 x− λ1 00 0 (x− λ1) (x− λ2)

y si los tres valores propios son diferentes serıa

1 0 00 1 00 0 (x− λ1) (x− λ2) (x− λ3)

Entonces, podemos tambien constriur la forma canonica de Jordan, calculandola forma canonica diagonal de la matriz y formando una celula de Jordan para cadafactor invariante del grado del factor invariante correspondiente. Esto se puedeentender mejor con un ejemplo.

Ejemplo 5.30. Como ya vimos, la forma canonica diagonal de la matriz car-acteristica de la matriz (5.1)

A =

5 3 3−3 −1 −3−3 −3 −1

Page 85: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. FORMA CANONICA NATURAL 73

es la matriz

1 0 00 2− λ 00 0 − (1 + λ) (2− λ)

Por lo que, su forma canonica de Jordan tendra una celula de Jordan de ordenuno para el factor invariante 2− λ y otra celula diagonal para el factor invariante(1 + λ) (2− λ) (ver (5.3)).

Ejercicio 5.31. Encontrar la forma canonica de Jordan de las matrices

1 0 012 0 1

21 −2 2

52 −3 3

21 −2 1− 5

2 3 − 32

1 1 0−1 1 −1−1 −3 0

Ejercicio 5.32. Sea A una matriz con polinomio caracteristico (x− 2)3(x− 1)

2

y polinomio minimo (x− 2)2 (x− 1) . ¿Cual es su forma canonica de Jordan?

Ejercicio 5.33. Encontrar todas las formas canonicas de Jordan posibles de

una matriz que tiene polinomio caracteristico (x− 2)3(x− 1)

2.

3. Forma Canonica Natural

La forma canonica natural tiene la ventaja sobre la forma canonica de Jordan,de ser un representante para las clases de matrices en cualquier campo. A diferenciade la forma canonica de Jordan, donde el campo tiene que ser algebraicamentecerrado, como los complejos, la forma canonica natural es adecuada para cualquiercampo. Tiene la desventaja de nos ser diagonal. Hay una enorme semejanza entrelas dos formas canonicas, asi que empecemos por definir las celulas de la formacanonica natural.

Definicion 5.34. Sea P (x) polinomio de grado n, tal que su coeficiente prin-cipal sea 1, i.e.

P (x) = a0 + a1x+ · · ·+ an−1xn−1 + xn

La matriz

N =

0 1 0 · · · 00 0 1 · · · 0...

......

. . ....

0 0 0 · · · 1−a0 −a1 −a2 · · · −an−1

se llama la matriz asociada al polinomio P (x).

Vamos a calcular el polinomio caracteristico de N . Se obtiene

Page 86: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

74 5. FORMAS CANONICAS

det (N − Ix) = det

−x 1 0 · · · 00 −x 1 · · · 0...

......

. . ....

0 0 0 · · · 1−a0 −a1 −a2 · · · −an−1 − x

= a0 det

1 0 · · · 0−x 1 · · · 0...

.... . .

...0 0 · · · 1

− a1 det

−x 0 · · · 00 1 · · · 0...

.... . .

...0 0 · · · 1

+ · · · −

(−an−1 − x) det

−x 1 · · · 00 −x · · · 0...

......

. . .

0 0 · · · −x

= a0 + a1x+ · · ·+ (an−1 + x) xn−1 = P (x)

Este resultado da pie al siguiente lema.

Lema 5.35. El polinomio caracteristico de una matriz asociada al polinomioP (x) es P (x).

La forma canonica natural consiste en substituir por cada factor invariantede grado ni su respectiva matriz asociada. Analogamente a la forma canonicade Jordan, las matrices nilpotentes ahora son subtituidas por matrices naturales.Veamos algunos ejemplos.

Ejemplo 5.36. Tomemos de nuevo la matriz (5.1) del ejmplo 5.11

A =

5 3 3−3 −1 −3−3 −3 −1

ya sabemos que su polinomio caracteristico esta dado por (1 + λ) (2− λ)2 = λ3 −3λ2 + 4 y su polinomio mınimo por (1 + λ) (2− λ). Ya sabemos que la matrizcaracteristica tiene la forma canonica diagonal

1 0 00 2− λ 00 0 − (1 + λ) (2− λ)

Por lo que, su forma canonica natural tendra una celula natural de orden unopara el factor invariante 2 − λ y otra celula natural para el factor invariante− (1 + λ) (2− λ) = λ2 − λ− 2

(5.6) N =

2 0 00 0 10 2 1

Page 87: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. FORMA CANONICA NATURAL 75

Ejemplo 5.37. Sea de nuevo A la matriz (5.4)

A =

6 3 4−3 −1 −3−4 −3 −2

Como ya vimos, el determinante de esta matriz es −4 y a traza es 3. Su polinomio

caracteristico es de nuevo (1 + λ) (2− λ)2 y ahora el polinomio mınimo es tambien

(1 + λ) (2− λ)2. Esta matriz tiene una forma canonica diagonal para su matrizcaracteristica dada por

1 0 00 1 0

0 0 (1 + λ) (λ− 2)2

por lo que solo tiene una celula natural de grado tres para el polinomio (1 + λ) (λ− 2)2

=λ3 + 4λ2 − 3. Por lo que su forma natural sera

(5.7) N =

0 1 00 0 13 0 −4

Ejemplo 5.38. Observemos como se relacionan las matrices canonicas de Jor-dan y la canonica natural. Por ejemplo, de las formas canonicas anteriores, setiene que (5.6) y (5.3) se ralacionan sugun

2 0 00 0 10 1 2

= U

2 0 00 2 00 0 −1

U−1

con U =

1 0 00 a b0 2a −b

ab 6= 0

y para (5.7) y (5.5), la relacion es

0 1 00 0 1−4 0 3

= U

2 1 00 2 00 0 −1

U−1

con U =

a 0 b2a a −b4a 4a b

ab 6= 0

Ejemplo 5.39. Sea T = A | A es matriz 3 × 3 con trA = 0. Entonces Ttiene solo dos clases,

[T ]1 =

0 1 00 0 1a b 0

y [T ]2 =

q 0 00 0 10 2q2 −q

Ejercicio 5.40. Demostrar que el conjunto de las matrices 3 × 3 sin trazatienen solo las dos clases anteriores.

Ejercicio 5.41. Encontrar su respectivas formas canonicas de Jordan.

Page 88: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

76 5. FORMAS CANONICAS

Ejercicio 5.42. Encontrar la forma canonica natural de las matrices

1 0 012 0 1

21 −2 2

52 −3 3

21 −2 1− 5

2 3 − 32

1 1 0−1 1 −1−1 −3 0

Ejercicio 5.43. Sea A una matriz con polinomio caracteristico (x− 2)3 (x− 1)2

y polinomio minimo (x− 2)2(x− 1) . ¿Cual es su forma canonica natural?

Ejercicio 5.44. Encontrar todas las formas canonicas naturales posibles de

una matriz que tiene polinomio caracteristico (x− 2)3(x− 1)

2.

Ejercicio 5.45. Sea A =

4 −6 1−6 12 0−2 6 1

. Encuentre sus valores y vec-

tores propios. Reduzca la matriz por operaciones elementales (invariantes) hastasu forma mas elemental. ¿Cual es su Rango? Encuentre P tal que A = PAdP

−1,donde Ad es la forma diagonal de A.

Ejercicio 5.46. Sea B =

−6 1 012 0 16 1 1

Encuentre sus valores y vectores

propios. Reduzca la matriz por operaciones elementales (invariantes) hasta suforma mas elemental. ¿Cual es su Rango?

Ejercicio 5.47. Demuestre de forma sencilla que las matrices A y B anterioresno son similares.

Ejercicio 5.48. Encuentre la forma canonica diagonal de las matrices carac-teristicas de A y B

Page 89: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

Part 3

VARIABLE COMPLEJA

Page 90: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 91: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 6

EL PLANO COMPLEJO

1. Los Numeros Complejos

Generalmente se introducen los numeros argumentando que cada uno de estosconjuntos resuelve determinada ecuacion algebraica. Asi por ejemplo, la ecuacionx − 2 = 0 tiene solucion en los numeros naturales N . Mientras que la ecuacionx+2 = 0 ya no tiene solucion en el conjunto de los numeros naturales, para resolverlahay que introducir los numeros enteros Z. Mas aun, la ecuacion 2x − 1 = 0 solopuede resolverse introduciendo los numeros racionales Q. Hasta aqui se tiene queN ⊂ Z ⊂ Q. Sin embargo, la ecuacion no lineal x2 − 2 = 0 no tiene solucion enlos numeros racionales. Esta ecuacion tiene solucion solo si se definen los numerosirracionales I. Se puede ver que I ∩ Q = φ. Entonces se introducen los numerosreales como ℜ = I ∪ Q. Aun ası, la ecucion x2 + 2 = 0 no tiene solucion en losnumeros reales. Entonces se introducen los numeros imaginarios (que son tan realescomo los numeros reales), tal que x2 +2 = 0 tenga solucion. Se acostumbra escribir

x =√

2i, donde i es la unidad imaginaria, tal que i2 = −1, ası que x2 = −2.Finalmente los numeros complejos son la suma de numeros reales mas numerosimaginarios. La introduccion de los numeros complejos es de gran ayuda en elanalisis, como veremos, con numeros comples se pueden hacer muchas cosas inclusoen el analisis real. Ası, formalmente los numeros complejos se definen de la siguientemanera.

Definicion 6.1. El campo de los complejos C se define al conjunto

C = z = a+ ib | a, b ∈ ℜdonde i2 = −1.

Notacion 6.2. A a se le llama la parte Real de z y a b la parte imaginaria,Re(z) = a, Im(z) = b.

Notacion 6.3. Sea R ⊂ C. A R se le llama una region.

Graficamente los numeros complejos se representan tambien en coordenas po-lares. Sea a, b ∈ ℜ, podemos escribir a = r cos (θ) y b = r sin (θ) tal que unnumero complejo z = a + ib = r(cos (θ) + i sin (θ)), vean la figura 1. Se sigue que

r =√a2 + b2 y θ = arctan (b/a). A la constante r se le llama el modulo de z y a

θ el argumento de z.

Notacion 6.4. A r tambien se le denota por |z| = r y a θ como θ = arg (z).

Un numero complejo queda determinado por r y θ, hasta multiplos de 2π, esdecir, arg (z) = θ + 2πk, k = 0,±1, · · ·

Ejercicio 6.5. Encuentre los modulos y argumentos de los siguientes numeroscomplejos

79

Page 92: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

80 6. EL PLANO COMPLEJO

Figure 1. Un numero complejo se puede representar como z =x+ iy = a+ ib = r[cos(θ) + i sin(θ)].

1, 1 + i, 5 + 3i, 1− i, −5 + 3i, 5− 3i, −5− 3i.

La estructura algebraica de los numeros complejos esta basada en la definicionde la suma y el producto entre estos. Esta definicion, obviamente se basa en laestructura de los numeros reales. Formalmente tenemos.

Definicion 6.6. Sean z1, z2 ∈ C, entonces se define· La suma z1 + z2 = (a1 + ib1) + (a2 + ib2) = a1 + a2 + i (b1 + b2),· El producto z2 · z1 = (a1 + ib1) · (a2 + ib2) = a1a2 − b1b2 + i (a1b2 + b1a2)

En coordenadas polares, la suma y el producto se ven como:

Corolario 6.7. |z1 · z2| = |z1| · |z2| y arg(z1 · z2) = arg (z1) + arg (z2).

Demostracion 6.8. z1 · z2 = r1r2(cos (θ1) + i sin (θ1))(cos (θ2) + i sin (θ2)) =r1r2[cos (θ1 + θ2) + i sin (θ1 + θ2)]

La diferencia sustancial de los numeros coplejos con los numeros reales es quecada numero complejo tiene un acompanante natural a el llamado el complejoconjugado. Su definicion es como sigue.

Definicion 6.9. Sea z ∈ C. El complejo conjugado de z = a+ ib se definepor z = a− ib

Claramente se tiene,

Corolario 6.10. zz = |z|2

2. Funciones en el Plano Complejo

En esta seccion vamos a estudiar el comportamiento de las funciones en el planocomplejo, es decir, funciones que van del conjunto de los complejos al conjunto delos complejos. A pesar de que estas funciones son muy parecidas a las funciones enlos reales, existen diferencias sutanciales que le dan una gran riqueza a las funciones

Page 93: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. FUNCIONES EN EL PLANO COMPLEJO 81

en el plano complejo. Estas deferencias las vamos a utilizar para hacer calculos muycomplejos en el plano real, simplificando la estructura y los calculos. Para iniciaresta seccion, vamos a definir primero una funcion compleja.

Definicion 6.11. Una funcion en el plano complejo, es un mapeo f : C → Ctal que

a+ ib→ f(a, b) = u(a, b) + iv(a, b)

Las propiedades fundamentales de funciones reales se pueden extender al casode las funciones complejas. De una manera analoga a como se define continuidaden funciones de variable real, en variable compleja se define continiudad. Solo quela estructura compleja de estas funciones provocan cambios y sutilezas, que le danmucha riquza estructural a las funciones complejas. Vamos a ver esto con cuidado.Vamos a iniciar con la definicion de continuidad, de hecho es la misma definicionque se usa en variable real, o en analisis o en topologia mas adelante. Solo que aqui,la definicion implica algunos cambios interesantes.

Definicion 6.12. Sea f : C → C. La funcion f se llama continua en z ∈ C,si para toda ǫ > 0, con ǫ ∈ ℜ, uno puede encontrar δ > 0, δ ∈ ℜ, tal que

|z − z′| < δ, implica |f(z)− f(z′)| < ǫ

En palabras, f es continua en z, si para cualquier numero z′ suficientementecerca de z, f(z′) es suficientemente cerca de f(z).

Figure 2. La funcion f(z) = x + 2iy. A cada punto x + iy delplano complejo, le asocia x+ 2iy.

Ejemplo 6.13. Sea f : C → C, tal que f(z) = x + 2iy, se representa grafi-camente en la figura 2. Esta funcion es continua en cero. Veamos esto. De ladefinicion de continuidad se sigue que |z| < δ implica |x+ 2iy| < ǫ, es decir

√x2 + y2 < δ implica

√x2 + 4y2 < ǫ

Si escogemos ǫ = 2δ se cumple la desigualdad, vean la figura 3. Por lo tanto, sesigue que f es continua en cero.

Page 94: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

82 6. EL PLANO COMPLEJO

Figure 3. En el plano complejo de la izquierda se muestra laregion (x2 + y2)1/2 < δ, mientras que en el plano de la izquierdase muestra la region (x2 + 4y2)1/2 < δ. Obsrvese como la region(x2 + y2)1/2 < ǫ < 2δ , contiene a la region (x2 + 4y2)1/2 < δ.

Ejercicio 6.14. Decir si las siguiente funciones son continuas, o en su casoen donde no son continuas, usando la definicion:

1) f(z) = z2

2) f(z) = x+ i2y, para z = x+ iy.

3) f(z) = zx2+y2 , para z = x+ iy.

4) f(z) = z + z5) f(z) = z6) f(z) = zz7) f(z) = z − 2z2

8) f(z) = (z + 2)2

La definicion de lımite en variable compleja es tambien analoga a la definicionde lımite en variable real. Formalmente la definicion de lımite de funciones devariable compleja es como sigue.

Definicion 6.15. Sea f : C→ C, y z1, z2 ∈ C. El lımite de f cuando z tiendea z1 es z2, si para toda N > 0 existe δ > 0 con N , δ ∈ ℜ tal que |z − z1| < δimplica |f(z)− z2| < N

Notacion 6.16. El lımite de f cuando z tiende a z1 es z2 se denota

limz→z1

f(z) = z2

La relacion entre lımite y continuidad esta dada por las siguientes dos proposi-ciones.

Proposicion 6.17. Si limz→z1 f (z) = z2 y f(z1) = z2, se sigue que f escontinua.

Demostracion 6.18. Sabemos que para toda N > 0 existe δ > 0, con N ,δ ∈ ℜ tal que |z − z1| < δ implica |f(z)− z2| < N . Hagamos N = ǫ y z1 = z′ y

Page 95: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. FUNCIONES EN EL PLANO COMPLEJO 83

como f(z1) = f(z′) = z2, entonces se tiene que para toda ǫ > 0 existe δ > 0, talque |z − z1| = |z − z′| < δ implica |f(z)− z2| = |f(z)− f(z′)| < ǫ.

Proposicion 6.19. Sea f : C → C continua en z1, con f(z1) = z2 . Entonces

limz→z1

f (z) = z2

Ejercicio 6.20. Demostrar la proposicion.

Ejercicio 6.21. Utilizando la proposicion anterior, verificar si las funcionesdel ejercicio 6.14 son continuas.

Existe una serie de propiedades de los lımites en variable compleja comple-tamente analogas a variable real. Vamos a escribirlas y a escribir solo una de-mostracion parcial. De hecho la demostracion es como en variable real, por eso noincluiremos toda la demostracion.

Teorema 6.22 (sobre lımites.). Sean f(z) y F (z) funciones cuyos lımites z →z0 existen y estan dados por

limz→z0

f(z) = w0 limz→z0

F (z) = W0 6= 0

Entonces1)

limz→z0

[f(z) + F (z)] = w0 +W0

2)

limz→z0

[f(z)F (z)] = w0W0

3)

limz→z0

f(z)

F (z)=w0

W0

4) Si f(z) = u(x, y) + iv(x, y) se sigue

limz→z0

f(z) = limx→x0,y→y0

u(x, y) + i limx→x0,y→y0

v(x, y)

Demostracion 6.23. Supongamos que F (z) = U(x, y) + iV (x, y) y f(z) =u(x, y) + iv(x, y). Demostremos el insiso 3). Se tiene que

limz→z0

f(z)

F (z)= lim

z→z0

u+ iv

U + iV

= limz→z0

(u+ iv) (U − iV )

U2 + V 2

= limx→x0,y→y0

(uU

U2 + V 2+

vV

U2 + V 2

)

+i limx→x0,y→y0

(vU

U2 + V 2− uV

U2 + V 2

)

=

(u0U0

U20 + V 2

0

+v0V0

U20 + V 2

0

)

+i

(v0U0

U20 + V 2

0

− u0V0

U20 + V 2

0

)

Page 96: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

84 6. EL PLANO COMPLEJO

donde en la ultima identidad hemos usados los teoremas de variable real. Entonces,reagrupando de nuevo se tiene que

limz→z0

f(z)

F (z)=u0 + iv0U0 + iV0

Ejercicio 6.24. Demostrar el resto del teorema usando los teoremas similaresde lımites en variable real.

Con la propiedad 4) podemos utilizar los teoremas y metodos comunes de vari-able real para obtener lımites de funciones en variable compleja. Este resultado lousaremos constentemente en adelante.

3. La Derivada en el Plano Complejo

La derivada de funciones de variable compleja tiene un comportamiento analogoa la derivacion de funciones en los reales. Sin embargo, es aqui donde las sutilezasdel plano complejo empiezan a ser importantes, y las analogıas se interrumpendebido a algunas diferencias que hacen del plano complejo algo diferente. Sonestas diferencias las que nos interesan, pero son las analogıas las que vamos autilizar continuamente. Vamos a iniciar con la definicion de la derivada en variablecompleja.

Definicion 6.25. Sea f : C → C continua en z. La derivada de f en z sedefine como

df

dz= lim

∆z→0

f(z +z)− f(z)

zsi este lımite existe y es unico, se dice que la derivada existe.

Si comparamos la definicion anterior con la derivada de funciones en los reales,veremos que son aparentemente iguales. Pero para ver la diferencia y similitudes,vamos a ver algunos ejemplos.

Ejemplo 6.26. Sea f(z) = 2x + 2iy, entonces la derivada en cero de estafuncion esta dada por

df

dz

∣∣∣∣z=0

= limz→0

f(z)− f(0)

z = limx→0,y→0

2x+ 2iy

x+ iy= 2

donde hemos escrito z = x+ iy, ası que el lımite y por tanto la derivada es 2.

El resultado del ejemplo anterior no es sorprendente, en variable real la funcionanterior f(z) = 2z = 2x+2iy tambien es deribable. Sin embargo veamos el siguienteejemplo.

Ejemplo 6.27. Sea f(z) = x + 2iy, entonces la derivada de esta funcion estadada por

df

dz

∣∣∣∣z=0

= limz→0

f(z)− f(0)

z = limx→0,y→0

x+ 2iy

x+ iy= lim

x→0,y→0

x2 + 2y2 + ixy

x2 + y2

pero este lımite no conmuta, ya que si tomamos primero x→ 0 y luego y → 0, veanla figura 4, obtenemos

df

dz

∣∣∣∣z=0

= 2

Page 97: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. LA DERIVADA EN EL PLANO COMPLEJO 85

Figure 4. Dos trayectorias por las que se puede ir del puntox+ iy a 0.

Pero si tomamos primero el lımite y → 0 y luego x→ 0 obtenemos

df

dz

∣∣∣∣z=0

= 1

lo que nos dice que f no es derivable en z = 0

Ejercicio 6.28. Usando la definicion, encontrar la derivada, cuando exista,de las funciones del ejercicio 6.14. En su caso, decir en que puntos la funcion noes derivable.

3.1. Formulas de derivacion: En variable compleja las formulas de derivacionson generalmente las mismas que las usadas en variable real, si sabemos que laderivada existe. El problema es saber cuando una funcion de variable compleja esderivable. Para saberlo, existen una forma sencilla de determinar si una funcionde variable compleja es derivable o no. Esto se hace utilizando las condiciones deCauchy-Riemann. Estas condiciones se ven en el siguiente teorema.

Teorema 6.29 (de Cauchy-Riemann). Sea f : C → C tal que f(z) = u(x, y) +iu(x, y) con u, v ∈ C1. Entonces f es derivable en z, sı y solo sı

∂u

∂x=∂v

∂yy∂u

∂y= −∂v

∂x

Page 98: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

86 6. EL PLANO COMPLEJO

Demostracion 6.30. ⇒) Supongamos f derivable. Entonces el lımite

f ′ =df

dz= lim

∆z→0

f(z + ∆z)− f(z)

∆z

existe y es unico. Segun los teoremas de lımite real, este lımite no depende de latrayectoria por la cual ∆z → 0. Tomemos dos trayectorias diferentes: 1) ∆y → 0y luego ∆x→ 0, y la trayectoria 2) ∆x→ 0 y luego ∆y → 0.

Entonces para 1)

df

dz= lim

∆y=0

∣∣∣∣u(x, y + ∆y)− u(x, y)

i∆y+ i

v(x, y + ∆y)− v(x, y)i∆y

∣∣∣∣ = −i∂u∂y

+∂v

∂y

Para la trayectoria 2) se tiene

df

dz= lim

∆x→0

∣∣∣∣u(x+ ∆x, y)− u(x, y)

∆x+ i

v(x+ ∆x, y)− v(x, y)∆x

∣∣∣∣ =∂u

∂x+ i

∂v

∂x

Lo que implica las condiciones de Cauchy-Riemann⇐) Supongamos que se cumplen las condiciones de Cauchy-Riemann. Como

u, v y son de clase C1, son continuas y con derivadas continuas, entonces podemosescribir por el teorema del valor medio que

∆u = u(x+ ∆x, y + ∆y)− u(x, y) =∂u

∂x∆x +

∂u

∂y∆y + ǫ1∆x+ ǫ2∆y

donde ǫ1 y ǫ2 tienden a cero cuando ∆x y ∆y tienden a cero. Lo mismo para ∆v.Entonces

∆f = f(z + ∆z)− f(z) = ∆u+ i∆v

=∂u

∂x∆x+

∂u

∂y∆y + ǫ1∆x+ ǫ2∆y

−i(∂v∂x

∆x+∂v

∂y∆y + ǫ3∆x+ ǫ4∆y)

Como las condiciones de Cauchy-Reimann se cumplen, tenemos

∆f =∂u

∂x(∆x + i∆y) + i

∂v

∂x(∆x+ i∆y) + ∆xδ1 + ∆yδ2

donde δ1 y δ2 son combinaciones lineales de las ǫ’s. Ahora bien, |∆x| ≤ |∆z| y|∆y| ≤ |∆z|, por lo tanto |∆x/∆z| ≤ 1 y |∆y/∆z| ≤ 1. Ası que

f ′(z) := lim∆z→0

∆f

∆z=∂u

∂x+ i

∂v

∂x= −i

(∂u

∂y+ i

∂v

∂y

)

ya que los ultimos terminos tienden a cero, cuando ∆z → 0. Por lo tanto laderivada de f(z) existe.

En lo que sigue vamos a trabajar con funciones que son derivables en una regiono al menos no lo son en puntos definidos. Cuando una funcion es derivable en unentorno, en una region del espacio complejo, se dice que es analıtica ahi. El resto denuestro estudio de funciones de variable compleja se limitara al estudio de funcionesanalıticas, o no analıticas en solo puntos bien definidos. Vamos a ver la definicionformal de funcion analıtica.

Page 99: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. LA DERIVADA EN EL PLANO COMPLEJO 87

Definicion 6.31. Una funcion f : C → C es analıtica, holomorfa o regularen un punto z0 ∈ C, si su derivada existe en un entorno de z0, es decir, si existeun ǫ > 0 tal que f ′ existe para todo z ∈ z | |z − z0| < ǫ, ǫ ∈ ℜ+

Para familiarizarnos con esta importate definicion, vamos a ver algunos ejem-plos.

Ejemplo 6.32. Sea la funcion f(z) = |z|2 = zz = x2 + y2. Las condiciones deCauchy-Riemann para esta funcion son

∂u

∂x= 2x;

∂v

∂y= 0

y∂u

∂y= 2y;

∂v

∂x= 0

y solo se cumplen para z = 0. Por lo que |z|2 no es analıtica, pues solo es derivableen z = 0.

Ejemplo 6.33. Por otro lado, para la funcion f(z) = z2 = (x+ iy)2

= x2 −y2 + 2ixy se tiene que u = x2 − y2 y v = 2xy, ası que

∂u

∂x= 2x;

∂v

∂y=2x

y∂u

∂y= −2y;

∂v

∂x=2y

Es decir, las condiciones de Cauchy-Riemann se cumplen siempre, por lo que z2 esuna funcion analıtica.

Ejercicio 6.34. Usando las condiciones de Cauchy-Riemann, verificar cual delas funciones del ejercicio 6.14 son analıticas y en que puntos no lo son.

Cuando un funcion compleja no es analıtica en puntos determinados, se diceque la funcion es singular en esos puntos. Al punto mismo se le llama singularidado polo. Formalmente se tiene.

Definicion 6.35. Sea f : C C analıtica en cada punto en el entorno de z0,pero no en z0. Se dice que z0 es un punto singular de f .

Veamos un ejemplo de singularidad.

Ejemplo 6.36. Sea f(z) = 1/z. Su derivada es f ′ = −1/z2. Esta funcion sepuede escribir como

f (z) =1

x+ iy

=x

x2 + y2− i iy

x2 + y2

por lo que u = x/(x2 + y2

)y v = −y/

(x2 + y2

). Entonces las condiciones de

Cauchy-Riemann son

∂u

∂x=

∂v

∂y= − x2 − y2

(x2 + y2)2 y

∂u

∂y= −∂v

∂x= − 2xy

(x2 + y2)2

Page 100: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

88 6. EL PLANO COMPLEJO

las cuales no estan definidas en z = 0. La funcion es analıtica para z 6= 0, pero nopara z = 0, entonces z = 0 es un punto singular de f .

Comentario 6.37. Todo polinomio en z, P (z) = a0 + a1z+ a2z2 + · · ·+ anz

n

es analıtico, ya que sus derivadas existen para toda z ∈ C.Ejercicio 6.38. Senale los puntos singulares de las funciones del ejercicio

6.14.

Existen algunas propiedades muy importantes para decidir si una funcion esanalıtica o no. Estas propiedades simplifican enormemente el trabajo para podersaber si una funcion es analıtica en alguna region. Vamos a ver estas propiedadesen la siguente proposicion.

Proposicion 6.39. Sean P (z) y Q(z) funciones analıticos en una region R ⊂C. Entonces

1) P ·Q es analıtica.

2) P +Q es analıtica.

3) P/Q es analıtico para toda region R1 ⊂ C tal que Q 6= 0

4) P Q es analıtica

Demostracion 6.40. Vamos a demostrar 3). Sean P y Q analıticas y Q 6= 0en una region R1. Entonces

d

dz

P

Q=

1

Q

(−PQ

d

dzQ+

d

dzP

)

como P y Q son analıticas y Q 6= 0, las derivadas de P y Q existen en un entornoy las funciones P y Q existen en ese entorno y son continuas. Dado que Q 6= 0 enR1, la funcion 1/Q es continua en ese entorno y por lo tanto la derivada de P/Qexiste y es continua en R1. Es decir, P/Q es analıtica.

Ejercicio 6.41. Demostrar el resto de la proposicion.

Ejercicio 6.42. Utilizando esta proposicion, confirme cual de las siguientefunciones son analıticas y en que region.

1) f(z) = z2

2) f(z) = x+ i2y, para z = x+ iy.

3) f(z) = zx2+y2 , para z = x+ iy.

4) f(z) = 1z+2z

5) f(z) = 1z

6) f(z) = 1zz

7) f(z) = 1z−2z2

8) f(z) = 1z+2

4. Funciones Armonicas

Una conclusion inmediata de las condiciones de Cauchy-Riemman son el hechoque las funciones reales que forman la funcion de variable compleja, cumplen la

Page 101: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. FUNCIONES ARMONICAS 89

ecuacion de Laplace en el plano, en la region donde son analıticas. A estas funcionesse les llama armonicas. Para ver esto, vamos a seguir el siguiente razonamiento.

Sea f(z) = u + iv una funcion analıtica en alguna region alrededor de z, esdecir, se tiene que.

∂u

∂x=∂v

∂y,∂u

∂y= −∂v

∂x

entonces f ′(z) existe. Si las funciones u y v tienen derivadas continuas y a su vezderivables, se debe cumplir que

(6.1)∂2v

∂x∂y=∂2v

∂y∂x

Vamos a usar las condiciones de Cauchy-Riemann en la indentidad (6.1), se obtieneque

∂2v

∂x∂y=∂2u

∂x2

∂2v

∂x∂y= −∂

2u

∂y2

Si sumamos estas dos indentidades, obtenemos

∂2u

∂x2+∂2u

∂y2= 0

Esta es es la ecuacion de Laplace para la funcion u. A estas funciones se les llamafunciones armonicas. Formalmente tenemos.

Definicion 6.43. Toda funcion que cumple la ecuacion de Laplace

∂2u

∂x2+∂2u

∂y2= 0

se llama armonica.

Notacion 6.44. tambien se denota la ecuacion de Laplace por

∇2u =∂2u

∂x2+∂2u

∂y2= 0

.

Analogamente, si f es analıtica, se tiene que

∂2v

∂x2+∂2v

∂y2= 0

Entonces se tiene el siguiente lema.

Lema 6.45. Para toda funcion donde f = u+ iv y se tenga que f es analıticase sigue entonces que u y v son armonicas.

Ejercicio 6.46. Diga cual de las funciones de los ejercicios 6.14 y 6.42 sonarmonicas.

Page 102: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

90 6. EL PLANO COMPLEJO

4.1. Funciones Elementales. Las funciones elementales en variable real puedenser extendidas a variable compleja de una manera sencilla. Para definir funcionesen variable compleja lo que se hace es tomar las funciones polinomiales y simple-mente se traducen cambiando la variable real por la compleja, x z. Las funcionestrasendentes se traducen a variable compleja mas indirectamente: en variable com-pleja son definidas segun su expresion en series de Taylor. Por ejemplo:

ez = 1 + z +1

2!z2 + · · ·

o analogamente

cos (z) =1

2(eiz + e−iz)

sin (z) =1

2(eiz − e−iz)

etc. Estas funciones elementales se derivan, suman o multiplican igual que las fun-ciones de variables reales. Sin embargo, las funciones ahora no se ven graficamenteigual a las de variable real. Por ejemplo, es facil ver aquı tambien que se sigue laidentidad

ez = ex+iy = ex(cos(y) + i sin(y))

por lo que la exponencial de un numero complejo es una funcion periodica, es decir,ez+2ikπ = ez, para todo k = 0,±1,±2, · · · . Esto causa que la funcion inversa a laexponencial no sea una funcion, ya que esta multivaluada. Por eso se acostrumbratomar a la funcion ln como la que se obtiene para k = 0.

Otra diferencia interesante es que las funciones trigonometicas y las hiperbolicasestan relacionadas entre sı. Por ejemplo, sin(z) = −i sinh(iz), o cos(z) = cosh(iz),etc.

Ejercicio 6.47. Usando esta analogia, verifique cual de las siguintes funcionesson analıticas y armonicas y en que puntos.

1) f(z) = ez

2) f(z) = sin (z)3) f(z) = cos (z)4) f(z) = ln (z − 1)5) f(z) = sinh (z)6) f(z) = cosh (z)7) f(z) = arcsin (z)8) f(z) = arctan (z)

5. La Integral en el Plano Complejo

De nuevo existe un analogia estrecha entre la integracion de variable real y laintegracion en variable compleja. Pero existen sutilezas que las hacen diferentes.Por ejemplo, a diferencia de la integracion en una variable real, la integracion envariable compleja es equivalente a la integracion en un plano, llamado el plano com-plejo. Es por eso que para definir la integral de una funcion compleja, necesitamosdefinir una curva por donde se va a llevar a cabo la integrar. Entonces iniciemoscon las siguientes definiciones.

Definicion 6.48. Sea γ : ℜ C un mapeo. Si γ es de clase C0 se dice que γes una curva en C, vean la figura 5.

Page 103: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. LA INTEGRAL EN EL PLANO COMPLEJO 91

Figure 5. Una curva definida en el plano complejo. Una curvaes un mapeo que va de los numeros reales al plano complejo.

Definicion 6.49. Sea γ una curva en C y P una particion del intervalo (0, 1)con γ : (0, 1) → C. Si ti ∈ P, sea γ(ti) = zi y ∆jz = zj − zj−1, vean la figura 6.Sea zj cualquier punto en la curva entre zj−1 y zj. La integral de f(z) a lo largode γ se define como.

Figure 6. Una particion del intervalo (0, 1) mapea una curvapartida en secciones, dando como resultado una particin de lacurva.

γ

f(z)dz = limn→∞

n∑

j=1

f(zj)∆jz

La integracion de funciones de variable compleja se puede reducir a integra-ciones en los reales, separando la funcion compleja en su parte real y su parteimaginaria. Esta separacion la podemos ver en el siguiente teorema.

Page 104: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

92 6. EL PLANO COMPLEJO

Teorema 6.50. Sea f(z) = u + iv una funcion f : C C. La integral de f alo largo de una curva γ esta dada por

γ

f(z)dz =

γ

(udx− vdy) + i

γ

(vdx + udy)

donde las integrales del lado derecho son integrales de linea reales.

Demostracion 6.51. Sea f = u(x, y) + iv(x, y) y sean

∆jz = zj − zj−1 = xj − xj−1 + i(yj − yj−1) = ∆jx+ i∆jy

j = 1, · · · , n. De la definicion.∫

γ

f(z)dz = limn→∞

n∑

j=1

[u(x′j , y′j) + iv(x′j , y

′j)](∆jx+ i∆jy)

= limn→∞

n∑

j=1

[u(x′j , y′j)∆jx− v(x′j , y′j)∆jy] +

+i limn→∞

n∑

j=1

[v(x′j , y′j)∆jx+ u(x′j , y

′j)∆jy]

Estos ultimos lımites son las integrales de linea de las funciones correspondientes,ası se sigue el teorema.

Comentario 6.52. Si podemos representar γ en su forma parametrica, tal queγ : ℜ C, t → γ(t) = φ(t) + iψ(t) = x + iy, entonces se tiene que dx = φ′dt,dy = ψ′dt y la integral

γ

f(z)dz =

∫ t2

t1

(uφ′ − vψ′)dt+ i

∫ t2

t1

(vφ′ + uψ′)dt

la cual existe si f(z) es continua.

Corolario 6.53. Sean γ una curva formada por un numero finito de curvasγ1, · · · , γn. Entonces

γ

f(z)dz =

γ1

f(z)dz +

γ2

f(z)dz + · · ·+∫

γn

f(z)dz

Veamos algunos ejemplos sencillos para familiarizarnos con el teorema anterior.

Ejemplo 6.54. Vamos a calcular la integral

I1 =

∫ 2+i

0

z2dz

por la trayectoria 0A de la figura 7, que es la linea recta entre 0→ A = 2 + i dadapor y = 1/2x. Se tiene que z2 = x2 − y2 + 2xyi y dz = dx+ idy. Entonces

I1 =

γ

[(x2 − y2)dx − xy dy] + i

γ

[2xy dx+ (x2 − y2)dy]

Sobre OA, x = 2y y dx = 2dy

I1 =

∫ 1

0

[(4y2 − y2)2dy − 2y2dy

]+ i

∫ 1

0

[8y2dy + (4y2 − y2)dy

]=

2

3+

11

3i

Page 105: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. LA INTEGRAL EN EL PLANO COMPLEJO 93

Figure 7. Las trayectorias que unen el origen con el punto 2 + i.

Ejemplo 6.55. Ahora tomemos otra trayectoria. Vayamos por el eje de las xhasta el punto B = (2, 0) y luego subamos por la recta perpendicular hasta A = (2, i).Por la trayectoria 0BA. A lo largo de 0B, z = x, dz = dx. A lo largo de BA ,z = 2 + iy, dz = idy. Se obtiene

I2 =

∫ 2

0

x2dx+

∫ 1

0

(i(4− y2)− 4y

)dy =

8

3+

11

3i− 2 =

2

3+

11

3i

es decir

I2 = I1 =1

3z3

∣∣∣∣2+i

0

=1

3(2 + i)3 =

2

3+

11

3i

Ejemplo 6.56. Evaluemos la integral I =∫γ z

2dz a lo largo del cırculo de

radio 1, como en la figura 8, es decir a lo largo de la trayectoria r2 = x2 + y2 = 1.Para hacer esta integral, conviene hacer un cambio de variable, sean x = r cos (θ),y = r sin (θ), tal que x+ iy = cos (θ) + i sin (θ) = eiθ. Entonces z = eiθ y por tantodz = ieiθdθ sobre el cırculo. Se tiene que

I2 = i

∫ 2π

0

e2iθeiθdθ =1

3e3iθ

∣∣2π0

= 0

Ejemplo 6.57. Evaluemos ahora la integral

I =

γ

1

zdz

a lo largo del cırculo de radio 1, de nuevo como en la figura 8. tambien hacemos elcambio de variable x = cos (θ), y = sin (θ). Se tiene que

I2 = i

∫ 2π

0

eiθe−iθdθ = 2πi

Page 106: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

94 6. EL PLANO COMPLEJO

Figure 8. La trayectoria dada por el crculo de radio 1, x2 +y2 =cos(θ) + i sin(θ) = eiθ.

Ejercicio 6.58. Evaluar la integral∫γf(z)dz, donde f(z) son las funciones

del ejercicio 6.42 y γ es la trayectoria dada por |z| = 1.

Las propiedades de las integrales en variable compleja es muy semajante alas propiedades de las integrales de variable real. Sin embargo hay diferenciassustanciales que es justamente lo que hace tan importante el estudio de las funcionesde variable compleja y su integracion. Estas diferencias las veremos mas adelante,por ahora veamos sus propiedades.

Proposicion 6.59 (Propiedades de las integrales.). Sea f : C C integrable,γ y β trayectorias. Entonces, se cumple que

a) ∫

γ

f(z)dz = −∫

−γf(z)dz

b) ∫

γ

kf(z)dz = k

∫f(z)dz para toda k ∈ C

c) ∫

γ

(f(z) + g(z)) dz =

γ

f(z)dz +

γ

(z)dz

Demostracion 6.60. La demostracion se sigue de las propiedades de integralesde linea.

Page 107: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. LA INTEGRAL EN EL PLANO COMPLEJO 95

El comportamiente de las dos integrales de los ejemplos y ejercicios anterioreses generico y corresponde a un teorema de variable compleja muy importante. Estees:

Teorema 6.61. Sea f : C C univaluada y analıtica dentro y sobre una curvacerrada γ, entonces. ∫

γ

f(z)dz = 0

Demostracion 6.62. Usando el teorema de Green en el plano∫

(Pdx+Qdy) =

∫ ∫

R

(∂Q

∂x− ∂P

∂y)dx dy

y usando f(z) = u+ iv, y como f(z) es continua, obtenemos,∫

(udx− vdy) = −∫ ∫

R

(∂v

∂x+∂u

∂y)dx dy

y ∫(vdx + udy) =

∫ ∫

R

(∂u

∂x− ∂v

∂y)dx dy

Pero como f es anaıtica, ambas integrales son cero, por las condiciones de Cauchy-Riemann, (la hipotesis f(z) continua incluso se puede eliminar).

Definicion 6.63. Sea R ⊂ C una region en C. Decimos que R es simplementeconexa, si toda curva cerrada considerada dentro de ella, solo contiene puntos deR, vean la figura 9.

Definicion 6.64. Una region R que no es simplemente conexa, se llama deconexion multiple.

Ejemplo 6.65. La figura 10 muestra una region de conexion multiple. Lospuntos dentro de C2 y C3 no estan en C1.

A partir de aqui ya podemos iniciar un conjunto de teoremas y resultadospara la integracion de funciones de variable compleja. Estos teoremas son los queutilizaremos en la practica para multiples cosas. Vamos a iniciar con un teoremapara la integracion de funciones analıticas, univaluadas en regiones de conexionmultiple.

Teorema 6.66. Sea f(z) una funcion univaluada y analıtica en y sobre elcontorno de una region de conexion multiple R. Si B es el contorno de R formadopor un numero finito de curvas cerradas, independientes se tiene que:

B

f(z)dz = 0

Demostracion 6.67. Se toma una trayectoria cerrada unica en la region deconexion multiple, como el ejemplo que se muestra en la figura 11.

Otro resultado importante es que la integracion de funciones analıticas no de-pende de la curva cerrada sobre la que se integra.

Page 108: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

96 6. EL PLANO COMPLEJO

Figure 9. Una region R es simplemente conexa, si toda curvacerrada considerada dentro de ella, solo contiene puntos de R. Aquıse ven dos regiones: C2, en donde toda curva cerrada contienesolo puntos de C2, es decir, la curva que la rodea se puede hacertan pequena como sea, y el cırculo que rodea al agujero C3, queno puede hacerse tan pequeno como se quiera. Por eso C1 no essimplemente conexa.

Teorema 6.68. Sea f : C C integrable. Si f(z) es analıtica, se sigue que∫

γ1

f(z) =

γ2

f(z)

para todas dos trayectorias cerradas γ1 y γ2, es decir, trayectorias que inician yterminan en el mismo punto en C .

Demostracion 6.69. −γ1 γ2 = γ es cerrada. Ver figura 12.

Veamos un ejemplo para clarificar estos ultimos resultados.

Ejemplo 6.70. Integremos la funcion 1/(z2 + 16

)en una region entre dos

cırculos concentricos alrededor de 0, como se muestra en la figura 13. Esta funciones singular en z = ±4i. Sobre el cırculo exterior, z = 2eiθ y sobre el interior setiene que z = eiθ. Entonces separemos la integracion en los dos cırculos, se tiene:

B

dz

z2 + 16= i

∫ 2π

0

2eiθdθ

4e2iθ + 16+ i

∫ 2π

0

eiθdθ

e2iθ + 16

=1

4arctan

(1

2e2iθ

)∣∣∣∣2π

0

+1

4arctan

(1

4e2iθ

)∣∣∣∣2π

0

= 0

Page 109: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. LA INTEGRAL EN EL PLANO COMPLEJO 97

Figure 10. La figura muestra una region de conexion multiple.Los puntos dentro de C2 y C3 no estan en C1, son agujeros de estaregion.

ya que e0 = e4iπ = 1. Es mas, podemos ver que

∫ 2π

0

2eiθdθ

4e2iθ + 16= −

∫ 0

eiθdθ

e2iθ + 16

que corresponde a la integral a lo largo de cada cırculo por separado, pero en sentidocontrario.

Ejercicio 6.71. Usando los teoremas anteriores, diga en que regiones las fun-ciones de los ejercicios 6.14 y 6.42 tienen integrales diferentes de cero para trayec-torias cerrdas.

Analogamente al teorema fundamental del calculo, aqui tambien se puede verque la integral de una funcion analıtica, es su antiderivada. Por lo que la analogiade la integracion de funciones analıticas con funciones de variable real, es muyprofunda. Veamos este teorema.

Teorema 6.72. Sean f(z) : C C y F (z) : C C funciones analıticas. Si

F (z) =

∫ z

z0

f(z′)dz′, entonces F ′(z) = f(z)

Ejercicio 6.73. Demostrar el teorema.

La integral de una funcion analıtica es entonces analıtica.

Page 110: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

98 6. EL PLANO COMPLEJO

Figure 11. Region de conexion multiple unida con trayectoriasque la unen a la trayectoria principal para formar una trayectoriacerrada unica.

6. La Integral de Cauchy

Uno de los teoremas mas importantes en varaiable compleja y que mas vamos ausar en adelante es el teorema de Cauchy. Basıcamente es una formula para evaluarintegrales que son singulares en un punto y queremos llevar a cabo la integral enuna region que contenga la singularidad. Como vimos, la integral cerrada de unafuncion analıtica es cero. Pero la singularidad contenida en la region de integracionhace que la integral de la funcion singular ya no sea cero. Lo bonito del teoremaes que no solo nos dice que la integral existe, sino nos da una formula muy simplepara calcularla. Veamos este teorema.

Teorema 6.74 (de Cauchy). Sea f : C C funcion univaluada y analıticadentro y sobre una curva cerrada γ. Si z0 es cualquier punto interior a γ, se tieneque

f(z0) =1

2πi

γ

f(z)

z − z0dz

A esta integral se le llama formula de la integral de Cauchy.

Demostracion 6.75. Sea γ una curva que contenga z0, vean la figura 14. Sear0 = |z − z0|, tal que γ0 = z ∈ C ||z − z0| ≤ r ⊆ γ(ℜ). Como f(z) es analıtica, sesigue que f(z)/ (z − z0) es analıtica, salvo en z = z0. Por el teorema de conexionmultiple de Cauchy, se tiene

γ

f(z)

z − z0−∫

γ0

f(z)

z − z0= 0

Page 111: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

6. LA INTEGRAL DE CAUCHY 99

Figure 12. La composicion de las dos trayectorias 1 y 2 escerrada. Obviamente esta trayectoria se une en algun lugar a travesde una recta que va y regresa como en la figura anterior.

es decir: ∫

γ

f(z)dz

z − z0= f(z0)

γ0

dz

z − z0+

γ0

f(z)− f(z0)

z − z0dz

Sobre γ0, (z − z0) = r0eiθ, por lo que dz = ir0e

iθdθ, es decir∫

γ0

dz

z − z0=

∫ 2π

0

e−iθ

r0ir0e

iθdθ = 2πi

Como f(z) es continua, esto implica que para toda ǫ ∈ ℜ, existe δ > 0 tal que|z − z0| < δ, implica que |f(z)− f(z0)| < ǫ. Tomemos δ = r0, entonces

∣∣∣∣∫

γ0

f(z)− f(z0)

z − z0dz

∣∣∣∣ ≤∫

γ0

|f(z)− f(z0)||z − z0|

|dz| < ǫ

r0

γ0

|dz|

r0

∫ 2π

0

|ir0eiθdθ| = 2πǫ

r0r0 = ǫ2π

Por lo que esta integral sera mas pequena que 2πǫ, que tiene el valor tan pequenocomo se quiera. Por lo que esta integral es cero.

Una implicacion inmediata, es que si derivamos la formula de Cauchy obten-emos una formula equivalente. Es decir.

Page 112: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

100 6. EL PLANO COMPLEJO

Figure 13. Trayectoria de integracion dada por dos cırculoscentrados en el origen.

Corolario 6.76.

f ′(z0) =1

2πi

γ

f(z)

(z − z0)2dz

Claramente este proceso se puede llevar a cabo para obtener las derivadas deorden mayor. Lo que sigue es aprender a usar la formula. Para esto proponemoslos siguientes ejercicios.

Ejercicio 6.77. Realice las siguientes integrales1)∫γ z

2dz, donde γ es cualquier trayectoria cerrada.

2)∫γ

cos(z)/(z + 1)2dz, donde γ es un cırculo de radio 1/2 y centro en cero.

3)∫γ

cos(z)/(z + 1)2dz, donde γ es un cırculo de radio 2 y centro en cero.

4)∫γ

2z+1z+z2 dz, donde γ es un cırculo de radio 2 y centro en cero.

5)∫γ

2z+1z+z2 dz, donde γ es un cırculo de radio 1/2 y centro en cero.

6)∫γ

4z3+z2−1z(z2−1) dz, donde γ es un cırculo de radio 2 y centro en cero.

7)∫γ

4z3+z2−1z(z2−1) dz, donde γ es un cırculo de radio 1/2 y centro en cero.

8)∫γz2−2z−1z+z2 dz, donde γ es un cırculo de radio 1/2 y centro en 1.

El teorema y el corolario anteriores son de suma importancia para evaluarintegrales, tanto en el caso de variable compleja como en variable real. Mas adelante

Page 113: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

6. LA INTEGRAL DE CAUCHY 101

Figure 14. Trayectoria de integracion utilizada en el teorema de Cauchy.

dedicaremos una seccion a este importante resultado. Por ahora vamos a intruducirotra consecuencia directa de la formula de Cauchy que nos servira para la evaluacionde integrales. Este teorema es el siguiente.

Teorema 6.78. Sea f : C → C una funcion univaluada y analıtica en un punto,entonces sus derivadas de todos los ordenes, f ′(z), f ′′(z), · · · , son tambien funcionesanalıticas en dicho punto.

Demostracion 6.79. f(z) analıtica implica que f ′(z) existe en algun entornopara el cual f(z) es analıtica. Si usamos el corolario anterior, encontramos que

f ′′(z0) =2!

2πi

γ

f ′(z)(z − z0)3

dz

Usemos el entorno |z − z1| = r1 dentro del entorno cubierto por γ, entonces f ′′(z0)existe y por tanto f ′(z0) es analıtica. Repitiendo el argumento se sigue que f (n)(z0)es analıtica. Esto implica que si f = u + iv, entonces u y v, serıan funciones declase C∞.

Este teorema nos conduce a la formula

(6.2) f (n)(z0) =n!

2πi

γ

f(z)dz

(z − z0)n+1n = 1, 2, · · ·

Claramente esta formula se cumple igual si en vez de una region conexa, setoma una region de conexion multiple que contenga en su interior al punto z0. El

Page 114: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

102 6. EL PLANO COMPLEJO

resultado opuesto tambien es valido, es decir, si la integral de una funcion es ceropara cualquier trayectoria cerrada, entonces la funcion es analıtica. A este teoremase conoce como el teorema de Morera.

Teorema 6.80 (de Morera). Sea f : C C una funcion continua en la regionR. Si para cualquier trayectoria γ cuyo contorno este dentro de R se cumple que

γ

f(z)dz = 0

entonces f(z) es analıtica en R.

Demostracion 6.81. Sin Dem.

Ejercicio 6.82. Realice las siguientes integrales

1)∫γ e

z/(z2 + 1

)5dz, donde γ es cualquier trayectoria cerrada.

2)∫γ cos(z)/(z − 1)5dz, donde γ es un cırculo de radio 1/2 y centro en cero.

3)∫γ

cos(z)/(z − 1)5dz, donde γ es un cırculo de radio 1/2 y centro en 1.

4)∫γ

3z3−z2+5z+1(z2−1)2

dz, donde γ es un cırculo de radio 2 y centro en cero.

5)∫γ

3z3−z2+5z+1(z2−1)2

dz, donde γ es un cırculo de radio 1 y centro en 1.

Page 115: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 7

SERIES

Una de las aplicaciones practicas de la teorıa de variable compleja es sin dudael hecho de que esta teorıa nos da metodos muy poderosos para evaluar integrales.El objetivo de este capitulo es introducir una serie de metodos utilizando todo loque hemos aprendido y la teorıa de series en variable compleja, para poder evaluarintegrales complicadas. Para eso, es necesario intruducir la teorıa de series envariable compleja y es lo que haremos primero.

1. Series en el Plano Complejo

La definicion de las series en variable compleja es completamente analogo a lasseries en variable real. Una serie es entonces una suma de la forma

(7.1) z1 + z2 + · · ·+ zn + · · · =∞∑

n=1

zn

La serie sera convergente si su parte real y su parte imaginaria lo son por separado.Para determinar si una serie converge entonces, se usan los metodos comunes enla determinacion de convergencia en variable real. Vamos a recordar brevementealgunos criterios.

1) Criterio de comparacion. Si 0 ≤ an ≤ bn, para toda n, entonces si laserie

∑∞n=1 bn converge, tambien converge

∑∞n=1 an.

2) Prueba del cociente. Sea an > 0 para todo n y

limn→∞

an+1

an= r

entonces∑∞

n=1 an converge si r < 1.3) Teorema de Leibniz. Si a1 ≥ a2 ≥ · · · ≥ 0 y

limn→∞

an = 0

entonces la serie∑∞n=1(−1)n+1an = a1 − a2 + a3 − a4 · · · converge.

Para aplicar estos criterios de convergencia se toman la parte real y la imag-inaria por separado y se aplica entonces a las series de variable compleja. Sinembargo, podemos definir algo mas fuerte que convergente, que se llama absoluta-mente convergete. Su definicion es como sigue:

Definicion 7.1. Una serie del tipo (7.1) convergente, se dice absolutamenteconvergente si

|z1|+ |z2|+ · · ·+ |zn|+ · · · =∞∑

n=1

|zn|

es convergente

103

Page 116: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

104 7. SERIES

Si una serie es absolutamente convergente, entonces es convergente.Vamos a ver un ejemplo de esta definicion en forma de teorema.

Teorema 7.2 (de Abel). Sea la serie

(7.2) c0 + c1 z + · · ·+ cn zn + · · · =

∞∑

n=1

cn zn

Si esta serie converge para algun valor zo, entonces la serie converge absolutamentepara todos los valores z tales que |z| < |zo|

Demostracion 7.3. Por hipotesis se tiene que∑∞

n=1 cn zno convege, por lo que

|cn zno | < M es acotado para toda n y para alguna M ∈ ℜ. Sea r = |z/zo|, entonces

|cn zn| = |cn zno |∣∣∣∣z

zo

∣∣∣∣n

< M rn

por lo que, usando el criterio de comparacion de las series, se tiene que si r < 1,la serie converge absolutamente.

Veamos otros ejemplos.

Ejemplo 7.4. Sea la serie

S =

∞∑

n=1

ein

n2

Claramente podemos descomponer esta serie en su parte real y su parte imaginariacomo

S =

∞∑

n=1

(cos(n)

n2+ i

sin(n)

n2

)

Primero observemos que el modulo de los terminos de la serie es∑∞

n=1 1/n2 y estaserie es convergente, por lo que la serie S es absolutamente convergente. La dosseries por separado, la parte real y la imaginaria, tambien son convergentes, por loque S es convergente.

Ejemplo 7.5. Vamos a determinar si la serie

S =

∞∑

n=1

zn cos(in)

es convergente. Para hacer esto, primero observamos que cos(in) = cosh(n).Tomemos ahora un valor arbitrario para z, digamos zo y chequemos las condi-ciones para las cuales la serie

∑∞n=1 z

no cosh(n) converge. Para hacer esto, usamos

el criterio del cociente, esto es:

limn→∞

∣∣∣∣zn+1o cosh(n+ 1)

zno cosh(n)

∣∣∣∣ = limn→∞

∣∣∣∣zo (cosh(n) cosh(1) + sinh(n) sinh(1))

cosh(n)

∣∣∣∣= lim

n→∞zo |cosh(1) + tanh(n) sinh(1)|

= zo |cosh(1) + sinh(1)| = zo e

por lo que la serie S converge si zo < 1/e

Este valor determina una region para la cual la serie converge y se le llamaradio de convergencia. Formalmente se puede definir como sigue:

Page 117: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. SERIES DE TAYLOR EN EL PLANO COMPLEJO 105

Definicion 7.6. El radio de convergencia de una serie del tipo (7.2) sedefine como

limn→∞

∣∣∣∣cncn+1

∣∣∣∣

Ejercicio 7.7. Determinar el radio de convergencia, cuando exista, de lassiguientes series:

1)∑∞

n=1 zn ein

2)∑∞

n=1 zn ei

πn

3)∑∞

n=1

(z

1−i

)n

4)∑∞

n=1 zn in

5)∑∞

n=1 zn sin( iπn )

2. Series de Taylor en el Plano Complejo

Las series de Taylor en variable compleja son de primordial importancia paraevaluar funciones. En esta seccion vamos a definir las series de Taylor y Maclaurin ydespues pasaremos a definir las series de Laurent, que se utilizaran para varios teo-remas y despues para desarrolar metodos que nos seran muy utiles en la evaluacionde integrales. Vamos a iniciar con el siguiente teorema.

Teorema 7.8 (Series de Taylor). Sea f(z) una funcion analıtica en una regiondentro de una circunferencia γ0, con centro en z0 y radio r0. Para todo puntodentro de γ0 se tiene

f(z) = f(z0) + f ′(z0)(z − z0) +f ′′(z0)

2!(z − z0)2 + · · ·+ fn(z0)

n !(z − z0)n + · · ·

Demostracion 7.9. Sea z ∈ γ0 y r = |z − z0|, i.e., r < r0. Sea γ1 la circun-ferencia |z′ − z0| = r1, tal que r < r1 < r0. f(z) es analıtica dentro y sobre de γ1 .De la integral de Cauchy, tenemos

f(z) =1

2πi

γ1

f(z′)dz′

z′ − zPero

1

z′ − z =1

(z′ − z0)− (z − z0)=

1

z′ − z0· 1

1− z−z0z′−z0

Ahora usamos la formula

1 + α+ · · ·+ αn−1 =αn − 1

α− 1

se obtiene1

1− α = 1 + α+ α2 + · · ·+ αn−1 +αn

1− αEntonces, si hacemos α = z−z0

z′−z0 , obtenemos una formula equivalente

1

z′ − z =1

z′ − z0

(1 +

z − z0z′ − z0

+ · · ·+(z − z0z′ − z0

)n−1

+1

1− z−z0z′−z0

(z − z0z′ − z0

)n)

Page 118: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

106 7. SERIES

Asi que

f(z′)

z′ − z =f(z′)

z′ − z0+

f(z′)

(z′ − z0)2(z−z0)+· · ·+

f(z′)

(z′ − z0)n(z−z0)n−1+

f(z′)

(z′ − z)(z′ − z0)n(z−z0)n

Ahora dividimos esta identidad entre 2πi e integramos todos los terminos usandoel teorema de Cauchy, para obtener

f(z) = f(z0) + f ′(z0)(z − z0) + · · ·+ f (n−1)(z0)

n!(z − z0)n−1 +Rn

donde el residuo Rn esta dado por

Rn =(z − z0)n

2πi

γ1

f(z′)dz′

(z′ − z)(z′ − z0)n

y γ1 es la trayectoria cerrada definida anteriormente. Recordemos que |z − z0| = ry |z′ − z0| = r1 y como |z′ − z0| ≤ |z′ − z|+ |z − z0|, entonces |z′ − z| ≥ |z′ − z0| −|z − z0| = r1 − r. Esto es, si M es el maximo de |f(z′)| dentro de la curva γ1, elresiduo es menor que

|Rn| ≤∣∣∣∣rn

2πi

2πiM r1(r1 − r)rn1

∣∣∣∣ =r1M

r1 − r

(r

r1

)n→

n→∞0

ya que r < r1. Esto implica que tomando la serie hasta infinito obtenemos el valorde la funcion en cualquier punto. Es decir,

f(z) = f(z0) +

∞∑

n−1

f (n)

n!(z − z0)n

La convergencia de la serie, entonces, se da si la funcion f(z) es analıtica dentrode γ0

Notacion 7.10. Si la serie se toma para z0 = 0, la serie se llama serie deMaclaurin.

Page 119: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. SERIES DE LAURENT 107

Ejemplo 7.11. Los ejemplos mas tıpicos de series de Taylor y Maclurin son

exp (z) = 1 +

∞∑

n=1

zn

n!para |z| <∞

sin (z) =

∞∑

n=1

(−1)n+1 z2n−1

(2n− 1)!, para |z| <∞

cos (z) = 1 +

∞∑

n=1

(−1)nz2n

(2n)!, para |z| <∞

sinh (z) =∞∑

n=1

z2n−1

(2n− 1)!, para |z| <∞

cosh (z) = 1 +

∞∑

n=1

z2n

(2n)!, para |z| <∞

1

1 + z=

∞∑

n=o

(−1)n zn, para |z| < 1

1

z=

∞∑

n=o

(−1)n(z − 1)n, para |z − 1| < 1

Veamos otro ejemplo.

Ejemplo 7.12. Vamos a desarrollar la funcion

f(z) =1

3− 2 z

en series de Taylor en potencias de z − 3. Para hacer esto, vamos a transfomar lafuncion f como sigue:

1

3− 2 z= − 1

3 + 2(z − 3)= −1

3

1

1 + 23 (z − 3)

Ahora usamos la formula para el desarrollo de Taylor de 1/(1 + z) con |z| < 1,substituyendo z → 2/3(z − 3). Se obtiene:

1

3− 2 z= −1

3

[1− 2

3(z − 3) +

22

32(z − 3)2 − 23

33(z − 3)3 + · · ·

]

la cual es convergente para |z − 3| < 32 .

3. Series de Laurent

Las series de Laurent son una forma de descomposicion que se puede llevar acabo en cualquier funcion analıtica. Las series de Laurent contienen coeficientesque seran utilizados para la evaluacion de integrales de una manera muy sencilla.Vamos a iniciar con el teorema de las series de Laurent.

Teorema 7.13 (Series de Laurent). Sean γ1 y γ2 dos trayectorias circularesconcentricas, con centro en z0. Sea z′ un punto en γ1 γ2, tal que |z′ − z0| = r1o |z′ − z0| = r2, con r2 < r1. f(z) es analıtica sobre γ1 y γ2 y en la region entreellas, como se muestra en la figura 1. Entonces f(z) puede representarse como unaserie de potencias de orden positivo y negativo como

Page 120: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

108 7. SERIES

Figure 1. Trayectoria de integracion utilizada en el teorema deseries de Laurent.

f(z) =

∞∑

n=0

an(z − z0)n +

∞∑

n=1

bn(z − z0)n

donde

an =1

2πi

γ1

f(z′)dz′

(z′ − z0)n+1n = 0, 1, · · ·

bn =1

2πi

γ2

f(z′)dz′

(z′ − z0)−n+1n = 1, 2, · · ·

Notacion 7.14. A estas series se les llama series de Laurent.

Demostracion 7.15. La integral de Cauchy de f(z) es

f(z) =1

2πi

γ1

f(z′)dz′

z′ − z −1

2πi

γ2

f(z′)dz′

z′ − zya que dentro de esta trayectoria, f(z) es analıtica. Si como en el teorema anteriorusamos la descomposicion de 1

z′−z pero ahora en cada integral, obtenemos

f(z) =1

2πi

γ1

f(z′)dz′(

1

z′ − z0+

z − z0(z′ − z0)2

+ · · ·+ (z − z0)n−1

(z′ − z0)n+

(z − z0)n(z′ − z0)n(z′ − z)

)

− 1

2πi

γ2

f(z′)dz′(

1

z − z0+

z′ − z0(z − z0)2

+ · · ·+ (z′ − z0)n−1

(z − z0)n+

(z′ − z0)n(z − z0)n(z − z′)

)

donde, de la misma forma que en el teorema de Taylor, el residuo

(z − z0)n2πi

γ1

f(z′)dz′1

(z′ − z0)n(z′ − z)

Page 121: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. SERIES DE LAURENT 109

tiende a cero para n→∞. Solo nos falta ver el segundo residuo dado por

1

2πi (z − z0)n∫

γ2

f(z′)dz′(z′ − z0)n(z − z′)

pero por el mismo argumento que para el primer residuo, se puede ver que tambientiede a cero para cuando n tiende a infinito. Por lo que se sigue el teorema.

Ejercicio 7.16. Demuestre que el residuo de la serie

1

2πi (z − z0)n∫

γ2

f(z′)dz′(z′ − z0)n(z − z′)

tiende a cero para n→∞

Para familiarizarnos con las series de Laurent, en lo que sigue vamos a daralgunos casos particulares de ellas ası como algunas aplicaciones y ejemplos. Lasseries de Laurent son muy generales, de hecho contienen a las de Taylor. Vamos ainiciar con una proposicion diciendo justamente esto.

Proposicion 7.17. Si la funcion f es analıtica dentro y fuera de una curva|z − z0| = r0, su serie de Laurent se reduce a

f(z) =

∞∑

n=0

an(z − z0)n

y converge a f(z) para todos los puntos interiores de la circunferencia |z−z0| = r0.

Es claro que esta serie es la serie de Taylor de f(z) en potencias de (z − z0).

Demostracion 7.18. Si f es analıtica dentro del circulo |z−z0| = r0, se sigueque bn = 0 en la serie de Laurent, para todo n. La serie se vuelve un desarrollo enserie para f totalmente analogo como en el caso del teorema de Taylor.

Veamos algunos ejemplos representativos.

Ejemplo 7.19. Tomemos la funcion

f(z) =1

z(1 + z2)

Esta funcion es singular para z = 0 y z = ± i. Primero vamos a encontrar su seriede Laurent dentro de una trayectoria cerrada con |z| < 1. Para este caso, podemosexpander el termino 1/(1 + z2) en series como sigue

f(z) =1

z

1

1 + z2

=1

z

(1− z2 + z4 − z6 + · · ·

)

=1

z+

∞∑

n=1

(−1)nz2n−1 para (0 < |z| < 1)

Sin embargo, si ahora tomamos la region |z| > 1 esta expansion ya no es valida. Loque se acostumbra entonces es buscar que se cumplan las condiciones para que laexpanson pueda realizarse. Para esto hagamos lo siguiente, si |z| > 1, esto implica

Page 122: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

110 7. SERIES

que |1/z| < 1, ası que hagamos la expansion usando este hecho. Por ejemplo,podemos hacer

f(z) =1

z3

1

1 + z−2=

1

z3

∞∑

n=1

(−1)nz−2n =

∞∑

n=0

(−1)n1

z2n+3para |z| > 1

ya que∣∣1/z2

∣∣ < 1. Asi, la expresion en series de la funcion depende de la regionen donde queremos obtener la serie.

Ejemplo 7.20. Vamos a buscar la serie de Laurent de la funcion

f(z) =1

(1 − z2)2

dentro de la esfera 0 < |z − 1| < 2. Para hacer esto utilizaremos la formula de lasseries de Laurent en su forma intergral. Los coeficientes de la serie estan dadospor:

an =1

2πi

γ1

1(1−z′2)2 dz

(z′ − 1)n+1

=1

2πi

γ1

dz′

(z′ − 1)n+3 (1 + z′)2

=1

(n+ 2)!

dn+2

dzn+2

[1

(1 + z)2

]∣∣∣∣z=1

=1

(n+ 2)!

(−1)n(n+ 3)!

(1 + z)n+4

∣∣∣∣z=1

=(−1)n(n+ 3)

2n+4n = 0, 1, · · ·

donde γ1 es una trayectoria alrededor de z = 1, y hemos usado la formula (6.2)para las derivadas de la integral de Cauchy. De una manera semjante, vamos aevaluar la integral para los coeficientes bn, tenemos:

bn =1

2πi

γ1

1(1−z′2)2

dz′

(z′ − 1)−n+1

=1

2πi

γ1

dz′

(z′ − 1)−n+3(1 + z′)2n = 1, 2, · · ·

Para n = 1, 2, el resultado es el mismo que para an, pero con n = −2,−1. Paran ≥ 3, la funcion interior de la integral es analıtica en z = 1 y la integral es cero.Entonces la serie sera:

1

(1− z2)2=

∞∑

n=−2

(−1)n(n+ 3)

2n+4(z − 1)n

Ejercicio 7.21. Obtenga con detalle las expresiones de las series de las fun-ciones siguientes

1) z2, dentro cualquier trayectoria cerrada.

2) cos(z)/(z + 1)2, dentro de cırculo de radio 1/2 y centro en cero.

3) cos(z)/(z + 1)2, dentro de un cırculo de radio 2 y centro en cero.

Page 123: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. POLOS Y RESIDUOS 111

4) 2z+1z+z2 , dentro de un cırculo de radio 2 y centro en cero.

5) 2z+1z+z2 , dentro de un cırculo de radio 1/2 y centro en cero.

6) 4z3+z2−1z(z2−1) , dentro de un cırculo de radio 2 y centro en cero.

7) 4z3+z2−1z(z2−1) , dentro de un cırculo de radio 1/2 y centro en cero.

8) z2−2z−1z+z2 , donde γ es un cırculo de radio 1/2 y centro en 1.

En algunas ocaciones conviene realizar algunos cambios a las funciones analıticaspara poder encontrar su serie de Laurent. Por ejemplo, cuando una funcion analıticase pude descomponer en el producto de dos o mas funciones analıticas mas simples.En este caso es posible encotrar sus series utilizando la siguiente proposicion.

Proposicion 7.22. La serie del producto de dos funciones analıticas convergehacia el producto de sus series para todo los puntos interiores a las dos circunfer-encias de convergencia.

Demostracion 7.23. Sean

f(z) =∞∑

n=0

anzn y g(z) =

∞∑

n=0

bnzn

analıticas en una region R. Entonces, como f(z) y g(z) son analıticas en esa region,su serie de Maclaurin existe en la region. Se sigue que f(z)g(z) es analıtica ahı y

f(z)g(z) =∑∞

n=0 cnzn con

= a0b0+ c0 = f(0)g(0) = a0b0(a0b1 + a1b0)z+ c1 = f(0)g′(0) + f ′(0)g(0) = a0b1 + a1b0(a0b2 + a1b1 + a2b2)z

2+ c2 = 12! [f(0)g′′(0) + 2f ′(a)f ′(0) + f ′′g(0)]

... = a0b2 + a1b1 + a2b0, etc.

4. Polos y Residuos

Ya estamos listos para introducir el teorema mas importante para resolverintegrales complicadas. Como ya conocemos la serie de Laurent de una funcion, sepueden entonces conocer los coeficientes de la serie y con esto es posible conocerlos polos y tambien los residuos, como veremos mas adelante. La idea es muysimple, los coeficientes de la serie son de hecho integrales de funciones, pero laserie se puede encontrar por otros metodos. Entonces, conocidos los coeficientes,podemos igualarlos a las integrales correspondientes. Estos coeficientes son losque se necesita para poder evaluar integrales. Vamos a iniciar esta seccion con lasiguiente definicion.

Definicion 7.24. Sea f : C→ C analıtica en todos los puntos de la region R,excepto en z0 ∈ R. Entonces z0 se llama punto singular aislado de f en R.

Notacion 7.25. Otra manera de enunciar esta definicion es diciendo que z0es un punto singular aislado, si en toda la region alrededor de Rz0 = z ∈ R | 0 <|z − z0| ≤ r1, f es analıtica.

Page 124: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

112 7. SERIES

Otra concepto que usaremos mucho en lo que sigue es el concepto de residuo,que es simplemente el coeficiente principal de la serie de Laurent de una funcion,formalmente tenemos.

Definicion 7.26. Sea f : C C analıtica en R con el punto singular aisladoz0 y sea

f(z) =

∞∑

n=0

an(z − z0)n +b1

z − z0+

b2(z − z0)2

+ · · ·

la serie de Laurent de f alrededor de z0. Al coeficiente b1 de la serie se le llamaresiduo.

Comentario 7.27. Observemos que b1 tiene la forma

b1 =1

2πi

γ

f(z′)dz′,

donde γ es cualquier curva cerrada que envuelva solo al punto singular aislado z0de f , pero no a otro mas.

Comentario 7.28. Para calcular los residuos en ocaciones es muy util laformula

(7.3) b1 = limz→z0

(z − z0) f (z)

Para comprender mejor estas definiciones, vamos a ver algunos ejemplos.

Ejemplo 7.29. Sea

f(z) =cos (z)

z3

Alrededor de z0 = 0, la serie de Laurent de esta funcion es

cos(z)

z3=

1

z3− 1

2

1

z+

1

4!z − 1

6!z3 + · · · para |z| < 0

El residuo sera b1 = −1/2. Esto quiere decir que

1

2π i

γ

cos(z)

z3dz = −1

2

donde γ es cualquier trayectoria cerrada que rodee a z0 = 0.

Ejemplo 7.30. Vamos a encontrar los residuos de la funcion

f(z) =5z − 2

z(z − 1),

alrededor de |z| = 2. Dentro de |z| = 2 estan las dos singularidades aisladas z = 0y z = 1. Primero encontremos la serie de Laurent alrededor de z = 0, pero con|z| < 1. Para esto, simplemente separemos las series

5z − 2

z(z − 1)=

5

z − 1− 2

z(z − 1)

=

(5− 2

z

)1

z − 1

=

(−5 +

2

z

)(1 + z + z2 + · · · )

=2

z− 3− 3z − 3z2 − · · ·

Page 125: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. POLOS Y RESIDUOS 113

Ası, el residuo para 0 < |z| < 1 es K1 = 2. Ahora vamos a buscar la serie alrededordel otro polo z = 1. Para hacer esto, busquemos una descomposicion de la funcionde tal forma que podamos expandirla en series alrededor de z = 1. Podemos hacer

5z − 2

z(z − 1)=

(5z − 5 + 3

z − 1

)1

z=

(5 +

3

z − 1

)1

z

=

(5 +

3

z − 1

)[1− (z − 1) + (z − 1)2 − · · · ]

= 5− 5(z − 1) + 5(z − 1)2 +3

z − 1− 3 + 3(z − 1)− 3(z − 1)2 + · · ·

=3

z − 1+ 2− 2(z − 1) + 2(z − 1)2 − · · ·

para 0 < |z − 1| < 1, por lo que el residuo es K2 = 3.

Ejercicio 7.31. Obtenga los residuos de las fuciones del ejercicio 7.21.

El calculo anterior es generico en funciones analıticas y es otro de los resultadosmas importantes de la variable compleja. Con este resultado ya podemos demostrarel teorema de los residuos.

Teorema 7.32 (del Residuo). Sea f : C C analıtica en una region R, exceptoen un numero finito de puntos singulares aislados, sea γ una curva cerrada que rodeaun numero finito de esos puntos. Sean K1, · · · ,Kn los residuos de f alrededor deestos puntos. Entonces

γ

f(z)dz = 2πi(K1 +K2 + · · ·+Kn)

Demostracion 7.33. Tomemos la curva γ y la descomponemos en seccionesque rodeen a los polos, como se muestra en la figura 2. Entonces se tiene∫

γ

f(z)dz =

γ1

f(z)dz +

γ2

f(z)dz + · · ·+∫

γn

f(z)dz = 2πi(K1 +K2 + · · ·+Kn)

Ejemplo 7.34. Vamos a evaluar la integral∫

5z − 2

z(z − 1)dz

alrededor de |z| = 2 . Como vimos en el ejemplo 7.30, la serie de Laurent alrededorde z = 0 es

5z − 2

z(z − 1)=

2

z− 3− 3z − 3z2 · · ·

y el residuo par 0 < |z| < 1 es K1 = 2. Para el otro residuo teniamos

5z − 2

z(z − 1)=

3

z − 1+ 2− 2(z − 1) + 2(z − 1)2

para 0 < |z − 1| < 1, por lo que el residuo es K2 = 3. Entonces la integral sera∫

γ

5z − 2

z(z − 1)dz = 2πi(2 + 3) = 10πi

Page 126: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

114 7. SERIES

Figure 2. Trayectoria de integracion utilizada en el teorema del residuo.

Para comprobar que esto es cierto, evaluemos la integral directamente∫

γ

5z − 2

z(z − 1)dz =

γ

2

zdz +

γ

3

z − 1dz = 2πi(2 + 3)

O hagamos el desarrollo en series de otra forma alternativa que abarque los dospolos, por ejemplo, para |z| > 1 podemos hacer

5z − 2

z(z − 1)=

5z − 2

z2

1

1− 1z

= (5z − 2)

∞∑

n=0

1

zn+2

por lo que el residuo aqui es 5, ası que al final, con cualquiera de las formas decalcular la integral, obtenemos el mismo resultado, como debe ser.

Ejercicio 7.35. Usando el teorema del residuo, calcular las integrales sigu-ientes

1)∫γ

cos(z)(z+1)2 dz

2)∫γ

2z+1z+z2 dz

3)∫γ

4z3+z2−1z(z2−1) dz

4)∫γz2−2z−1z+z2 dz

5)∫γ

ez

(z2+1)5dz

6)∫γ

cos(z)(z−1)5 dz

7)∫γ

3z3−z2+5z+1(z2−1)2

dz

Page 127: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. POLOS Y RESIDUOS 115

En ocaciones hay funciones que tienen muchos polos en el mismo punto, o deotra manera, algun polo es multiple, es decir, el polo esta elevado a alguna potencia.Estos polos multiples reciben un nombre especial.

Definicion 7.36. Sea f : C C analıtica alrededor de z y sea.

f(z) =b1

z − z0+

ba(z − z0)2

+ · · ·+ bm(z − z0)m

+

∞∑

n=0

an(z − z0)n

la serie de Laurent de f(z) alrededor de z0, tal que bm 6= 0 pero bm+1, bm+2 · · · = 0.Entonces se dice que z0 es un polo de orden m. Si m = 1 , se dice que z0 es unpolo simple.

Podemos construir una formula analoga a la formula (7.3) para calcular losresiduos de polos de orden arbitrario. Esta formula esta dada en la siguienteproposicion.

Proposicion 7.37. Sea f : C C univaluada, tal que, para algun m entero ypositivo

F (z) = (z − z0)mf(z)

es analıtica en z0 y F (z0) 6= 0. Entonces f(z) tiene un polo de orden m en z0. Elresiduo sera F (m−1)(z0)/(m− 1)!

Demostracion 7.38. Supongamos que f(z) tiene un polo de orden m, por loque bm 6= 0, pero todos los bm+k = 0, con k > 1. Vamos a construir la funcionF (z) = (z − z0)mf(z), se tiene

F (z) = b1(z − z0)m−1 + ba(z − z0)m−2 + · · ·+ bm +

∞∑

n=0

an(z − z0)n+m

Claramente F (z0) = bm 6= 0. Si tomamos la m − 1 derivada de F (z), se obtieneque

dm−1F (z)

dzm−1= (m− 1)!b1 +

∞∑

n=0

(n+m− 1)!an(z − z0)n+1

Por lo que b1 = 1/(m− 1)!F (m−1)(z0)

Comentario 7.39. Para calcular los polos de orden m en general es conve-niente utilizar la formula

(7.4) bm = limz→z0

((z − z0)mf(z0))(m−1)

(m− 1)!

Usemos esta formula en un ejemplo sencillo.

Ejemplo 7.40. Tomemos

f(z) =z2 − 2z + 3

z − 2

es claro que esta funcion se puede descomponer como

z2 − 2z + 3

z − 2=

3

z − 2+ z

Entonces esta expresion tiene un residuo K1 = 3 y un polo simple en z0 = 2. Parallegar al mismo resultado, ahora calculems F (z), obtenemos

F (z = 2) = (z − 2)f(z)|z=2 = z2 − 2z + 3∣∣z=2

= 3

Page 128: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

116 7. SERIES

como antes.

Ejemplo 7.41. Encontremos los residuos de la funcion

f(z) =z2

(z2 + 9)(z2 + 4)2

Esta funcion tiene 2 polos simples en ±3i y dos dobles en ±2i. Para calcular losresiduos usemos la formula (7.3)

b1 = limz→3i

z2

(z + 3i)(z2 + 4)2= − 3

50iy

b1 = limz→−3i

z2

(z − 3i)(z2 + 4)2=

3

50i

Los polos dobles los calculamos usando la formula (7.4)

limz→2i

((z − 2i)2f(z)

)′

=

(z2

(z2 + 9)(z + 2i)

)′= − 13i

200

analogamente

limz→−2i

((z − 2i)2f(z)

)′

=

(z2

(z2 + 9)(z − 2i)

)′=

13i

200

La formula para obtener el residuo tambien puede ser usada para otros fines.Por ejemplo, vamos a usarla para evaluar el lımite de la funcion

g(z) = 2cosh(z)

z2− 2

sinh(z)

z3

en cero.

Ejemplo 7.42. Tomemos la serie

f(z) =sinh (z)

z4

Su funcion F (z) correspondiente debe ser

F (z) = zmsinh (z)

z4

Si m ≥ 4, F (0) = 0. Pero si m = 3,

F (z = 0) =sinh(z)

z

∣∣∣∣z=0

= 1

Entonces

1

2!

d2 F (z = 0)

dz2=

1

2

(sinh(z)

z− 2

cosh(z)

z2+ 2

sinh(z)

z3

)∣∣∣∣z=0

Que es justamente 1/2!F ′′(0) = 1/2 limz→0(sinh(z)/z − g(z)), que es el lımite quebuscamos. Para saber cual es su valor, vamos a evaluar la serie de Laurent de lafuncion f(z). Se obtiene

f(z) =sinh (z)

z4=

1

z3+

1

3!

1

z+

1

5!z +

1

7!z3 + · · ·

Page 129: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. POLOS Y RESIDUOS 117

Por lo que sinh (z) /z4 tiene un residuo igual a 1/6 y un polo triple en z = 0.Usando este resultado podemos evaluar la funcion

1

2!F ′′(0) =

1

2

(sinh(z)

z− 2

cosh(z)

z2+ 2

sinh(z)

z3

)∣∣∣∣z=0

=1

6

Como limz→0 sinh(z)/z−g(z) = 1/3 y limz→0 sinh(z)/z = 1, se tiene que limz→0 g(z) =2/3

Como ya habran notado, las singularidades de algunas funciones tienen la car-acteristica de poder ser eliminadas transfomando la funcion original en otra quese convierte en analıtica. A estas sigularidades se les llama removibles, porque dehecho se pueden evitar, por ejemplo, multiplicando la funcion por algun factor,como es el caso de la definicion de la funcion F . Formalmente estas sigularidadesse definen como sigue.

Definicion 7.43. Sea F1 : C C analıtica en una region R, excepto paraz = z0 ∈ C. Sea F (z) = F1(z) para toda z 6= z0 y F (z0) = k, con F : C → C. SiF (z) es analıtica, se dice que z0 es una singularidad removible o evitable.

Para aclarar esta definicion, veamos algunos ejemplos y ejercicios.

Ejemplo 7.44. Sea f : C C analıtica en R pero con un polo z = z0 de ordenm. Si definimos F = (z − z0)mf(z), esta nueva funcion es analıtica y tiene unasingularidad en z = z0 que es removible.

Ejemplo 7.45. Sea

f(z) =1

z (ez − 1)=

1

z2

1

1 + z2! + z2

3! + · · ·Esta funcion es singular en z = 0 y tiene un polo doble. De hecho

1

z (ez − 1)=

1

z2(1− 1

2z + · · · )

El residuo de f(z) es K1 = − 12 . Sin embargo, la funcion F = z2f(z) es analıtica

en z = 0, por lo que z = 0 es un polo removible de F .

Ejercicio 7.46. Encontrar los polos y residuos de las siguientes funciones.

1) cos(z)(z+1)2

2) 2z+1z+z2

3) 4z3+z2−1z(z2−1)

4) z2−2z−1z+z2

5) ez

(z2+1)5

6) cos(z)(z−1)5

7) 3z3−z2+5z+1(z2−1)2

Page 130: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

118 7. SERIES

5. Evaluacion de Integrales

Una de las aplicaciones directas de los resultados anteriores es la posibilidadde desarrollar algunos metodos para evaluar integrales que son muy complicadas.Para explicar estos metodos, lo mas conveniente es dar ejemplos de como se utilizanestos. En esta seccion veremos algunos ejemplos de evaluacion de integrales usandolos resultados de variable compleja.

5.1. Integrales de la forma.∫ ∞

−∞

p(x)

q(x)dx

Ejemplo 7.47. Vamos a encontrar la integral∫ ∞

0

dx

x2 + 1=

1

2

∫ ∞

−∞

dx

x2 + 1

Tomemos la funcion f(z) = 1z2+1 , tienen dos polos simples en +i y −i. Sea γ una

curva cerrada, pasando por el eje real y haciendo un semicırculo, como en la figura3. Se tiene

Figure 3. Curva cerrada, pasando por el eje real y haciendo unsemicırculo que contiene al polo simple +i.

∫ R

−R

dx

x2 + 1+

γR

dz

z2 + 1=

γ

dz

z2 + 1

=

γ

i dz

2(z + i)−∫

γ

i dz

2(z − i)

= 2πi

(0− 1

2i

)= π

Page 131: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. EVALUACION DE INTEGRALES 119

donde γR es el semicırculo superior. γR es tal que |z| = R y como∣∣z2 + 1

∣∣ ≥∣∣z2∣∣− 1 = R2 − 1 se tiene

∣∣∣∣∫

γR

dz

z2 + 1

∣∣∣∣ ≤∫

γR

|dz|R2 − 1

=πR

R2 − 1

R→∞→ 0

ası que ∫ ∞

−∞

dx

x2 + 1= π

Ejemplo 7.48. Evaluar∫ ∞

0

x2dx

(x2 + 9)(x2 + 4)2=

1

2

∫ ∞

−∞

x2dx

(x2 + 9)(x2 + 4)2

Consideremos a la funcion

f(z) =z2

(z2 + 9)(z2 + 4)2

Como vimos en el ejercicio 7.41, esta funcion tiene 2 polos simples en ±3i y dosdobles en ±2i, cuyos residuos estan dado por K3i = 3i

50 , K−3i = − 3i50 , K2i = − 13i

200

y K−2i = 13i200 . Entonces la integral sobre el contorno se toma como en el ejemplo

anterior, sera∫ R

−R

dz

(z2 + 9)(z2 + 4)2+

γR

dz

(z2 + 9)(z2 + 4)2

=

γ

dz

(z2 + 9)(z2 + 4)2

= 2πi(K1 +K3) = 2πi

(3 i

50− 13 i

200

)=

π

100

Usando los mismos argumentos del ejemplo anterior, se llega a∫ ∞

0

dx

(x2 + 9)(x2 + 4)2=

π

200

En general, si f(z) es de la forma

f(z) =p(z)

q(z)

donde p(z) y q(z) son ambas analıticas, pero f(z) tiene un polo simple en z = z0,con f(z0) 6= 0, esto implica que q(z0) = 0, pero q′(z0) 6= 0. Podemos escribir.

f(z) =p(z0) + p′(z0)(z − z0) + p′′(z0)(z′ − z0)2/2! + · · ·q(z0) + q′(z0)(z − z0) + q′′(z0)(z − z0)2/2! + · · ·

de donde se sigue que

F (z) = (z − z0)f(z) =p(z0) + p′(z0)(z − z0) + · · ·

q′(z0) + q′′(z0)(z − z0)/2! + · · ·es analıtica. Del polo simple podemos calcular el residuo. Si observamos que

b1 = limz→z0

F (z) = limz→z0

(z − z0)f(z) =p(z0)

q′(z0)

Page 132: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

120 7. SERIES

Analogamente, si el polo es doble q(z0) = q′(z0) = 0 pero q′′(z0) 6= 0 y

b2 = limz→z0

((z − z0)2f(z))′

2!=

2

3q′′(z0)2(3p′(z0)q

′′(z0)− p(z0)q′′′(z0))

Ejercicio 7.49. Evaluen las siguientes integrales1)∫∞−∞

dx(1+x2)3 = 3

2)∫∞−∞

x2 dx(x2+4x+13)2 = 13

54π

3)∫∞−∞

dx1+x6 = 2

4)∫∞−∞

x2 dx1+x6 = 1

5)∫∞−∞

sin(x) dx1+x6 = 0

5.2. Integrales de la forma.∫ ∞

−∞f(x) exp (ixh) dx

Estas integrales son de suma importancia porque son las transformadas deFourier de la funcion f(x). Estas se pueden resolver de la siguiente forma

Lema 7.50. Sea f(x) una funcion tal que limx→±∞

f(x) = 0 y h > 0. Entonces la

integral∫ ∞

−∞f(x) exp (ihx) dx = 2πi [ residuos del plano medio superior]

Demostracion 7.51. Consideremos la integral a lo largo de la curva γ dadaen la figura 3. Claramente

γ

f(z) exp (ihz)dz =

∫ R

−Rf(z) exp (ihz)dz +

γR

f(z) exp (ihz)dz

Vamos a demostrar que la segunda integral del lado derecho de la identidad seanula cuando R → ∞. Ahora bien, como lim

x→±∞f(x) = 0, esto implica que para

R >> 1 existe siempre un numero real M > 0 tal que |f(z)| < M . Si hacemosz = Reiθ = R [cos (θ) + i sin (θ)], se tiene que para R >> 1

In =

∣∣∣∣∫

γR

f(z) exp (ihz)dz

∣∣∣∣ ≤ M

∣∣∣∣∫ π

0

exp (hR [i cos (θ)− sin (θ)]) iReiθdθ

∣∣∣∣

≤ MR

∣∣∣∣∫ π

0

exp (hR i [cos (θ) + θ]) dθ +

∫ π

0

exp (−hR sin (θ)) eiθdθ

∣∣∣∣

La primera es la integral de una funcion periodica y por tanto es finita y positiva,digamos igual a I0, entonces podemos escribir

In = MR

∣∣∣∣I0 +

∫ π

0

exp (−hR sin (θ)) eiθdθ

∣∣∣∣

≤ 2MR

∫ π/2

0

exp (−hR sin (θ)) dθ

Page 133: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. EVALUACION DE INTEGRALES 121

donde hemos usado la simetria de sin(θ) entre 0 ≤ θ ≤ π/2. Pero en este intervalo,la funcion sin(θ) ≥ 2 θ/π, entonces podemos escribir:

In ≤ 2MR

∫ π/2

0

exp

(−2 hR

θ

π

)dθ

= −M πe−hR − 1

h→

R→∞0(7.5)

dado que h > 0 y que M → 0 cuando R→∞.

Ejemplo 7.52. Vamos a evaluar la integral∫ ∞

−∞

exp (ixT )

k2 − x2dx

Consideremos la integral ∫

γ

exp (izT )

k2 − z2dz

Para T > 0, γ es la trayectoria de la figura 4. Se tiene que

Figure 4. Curva cerrada, pasando por el eje real y haciendo unsemicırculo que contienen los dos polos simples en +k y −k.

γ

exp (izT )

k2 − z2dz =

1

2k

γ

exp (izT )

z + kdz − 1

2k

γ

exp (izT )

z − k dz

=1

2k[exp (−ikT )− exp (ikT )]

= − ik

sin (kT )

Page 134: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

122 7. SERIES

Para T < 0, tomemos la misma trayectoria pero ahora con el simicirculo haciaabajo, para que la integral (7.5) se integre de 0 a −π/2. Solo que en este caso lospolos quedan fuera de la trayectoria y por tanto la integral se anula, por lo que

∫ ∞

−∞

exp (ixT )

k2 − x2dx =

− ik sin (kT ) para T > 0

0 para T < 0

Ejemplo 7.53. Vamos a evaluar la integral∫ ∞

−∞

exp (i (xR+ yT ))

y − ix0x2

dx dy

Podemos llevar a cabo la integracion parte por parte. Primero integremos con re-specto a y. La integral que vamos a resolver se ve entonces como:

∫ ∞

−∞exp (ixR) dx

∫ ∞

−∞

exp (iyT )

y − z0dy

donde z0 = ix0x2. Observemos que esta integral se puede llevar a cabo usando una

trayectoria como la del ejercicio anterior, donde solo se tiene el polo y = z0. Ahorabien, si T > 0, la trayectoria cubre el polo z0, pero si T < 0 no lo cubre. Por loque se obtiene que

∫ ∞

−∞exp (ixR) dx

∫ ∞

−∞

exp (iyT )

y − z0dy =

∫ ∞

−∞exp

(ixR− x0x

2T)dx

para T > 0, y la integral es cero para T < 0. Queda resolver la integral anterior,llamada la integral de Gauss. Para evaluarla, primero completemos el cuadradoen la exponencial, se obtiene

e−R2/4b

∫ ∞

−∞e−bz

2

dz

donde hemos llamado b = x0T y a z = x − R/2b. Esta integral puede evaluarseusando el siguiente metodo. Si llamamos la integral Ip, lo que vamos a hacer es

integrar√I2p , de la siguiente forma:

Ip = e−R2/4b

∫ ∞

−∞e−bz

2

dz = e−R2/4b

(∫ ∞

−∞e−bx

2

dx

) 12(∫ ∞

−∞e−by

2

dy

) 12

= e−R2/4b

(∫ ∞

−∞

∫ ∞

−∞e−b(x

2+y2)dx dy

) 12

= e−R2/4b

(∫ 2π

0

∫ ∞

0

e−br2

rdrdθ

) 12

= e−R2/4b

√π

bexp

( −R2

4x0T

)√π

x0T

si T > 0, y cero si T < 0. Observese que aqui no utilizamos el teorema del residuo.Para evaluar la ultima integral, claramente se utilizaron coordenadas polares.

Encontrar los polos y residuos de las siguientes funciones.

Ejercicio 7.54. Evaluen las siguientes integrales

1)∫∞−∞

cos(x)(x+1)2 e

iTxdx

Page 135: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. EVALUACION DE INTEGRALES 123

2)∫∞−∞

ex

(x2+1)5eiTxdx

3)∫∞−∞

3x3−x2+5x+1(x2−1)2

eiTxdx

4)∫∞−∞

cos(x)(x−1)5 e

iTxdx

5.3. Integrales de la forma.∫ 2π

0

F (sin (θ) , cos (θ))dθ

Para este tipo de integrales, la transformacion z = eiθ, dz = izdθ es siempremuy util, ya que sin (θ) = 1

2i

(z − z−1

)y cos (θ) = 1

2i

(z − z−1

). Este metodo es

generico y nosotros lo vamos a mostrar con un ejemplo.

Ejemplo 7.55. Vamos a evaluar la integral

(7.6) I =

∫ 2π

0

dθ54 + sin (θ)

efectuando la transfomacion para este timpo de integrales, se obtiene:

I =

γ

dz

iz(

54 + 1

2i (z − z−1))

=

γ

4dz

2z2 + 5iz − 2

=

γ

2dz

(z + 2i)(z + 12 i)

=8

donde la integracion se hizo a lo largo de la curva γ dada por |z| = 1, como en lafigura 5.

Ejercicio 7.56. Evaluen las integrales

1.-∫ 2π

0(cos(θ) sin(θ))2 dθ

2.-∫ 2π

0cos(θ) sin2(θ) dθ

3.-∫ 2π

0dθ

1+2 sin2(θ)

4.-∫ 2π

0dθ

3 cos2(θ)+2 sin2(θ)

5.-∫ 2π

0i cos(θ)dθ

(cos2(θ)+2 i sin(θ) cos(θ)−sin2(θ)+1)3−∫ 2π

0sin(θ)dθ

(cos2(θ)+2 i sin(θ) cos(θ)−sin2(θ)+1)3

Page 136: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

124 7. SERIES

Figure 5. Curva cerrada, pasando por el eje real y haciendo uncırculo que contienen al polo simple z = −i/2.

Page 137: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 8

GEOMETRIA DEL PLANO COMPLEJO

En este capıtulo veremos brevemente una parte de la geometrıa del plano com-plejo. Nos concentraremos unicamente a dos aspectos, las transformaciones con-formes y las superficies de Riemann. Vamos a iniciar con las transformacionesconformes.

1. Transformaciones Conformes

Las transformaciones conformes se llevan a cabo para poder simplificar unproblema. Son muy utiles en la solucion de ecuaciones diferenciales, para resolverproblemas de fısica, quımica, ingenierıa y matematicas en general, entre otros. Sudefinicion es la siguiente:

Definicion 8.1. Una transformacion conforme en una region R ⊂ C esuna funcion Z : C → C tal que Z es analıtica y

dZ

dz6= 0

en R.

Lo interesante de la funcion Z es que transforma una region del dominio deella, en otro region diferente, es decir, a cada punto z = x + iy del plano complejo(x, y), le asocia otro punto Z = u(x, y) + iv(x, y) del plano complejo (u, v). Paraver esto, vamos algunos ejemplos.

Ejemplo 8.2. Traslaciones. El ejmplo mas simple es sin duda una traslacionconforme. Sea Z(z) = Z(x, y) = z + z0 = x+ x0 + i(y + y0). Entonces, un puntox + iy en el plano complejo, se ve como otro punto x + x0 + i(y + y0) en el planoconforme, como en la figura 1

Figure 1. La transformacion conforme Z(z) = z + z0, la cualconrresponde a una traslacion.

125

Page 138: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

126 8. GEOMETRIA DEL PLANO COMPLEJO

A cada punto z = x + iy se le asocia un punto u = x + x0 y v = y + y0. Porejemplo, una linea en el plano complejo y = mx + b, se transforma en v − y0 =m(u − x0) + b, la cual es una linea paralela a la anterior desplazada, como en lafigura 1

Ejemplo 8.3. Rotaciones. Otro ejemplo interesante es la rotacion con-forme. Esta esta definida como Z(z) = z z0. Para visualizar la transformacion,es conveniente escribir esta en su forma polar. Si z = reiθ, entonces Z(z) =r r0 e

i(θ+θ0). Es decir, el punto z = reiθ fue trasladado una distancia r → r r0 yrotado de θ → θ + θ0. Vean la figura 2. Por ejemplo, la rotacion z0 = eiθ0 de un

Figure 2. La transformacion conforme Z(z) = z z0, la cualconrresponde a una rotacion del punto z.

cırculo x2 + y2 = zz = r2 en el plano complejo, deja al cırculo invariante, ya quesi lo vemos en la representacion polar, este queda como ZZ = zz0zz0 = r2.

Ejemplo 8.4. Inversiones. Tal vez el ejemplo mas interesante sea el de la in-version conforme. La inversion esta definida como Z(z) = 1/z y para visulizarlaprimero conviene escribir el nmero z en su forma polar z = reiθ. Entonces, lainversion se ve como Z(z) = 1

r e−iθ, es decir, la inversion lleva al numero z al lado

opuesto del plano complejo. Otra forma conveniente de visualizar una inversion esutilizando su forma Z(x, y) = 1/(x + iy) = (x − iy)/(x2 + y2). De aquı se ve queuna inversion nos lleva al complejo conjugado del numero, dividio entre el moduloal cuadrado. Vamos a escribir la forma explicita de la inversion como

(8.1) u =x

x2 + y2, v = − y

x2 + y2

De donde podemos escribir

x =u

u2 + v2, y = − v

u2 + v2

Por ejemplo, una lınea recta que pasa por el orıgen y = mx, tras una inversionse verıa como esa lınea recta pero con la pendiente invertida − v

u2+v2 = m uu2+v2 , es

decir v = −mu. Una lınea paralela al eje x, y = c, se verıa como:v

c+ u2 + v2 = 0

que se puede escribir de otra forma como

u2 + (v +1

2c)2 =

1

(2c)2

Page 139: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. TRANSFORMACIONES CONFORMES 127

el cual es un cırculo centrado en (0,−1/(2c)), de radio 1/(2c). Es decir, una rectaparalela al eje x, bajo una inversion es un cırculo. En la figura 3 se puede ver elcırculo u2 + (v+ 1/2)2 = 1/4, el cual es la inversion de la recta y = 1. En general,una recta y = mx+ b se verıa tras una inversion como:

v = −mu− b(u2 + v2)

Esta ultima expresion se puede reescribir como

(8.2)

(v +

1

2b

)2

+(u+

m

2b

)2

=1 +m2

4b2

para b 6= 0, el cual es claramente un cırculo con centro en −1/(2b)(m, 1) y con

radio√

1 +m2/(2b), en el plano (u, v). En la figura 3 se puede ver el cırculo(u + 1/2)2 + (v + 1/2)2 = 1/2, el cual es la inversion de la recta y = x + 1.Concluimos que la inversion de una recta que pasa por el origen es siempre otrarecta con pendiente invertida o un cırculo, si la recta no pasa por el origen.

Figure 3. La transformacion conforme Z(z) = 1/z, de la rectay = x+ 1, en el plano (u, v).

De la misma manera podemos visualizar un cırculo despues de una inversion.Sea el cırculo zz = x2+y2 = r2, con r constante. Usando las expresiones anteriores,el cırculo se ve como:

x2 + y2 =u2

(u2 + v2)2+

v2

(u2 + v2)2= r2

de donde se sigue que:

u2 + v2 =1

r2

Es decir, se obtiene el mismo cırculo, pero con un radio invertido.

Vamos a observar una caracteristica muy interesante de las transformacionesconformes. Veamos primero el ejemplo 8.2 de las traslaciones conformes. Altrasladar una recta del plano (x, y) al plano (u, v), la pendiente de las rectas nose altera, ası que si dos curvas en el plano (x, y) se cruzan en un punto, el anguloque forman entre ellas se conservara en el plano (u, v). Esta afirmacion no es tan

Page 140: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

128 8. GEOMETRIA DEL PLANO COMPLEJO

evidente en el ejemplo 8.4 de las inversiones conformes. Sin embargo, sean dosrectas que se cruzan en el plano (x, y), por ejemplo y = m1x + b1 y y = m2x+ b2y supongamos que se cruzan en el punto (x0, y0). En este punto se tiene que:

x0 =b2 − b1m1 −m2

y0 =m1b2 −m2b1m1 −m2

(8.3)

Tomemos la inversion conforme de las rectas como en el ejemplo 8.4. Con estosvalores, tambien podemos escribir el punto de cruce (u0, v0) de los cırculos corre-spondientes en el plano (u, v), usando la formula (8.1) y los valores (8.3). En elplano (u, v), la pendiente M de la recta tangente en cualquier punto (u, v) de loscıculos correspondietes a las rectas en (x, y) se obtiene derivando (8.2), es decir:

(8.4) M =dv

du= −u+ m

2b

v + 12b

En el punto (u0, v0), el ciırculo 1 tendra una recta tangente con pendiente M1 y elcırculo 2, una recta tangente con pendiente M2, dadas por (8.4), con sus valorescorrespondientes de m1, b1, m2 y b2. Ahora calculemos los angulos que formandichas rectas. Lo mas simple es calcular la tangente de su diferencia, es decir:

(8.5) tan(θ2 − θ1) =M2 −M1

1 +M1M2

donde θ1 es el angulo que forma la recta tangente al cırculo 1 en el punto (u0, v0)con el eje u y θ2 es el correspondiente para el cırculo 2. Ahora substituimos losvalores de M1 y M2 en terminos de las contantes de las rectas y (despues de muchaalgebra) se obtiene:

tan(θ2 − θ1) =m1 −m2

1 +m1m2= tan(α2 − α1)

donde ahora α1 es el angulo que forma la recta 1 con el eje x y α2, el que formala recta 2. Es decir, de nuevo la diferencia entre los angulos se conserva. En lafigura 3 se puede ver como las rectas y = x + 1 y y = 1 se cruzan en (0, 1). Loscırculos correspondientes se cruzan en el plano (u, v) en el punto (0,−1). En estepunto las rectas tangentes a cada cırculo forman un angulo igual que las rectascorrespondientes en el plano (x, y). Lo que vamos a probar ahora es que estapropiedad es general en las transformaciones conformes.

Teorema 8.5. Sean α1 y α2 los angulos de las rectas tangentes a dos curvasC1 y C2 respectivamente en un punto (x0, y0) donde estas curvas se cruzan. SeanZ : C → C una transformacion conforme y C′

1 y C′2 las curvas transformadas bajo Z

de C1 y C2, respectivamente. Sea θ1 el angulo con respecto a u de la curva tangentede C′

1 en el punto Z(x0, y0) = (u0, v0) y θ2 el angulos de la curva tangente de C′2.

Entonces se cumple que

θ1 − θ2 = α1 − α2

Demostracion 8.6. Por definicion, la transformacion conforme Z cumple conque

dZ

dz

∣∣∣∣z0

= lim∆z→0

∆Z

∆z

∣∣∣∣z0

= reiφ∣∣z06= 0

Page 141: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. TRANSFORMACIONES CONFORMES 129

Por supuesto el angulo φ depende de z, pero para un punto fijo z0 este angulo esuna constante. En su forma polar, para que dos numeros complejos sean iguales, sumodulos y sus argumentos deben coincidir. Entonces, los argumentos de la ecuacionanterior son:

φ = arg lim∆z→0

∆Z

∆z= lim

∆z→0arg

∆Z

∆z= lim

∆z→0arg∆Z − lim

∆z→0arg ∆z

= θ − αcomo se muestra en la figura 4. Supongamos que tenemos las dos curvas, C1 y C2

en el plano (x, y) y se cruzan en el punto z0 = x0 + iy0. En el plano (u, v) estascurvas son C′

1 y C′2. Para la curva 1 se tiene que φ = θ1 − α1 y para la curva 2

φ = θ2 − α2, de tal forma que:

θ1 − θ2 = α1 − α2

Figure 4. Los argumentos de la transformacion conforme Z, enel lımite cuando ∆z va a cero.

Un ejemplo muy interesante de una transformacion conforme no lineal es elsiguiente:

Ejemplo 8.7. Sea Z = z2 una transformacion conforme. Esta transformacionesta dada por:

u = x2 − y2, v = 2xy

A esta transformacion se le conoce como coordenadas hiporbolicas, ya que laslineas u = x2 − y2 =constante y v = 2xy =constante, forman hiperbolas en elplano (x, y). Lo interesante del teorema anterior es que como la transformacionlleva hiperbolas del plano (x, y) a lineas perpendiculares al plano (u, v), como seve en la figura 5, las hiperbolas en el plano (x, y) forman un sistema otrogonal decoordenadas, por eso el nombre de coordenadas hiperbolicas.

Existen muchos mas ejemplos de este tipo de transformaciones, pero es mejorque el lector las estudie en forma de ejercicios.

Page 142: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

130 8. GEOMETRIA DEL PLANO COMPLEJO

Figure 5. La transformacion conforme Z = z2, la cual trans-forma coordenadas hiperbolicas en coordenadas castesianas.

Ejercicio 8.8. Consideremos las sucesion de transformaciones conformes1.- z1 = z + d

c

2.- z2 = c2z13.- z3 = 1

z24.- z4 = (bc− ad)z35.- z5 = a

c + z4Tomen sucesivemente estas transformaciones y encuentren el resultado final y

la condicion para que esta ultima sea una transformacion conforme. Sean el cırculox2 + (y − 1)2 = 1 y la recta y = x + 1. Encuentren las curvas resultantes despuesde la quinta transformacon sucesiva de estas dos curvas. A esta transformacion sele llama la transformacion homografica.

Ejercicio 8.9. Examinen la transformacion conforme

Z = 2 arctan(ia z)

Den sus transformaciones del plano (x, y) al plano (u, v) y viceversa explıcitamente.Encuentren la tranformacion del cırculo x2 + (y − 1)2 = 1 y de la recta y = x + 1bajo esta transformacion.

2. Superficies de Riemann

En la seccion anterior vimos como la funcion f : C → C, tal que f(z) = z2

transforma puntos de un plano complejo a otro. En su forma polar, esta funciontambien se puede escribir como f(z = reiθ) = r2e2iθ. En particular, podemostomar un cırculo en el dominio de la funcion y ver como este se mapea en elcodominio. Claramente, una vuelta en el dominio implicara una doble vuelta en elcırculo del codominio, alrededor de un cırculo que tiene el cuadrado del radio delcorrespondiente en el dominio. En la seccion 4 vimos que el inverso de esta funcion

Page 143: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. SUPERFICIES DE RIEMANN 131

en el plano real, no es una funcion porque no es univaluada, es decir f : ℜ → ℜ,tal que f(x) =

√x tiene dos valores para cada x en el dominio. En esta seccion

veremos de una manera intuitiva como en variable compleja es posible hacer queeste tipo de mapeos se puedan ver como funciones, definiendo un dominio adecuadollamado superficie de Riemann. En realidad, una superficie de Riemann es unavariedad compleja, pero nosotros veremos variedades hasta la seccion 1. Por ahoralo que haremos es ver la idea funcional de lo que es una superficie de Riemann.Para hacer esto veremos un par de ejmplos.

Ejemplo 8.10. Vamos a iniciar con la funcion (relacion) f : C → C, tal que

f(z) =√z. En su forma polar, esta funcion f(reiθ) =

√re

12 θ recorre la mitad

de un cırculo en el plano (u, v), como se ve en la figura 6. Vamos a identificar

Figure 6. La transformacion conforme Z =√z, recorre solo la

mitad del plano (u, v).

el eje positivo de los reales ℜ+ con otro eje positivo de la parte real de otro planocomplejo, como se ve en la figura 7, de tal forma que un cırculo iniciando en elpunto 0, continua hasta el punto 1 de ese plano, despues sigue en el punto 1 del otroplano y sigue hasta el punto 2 de ese plano y de ahi pasa al punto 2 del primer planocomplejo, hasta completar una vuelta en los dos plano. A estos dos planos juntosse le llama una superficie de Riemannm R, de tal forma que la funcion R → C,con f(z) =

√z ahora es una funcion univaluada y biyectiva.

Ejemplo 8.11. Otro ejemplo similar es la funcion f : C → C donde f(z) = z1/3.En este caso dos planos identificados como en el caso anterior no seran suficiente.Para esta funcion se necesitan tres planos, como los de la figura 8. En esta superficiede Riemann iniciamos en el punto 0, continuamos hasta e punto 1 de este planoy de ahı pasamos al punto 1 del segundo plano, seguimos en este plano hasta elpunto dos y continuamos en el punto dos del tercer plano hasta al punto tres, quenos conduce de nuevo al punto 3 del primer plano complejo. Si el dominio dela funcion f es esta superficie de Riemann R, es decir, f : R → C, la funcionf(z) = z1/3 es biyectiva.

Ejemplo 8.12. Finalmente vamos a anlizar la funcion ln(z). En este casotenemos que ln(reiθ) = ln(r)+ iθ. Esta funcion (relacion) tiene un numero infinitode puntos de multivaluacion, ya que todos los valores de θ = θ + 2kπ, con k =0,±1,±2, · · · , corresponden al mismo punto z = reiθ = reiθ+i2kπ . Para este caso

Page 144: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

132 8. GEOMETRIA DEL PLANO COMPLEJO

Figure 7. Dos planos complejos (x, y), en donde identificamossus partes reales positivas. Esta union de espacios forma una su-perficie de Riemann.

Figure 8. Lo mismo que en la figura 7, pero ahora con tres planos.

vamos a necesitar una superficie de Riemann con un numero infinito de planosidentificados como en los casos anteriores.

Page 145: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

Part 4

ANALISIS

Page 146: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 147: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 9

ESPACIOS METRICOS Y UNITARIOS

1. Estructuras sobre ℜ y ℜn

En la parte de Algebra estudiamos las estructuras algebraicas sobre ℜ y ℜn.En particular, sabemos que ℜ es un campo ordenado donde la estructura algebraicade campo nos da las reglas de calculo de la adicion, substraccion, multiplicaciony division, las cuales se relacionan con el orden natural ≤ de los numeros reales.Este orden es tanto un orden parcial como tambien lineal, y proporciona conceptoscomo los de maximo, mınimo, cotas, supremo e infimo de subconjuntos, conceptosde suma importancia en el analisis. Tambien vimos que ℜn es un espacio vectorialsobre ℜ , cuyas operaciones (adicion entre vectores y multiplicacion de escalarescon vectores) se basan enteramente en operaciones del campo ℜ. Conocemos con-ceptos como subespacio vectorial, independencia lineal, cerradura lineal, base, di-mension, y homomorfismos (mapeos lineales) entre espacios vectoriales, los cualesdebemos tener presentes para poder estudiar los temas del analisis presentados eneste capıtulo. Sin embargo, ℜ y ℜn tienen mas estructuras, las cuales, normalmenteen un contexto practico o de aplicacion, supondremos nosotros aquı que el lector haconocido ya antes. Las siguientes secciones dentro de esta introduccion recuerdanestos conceptos dentro de nuestro conocimiento y lo ordena en un contexto nuevo.

1.1. ℜn como espacio vectorial normado. Recordamos que ℜ es un campoordenado y supondremos en este texto que la definicion formal del valor absolutoes un concepto muy sencillo y conocido.

Definicion 9.1. Para x ∈ ℜ, se define el valor absoluto de x por |x| =maxx,−x.

Vemos que |x| es un numero real no negativo, pues obviamente

|x| = maxx,−x =

x, si x ≥ 0,−x, si x < 0

,

ası que, |·| es un mapeo de ℜ en ℜ+. Observamos que x ∈ ℜ es un punto sobrela lınea real, o, equivalentemente, un vector sobre la lınea real, apuntando desdeel origen 0 hacia el punto x. Es evidente que |x| es la longitud de este vector ola distancia (igual a la longitud del segmento de lınea) entre 0 y x. Aplicando ladefinicion del valor absoluto y propiedades del maximo, es facil deducir las siguientespropiedades:

Lema 9.2. Para x, y ∈ ℜ:1) |x| = 0 sı y solo sı x = 0.2) |−x| = |x|3) |xy| = |x| |y|4) |x+ y| ≤ |x|+ |y|

135

Page 148: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

136 9. ESPACIOS METRICOS Y UNITARIOS

5) − |x| ≤ x ≤ |x|Comentario 9.3. Aplicando induccion matematica, la propiedad 4) implica

que|x1 + x2 + · · ·+ xn| ≤ |x1|+ |x2|+ · · ·+ |xn| ,

para x1, x2, · · · , xn ∈ ℜ.

En el plano euclideano ℜ2, comunmente hemos medido la longitud de un vectorx = (x1, x2) ∈ ℜ2 como

‖x‖2 =

√|x1|2 + |x2|2 =

√(x1)2 + (x2)2,

lo cual, segun el teorema de Pitagoras, es la longitud del segmento de lınea entreel orıgen 0 = (0, 0) del plano Euclidiana y el punto x, es decir, es la longitud delvector x = (x1, x2), ver figura 1

Figure 1. En el plano, la norma canonica representa la longituddel vector, es decir, la distancia entre el origen de coordenadas yel punto.

Mas generalmente, conocemos la longitud de un vector x = (x1, x2, · · · , xn) ∈ℜn dada por

‖x‖2 =

√√√√n∑

i=1

(xi)2.

Es obvio que ||x||2 es un numero real no negativo para cualquier x ∈ ℜn,asıque, ‖ · ‖2 es un mapeo de ℜn en ℜ+. Las siguientes propiedades son parecidas apropiedades que ya habıamos observado para el valor absoluto:

Lema 9.4. Se tiene que1) ‖x‖2 = 0 sı y solo sı x = 0.2) ‖αx‖2 = |α| ‖x‖2, para todo x ∈ ℜn y α ∈ ℜ.3) ‖x + y‖2 ≤ ‖x‖2 + ‖y‖2, para todo x,y ∈ ℜn .

Page 149: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. ESTRUCTURAS SOBRE ℜ Y ℜn 137

Ejercicio 9.5. Demostrar las propiedades del lema 9.4.

‖x‖2 es llamado la norma Euclidiana del vector x ∈ ℜn; es evidente quepara el caso n = 1, ‖x‖2 es exactamente el valor absoluto de x. Observamos que enlas propiedades de la norma Euclidiana (lema 9.4), se usa la estructura del espaciovectorial ℜn:

* En 1), x = 0 significa que x es el elemento neutro del grupo (ℜn,+).* En 2), se multiplica un escalar α con un vector x.

* En 3), su suman dos vectores x,y.

1.2. ℜn como espacio metrico. Observemos primero la lınea real y definamosla siguiente funcion

d2(x, y) =√

(x− y)2,x, y ∈ ℜ . Evidentemente

d2(x, y) =

x− y, si x ≥ y−(x− y), si y ≥ x = |x− y|

es la longitud del segmento de lınea entre x y y, sobre la recta de los numerosreales, ası que, d2(x, y) mide la distancia entre x y y. Es facil observar que d2(·, ·)es un mapeo de ℜ × ℜ en ℜ+, es decir, d2(x, y) ≥ 0 para todo x, y, z ∈ ℜ, con lassiguientes propiedades:

1) d2(x, y) = 0 sı y solo sı |x− y| = 0⇐⇒ x = y.2) d2(x, y) = d2(y, x),3) d2(x, y) + d2(y, z) ≥ d2(x, z),Si definimos la distancia d2(x,y) entre dos puntos del plano euclideano, x =

(x1, x2), y = (y1, y2) ∈ ℜ2, igualmente como la longitud del segmento de lınea entre

los dos puntos, entonces d2(x,y) =√

(x1 − y1)2 + (x2 − y2)2, ver figura 2, o masgeneralmente

d2(x,y) =

√√√√n∑

i=1

(xi − yi)2,

para x = (x1, x2, · · · , xn), y = (y1, y2, · · · , yn) ∈ ℜn. Ahora, d2(·, ·) es un mapeode ℜn×ℜn en ℜ+, y tiene las mismas propiedades como las de arriba:

Lema 9.6. d2(·, ·) es un mapeo de ℜn×ℜn en ℜ+ d2(x,y) ≥ 0 para todox,y, z ∈ ℜn y tiene las siguientes propiedades:

1) d2(x,y) = 0 sı y solo sı |x− y| = 0 sı y solo sı x = y.2) d2(x,y) = d2(y,x),3) d2(x,y) + d2(y, z) ≥ d2(x, z).

d2(x,y) se llama la metrica Euclideana sobre ℜn. Observamos que, en laspropiedades de la metrica Euclideana, en contraste a las propiedades de la normaEuclideana, no se usa la estructura algebraica del espacio vectorial de ℜn, solamenteaparece la estructura algebraica de los numeros reales (el neutro 0 de la suma, elorden ≤ y la suma entre numeros reales). Sin embargo, siendo definidas ||x||2 sobreℜn y d2(x,y) sobre ℜn×ℜn, sus formulas hacen evidente las siguientes relaciones:

Page 150: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

138 9. ESPACIOS METRICOS Y UNITARIOS

Figure 2. . La distancia entre dos puntos en el plano. Estadistancia es la distancia canonica en el plano y se basa en el teoremade Pitagoras.

d2(x,y) = ||x− y||2,‖x‖2 = d2(x,0),

x,y ∈ ℜn, 0 el neutro de (ℜn,+).

1.3. ℜn como espacio euclideano. Otra estructura sobreℜn es el productoescalar sobre ℜn, tambien llamado producto interno sobre ℜn, definido como

(x,y) =

n∑

i=1

xiyi, x = (x1, x2, · · · , xn), y = (y1, y2, · · · , yn) ∈ ℜn.

Evidentemente (x,y) es un mapeo de ℜn×ℜn en ℜ. Sabemos que el productoescalar es importante para definir conceptos geometricos como angulo, ortogonali-dad y paralelidad. Para ver esto, hagamos un ejemplo en ℜ2.

Ejemplo 9.7. Siempre es posible escribir un vector en ℜ2 como x = (x1, x2) =r1 (cos(θ1), sin(θ1)), y lo mismo para y = (y1, y2) = r2 (cos(θ2), sin(θ2)), ver figura3. Entonces el producto interno de x con y es

(x,y) = x1y1 + x2y2

= r1r2 (cos(θ1) cos(θ2) + sin(θ1) sin(θ2))

= r1r2 cos(θ1 − θ2)= ||x|| · ||y|| cos(θ)

donde θ es el angulo entre los dos vectores x y y. Este resultado tambien puedeverse como la definicion de los angulos en ℜ2.

El producto interno tiene interesantes propiedades:

Page 151: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. ESTRUCTURAS SOBRE ℜ Y ℜn 139

Figure 3. Los vectores x y y escritos en coordenadas polares.En vez de asignar dos distancias con respecto a los ejes x y y, seasignan a cada punto su distancia al origen y el angulo que formancon el eje x.

Lema 9.8. El producto escalar (x,y) definido arriba para x,y, z ∈ ℜn satisfaceque

i) (x + y, z) = (x, z) + (y, z), (αx, z) = α(x, z),(x,y + z) = (x,y) + (x, z), (x, αz) = α(x, z), para α ∈ ℜ (Bilinealidad).ii) (x,y) = (y,x), (Simetrıa).iii) (x,x) ≥ 0 para todo x ∈ ℜn y (x,x) = 0⇐⇒ x = 0.

Demostracion 9.9. i) Para el primer argumento, sean x,y, z ∈ ℜn, α ∈ ℜ;(x+y, z) =

∑ni=1(xi+yi)zi =

∑(xizi+yizi) =

∑xizi+

∑yizi = (x, z)+(y, z),

de la misma forma se tiene que (αx, z) =∑n

i=1 αxizi = α∑n

i=1 xizi = α(x, z).La demostracion para el segundo argumento es analoga, se usa la distributividad

del grupo (ℜ,+) .ii) es obvio.iii) (x,x) =

∑ni=1 x

2i evidentemente es no negativo, y es igual a 0 sı y solo sı

x2i = 0 para todo i (puesto que x2

i ≥ 0), lo cual es equivalente a xi = 0 para todo i,lo cual equivale a x = (0, 0, · · · , 0) = 0 ∈ ℜn.

La Bilinealidad en i) significa que el mapeo (·, ·) es lineal en cada coordenada.Eso no significa que el mapeo es lineal ! Si el mapeo (·, ·) fuese lineal, entoncestendrıamos que α(x,y) = (αx, αy). Sin embargo, aplicando la bilinealidad, obten-emos (αx, αy) = α(x, αy) = α2(x,y). En la propiedad iii), x = 0 significa que xes el neutro del grupo aditivo ℜn, es decir, x = (0, 0, · · · , 0).

Resumimos lo recordado en las ultimas tres subsecciones:

Page 152: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

140 9. ESPACIOS METRICOS Y UNITARIOS

Resumen 9.10. Sean x = (x1, x2, · · · , xn) y y = (y1, y2, · · · , yn) ∈ ℜn, en-tonces

‖x‖2 =

√√√√n∑

i=1

(xi)2, (Norma euclidiana).

d2(x,y) =

√√√√n∑

i=1

(xi − yi)2, (Metrica euclideana),

(x,y) =

n∑

i=1

xiyi, (Producto escalar o Producto interno).

Comentario 9.11. Debido a las formulas anteriores, las siguientes relacionesson evidentes:

1) d2(x,y) = ‖x− y‖2,2) ‖x‖2 = d2(x,0),

3) (x,x) = (‖x‖2)2,4) ‖x‖2 =

√(x,x).

En las siguientes secciones vamos a apliar todas estas definiciones a conjuntos oespacios vectoriales mas generales para construir espacios de soluciones a ecuacionesdiferenciales y a problemas de la fısica, quımica, ingenierıa, etc.

2. Espacios Metricos.

La nocion de distancia en las ciencias natuales y la ingenierıa es de suma impor-tancia. Es por eso que definir distancias entre puntos o elementos de un conjuntoes de mucha utilidad para poder modelar objetos y espacios naturales. En estaseccion estudiaremos conjuntos en donde se define una distancia o metrica. Esteconcepto esta dada en la siguiente definicion.

Definicion 9.12. Sea X conjunto y ρ : X ×X ℜ mapeo, tal que1) ρ (x, y) ≥ 0, ρ (x, y) = 0, sı y solo sı x = y, i.e. positiva definida2) ρ (x, y) = ρ (y, x) , es simetrica3) ρ (x, z) ≤ ρ (x, y) + ρ (y, z) se cumple la propiedad del triangulo.Al par (X, ρ) se le llama espacio metrico y a la funcion ρ se le llama dis-

tancia o metrica.

Observemos que X no necesariamente tiene algun tipo de estructura, es sim-plemente un conjunto. De hecho, todos los procesos matematicos emanados de ladefinicion aterior, como sumas y comparaciones, etc., se llevan a cabo en el campoordenado de los reales (ℜ,+, ·,≤). Veamos algunos ejemplos.

Ejemplo 9.13. Sea X conjunto y

ρT (x, y) =

0 si x = y1 si x 6= y

La distancia entre dos puntos es siempre 1. A esta distancia se le llama dis-tancia discreta.

Page 153: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. ESPACIOS METRICOS. 141

Ejemplo 9.14. Recordemos el ejemplo de los reales visto en la seccion ateriorX = ℜn. Sean x = (l1, · · · , ln) y y = (m1, · · · ,mn). La distancia estandard en ℜnes

ρ (x, y) =

√√√√n∑

i=1

(li −mi)2

A esta distancia se le conoce como la distancia canonica de ℜn.Ejemplo 9.15. Tomemos de nuevo los reales X = ℜn. Otra distancia en ℜn

esta dada por

ρp (x, y) =

(n∑

i=1

| li −mi |p)1/p

, tal que p ∈ ℜ y p > 1

A esta distancia se le conoce como la distancia p de ℜn.Ejemplo 9.16. Sea C ([a, b]) = f | f es continua en [a, b]. Una distancia en

este conjunto es

ρ (f, g) =

(∫ b

a

(f (t)− g (t))2dt

)1/2

A esta distancia se le conoce como la distancia canonica de C ([a, b]).

Ejemplo 9.17. Sea C ([a, b]) . Otra distancia en C ([a, b]) es

ρmax (f, g) = maxa≤t≤b

| g (t)− f (t) |

A esta distancia se le conoce como la distancia max de C ([a, b]).

Ejemplo 9.18. Sea L2 dada por L2 = (l1, l2, . . .) | li ∈ ℜ tal que∑∞

i=1 li <∞, llamados los espacios L2, que consiste del conjunto de vectores de dimensioninfinita que tienen norma finita. La funcion

ρL2 (x, y) =

√√√√∞∑

i=1

(mi − li)2

con x = (l1, l2, . . .) y y = (m1,m2, . . .), es una distancia en L2

Ejercicio 9.19. Demostrar que 1)6) son espacios metricos. 3) solo parap = 3.

Es conveniente definir regiones especiales de los espacios metricos. Por ejemplo,si una region esta llena de elementos del conjunto, en el sentido de que en esa region,a distancias muy cortas de algun elemento, siempre encontraremos mas elementosdel conjunto o si ciertos puntos del conjunto estan a una cierta distancia de algunelemento. Al igual que en la seccion pasada, en esta seccion cuando nos refiramosa espacio solamente, se trata de un espacio metrico. Iniciaremos con a definicionde bola, esta es

Definicion 9.20. Sea (X, ρ) espacio metrico. La bola de centro x ∈ X y radior > 0, es el conjunto Br (x) = y ∈ X | ρ (x, y) < r, para toda r > 0 y x ∈ X.

Observe que un bola nunca es vacia Br (x) 6= φ pues x ∈ Br (x) .

Ejemplo 9.21. Sea (X, ρT ) espacio. Las bolas en este espacio son todas igualesBr (x) = y ∈ X | ρT (x, y) = 1 < r

Page 154: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

142 9. ESPACIOS METRICOS Y UNITARIOS

Ejemplo 9.22. Sea (ℜn, ρ), el espacio real de dimension n con su distanciacanonica. Las bolas seran verdaderas “pelotas”, como las conocemos de nuestraexperiencia. Por ejemplo, en (ℜ, ρ) las bolas estan definidas como

Br (x) = y ∈ ℜ | ρ (x, y) = |x− y| < r= (x− r, x+ r)

que es el intervalo cerrado entre x− r y x+ r. En (ℜn, ρ) las bolas seran

Br (x) =

y ∈ ℜ

2 | ρ (x, y) =

√√√√n∑

i=1

(li −mi)2< r

= y ∈ ℜ2 | (l1 −m1)2 + (l2 −m2)

2 + · · ·+ (ln −mn)2 < r2

es decir, todos los puntos metidos dentro de una esfera de radio r con centro en x.

Ejemplo 9.23. Sea (Pn ([0, 1]) , ρ), el espacio de polinomios definidos entre[0, 1] con la distancia canonica de C ([a, b]). Las bolas estan definidas como

Br (f) = g ∈ Pn ([0, 1]) | ρ (f, g) < r.Sea f(x) = x y tomemos n = 1 por simplicidad. Entonces

ρ (f, g) =

(∫ 1

0

(t− (a0 + a1t))2dt

)1/2

=

(1

3

(1− a0 − a1)3 + a0

3

1− a1

)1/2

Por lo tanto, la bola de radio 1 y centrada en x sera

B1(x) = a0 + a1t ∈ P1 ([0, 1]) | (1− a0 − a1)3

+ a03 < 3 (1− a1)

Para visualizar la superficie de esta bola, hagamos a0 = r cos(θ) y a1 = r sin(θ) ygrafiquemos el espacio de parametros (a0, a1) en coordenadas esfericas. El resultadose muestra en la figura 4 para r = 0.5.

Ejemplo 9.24. Sea (Fp, ρ), el espacio de las funciones periodicas pares definidosentre [0, 2π] con su distancia canonica. Sea f(x) = cos(2x), entonces

ρ (f, g) =

(∫ 2π

0

(cos(2t)− (a0 + a1 cos(t) + a2 cos(2t) + · · · ))2 dt)1/2

=((2a2

0 + (a2 − 1)2+ a2

1 + · · · )π)1/2

Por lo tanto, la bola de radio 1 y centrada en x sera

Br(cos(2x)) = g ∈ Fp | (2a20 + (a2 − 1)

2+ a2

1 + · · · )π < r2Ejercicio 9.25. Encontrar B1(0) y B1(1) en (P1 ([0, 1]) , ρ).

Ejercicio 9.26. ¿Como son las bolas en (P1 ([0, 1]) , ρmax)?

Ejercicio 9.27. Encontrar Br(0) y Br (cos(jx)) en (Fp, ρ).

Ejercicio 9.28. ¿Como son las bolas en (ℜn, ρp)?

Page 155: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. ESPACIOS METRICOS. 143

Figure 4. La bola de radio 1 y centrada en x del espacio de poli-nomios definidos entre [0, 1] con la distancia canonica de C([a, b]),vista en coordenadas polares.

Mas adelante definiremos un espacio topologico. La definicion de espaciotopologico esta basada en la definicion de conjunto abierto. En un espacio metricosiempre es posible definir el concepto de conjunto abierto y se puede ver que con estadefinicion, todo espacio metrico es topologico. La definicion de conjunto abierto esla siguiente

Definicion 9.29. Un conjunto abierto en un espacio (X, ρ) es un subcon-junto U ⊆ X tal que para toda p ∈ U siempre existe ǫ > 0 con Bǫ (p) ⊂ U. φ ⊂ Xes siempre abierto por definicion.

La primera consecuencia interesante de las bolas, es que estas son abiertas enel espacio, este resultado lo podemos enunciar como sigue.

Proposicion 9.30. Toda bola en un espacio metrico es un conjunto abierto.

Demostracion 9.31. Sea y ∈ Br (x) en el espacio (X, ρ) . Para x = y, Br (y) =Br (x) . Para y 6= x, sea ρ (y, x) = r′ < r y z ∈ Br−r′ (y). Esto implica queρ (y, z) < r − r′. Entonces ρ (x, z) ≤ ρ (x, y) + ρ (y, z) < r′ + r − r′ = r es decirz ∈ Br (x) y por tanto Br−r′ (y) ⊂ Br (x) .

La consecuencia mas interesante de estas definiciones es el hecho de que losabiertos son uniones de bolas. Mas adelante, cuando estudiemos los espaciostopologicos, esta consecuencia es lo que demuestra que un espacio metrico es unespacio topologico, esto lo podemos enunciar como sigue.

Proposicion 9.32. A es un conjunto abierto en (X, ρ) sı y solo sı A es unionde bolas.

Demostracion 9.33. =⇒) A es conjunto abierto, esto implica que para todax ∈ A existe δ tal que Bδ (x) ⊂ A, esto es A ⊂ ∪

x∈ABδ (x) ⊂ A o sea A =

∪x∈A

Bδ (x) .

Page 156: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

144 9. ESPACIOS METRICOS Y UNITARIOS

⇐) Sea A = ∪x∈I

Bα siendo Bα bolas en (X, ρ) . Si x ∈ A implica que x ∈ Bβpara algun β, por lo tanto A es abierto.

Ejemplo 9.34. Sea (ℜn, ρT ). Las abiertos, con la metrica ρT en ℜn se venmuy distintas de los abiertos con la metrica canonica. Con esta metrica, una bolade radio r < 1 es solo el punto central Br<1(x) = x y una bola de radio r ≥ 1es todo el espacio Br≥1(x) = ℜn. Entonces cada punto es un abierto y la union depuntos es un abierto.

Otra definicion importante es la de conjunto denso, es decir, la de un conjuntoen el que sus elementos estan tan cercanos unos de otros como se quiera, al lado decada elemento existira otro elemento del conjunto. Esta definicion formalmente es:

Definicion 9.35. Sea (X, ρ) espacio y sea E ⊆ X. Se dice que E es denso enX si para toda x ∈ X cualquier Bǫ (x) (ǫ > 0 arbitrario) se cumple que Bǫ (x)∩E 6=φ.

Ejemplo 9.36. Sea (ℜn, ρ) y Cr (x) = y ∈ ℜn | ρ (x, y) ≤ r. Una bola Br(x) =y ∈ ℜn | ρ (x, y) < r es densa en Cr (x) ya que cualquier bola Bǫ (x) con x ∈Cr (x) tendra al menos un elemento en Br(x).

Ejemplo 9.37. Sea E = ℜ\N el conjunto de los reales sin los naturales. Esteconjunto es denso en los reales, ya que cualquier intervalo cerrado, incluso centradoen un natural, tendra al menos un elemento de los reales, ver figura 5.

Figure 5. El conjunto E = ℜ\N que es el conjunto de los realessin los naturales. Este conjunto es denso en los reales, ya quecualquier intervalo cerrado, incluso centrado en un natural, tendraal menos un elemento de los reales.

Ejemplo 9.38. Los numeros irracionales son densos en los numeros reales. Espor eso que podemos aproximar los numeros irracionales con algun numero racional.

Ejercicio 9.39. Demuestra el siguiente lema:Si f : ℜ −→ ℜ es biyeccion, entonces d (x, y) =| f (x) − f (y) | es una metrica

sobre ℜ.

Page 157: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. ESPACIOS NORMADOS 145

3. Espacios Normados

Regresemos a los espacios vectoriales en donde vamos a introducir un nuevoconcepto llamado la norma, que de una forma intuitiva no dice el tamano de unvector. Este concepto lo aprendimos en ℜn y aquı lo vamos a definir para cualquierespacio vectorial, es decir, este concepto solo vale en espacios vectoriales. Esto lohacemos en la siguiente definicion.

Definicion 9.40. Sea V espacio vectorial sobre el campo K y N : V K unmapeo, tal que para toda x ∈ V y α ∈ K se tiene:

1) N (x) ≥ 0 para toda, x ∈ V , N (x) = 0 sı y solo sı x = 0.2) N (αx) = |α|N (x),3) N (x+ y) ≤ N (x) +N (y)A N se le llama norma de V y a (V,N) se le llama espacio normado.

Notacion 9.41. A la norma la vamos a denotar como N =‖ · ‖La relacion entre los espacios normados y los espacios metricos es que todo

espacio normado es metrico, pero no alreves. Este resultado se puede ver en lasiguiente proposicion.

Proposicion 9.42. Todo espacio normado es metrico

Demostracion 9.43. Sea (V,N) un espacio normado. Tomemos ρ (x,y) =N (x− y), para todo x, y ∈ V, espacio vectorial. Entonces ρ (x,y) es una distancia,ya que

1) ρ (x,y) = N (x− y) ≥ 0 y ρ (x,y) = 0 sı y solo sı N (x− y) = 0 o sea sı ysolo sı x = y.

2) ρ (x,y) = N (x− y) =| −1 | N (y − x) = ρ (y,x)3) ρ (x, z) = N (x− z) = N (x− y + y − z) ≤ N (x− y)+N (y − z) = ρ (x,y)+

ρ (y, z).

Entonces si definimos un espacio normado, automaticamente hemos definidoun espacio metrico pero no alreves. Veamos un ejemplo donde un espacio metricono puede generar una norma.

Ejemplo 9.44. Sea (ℜ, dln), con dln (x, y) = |ln (x+ 1)− ln (y + 1)|. Veamosque esta distancia genera una metrica.

i) dln (x, y) ≥ 0, ya que |ln (x+ 1)− ln (y + 1)| ≥ 0ii) dln (x, y) = dln (y, x)iii)

dln (x, z) = |ln (x+ 1)− ln (z + 1)|= |ln (x+ 1)− ln (y + 1) + ln (y + 1)− ln (z + 1)|≤ |ln (x+ 1)− ln (y + 1)|+ |ln (y + 1)− ln (z + 1)|= dln (x, y) + dln (y, z)

Pero esta distancia no genera una norma. Uno esperarıa que la norma, el tamanodel vector, debiere estar dado por ‖ x ‖ln= dln (x, 0) = |ln (x+ 1)|. Sin embargoesta no es una norma, ya que no cumple con el inciso 2) de la definicion 9.40, porejemplo, ‖ 3 · 2 ‖ln=‖ 6 ‖ln= ln (7) 6= |3| ‖ 2 ‖ln= 3 ln (3).

En los espacios vectoriale el concepto de continuidad es un concepto que de-pende esencialmente de la existencia de una distancia o de una norma. Las defini-ciones de continuidad y de lımite de una sucesion se puede hacer utilizando una

Page 158: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

146 9. ESPACIOS METRICOS Y UNITARIOS

norma o una distancia. En lo que sigue, usaremos el sımbolo ρ(x, y) para desig-nar la norma N(x − y) o la distancia ρ(x, y) en un espacio metrico o normado ydesignaremos indistintamente los elementos de estos espacios por letras x, y, z, etc.aunque sean vectores, y diremos explicitamente cuando hay una diferencia.

Como ya hemos definido distancia en un conjunto, ahora es posible definir elconcepto de continuidad. Este concepto consiste en el hecho de que la distancia dedos imagenes de una funcion es tan pequena como se quiera (respecto a la distanciadefinida en el conjunto) para dos puntos tan cercanos como se quiera, la definicionformal es como sigue.

Definicion 9.45. Sean (X, ρ) y (X ′, ρ′) espacios metricos o normados. Unafuncion f : X X ′ se dice continua en x ∈ X, si para toda ǫ > 0 existeun δ = δ (ǫ, x) tal que si ρ (x, y) < δ esto implica que ρ′ (f (x) , f (y)) < ǫ. Si fes continua para toda x ∈ A ⊂ X, se dice que f es continua en A. Si para todax ∈ A ⊂ X se tiene que δ = δ (ǫ), se dice que f es uniformemente continua en A.

Ejemplo 9.46. Sea (ℜn, ρ) el espacio real con su metrica canonica. Entonces ladefinicion de continuidad es la definicion tradicional para funciones f : ℜn ℜm.

Ejemplo 9.47. Sea (X, ρT ) espacio metrico y sea f : X X. Observemosque no existe una δ tal que para ǫ > 0, digamos ǫ = 0.5 tal que ρT (x, y) = 1 < δ,implica ρ (f (x) , f (y)) < ǫ, ya que ρ (f (x) , f (y)) = 1. Es decir, con esta metrica,ninguna funcion es continua.

Ejercicio 9.48. Sea (ℜ, ρp). Vean si la funcion f : ℜ ℜ, x→ f(x) = x escontinua.

Ahora introducimos el concepto de sucesion. Las sucesiones seran de granutilidad para demostrar algunos teoremas, su definicion es:

Definicion 9.49. Una sucesion es un mapeo de los enteros positivos a unconjunto X, es decir f : Z+ → X, tal que i→ f(i) = xi.

Ejemplo 9.50. Sea X = ℜ Entonces f : Z+ → ℜ con n → xn = n2, 1/n,sin(n), etc. son sucesiones en los reales.

Las sucesiones mas interesantes en un espacio metrico o normado son las suce-siones de Cauchy, estas son sucesiones en las que los elementos de la sucesion estantan cerca como se quiera unos de otros, despues de algun termino de la sucesiondado. Se definen como sigue.

Definicion 9.51. Sea (xi) para i ∈ Z+ una sucesion en (X, ρ) . Se dice que(xi) es de Cauchy si para toda ǫ > 0 existe un numero entero positivo N ∈ Z+

tal que ρ (xk, xl) < ǫ si k, l ≥ N.Ejemplo 9.52. La sucesion en (ℜ, ρ), xn = 1/n es una sucesion de Cauchy,

ya que ρ(xk, xl) = |1/k − 1/l| < ǫ para algun numero ǫ, siempre que k y l seansuficientemente grandes.

Ejemplo 9.53. En un espacio (X, ρT ) salvo la sucesion constante, no haysucesiones de Cauchy, ya que ρT (xk, xl) = 1 siempre, los elementos de la sucesionnunca estan suficientemente cerca.

Ejercicio 9.54. Sea la sucesion xn = 1/n en (ℜ, ρp) . Vean si esta sucesion esde Cauchy.

Page 159: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. ESPACIOS NORMADOS 147

Una sucesion es convergente si para un elemento determinado la distancia detodos los elementos restantes estan tan cerca como se quiera de algun numero x,donde el numero x no necesariamente pertenece a la sucesion. Formalmente se tienela definicion.

Definicion 9.55. Sea xi sucesion en (X, ρ) . xi se dice convergente a x ∈ X,si para todo ǫ > 0 existe N = N (x, ǫ) ∈ Z+ tal que ρ (xn, x) < ǫ si n ≥ N. Sesimboliza por xi x.

Notacion 9.56. La convergencia de una sucesion tambien se simboliza comolimn→∞

xn = x

Ejemplo 9.57. La sucesion en (ℜ, ρ), dada por xn = 1/n es una sucesionconvergente, ya que ρ(xk, 0) = |1/k − 0| < ǫ para algun numero ǫ, siempre que k yl sean suficientemente grandes.

Ejercicio 9.58. Usando la definicion del lımite, demuestren quea) lim

n→∞3nn+1 = 3

b) limn→∞

1n2+1 = 0.

Ejercicio 9.59. Den un ejemplo que muestra que la convergencia de (|xn|) noimplica la convergencia de (xn).

Resumen 9.60. Vamos a recordar algunas propiedades de la convergencia desucesiones en un espacio metrico o normado (X, ρ):

1) Para toda sucesion, si tiene un lımite, este es unicamente determinado.

limn→∞

xn = x, en X, sı y solo sı limn→∞

ρ(xn, x) = 0, en ℜ.

Las siguientes propiedades nos proporcionan herramientas para calcular lımites:2) Toda sucesion convergente es acotada.3) Si (xn) y (yn) son convergentes con lim

n→∞xn = x, lim

n→∞yn = y, entonces las

sucesiones (xn + yn) y (xn · yn) son tambien convergentes ylimn→∞

(xn + yn) = x+ y,

limn→∞

(xn · yn) = x · y.4) Si lim

n→∞xn = x, lim

n→∞yn = y, y y 6= 0, yn 6= 0 para toda n , entonces

limn→∞

(xn

yn) = x

y .

5) Si (xn) y (yn) son convergentes y xn ≤ yn para todo n, entonceslimn→∞

xn ≤ limn→∞

yn

Como corolario de esta propiedad se tiene que aplicando esta a la sucesionconstante xn = 0 obtenemos: si (yn) es convergente y yn ≥ 0 para toda n, entonceslimn→∞

yn ≥ 0.

6) Si (xn) es convergente y existen a, b ∈ ℜ tales que a ≤ xn ≤ b para toda n,entonces

a ≤ limn→∞

xn ≤ b.7) Si (xn) es monotona, entonces lo siguiente es verdad:i) (xn) es convergente, sı y solo sı (xn) es acotada.ii) Si (xn) es creciente y acotada, entonces lim

n→∞xn = sup(xn, n ∈ N).

iii) Si (xn) es decreciente y acotada, entonces limn→∞

xn = inf(xn, n ∈ N).

Page 160: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

148 9. ESPACIOS METRICOS Y UNITARIOS

Ejemplo 9.61. La sucesion en (ℜ, ρ) , dada por xn = (1 + 1/n)n

es tambienuna sucesion convergente y converge a (1 + 1/n)

n → e.

Ejemplo 9.62. Sin embargo, la sucesion en (Q, ρ) , dada por xn = (1 + 1/n)n

no es una sucesion convergente, ya que (1 + 1/n)n → e y e /∈ Q. Esta sucesion no

es convergente pero si es de Cauchy.

Ejercicio 9.63. Muestren que la sucesion en (Q, ρ) , dada por xn = (1 + 1/n)n

es de Cauchy.

Ejercicio 9.64. Den ejemplos de:a) Dos sucesiones divergentes (xn), (yn) tales que la sucesion (xn + yn) es

convergente.b) Sucesiones divergentes (xn), (yn) tales que la sucesion (xn · yn) es conver-

gente.c) Una sucesion acotada que no es convergente.

Ejercicio 9.65. Establecer la convergencia (entonces determinar lımites) odivergencia de las siguientes sucesiones:

a) xn = 3n2+5n2+1 ,

b) xn = 4nn+1 ,

c) xn = (−1)nnn+3 .

Como vemos, la sucesion xn = 1/n es de Cauchy y es convergente. Existe unaconeccion entre ambos conceptos. Para esto se tiene la siguiente proposicion.

Proposicion 9.66. En un espacio metrico o normado, toda sucesion conver-gente es de Cauchy.

Demostracion 9.67. Sea xi sucesion convergente a x en (X, ρ) . Entoncesxi x implica que para toda ǫ > 0 existe N = N (x, ǫ) ∈ Z+ tal que ρ (xn, x) < ǫ/2si n ≥ N , por tanto ρ (xn, xm) ≤ ρ (xn, x) + ρ (xm, x) < ǫ si n,m ≥ N.

Por supuesto, como ya vimos con un ejemplo, lo contrario de esta proposicionno siempre es verdad. Las sucesiones de Cauchy no siempre son convergentes. Losespacios en los que toda sucesion de Cauchy converge son muy especiales y tienenun nombre particular, se tiene la siguiente definicion.

Definicion 9.68. Un espacio metrico o normado es completo si todasucesion de Cauchy converge.

Ejemplo 9.69. Se puede mostrar que los numeros reales con su norma canonicaes un espacio completo, pero como ya vimos, los racionales no es un espacio com-pleto. Claro, les faltan los irracionales para serlo.

De hecho, cualesquier norma sobre ℜn generan el mismo comportamiento deconvergencia sobre sucesiones, implicando que ℜn con cualquier norma es completo.Sin embargo, esto no es valido si trabajamos en espacios metricos, vamos a ver unoejemplo:

Ejemplo 9.70. Considerese (ℜ, dE), dE(x, y) = |x− y|, y la sucesion xn =n, n ∈ N . Claro que lim

n→∞xn =∞, es decir, (xn) no converge en ℜ con respecto a

dE, tambien es claro que (xn) no es de Cauchy en (ℜ, dE), debido a que |xn − xm| ≥1 para todo n,m ∈ N , m 6= n. Ahora tomemos la distancia en ℜ

da(x, y) = |arctan(x) − arctan(y)|

Page 161: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. ESPACIOS NORMADOS 149

y consideramos el espacio metrico (ℜ, da). La sucesion (xn) si es de Cauchy, pues

limn,m→∞

|arctan(n)− arctan(m)| = 0,

sin embargo, aquı igualmente vale que limn→∞

xn =∞, es decir, (xn) es una sucesion

de Cauchy que no converge. Por lo tanto, (ℜ, da) no es completo, es decir, los realesno son un espacio completo con esta distancia. Por cierto, observese que este dano genera una norma sobre ℜ.

Lo que nos dice el ejemplo anterior es que un conjunto puede ser completo conuna distancia y no serlo con otra, incluso esto puede suceder en ℜn. Sin embargo,en ℜn todas las normas nos dicen que ℜn es completo.

En ocaciones hay espacios en donde las metricas se conservan o hay funcionesen un espacio que conseva la metrica. A estas funciones que conservan las metricasse les conoce como isometrıas. Veamos su definicion formal.

Definicion 9.71. Sean (X, ρ) y (X ′, ρ′) espacios metricos y f : X X ′

funcion. f es una isometrıa si ρ′ (f (x) , f (y)) = ρ (x, y) .

Las isometrias son funciones muy especiales, son inyectivas y uniformementecontinuas, se tiene para ello la siguiente proposicion.

Proposicion 9.72. Sea f : X X ′ isometrıa. Se tienei) f es inyectivaii) f es uniformemente continua

Demostracion 9.73. i) Sean x, y,∈ X con x 6= y, entonces 0 6= ρ (x, y) =ρ′ (f (x) , f (y)) , es decir, f (x) 6= f (y) .

ii) Sea ǫ > 0 y x ∈ X. ρ (x, y) < ǫ implica que ρ′ (f (x) , f (y)) < ǫ = δ.

Es mas, la composicion de isometrıas, es isometrıa. Es por eso que con la com-posicion de funciones se puede defirnir un producto. Primero veamos la siguienteproposicion.

Proposicion 9.74. La composicion de isometrıas es una isometrıa.

Demostracion 9.75. Sean (X, ρ) , (Y, ρ′) , (Z, ρ′′) espacios metricos y f : X Y y g : Y Z isometrıas. Entonces

ρ (x, y) = ρ′ (f (x, ) f (y)) = ρ′′ (g(f (x)) , g (f (y))

= ρ′′ (g f (x) , g f (y))

Con este producto se define entonces un grupo con el conjunto de isometrıassobre. Veamos esto en la siguiente proposicion.

Proposicion 9.76. Sea (X, ρ) espacio metrico y sea el par

Iso (X, ρ) = (f : X X | f es isometrıa sobre , )donde es la composicion de funciones. Iso (X, ρ) es un grupo, llamado grupo deisometrıas del espacio metrico (X, ρ) .

Page 162: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

150 9. ESPACIOS METRICOS Y UNITARIOS

Demostracion 9.77. Demostremos las propiedades de grupo de Iso:i) Asociatividad: es claro que (f g) h = f (g h) para cualquier funcion

f, g, h ∈ Iso (X, ρ)ii) id|X ∈ Iso (X, ρ) , pues ρ (Id|X (x) , id|X (y)) = ρ (x, y) , por lo que Id|X

es isometrıa.iii) f sobre, como f es isometria, es inyectiva, por tanto f es bijectiva por lo

tanto, existe f−1 tal que f f−1 = id |X llamada la inversa.

En general Iso (X, ρ) no es abeliano, ya que f g 6= gf . El grupo de isometrıases de suma importancia en fısica, tanto en teorıas de campo como en gravitacion.

Ejercicio 9.78. Para x ∈ ℜn, se define ‖ x ‖= ∑ni=1 | xi |, con x =

(x1, · · · , xn)a) Demuestra para el caso n = 2 que eso define una norma sobre ℜn.b) Cuales son los puntos de ℜn que tienen norma 1?En ℜ2 hay 4 puntos x con ‖ x ‖= 1, por eso esa norma se denota por ‖ x ‖4 .c) Considera ‖ · ‖4 sobre Z2 ( x ∈ ℜn con coordenadas enteras), ası que para

x = (x1, x2) :‖ x ‖4=| x1 | + | x2 | .Aplicando que cada norma ‖ · ‖ genera una metrica d por d (x, y) =‖ x−y ‖, la

metrica correspondiente a ‖ · ‖4 es d4, dada por d4 (x, y) =| x1− y1 | + | x2− y2 |,x = (x1, x2), y = (y1, y2)

¿Como se ven las circunferencias con respecto a esta metrica?(Circunferencia con centro x y radio r es entonces el conjunto Cr (x) =

y ∈ Z2 | d4 (x, y) = r,) estudielo para x = (0, 0) , r = 1, 2, 3, 4.

Ejercicio 9.79. Aplicando el lema 9.6, demuestre que d (x, y) =| f (x)−f (y) |es una metrica sobre ℜ para

f (x) =

ln (x) para x ≥ 1(x− 1) para x < 1

Definase para x ∈ ℜ, tal que ‖ x ‖ no es una norma sobre ℜ (¿Cual axiomafalla?)

Eso se debe al hecho que nuestra metrica, por ejemplo, no es invariante bajotraslacion, es decir, existen x, t, a ∈ ℜ tales que d (x+ a, y + a) 6= d (x, y) . En-cuentre tales x, t y a.

4. Espacios Euclideanos.

En esta seccion vamos a estudiar espacios vectoriales con una estructura muyparticular. Se trata de espacios vectoriales en donde se ha definido una distancia ouna norma, es decir, el tamano de un vector. Estas estructuras son muy comunes enciencias naturales y muy utiles para definir movimiento en estos conjuntos. Primerointroducimos el concepto de producto escalar.

Definicion 9.80. Sea V un espacio vectorial real y B : V × V ℜ para todax,y ∈ V una funcion bilineal tal que

1) B(x,y) = B(y,x) , i.e. B es simetrica2) B (x,x) ≥ 0, i.e. B positiva definida3) B (x,x) = 0, sı y solo sı x = 0.A B se le llama un producto escalar o producto interno en V .

Con esta definicion de producto en espacios vectoriales podemos definir el con-cepto de espacio euclideano

Page 163: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. ESPACIOS EUCLIDEANOS. 151

Definicion 9.81. Al par (V,B) donde V es un espacio vectorial real y B unproducto escalar, se le llama espacio euclideano.

Notacion 9.82. A B tambien se le denota como (·, ·) , 〈x, y〉 , [x, y] , x · y,etc.

Veamos algunos ejemplos de productos internos y de espacios euclideanos.

Ejemplo 9.83. (ℜn, (·, ·)) con (x,y) = l1m1 + · · ·+ lnmn, con x,y ∈ ℜn talesque x = (l1, · · · , ln) y y = (m1, · · · ,mn)

Ejemplo 9.84. Sea L2 = (l1, l2, · · · ) | li ∈ ℜ tal que∑∞

i=1 l2i < ∞ con el

producto interno

(x,y) =∞∑

i=1

limi,

x = (l1, l2, · · · ) y = (m1,m2, · · · )Entonces (L2, (·, ·)) es un espacio euclideano ya que

∑ni=1 limi es absolutamente

convergente. L2 es de dimension infinita.

Ejemplo 9.85. Sea (Pn, ·) el espacio de los polinomios, con el producto interno· definido por x · y = a0b0 + a1b1 + · · · + anbn, para x,y ∈ Pn, donde x = a0 +a1x, · · · , anxn y y = b0 + b1x, · · · , bnxn. Se puede demostrar que con este productointerno, Pn es un espacio euclideano.

Ejemplo 9.86. Sea CR ([a, b]) el conjunto de las funciones continuas en [a, b].Sea

(f, g) =

∫ b

a

f (x) g (x) dx, f, g ∈ CR ([a, b])

entonces (f, g) es un producto escalar. Veamos esto

Demostracion 9.87. (f, g) es bilineal, ya que, para la primera entrada de

(·, ·) se tiene (α1f1 + α2f2, g) =∫ ba

(α1f1 (x) + α2f2 (x)) g (x) dx = α1 (f1, g) +α2 (f2, g) y analogamente para la segunda entrada

(·, ·) es simetrico

(f, f) =∫ ba f

2 (x) dx ≥ 0. Ademas si (f, f) = 0 esto es sı y solo sı∫ ba f

2 (x) dx =

0 sı y solo sı f2 (x) = 0 para toda x ∈ [a, b] .

Habiendo introducido el concepto de producto escalar entre vectores, podemosahora introducir el concepto de tamano de un vector, que es el producto internodel vector consigo mismo, o sea

Definicion 9.88. Sea (V, (·, ·)) un espacio euclideano. A

‖ x ‖= ((x,x))1/2 x ∈ Vse le llama la norma compatible de x.

Tambien es posible definir el tamano de un vector, su norma, sin necesidad dedefinir el producto interno, utilizando la definicion 9.40 de norma en espacios vecto-riales, no necesariamente con producto interno. De hecho, la norma compatible esuna norma en el espacio vectorial, pero que es compatible con el producto interno.Vamos a ver esto, pero antes veamos la siguiente proposicion:

Page 164: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

152 9. ESPACIOS METRICOS Y UNITARIOS

Proposicion 9.89 (Desigualdad de Schwarz). El valor absoluto del productointerno de dos vectores es menor o igual que el producto de las normas, i.e.

| (x,y) |≤‖ x ‖ · ‖ y ‖ .

Demostracion 9.90. Sean x′,y′ ∈ V y tomemos x = x′

‖x′‖ , y = y′

‖y′‖ de

tal forma que ‖ x ‖=‖ y ‖= 1. Sea t ∈ ℜ, se sigue que

0 ≤ (x− ty,x − ty) = (x,x)− (x, ty) − (ty,x) + (ty, ty)

= (x,x) − 2t (x,y) + t2 (y,y)

=‖ x ‖2 −2t (x,y) + t2 ‖ y ‖2

= 1− 2t (x,y) + t2

= (t− (x,y))2+ 1− ((x,y))

2

El termino (t− (x,y))2

es siempre positivo o puede ser cero. Si hacemos t =

(x,y) obtenemos que 0 ≤ 1 − ((x,y))2, lo que implica que ((x,y))

2 ≤ 1, o sea

| (x,y) |≤ 1. Entonces se tiene que en general |(

x′

‖x′‖ ,y′

‖y′‖

)|= 1

‖x′‖‖y′‖ (x′,y′) ≤ 1

La relacion entre espacios normados y euclidianoes es que todo espacio eu-clideano es un espacio normado, pero no alreves. Esto lo vemos en la siguientepropisicion.

Proposicion 9.91. Sea (V, (·, ·)) espacio euclideano y ‖ x ‖= ((x,x))1/2

. En-tonces (V, ‖ · ‖) es un espacio normado.

Ejercicio 9.92. Demostrar la proposicion. (Usar la desigualdad de Schwarz)

Vamos a ver algunos ejemplos, pero iniciemos presisamente con un ejemploen donde el espacio no es euclidiano, pero es un espacio sumamente interesante eimportante en todas las areas del conocimiento.

Ejemplo 9.93. Sea L =(ℜ2, (·, ·)

), con el producto (x,y) = l1m1−l2m2 donde

x = (l1, l2) y y = (m1,m2). Este no es un producto interno ya que (x,x) = l21 − l22no es mayor que cero y (x,x) = l21 − l22 = 0 no implica que x = 0. Un espacio coneste pseudo-producto interno se conoce como espacio Pseudo-euclideano oEspacio de Lorentz. A la norma generada por este producto interno se le llamaNorma de Lorentz. Estos espacios son de vital importancia en fısica puestoque son un modelo del espacio tiempo real y por eso les daremos un lugar especial.Observemos entonces que con la norma de Lorentz, hay vectores que no son cero,pero tienen norma (tamano) igual a cero. A estos vectores se les conoce comovectores nulos. Generalmente un vector en este espacio se denota como v = (x, t),se tiene que ‖ v ‖= x2 − t2. Los vectores nulos cumplen con la relacion x = ±t, esdecir, son los vectores tangente a trayectorias sobre el cono de luz.

Ejemplo 9.94. (ℜn, (·, ·)) con el producto interno canonico. Entonces se puededefinir una norma y con esta una metrica. La norma sera N(x) = (x,x) =√l21 + · · ·+ l2n, con x = (l1, · · · , ln). Entonces la metrica canonica esta dada por

ρ (x,y) = N (x− y) =

√(l1 −m1)

2+ · · ·+ (ln −mn)

2para y = (m1, · · · ,mn).

Esta es la metrica canonica de ℜn.

Page 165: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. ESPACIOS UNITARIOS 153

Ejemplo 9.95. Sea (Pn, ·), con el producto interno · canonico. Hagamos lomismo que para (ℜn, (·, ·)). Se tiene que x · y = a0b0 + a1b1 + · · · + anbn, parax,y ∈ Pn, donde x = a0+a1x+, · · · ,+anxn y y = b0+b1x+, · · · ,+bnxn. Entonces

ρ (x,y) = N (x− y) =

√(a0 − b0)2 + (a1 − b1)2 + · · ·+ (an − bn)2. La cual es la

metrica canonica para Pn.Ejemplo 9.96. Sea C ([a, b]) el conjunto de las funciones continuas en [a, b] .

De nuevo podemos construir una metrica en el espacio de funciones como

ρ (f, g) = N (f − g)= (f − g, f − g)

=

(∫ b

a

(f (x) − g (x))2dx

)1/2

, f, g ∈ C ([a, b])

la cual es la metrica canonica para C ([a, b]).

Ejemplo 9.97. Sea (Fp, ρ), el espacio de las funciones periodicas definidosentre [0, 2π] con esta distancia canonica podemos ver cual es la distancia entrecos(ix) y cos(jx), se tiene:

ρ (cos(ix), cos(jx)) =

(∫ 2π

0

(cos(ix)− cos(jx))2dt

)1/2

=√

2π, para i 6= j

Ejercicio 9.98. Demostrar que ρ (sin(ix), cos(jx)) =√

2π y ρ (sin(ix), sin(jx)) =√2π para i 6= j. Es decir, la distancia entre los vectores base de las funciones pe-

riodicas es√

2π.

Ejemplo 9.99. Sea L el espacio de Lorentz. Entonces se puede construir la

metrica ρ (x,y) = NL (x− y) =‖ x − y ‖=√

(x1 − y1)2 − (x2 − y2)2. Observen

que se pueden tener dos vectores diferentes, pero separados una distancia 0.

Ejercicio 9.100. Demuestre lo siguiente: Si V es un espacio vectorial sobreℜ con producto interno (·, ·) , entonces ‖ x ‖=

√(x, x) define una norma sobre V .

Nota: aplicar la desigualdad de Schwarz: | (x, y) |≤‖ x ‖ · ‖ y ‖ .

5. Espacios Unitarios

En esta seccion vamos a generalizar los espacios Euclidianos al caso en el queel campo del espacio vectorial no sean los numeros reales, sino el campo de loscomplejos. Como veremos, existen varias diferencias interesantes que hacen a estosespacios sobre los complejos importantes, sobre todo en la mecanica cuantica, quees importante en fısica, quımica, ingenierıa, etc. Su definicion es como sigue.

Definicion 9.101. Sea E un espacio vectorial sobre C y x, y ∈ E. Sea B :E × E → C un mapeo lineal en el primer argumento tal que

1) B (x,y) = B (y,x) es antisimetrico2) B (x,x) ≥ 0 es real3) B (x,x) = 0 sı y solo sı x = 0

Page 166: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

154 9. ESPACIOS METRICOS Y UNITARIOS

A B (x,y) = (x,y) se le llama producto escalar sobre E, y a (E, (·, ·)) se lellama espacio unitario.

Comentario 9.102. Algunas consecuencias inmediatas de la definicion ante-rior son las siguientes:

1) (x, αy) = (αy,x) = α (y,x) = α(y,x) = α (x,y) α ∈ C2) (x,y1 + y2) = (y1 + y2,x) = (y1,x) + (y2,x) = (y1,x)+(y2,x) = (x,y1)+

(x,y2)3) |Re (x,y) |≤‖ x ‖‖ y ‖Ejercicio 9.103. Demostrar 3)

Veamos algunos ejemplos de espacios unitarios.

Ejemplo 9.104. Sea el espacio vectorial Cn con el producto interno para x, y ∈Cn definido por (x,y) =

∑ni=1 li ·mi, donde x = (l1, · · · , ln) y y = (m1, · · · ,mn),

entonces (Cn, (·, ·)) es un espacio unitario.

Ejemplo 9.105. Sea de nuevo L2, pero ahora sobre el campo de los complejos,es decir,

(9.1) L2 =

li, para i = 1, · · · ,∞ | li ∈ C,

∞∑

i=1

| li |2<∞

Entonces (L2, (·, ·)) con (x,y) =∑∞

i=1 li · mi es un espacio unitario, con x y ydefinidos como en el ejemplo anterior.

Ejemplo 9.106. CC ([a, b]) y (f, g) =∫ baf (x) g (x)dx, con f, g ∈ CC ([a, b]) es

un espacio unitario, ya que si f = u+ iv, u, v ∈ CR ([a, b]), entonces∫ baf (x) dx =∫ b

a u (x) dx+i∫ ba v (x) dx, y la parte real y la imaginaria forman espacios euclidianos

por separado, entonces no es dificil ver que con este producto (CC ([a, b]) , (·, ·)) esun espacio unitario.

En este capıtulo vamos a usar la notacion de espacio para designar a un espacioeuclideano o a un espacio unitario. En los casos en que se trate de alguno enparticular, se dira explicitamente.

La nocion de que dos vectores son perpendiculares en el espacio es un conceptomuy usado en geometrıa euclidiana y en la vida cotidiana. Sin embargo, en unespacio vectorial arbitrio este concepto no es tan claro, al menos no se pude deducirintuitivamente. Por ejemplo, que significa que dos funciones o dos polinomios sonperpendiculares. Este concepto nos conduce a la geometrizacion del espacio vecto-rial en cuestion. Veamos las siguientes definiciones sobre perpendicular u ortogonal,que seran muy importantes para la geometrizacion del espacio.

Definicion 9.107. Sea (E, (·, ·)) espacio unitario y sean x,y ∈ E, con x 6= 0y y 6= 0. Si

1.- (x,y) = 0, x y y se dicen ortogonales o perpendiculares. Se simbolizax ⊥ y.

2.- Sean H ⊆ E y G ⊆ E. Se dice que H es perpendicular u ortogonal a G,si para toda x ∈ H y y ∈ G, (x,y) = 0. Se simboliza H ⊥ G.

3.- Sea H ⊆ E y H⊥ = x ∈ E | (x,y) = 0 y ∈ H se llama el complementoortogonal de H.

Page 167: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. ESPACIOS UNITARIOS 155

Ejemplo 9.108. Sea el espacio (ℜn, (·, ·)). Los vectores eii=1,··· ,n definidospor ei = (0, · · · , 1, · · · , 0), con el 1 en la i− esima posicion, son todos perpendicu-lares entre si.

Ejemplo 9.109. Sea (Pn, ·), con su producto interno canonico. Entonces lospolinomios 1, x, · · · , xn son todos perpendiculares entre si.

Ejemplo 9.110. Sea Fp ([0, 2π]) el conjunto de la funciones periodicas en [0, 2π] .Entonces las funciones cos(t), cos(2t), · · · sin(t), sin(2t), · · · son perpendicularesentre si. Esto se ve, si hacemos

(cos(it), cos(jt)) =

∫ 2π

0

cos(it) cos(jt)dt

= πδij

donde δij es la delta de Kroneker.

Ejercicio 9.111. Demostrar que (cos(it), cos(jt)) = πδij , lo mismo que (sin(it), sin(jt)) =πδij y (sin(it), cos(jt)) = 0.

Estas definiciones tienen consecuencias inmediatas, veamos ahora dos de ellas:

Proposicion 9.112. .1) H⊥ es subespacio de E

2) H ⊆(H⊥)⊥

Ejercicio 9.113. Demostrar la proposicion anterior

En lo que sigue vamos a introducir uno de los conceptos mas importantes conel que vamos a trabajar en este capıtulo y el de ecuaciones diferenciales. La ideaes tener un espacio vectorial con vectores perpendiculares que sean solucion de uncierto problema. Para introducir poco a poco estos espacios, vamos a iniciar conla siguiente definicion. Cuando en un espacio vectorial un conjunto de vectores sonperpendiculares entre sı, este conjunto recibe un nombre especial, este es:

Definicion 9.114. Sea (E, (·, ·)) espacio unitario. Sea xii∈I una familia deelementos de E. Si xi ⊥ xj para todos i, j ∈ I, I un conjunto de indices, i 6= j sedice que xii∈I es un sistema ortogonal. Si ademas ‖ xi ‖= 1 para todo i ∈ I,entonces xii∈I se llama sistema ortonormal.

Observemos que en este caso se sigue (xi,xj) = δij =

0, si i 6= j1, si i = j

En un espacio euclidiano la geometrıa de este se construye, por ejemplo, uti-lizando el teorema de Pitagoras. Este teorema utiliza fuertemente el concepto delineas o vectores perpendiculares. Vamos a ver ahora que este teorema se cumple enlos espacios euclidianos y unitarios y es la base de su geometrizacion. Su enunciadoes como sigue.

Teorema 9.115 (de Pitagoras). Sea (E, (·, ·)) espacio. Sean x1, · · · ,xn ∈E, tal que xii=1,··· ,n es un sistema ortogonal. Entonces

‖ x1 + · · ·+ xn ‖2=‖ x1 ‖2 + · · ·+ ‖ xn ‖2

Demostracion 9.116. Vamos a realizar el producto interno de la suma detodos los vectores del sistema ortogonoal, es decir, (x1 + · · ·+ xn,x1 + · · ·+ xn) =∑ni,j=1 (xi,xj) =

∑ni=1 (xi,xi) =

∑ni=1 ‖ xi ‖2, se sigue entonces el teorema.

Page 168: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

156 9. ESPACIOS METRICOS Y UNITARIOS

Como ya habiamos visto anteriormente, en todo espacio vectorial existe almenos una base. Lo que veremos a continuacion es que en todo espacio vecto-rial existe al menos una base ortogonal. Este resultado se discute en el siguienteteorema.

Teorema 9.117 (de Schmidt). Sea (E, (·, ·)) espacio unitario y yii∈1 vectoreslienalmente independiente de E con H = L (y1,y2, · · · ) ⊂ E. Entonces existe unsistema ortogonal xii∈1 con H = L (x1,x2, · · · ) .

Demostracion 9.118. El teorema se demuestra construyendo la base. La ideade la demostracion es que se toma una base arbitraria del espacio vectorial y seconstruye la nueva base ortogonal vector por vector, usando combinaciones linealesde la base origianal, haciendo que cada nuevo vector base sea perpendicular a losotros.

Ejemplo 9.119. Sea el espacio (ℜn, (·, ·)). Los vectores eii=1,··· ,n son per-pendiculares todos entre si y su norma es 1. Por lo que esta base forma un sistemaortonormal en ℜn.

Ejemplo 9.120. Sea (Pn, ·), con su producto interno canonico. Entonces lospolinomios 1, x, · · · , xn son todos perpendiculares entre si y forma un sistemaortonormal en Pn.

Ejemplo 9.121. Sea Fp ([0, 2π]) el conjunto de las funciones periodicas en[0, 2π]. Entonces las funciones cos(t), cos(2t), · · · sin(t), sin(2t), · · · son perpen-diculares entre si y forman un sistema ortogonal en Fp ([0, 2π]). Oberven que elconjunto de vectores no tiene norma 1, sino π.

Page 169: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 10

ESPACIOS DE HILBERT Y BANACH

En esta seccion nos vamos a enfocar a los espacios completos, con una estructurade espacio vectorial y que tengan una norma o un producto interno o ambos. Estosespacios, llamados espacios de Banach y espacios de Hilbert, son muy importantesporque ahi viven los operadores diferenciales y las soluciones de un sinnumero deecuaciones diferenciales. Esto le da una importencia enorme a este tipo de espacios.Vamos a iniciar con la introduccion de algunas propiedades de las series en espaciosnormados y luego con la definicion de los espacios de Hilber para despues pasar asu manipulacion.

1. Sistemas Ortonormales Completos.

Como ya vimos, con la norma se pueden definir conceptos como continuidad,convergencia, etc. Vamos a iniciar con las series en estos espacios y veamos unconcepto que generaliza el concepto de estas series. Sea (B, ‖ · ‖) un espacio denormado, y (xn) una sucesion en B. Definimos inductivamente una sucesion nueva(sn).

Definicion 10.1. Sea s1 = x1, sn+1 = sn + xn+1 para toda n = 1, 2, · · · .sn =

∑ni=1 xi se llama suma parcial n-esima de (xn). Si (sn) es convergente,

entonces s = limn→∞

sn, con s ∈ B, se llama serie infinita de (xn), y se denota por

s =∑∞

i=1 xi.

Comentario 10.2. Para B = ℜ, si (sn) no es convergente, se consideran doscasos:

i) (sn) es una serie propiamente divergente, es decir, limn→∞

sn = ∞, o

limn→∞

sn = −∞, entonces se dice que la serie∑∞i=1 xi diverge propiamente a ∞ o a

−∞;ii) En otro caso, tenemos una divergencia indeterminada de (sn), se dice

que la serie∑∞

i=1 xi es oscilalante.

Comentario 10.3. En ocasiones es util iniciar la enumeracion de (sn) conn = 0, o con algun otro numero entero. Ası que, el analisis de series infinitas, ensu esencia, es el analisis de sucesiones especiales, solo que en cada momento hayque recordar que

∑∞i=1 xi = lim

n→∞(∑n

i=1 xi).

Lema 10.4 (Criterio necesario de convergencia de series). La convergencia dela serie

∑∞i=1 xi implica que lim

n→∞xn = 0.

Demostracion 10.5. s =∑∞

i=1 xi = limn→∞

sn = limn→∞

sn+1, con sn =∑ni=1 xi.

Entonces podemos escribir 0 = s− s = limn→∞

(sn+1 − sn) = limn→∞

xn.

157

Page 170: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

158 10. ESPACIOS DE HILBERT Y BANACH

Una aplicacion practica de este criterio de necesidad nos da a saber cuandouna serie no converge. Si se tiene que en una serie lim

n→∞xn 6= 0, esto implica que la

serie∑∞

i=1 xi no converge. Sin embargo este criterio no es suficiente. Veamos unejemplo.

Ejemplo 10.6. Sea xn = ln(1 + 1n ), tenemos lim

n→∞xn = 0. Para ver esto

ultimo, recordemos que el numero de Euler e es el lımite de la sucesion creciente(1+ 1

n )n, por eso (1+ 1n )n ≤ e para todo n ∈ N . Aplicando la funcion estrictamente

monotona ln, se obtiene que ln((1 + 1n )n) ≤ ln(e) = 1, que implica n ln(1 + 1

n ) ≤ 1,

y entonces 0 ≤ ln(1 + 1n ) ≤ 1

n . Pero limn→∞

1n = 0, y el criterio de comparacio n nos

da que 0 ≤ limn→∞

(1 + 1n ) ≤ 0, implicando lim

n→∞(1 + 1

n ) = 0.

Sin embargo, veamos que la serie diverge:

sn =

n∑

i=1

ln(1 +1

i) =

n∑

i=1

ln(1 + i

i) =

n∑

i=1

(ln(i+ 1)− ln(i))

= ln(2)− ln(1) + ln(3)− ln(2) + ln(4)− ln(3) + · · ·+ ln(n+ 1)− ln(n)

= ln(n+ 1)− ln(1) = ln(n+ 1),

lo cual claramente es una sucesion estrictamente creciente no acotada por arriba,lo cual implica que

∑∞i=1 ln(1 + 1

i ) = limn→∞

sn = limn→∞

ln(n+ 1) =∞

Recordemos algunos de los criterios mas importantes de convergencia paraseries, los cuales pueden ser muy utiles en el futuro.

Critero 10.7 (de Cauchy). Si∑∞

i=1 xi es convergente, entonces la sucesion(sn) definida por sn =

∑ni=1 xi es de Cauchy.

Es decir,∑∞

i=1 xi converge sı y solo sı para todo ǫ > 0 existe nǫ ∈ N tal quem > n ≥ nǫ implica que ‖ sm − sn ‖=‖ xn+1 + xn+2 + · · ·+ xm ‖< ǫ.

Critero 10.8 (de comparacion). Si∑∞

i=1 ai y∑∞i=1 bi son series con ai ≥

0, bi ≥ 0 para toda i, y si existe un numero natural n tal que ai ≤ bi para todai ≥ n, entonces

Si∑∞

i=1 bi converge, tambien∑∞

i=1 ai converge.Si∑∞

i=1 ai =∞, entonces∑∞i=1 bi =∞.

Critero 10.9 (de cocientes de d’Alambert). Si xi > 0 para toda i, entonces,si existe n ∈ N tal que i ≥ n implica

xi+1

xi≤ q < 1

para un q fijo con 0 < q < 1 que no depende de i, entonces∑∞i=1 xi converge. En

caso de que i ≥ n e implique xi+1

xi≥ 1, la serie

∑∞i=1 xi es divergente.

Silimi→∞

xi+1

xi= g

entonces∑∞i=1 xi es convergente para g < 1 y divergente para g > 1 (incluyendo

g =∞).

Critero 10.10 (de la raiz). Si xi > 0 para toda i, entonces, si existe n ∈ Ntal que i ≥ n implica

i√xi ≤ q < 1

Page 171: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. SISTEMAS ORTONORMALES COMPLETOS. 159

para un q fijo con 0 < q < 1 que no depende de i, entonces∑∞i=1 xi converge. En

caso de que i ≥ n e implique i√xi ≥ 1, la serie

∑∞i=1 xi es divergente.

Si

limi→∞

i√xi = g

entonces∑∞i=1 xi es convergente para g < 1 y divergente para g > 1 (incluyendo

g =∞).

Vamos a regresar al tema principal de esta seccion. Vamos a estudiar losespacios ecuclidianos o unitarios completos. Estos espacios tienen una importanciaespecial y por eso reciben un nombre especial, se llaman espacios de Hilbert. Losespacios completos, ya sean Euclidianos y Unitarios, asi como los espacio normados,son muy importantes y es por eso que les vamos a dedicar este capitulo. El espacioen donde viven los estados cuanticos son los espacios de Hilbert, formalmente estosse definen como sigue.

Definicion 10.11. Un espacio Unitario o Euclidiano completo se llama Es-pacio de Hilbert.

Ejemplo 10.12. Como el conjunto de los reales es completo, entonces esteespacio con su producto interno canonico, es un espacio de Hilbert. Pero el conjuntode los enteros o los racionales no puede ser de Hilbert ni de Banach.

Ejemplo 10.13. Un ejemplo de espacio de Hilbert muy conocido es el espacioL2 definido antes: L2 =

(l1, l2, · · · ) | li ∈ C tal que

∑∞i=1 l

2i <∞

con el producto

interno (x,y) =∑∞i=1 limi para x = (l1, l2, · · · ), y = (m1,m2, · · · ). Este espacio

es de Hilbert. Su producto interno se denota mas comunmente como < x | y >=∑∞i=1 limi, y las li son los coeficientes de Fourier de algun desarrollo en series.

Los sistemas ortonormales son los conjuntos mas apropiados para describir unespacio de Hilbert. Son base del espacio, pero ademas son ortonormales, con loque cualquier elemento del espacio puede ser escrito en terminos de el con relativasencilles.

En los espacio Euclidianos o Unitarios podemos hacer la siguiente definicion.

Definicion 10.14. Sea E un espacio Euclidiano (o Unitario) y H ⊆ E. Seaxii∈I una familia de elementos de H e I una familia de ıindices. xii∈I sele llama un sistema completo de H si para toda x ∈ H se sigue que x =∑i∈I (x,xi)xi, es decir, la serie converge a x. Se dice que el sistema es ortonor-

mal si1) El sistema es completo2) xii∈I es una base ortonormal de H

En los espacios de Hilbert siempre existe un conjunto completo que lo genera.Esta propiedad es muy importante y constantemente utilizada por fısicos, quımicose ingenieros. Para demostrar este teorema, es necesario ver primero la siguienteproposicion, la cual enunciaremos sin demostracion.

Proposicion 10.15. Sea E un espacio de Hilbert y xii∈I una base ortonor-mal. xii∈I es completo sı y solo sı se sigue que si x ∈ E y se cumple que(x,xi) = 0 para todo indice i ∈ I, implica que x = 0.

Entonces se puede ver que

Page 172: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

160 10. ESPACIOS DE HILBERT Y BANACH

Teorema 10.16. Sea E un espacio de Hilbert. Entonces existe un sistemaortonormal completo xii∈I en E.

Demostracion 10.17. La idea de la demostracion es usar la proposicion an-terior y construir el sistema completo paso paso.

En lo que sigue vamos a estudiar la identidad de Parseval. Esta identidadsirve mucho en el calculo de las normas en espacios Euclidianos y Unitarios. Estaidentidad la veremos en la siguiente proposicion.

Proposicion 10.18 (Identidad de Parseval). Sea E espacio Euclidiano o Uni-tario y sea xii∈I un sistema ortonormal en H ⊂ E. xii∈I es completo sı y solo

sı ‖ x ‖2= ∑i∈I (x,xi)2 para toda x ∈ H.

Demostracion 10.19. ⇒) xii∈I completo implica que para toda x ∈ H x =∑i∈I (x,xi)xi, entonces

||x ‖2= (x,x) =

i∈I(x,xi)xi,

j∈I(x,xj)xj

=∑

j,i∈I(x,xi) (x,xj) (xixj) =

i,j∈I(x,xi) (x,xj) δij =

i∈I(x,xi)

2

⇐) Sea yii∈I sistema ortonormal, x ∈ H fijo y yn =∑ni=1 (x,yi)yi. Pero

yn es perpendicular a x− yn ya que

(yn,x− yn) =

n∑

i=1

(x,yi) (yi,x)−n∑

i,j=1

(x,yi) (x,yj) (yi,yj) = 0.

Entonces, por el teorema de Pitagoras

||x||2 = ||x− yn||2 + ||yn||2

y esto implica que

||x||2 − ||yn||2 = ||x− yn||2.Esto es ||x||2 −∑n

i=1 | (x,yi) |2 = ||x− yn||2. Pero como

||x||2 =

∞∑

i=1

| (x,yi) |2

esto implica que

limn∞

||x− yn||2 = 0

esto es

limn∞

yn = x =

∞∑

i=1

(x,yi)yi,

que tambien podemos escribir como

x =

∞∑

i=1

(x,xi)xi = y∞

para (xi)i∈I = (yi)i∈I y esto implica que (xi)i∈I es completo.

Page 173: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. SISTEMAS ORTONORMALES COMPLETOS. 161

En fısica, quımica y otras disciplinas cientıficas, es muy conveniente escribir lasfunciones de algun espacio en terminos de funciones conocidas. Generalmente setrabaja en estas diciplinas con espacios completos en donde se puede definir una baseortonormal. Entonces se eligen bases ortonormales que se estudian intensamentepara poder deducir despues propiedades generales de las funciones a estudiar ose trabaja simplemente con estas funciones en terminos de la base del espacio deHilbert, usandolas como una buena aproximacion de las funciones de interes.

Para esto tenemos la siguiente definicion.

Definicion 10.20. Sea xii∈I un sistema ortonormal completo en un espaciode Hilbert E. Entonces· (x,xi)i∈I se llaman coeficientes de Fourier con respecto a x y la base

ortonormal.· ∑i∈I (x,xi)xi se llama serie de Fourier.

Cada x ∈ E en un espacio de Hilbert puede ser representado en una serie deFourier, en donde esa x puede ser cualquier tipo de elemento, desde polinomios, fun-ciones periodicas, hasta funciones que son la solucion de alguna ecuacion diferencialde importancia.

Notacion 10.21. A pesar de que los elementos del espacio de Hilbert o Banachson siempre vectores, a partir de aquı vamos a uniformizar la notacion, entoncesdenotaremos los elementos de estos espacios ya no con negritias x, sino solamentecomo x. De cualquier forma, los espacios de Hilbert que mas vamos a usar, los demayor interes para nosotros, son los espacios vectoriales de funciones.

Veamos algunos ejemplos.

Ejemplo 10.22. Sea ℜn, con xi = ei, i = 1, · · · , n, la base canonica.1) Sea x = (l1, · · · , ln). Entonces x se pude representar como x =

∑ni=1 liei =∑n

i=1 (x · ei) ei.2) Para los numeros complejos Cn es analogo.

Ejemplo 10.23. Tomemos a L2 con la base

xi = ei =

(0, · · · , 1

i−esimo, · · ·

).

Sea xii∈I = xii=1,··· ,∞, entonces xii∈I es un sistema ortonormal completo,ya que si x ∈ L2, se tiene que (x, xi) = li, en donde x = (l1, · · · ) y

Σ∞i=1| (x,xi) |2 = Σ∞

i=1|li|2 = ||x||2.De la identidad de Parseval se sigue que xii∈I es completo.

Ejemplo 10.24. Sea Cℜ el conjunto de las funciones suaves f : ℜ → ℜ. Laserie de Taylor de esta funcion alrededor de 0 esta dada por

f(x) = f(0) +1

1!

(df

dx

∣∣∣∣x=0

)x+

1

2!

(d2f

dx2

∣∣∣∣x=0

)x2 +

1

3!

(d3f

dx3

∣∣∣∣x=0

)x3 + · · ·

Entonces, toda funcion suave (de hecho en cualquier punto) se puede representarpor un polinomio f(x) = p(x) = a0 + a1x + a2x

2 + · · · , donde los coeficientes delpolinomio estan dados por

aj =1

j!

djf

dxj

∣∣∣∣x=0

.

Page 174: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

162 10. ESPACIOS DE HILBERT Y BANACH

Sea (P , ·) el conjunto de los polinomios de grado arbitrario con su producto canonicoy pjj=0,1,··· = 1, x, x2, · · · . Es claro que este conjunto de vectores es un sistemacompleto en Cℜ. Entonces, toda funcion suave se puede escribir como

f(x) =

∞∑

i=1

(p · xi

)xi =

∞∑

i=1

aixi.

Ejemplo 10.25. Sea Fp ([0, 2π]) el conjunto de las funciones periodicas en[0, 2π]. Un sistema ortonormal completo de este espacio es

xjj∈I =

1√2π,

1√π

sin(jt),1√π

cos(jt)

j=1,··· ,n

Los coeficientes de Fourier estan dados por

(f, xj)j∈I =

(f, cos(jt)) =

∫ 2π

0 f cos(jt)dt,

(f, sin(jt)) =∫ 2π

0f sin(jt)dt,

Este conjunto es completo ya que si

0 = (f,xj) =

∫ 2π

0

f cos(jt)dt o

∫ 2π

0

f sin(jt)dt = 0

para todo j = 0, · · · , n, se sigue que f = 0.

Ejemplo 10.26. Un ejemplo simple de funciones ortonormales sobre las cualesse puede hacer un desarrollo de Fourier son las funciones 1/

√2π exp (imx)m∈I.

Estas funciones forman un sistema ortonormal completo en el intervalo [0, 2π], yaque

(1√2π

exp (imx) ,1√2π

exp (im′x)

)=

1

∫ 2π

0

exp (imx) exp (−im′x) dx = δmm′

para m,m′ ∈ Z. Este sistema ortonormal completo es de gran interes por su usoen fısica, quımica e ingenierıa. Se tiene que una funcion en el intervalo [0, 2π] sepuede escribir como

f(x) =∑

n∈I(f, exp (inx)) exp (inx) , donde

(f, exp (inx)) =1√2π

∫ 2π

0

f(x) exp (−inx)dx

Ejemplo 10.27. Sea Pn(x) los polinomios de grado n definidos por la formula

Pn(x) = cn ·dn

dxn(x2 − 1

)n, con cn =

1

n!, 2n

√2n+ 1

2.

Si integramos por partes n -veces el producto∫ 1

−1

Pm(x)Pn(x)dx = δmn

donde δmn es la delta de Kroneker, vemos que estas funciones son ortogonales.Como este conjunto de funciones son polinomios de grado arbitrario, el espaciogenerado por ellas es isomorfo a (P , ·). Entonces se puede demostrar que el con-junto Pn(x)n=1,··· es un sistema completo en el espacio de funciones suaves

Page 175: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. SISTEMAS ORTONORMALES COMPLETOS. 163

f : [−1, 1]→ ℜ. Esto quiere decir que toda funcion suave f en [−1, 1] se puedeescribir como

f(x) =

∞∑

n=0

(f, Pn)Pn, donde

(f, Pn) =2n+ 1

2

∫ 1

−1

f(x)Pn(x)dx

Estos polinomios son llamados polinomios de Legendre.

Ejemplo 10.28. Analogamente a los polinomios de Legendre se definen lospolinomios asociados de Legendre como

Pml (x) = (−1)m(1− x2

)m/2cndm+l

(x2 − 1

)l

dxm+l

= (−1)m(1− x2

)m/2 dmPl(x)dxm

con −l ≤ m ≤ l. Estos polinomios tambien son ortogonales, haciendo m integra-ciones por partes se puede ver que

∫ 1

−1

Pml (x)Pml′ (x)dx =

0 si l 6= l′

22l+1

(l+m)!(l−m)! si l = l′

Analogamente como en el caso de los polinomios de Legendre, este conjunto defunciones tambien son polinomios de grado arbitrario, asi que el espacio gener-ado por ellas es isomorfo a (P , ·). Entonces se puede demostrar que el conjuntoPml (x)n=1,··· es un sistema completo en el espacio de funciones suaves f : [−1, 1]→ ℜ.Esto quiere decir que toda funcion suave f en [−1, 1] se puede escribir como

f(x) =

∞∑

l=0

(f, Pml )Pml , donde

(f, Pml ) =2n+ 1

2

(l −m)!

(l +m)!

∫ 1

−1

f(x)Pml (x)dx

Ejemplo 10.29. Finalmente, un ejemplo muy importante es una combinaciondel ejemplo 10.26 combinado con los polinomios asociados de Legendre. Si definimoslas funciones

Y ml (θ, ϕ) = (−1)m

√2n+ 1

(l −m)!

(l +m)!Pml (cos(θ)) exp (imϕ)

se puede ver que el conjunto Y ml l,m∈I es un sistema ortonormal completo. A lasfuncines Y ml (θ, ϕ) se les llama armonicos esfericos. Es facil darse cuenta que

∫ 2π

0

∫ 1

−1

Y ml (θ, ϕ)Y m′

l′ (θ, ϕ) d (cos (θ)) = δll′δmm′

y por construccion, este sistema es una base del conjunto de funciones. Este sistemaes muy conveniente para escribir funciones que dependen solo de los angulos θ y ϕ,es decir, funciones cuyo dominio se encuentra en la esfera. Por eso los armonicos

Page 176: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

164 10. ESPACIOS DE HILBERT Y BANACH

esfericos son muy usados en problemas con simetria esferica. Toda funcion f quesolo depende de estos dos angulos se puede escribir como

f(x) =∞∑

l=0

l∑

m=−l(f, Y ml )Y ml , donde

(f, Y ml ) =2n+ 1

2

(l −m)!

(l +m)!

∫ 2π

0

∫ 1

−1

f(θ, ϕ)Y ml (θ, ϕ)d (cos (θ))

2. Operadores Adjuntos.

Ahora vamos a trabajar en los espacios normados completos, es decir, en losespacios de Banach. Estos espacios tienen muchas propidades, en ellos viven losoperadores, especialmente los operadores cuanticos. Vamos a definir los operadoresadjuntos y autoadjuntos y veremos algunas de sus propiedades. La definicion delos espacios de Banach es como sigue.

Definicion 10.30. Un espacio normado, completo, se llama Espacio de Ba-nach.

Comentario 10.31. Como ya sabemos, todo Espacio Unitario o Euclidiano esnormado, si estos ademas son completos, son espacios de Banach. Los espaciosnormados son tambien metricos, por lo tanto los espacios de Banach son espaciosmetricos.

Mas adelante vamos a necesitar el siguiente lema.

Lema 10.32. Sea xn una sucesion tal que limn∞

xn = x0 y f una funcion. En-

tonces f es continua en x0 sı y solo sı limn∞

f (xn) = f (x0)

Ejercicio 10.33. Demostrar el lema.

Proposicion 10.34. Sean (E, || · ||) y (F, || · ||) espacios normados y A : E Ffuncion lineal. Entonces A es continua sı y solo sı es continua en 0 (o en algunpunto x ∈ E.)

Demostracion 10.35. ⇒) Trivial.⇐) Supongamos que A es continua en 0. Sea xn una sucesion en E tal que

limn∞

xn = x. Sea yn := xn − x, esto implica que limn∞

yn = 0. Puesto que A es

continua en 0, se sigue que limn∞

A (yn) = A (0) = 0.

Entonces0 = lim

n∞A (xn − x) = lim

n∞[A (xn)−A (x)] ,

se sigue que limn∞

A (xn) = A (x)

Las funciones lineales acotadas son las de mayor interes en fısica. Cuando lafuncion es acotada, esta tiene propiedades especiales. Vamos a definir lo que es unafuncion acotada.

Definicion 10.36. Sean (E, || · ||E) y (F, || · ||F ) espacios normados y A : E F.

A se dice acotada, si

sup||x||E=1

||A (x) ||F < +∞,

para todo x ∈ E

Page 177: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. OPERADORES ADJUNTOS. 165

Ejemplo 10.37. Sea E = ℜ y A : ℜ F , tal que A → A (x) = α · x ∈ Farbitrario

||A (x) || = ||x · α|| = |x| · ||α||.Se sigue que

sup|x|=1

||A (x) || = sup ||α||,−||α|| = ||α|| < +∞

Ejemplo 10.38. Sea C ([a, b]) el conjunto de las funciones continuas en [a, b].Sea A : C ([a, b]) ℜ, tal que

f A (f) =

∫ b

a

f (x) dx.

Entonces

||A (f) || = ||∫ b

a

f (x) dx|| ≤∫ b

a

||f (x) ||dx ≤ ||f || (b− a) .

Entonces se tiene que

sup‖f‖=1

||A (f) || ≤ b− a < +∞,

y esto implica que A es acotada.

El concepto de acotada para una funcion queda mas claro despues del lemasiguiente, el cual enuciamos sin demostracion.

Lema 10.39. Sean (E, || · ||E) y (F, || · ||F ) espacios normados y A : E Fun mapeo lineal. A es acotada sı y solo sı existe c ∈ ℜ, tal que ||A (x) ||F ≤ c||x||E

Es decir, la funcion es acotada si la norma de sus valores son menores que lanorma del punto en donde se evaluo, para todo punto en el dominio. Las funcioneslineales acotadas son continuas, esta propiedad la demostramos en el siguiente teo-rema.

Teorema 10.40. Sean (E, || · ||E) y (F, ||·||F ) espacios normados y A : E Fun mapeo lineal. Entonces A es continua sı y solo sı A es acotada.

Demostracion 10.41. .⇒) Supongamos A continua. En particular es continua en 0, .i.e. para toda

ǫ > 0, existe δǫ tal que ‖ A (x)−A(0) ‖F< ǫ, para toda x se sigue que ‖ x−0 ‖E< δǫ.Pero A lineal implica A (0) = 0. Tomemos ǫ = 1. Entonces ‖ A (x) ‖F< 1, paratoda x con ‖ x ‖E< δ1 (*)

Sea

y′ =δ12

y

‖ y ‖Etal que ‖ y′ ‖E=

δ12< δ1.

Entonces por (*) ‖ A (y′) ‖F< 1 (**).Ademas

‖ A (y) ‖F=‖ A (y′) ‖F2

δ1‖ y ‖E≤

2

δ1‖ y ‖E

por (**). Esto quiere decir que

‖ A (y) ‖F≤ c ‖ y ‖E , con c =2

δ1

para toda y ∈ E.

Page 178: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

166 10. ESPACIOS DE HILBERT Y BANACH

⇐) Supongamos A es acotada. Entonces existe c tal que ‖ A (x) ‖≤ c ‖ x ‖,x ∈ E. Sea xn una sucesion en E, con lim

n∞xn = 0. Entonces

‖ A (xn)− 0 ‖F=‖ A (xn) ‖F≤ c ‖ xn ‖E .

Pero limn∞

xn = 0 sı y solo sı limn∞

‖ xn ‖E= 0. Se sigue que

0 ≤ limn∞

||A (xn) ‖F≤ limn∞

c ‖ xn ‖E= 0

o sea limn∞

‖ A (xn) ‖F= 0 pero esto es sı y solo sı limn∞

A (xn) = 0 = A (0) .

Entonces A es continua en cero por lo que A es continua.

El conjunto de funciones lineales acotadas, por tanto continuas, entre espaciosnormados, forma un espacio vectorial tambien. Este concepto lo escribiremos en lasiguiente definicion.

Definicion 10.42. L (E,F ) = A | A : E F, lineal y acotada.

Ya sabemos que L (E,F ) es un espacio vectorial, asociado a E y F . Existe uncaso particular de espacios normados muy interesante. Se puede definir una clasede espacios asociados usando como norma la definicion de acotado. Esto se posibleporque esta dafinicion es a su vez una norma. Esto es

Lema 10.43. Sea A ∈ L (E,F ). Se tiene que

‖ A ‖L= sup‖x‖E=1

‖ A (x) ‖F

es una norma en L (E,F ).

Ejercicio 10.44. Demostrar el lema.

Ejemplo 10.45. Sea E = ℜ2 y sea A la transformacion lineal representada porla matriz

A =

(2 11 0

)

Encontremos su norma ||A||. Tomemos un vector x cualquiera x = (l1, l2). Se tiene

||A|| = sup‖x‖E=1

‖ A (x) ‖

= sup‖x‖E=1

‖(

2 11 0

)(l1l2

)‖

= sup‖x‖E=1

((2l1 + l2)

2+ l21

)

= sup

(1 + 4l21 + 4l1

√1− l21

)

Esta ultima funcion toma valores maximos en 0.923. Por lo que ||A|| = 0.923.

Un resultado que es muy usado en el estudio de las normas de mapeos linealeses el siguiente:

Lema 10.46. Sea A operador lineal. Entoces ||A (x)|| ≤ ||A|| · ||x||

Page 179: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. OPERADORES ADJUNTOS. 167

Demostracion 10.47. Tomemos

||A (x)|| = ||x|| ·∣∣∣∣

∣∣∣∣A(

x

||x||

)∣∣∣∣

∣∣∣∣

ya que A es lineal. Por otro lado es claro que si ||y|| = 1, se tiene que

||A (y)|| ≤ sup‖y‖=1

||A (y)|| ,

por definicion de supremo. De donde se sigue que

||A (x)|| ≤ ||x|| · ||A||

Con esta norma es posible entonces demostrar que el espacio L (E,F ) es a suvez espacio de Banach, esto se ve en el siguiente teorema, que no demostraremos.

Teorema 10.48. Sea (L (E,F ) , ‖ · ‖L) el espacio nomado de las transforma-ciones lineales y continuas de E a F . Entonces si F es un espacio de Banach,(L (E,F ) , ‖ · ‖L) es de Banach.

Observemos que ‖ · ‖L es una norma en el espacio asociado, es una norma parael espacio de funciones lineales. Si E = F , este espacio tiene un trato especial.Podemos definir

Definicion 10.49. Sea E espacio de Hilbert y L (E) = L (E,E) . Con la norma

‖ A ‖= sup‖x‖E=1

‖ A(x) ‖E, L (E)

es el espacio de Banach de las funciones de E en E lineales y continuas.

Ahora vamos a introducir el concepto de operador adjunto. Para esto, veamosque en los espacios de Banach podemos construir un producto escalar. Sea A ∈L (E) . Podemos construir la forma bilinealB (x, y) = (Ax, y) con x, y ∈ E. Tenemosentonces la siguiente prposicion.

Proposicion 10.50. Si E es un espacio de Hilbert real, entonces B es unaforma bilineal continua sobre E × E. (Si E es complejo, B es una forma bilinealcontinua sobre E, para y ∈ E fijo).

Demostracion 10.51. B es bilineal ya que A es lineal y (·, ·) es bilineal. B escontinua, ya que

| B (x, y) | = | (Ax, y) | ≤ ‖ A (x) ‖ · ‖ y ‖ por la desigualdad de Schwarz,

≤ ‖ A ‖ · ‖ x ‖ · ‖ y ‖ por ser A lineal.

Entonces

sup‖x‖=1,‖y‖=1

| B (x, y) |≤ sup‖x‖=1,‖y‖=1

‖ A ‖ · ‖ x ‖ · ‖ y ‖

y como A es acotado, se tiene que

sup‖x‖=1,‖y‖=1

| B (x, y) |≤‖ A ‖,

es decir B tambien es acotado.

Page 180: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

168 10. ESPACIOS DE HILBERT Y BANACH

Ejemplo 10.52. Sea (ℜn, (·, ·)) con su producto canonico. Sea A la matrizrepresentativa de una transformacion lineal. Entonces (Ax, y) = Ax · y. Vamos atomar como ejemplo a la matriz.

A =

(−1 21 0

)

entonces Ax ·y = (−l1 +2l2, l1) · (m1,m2) = −l1m1 +2l2m1 + l1m2 para x = (l1, l2)y y = (m1,m2)

Ejemplo 10.53. Sea E = L2 =(l0, l1, · · · ) | li ∈ ℜ tal que

∑∞i=0 l

2i <∞

y

supongamos que los numeros li son los coeficientes de Fourier de alguna funcionsuave f . Un operador seria la derivada de f . Como f es suave, su derivada tambientiene una representacion de Fourier y por lo tanto la derivada es un operador linealtal que d/dx = A : E → E. Para ver un ejemplo, supongamos por simplicidadque f(x) = p(x) = a0 + a1x + a2x

2 + · · · , entonces los coeficientes aj = lj, paratoda j = 0, 1, · · · . La derivada de f sera f ′(x) = p′(x) = a1 + 2a2x + · · · , por loque la tranformacion lineal esta dada por A((l0, l1, l2, · · · )) = (l1, 2l2, 3l3, · · · ) . Surepresentacion matricial es entonces

A =

0 1 0 00 0 2 0 · · ·0 0 0 3

.... . .

ya que

A

l0l1l2...

=

l12l23l3...

Ejemplo 10.54. Sea Fp ([0, 2π]) el conjunto de las funciones periodicas en[0, 2π]. Como ya vimos un sistema ortonormal completo de este espacio es

xjj∈I =

1√2π,

1√π

sin(jx),1√π

cos(jx)

j=1,··· ,n.

Cualquier funcion periodica en [0, 2π] puede escribirse como

f(x) =1√2π

+1√π

n∑

j=1

aj sin(jx) +1√π

n∑

j=1

bj cos(jx)

y su derivada sera

f ′(x) =1√π

n∑

j=1

jaj cos(jx) − 1√π

n∑

j=1

jbj sin(jx),

Page 181: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. OPERADORES ADJUNTOS. 169

por lo que la matriz (2n+ 1)× (2n+ 1) que representa esta transformacion es

(10.1) B =

0 0 0 0 0 00 0 0 · · · −1 0 · · · 00 0 0 0 −2 0

......

. . ....

0 0 0 0 0 −n0 1 0 · · · 0 0 00 0 2 0 0 0

.... . .

......

0 0 0 · · · n 0 0 · · · 0

Ejercicio 10.55. Encuentrar la representacion matricial de d2/dx2 en L2 yen Fp.

Ejercicio 10.56. Encuentrar la representacion matricial de 2d2/dx2−3d/dx+1 en L2 y en Fp.

Con estas bases podemos definir el operador adjunto de una funcion lineal, sudefinicion formal es como sigue.

Definicion 10.57. Sea A ∈ L (E) y (Ax, y) = (x,A∗y), con x, y ∈ E. A A∗

se le llama el operador adjunto de A.

Ejemplo 10.58. Vamos a tomar de nuevo el ejemplo 10.52. Como ya vimos,la matrix A cumple que (Ax, y) = (−l1 + 2l2) m1 + l1 m2, donde

A =

(−1 21 0

),

x = (l1, l2) y y = (m1,m2). Observemos ahora que de igual manera se tiene

(x,AT y) = x ·AT y = x · (−m1 +m2, 2m1) = (−l1 + 2l2) m1 + l1 m2,

por lo que en este caso A∗ = AT . En general veremos mas adelante que para todamatriz simetrica real, su matriz adjunta es la misma matriz original. En el caso dematrices complejas, si la matriz transpuesta conjugada es la misma que la matrizoriginal, esta es igula a su adjunta.

Ejercicio 10.59. Encontrar los operadores adjuntos de las matrices A y B delos ejercicios 10.55 y 10.56.

Definicion 10.60. Sea E espacio de Hilbert y A ∈ L (E). Entonces la normade

||A|| = sup‖x‖=1

|(Ax, y)| .

Las principales propiedades de los operadores adjuntos son que ellos son tambienfunciones lineales, su norma es la misma que la de la funcion original y el adjuntodel adjunto es la misma funcion de salida. Esto lo vemos en la siguiente proposicion.

Proposicion 10.61. Sea A∗ operador adjunto de A. Entonces1) A∗ ∈ L (E)2) ‖ A∗ ‖=‖ A ‖3) (A∗)∗ = A

Page 182: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

170 10. ESPACIOS DE HILBERT Y BANACH

Demostracion 10.62. Demostremos 1) y 3).1) A∗ es lineal. Sean x, y1, y2 ∈ E, α1, α2,∈ ℜ o C. Entonces

(x,A∗ (α1y1 + α2y2)) = (Ax, α1y1 + α2y2)

= α1 (Ax, y1) + α2 (Ax, y2)

= α1 (x,A∗y1) + α2 (x,A∗y2)

= (x, α1A∗y1) + (x, α2A

∗y2)

Ademas, si 2) se cumple, A∗ es acotado y por tanto continuo.3)

(x, (A∗)∗ y

)= (A∗x, y) , por la definicion de adjunto

= (y,A∗x) = (Ay, x) por las propiedades de (·, ·)= (x,Ay)

por lo tanto (A∗)∗ (y) = A (y)

Otras propiedades importantes de los operadores adjuntos se refieren a la sumade adjuntos, el producto por una constante y la composicion de adjuntos, estas son.

Proposicion 10.63. Sean A,B ∈ L (E). α ∈ C1) (A+B)

∗= A∗ +B∗

2) (αA)∗ = α · A∗

3) (A B)∗

= B∗ A∗

Ejercicio 10.64. Demostrar la proposicion

Finalmente vamos a definir los operadores autoadjuntos, estos son muy impor-tantes en fısica y quımica; se definen como sigue.

Definicion 10.65. Sea E espacio de Hilbert y A ∈ L (E) .· Si A = A∗, A se llama operador autoadjunto.· Si A = −A∗, A se llama operador anti-autoadjunto.

Los operadores autoadjuntos o anti-autoadjuntos son los mas interesantes enfısica. En la teorıa cuantica aparecen estos operadores muy amenudo. Normalmentelos operadores diferenciales cumplen con esta propiedad. Veamos algunos ejemplos.

Ejemplo 10.66. En los ejemplos 10.1, el operador diferencial B es anti-autoadjunto,ya que B = −BT .

Ejemplo 10.67. Sea E espacio euclidiano y f : E E lineal y continua. f lorepresentamos por la matriz A. Si f es autoadjunto, la representacion de A cumplecon

(Ax, y) = (Ax)Ty = xTAT y = (x,Ay) = xTAy.

De donde se sigue el siguiente lema.

Lema 10.68. En un espacio euclidiano, todo operador autoadjunto tiene unarepresentacion con una matriz simetrica, i.e. AT = A. Asi mismo, un operadoranti-autoadjunto tiene una representacion con una matriz antisimetrica, i.e.AT = −A.

Lema 10.69. En un espacio unitario, todo operador autoadjunto tiene una rep-resentacion con una matriz hermitiana, i.e. AT = A† = A. Asi mismo, unoperador anti-autoadjunto tiene una representacion con una matriz antihermi-tiana, i.e. A† = −A.

Page 183: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. OPERADORES ADJUNTOS. 171

Ejercicio 10.70. Demostrar los lemas 10.68 y 10.69.

Page 184: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 185: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 11

ESPACIOS CON MEDIDA

1. Medida

Dentro del analisis, los espacios con medida juegan un papel muy importante.Estos espacios son la base de la teorıa de probabilidad y estadıstica, de los espaciosL2, etc. Aqui nos enfocaremos a los espacios L2, veremos primero su definicion yluego aplicaciones a las funciones especiales, que son solucion de ecuaciones difer-enciales importantes en fısica, quımica, ingenierıa, matemamticas, etc. Vamos aintroducir la definicion de algebra-σ para poder introducir la definicion de medida.Entonces epecemos con la siguiente definicion.

Definicion 11.1. Sea Ω conjunto P (Ω) el conjunto potencia de Ω. Sea F ⊆P (Ω). F se llama algebra sobre Ω si

1) φ ∈ F2) A ∈ F implica Ac ∈ F3) A1, A2 ∈ F implica A1 ∪A2 ∈ FNo hay que confundir el nombre algebra sobre algun conjunto con el de algebra

en el sentido algebraico. El nombre es el mismo, aunque las definiciones no tienennada que ver. En adelante no habra confucion, ya que el concepto que realmenteusaremos en esta seccion es el de algebra-σ, esta se define como sigue.

Definicion 11.2. F se llama algebra-σ sobre Ω si valen 1), 2) y3’) A1, A2, · · · ∈ F implica ∪∞i=1Ai ∈ FEn ocaciones el inciso 1) de la definicion de algebra puede cambiarse por1’) Ω ∈ F .Obviamente el inciso 1’) y 2) implican 1), por lo que las definiciones son equiv-

alentes. Observemos tambien que una algebra−σ sobre Ω es una algebra sobreΩ.

Vamos a ver algunos ejemplos.

Ejemplo 11.3. .1) El conjunto potencia completo es siempre una algebra o una algebra-σ sobre

el conjunto original, esto es F = P (Ω) es siempre una algebra σ sobre Ω.2) El conjunto formado por el conjunto original y el vacio, son una algebra-σ

F = φ,Ω.Ejemplo 11.4. F = φ,A,Ac,Ω para A 6= φ y A ⊂ Ω es tambien una algebra-

σ sobre Ω.

Ejemplo 11.5. Sea Ω = a, b, c, d, entonces una algebra-σ sobre Ω esta dadapor F1 = φ, a, b, c, d, a, b, c, d . Otra algebra-σ esF2 = φ, a, b , a, b, c, d, b, c, d, a, c, d,Ω, etc.

173

Page 186: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

174 11. ESPACIOS CON MEDIDA

Ejercicio 11.6. Demostrar que los ejemplos anteriores son algebras sobre Ω.

Comentario 11.7. Observemos que en la definicion de algebra, las unionesentre conjuntos ∪ puede cambiarse por intersecciones ∩.

Ejercicio 11.8. Demostrar la observacion 11.7 anterior.

La interseccion infinita de algebras-σ, es a su vez algebra-σ. Esto lo veremosen la siguiente proposicion.

Proposicion 11.9. Sean Fii∈I una familia de algebras-σ e I un conjunto deındices. Entonces ∩

i∈IFi tambien es algebra-σ.

Demostracion 11.10. Sean Fii∈I una familia de algebras-σ, entonces:1) φ ∈ Fi para toda i ∈ I esto implica que φ ∈ ∩

i∈IFi

2) A ∈ ∩i∈IFi sı y solo sı A ∈ Fi para toda i ∈ I. Puesto que Fi es una

σ-Algebra se sigue que Ac ∈ Fi para toda i ∈ I sı y solo sı Ac ∈ ∩i∈IFi.

3) Sean A1, A2 ∈ ∩i∈IFi sı y solo sı A1, A2 ∈ Fi para toda i ∈ I esto implica

que A1 ∪A2 ∈ Fi para toda i ∈ I sı y solo sı A1 ∪A2 ∈ ∩i∈IFi, analogicamente para

∪j∈I

Aj

En lo que sigue vamos a introducir las algebras-σ sobre los espacios metricos.Para esto introduciremos una definicion importante, para que con ella podemosdefinir el algebra σ de Borel.

Definicion 11.11. Sea E ⊂ P(Ω). Se define σ(E) = ∩i∈IFi, donde Fi son

algebras-σ, con E ⊂ Fi.Esta definicion pretende construir el algbra-σ mas pequena de un conjunto

arbitrario. La definicion anterior puede interpretarse de la siguiente manera. SeaΩ conjunto y E ⊂ P(Ω). Supongamos que E no es algebra-σ. Entonces, si E es unsubconjunto del conjunto potencia donde φ /∈ E , entonces se construye E ′ = E∪φ. SiE es tal que no todos los complementos de sus conjuntos pertenecen a E , entonces seconstruye E” con todos los complementos faltantes y ası, hasta formar una algebra-σ mınima, esta es σ(E). Este proceso equivale a tomar la interseccion de todas lasalgebras σ sobre Ω, es decir, segun la definicion anterior, equivale a tomar σ(E).

Ya estamos listos para introducir las algebra-σ sobre espacios metricos, lascuales tienen una importancia especial, estas se definen de la forma siguiente.

Definicion 11.12. Sea (M,ρ) espacio metrico, y sea E = U ⊆M | U abierto.A σ (E) se le llama algebra-σ de los conjuntos de Borel de M.

Ejemplo 11.13. Sea (ℜ, ρ) el espacio metrico real. Entonces

E = U ⊆ ℜ | U intervalo abierto de ℜ .Como los complementos de los intervalos abiertos son uniones de intervalos cerra-dos, σ (E), y por tanto, los conjuntos de borel de los reales, estara formado por elconjunto de los intervalos abiertos, union los intervalos cerrados, union todos losnumeros reales, union el conjunto vacio.

Ejemplo 11.14. Sea X = a, b. Un ejemplo de conjuntos abiertos (topologi-cos) de X son τX = φ, a , a, b. Entonces los conjunto de Borel de τX sonσ(τX) = φ, a , a, b , b.

Page 187: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. MEDIDA 175

Ejercicio 11.15. Sea E = bolas en ℜn. Construir σ (E) y demostrar que esuna algebra-σ explıcitamente.

Ahora ya estamos en posicion de definir espacio medible y medida. Comoveremos, en estos espacios podemos definir funciones especiales ortogonales y seriesde Fourier con estas funciones. Vamos a iniciar con los espacios medibles.

Definicion 11.16. Sea Ω un conjunto. A la upla (Ω,F) con Ω 6= φ y Falgebra−σ sobre Ω se le llama espacio medible.

Definicion 11.17. Una funcion µ : F → [0,∞) se le llama medida si1) µ (φ) = 02) Para una secuencia A1, A2, · · · ,∈ F tal queAi ∩Aj = φ i 6= j, se sigue µ (∪∞i=1Ai) =

∑∞i=1 µ (Ai) .

Definicion 11.18. Al triplete de (Ω,F , µ) con (Ω,F) espacio medible y µ me-dida, se le llama espacio con medida.

Algunas de las propiedades mas importantentes de los espacios con medida sonlas siguientes.

Lema 11.19. Una medida µ sobre (Ω,F) es finitamente aditiva.

Demostracion 11.20. Sean A1, · · · , An ∈ F disjuntos con Ai = φ para todai = n+ 1, · · · . Se sigue entonces que ∪ni=1Ai = ∪∞i=1Ai, esto implica que

µ (∪ni=1Ai) = µ (∪∞i=1Ai) =

∞∑

i=1

µ (Ai) =

n∑

i=1

µ (Ai)

Comentario 11.21. La medida µ > 0 por definicion.

Proposicion 11.22. Sean A,B ∈ F , µ medida sobre (Ω,F), espacio medible.Entonces

a) µ (A ∪B) ≤ µ (A) + µ (B)b) Si A ⊆ B, se sigue µ (A) ≤ µ (B)c) Si A ⊆ B con µ (A) <∞ se sigue que µ (B\A) = µ (B)− µ (A)

Demostracion 11.23. Primero demostremos b)b) A ⊆ B implica que B = A ∪ (B\A). Se tiene que µ (B) = µ (A ∪ (B\A))Entonces

µ (B) = µ (A) + µ (B\A) .

Pero µ ≥ 0 implica µ (B) ≥ µ (A)a) A,B ∈ F A ∪B = A ∪ (B\A)Entonces

µ (A ∪B) = µ (A) + µ (B\A)

por lema 0.41. Pero B\A ⊆ B. Por b) µ (B\A) ≤ µ (B) lo que implica que

µ (A ∪B) ≤ µ (A) + µ (B) .

c) µ (B) = µ (A ∪ (B\A)) = µ (A) + µ (B\A),entonces

µ (B\A) = µ (B)− µ (A)

Page 188: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

176 11. ESPACIOS CON MEDIDA

Veamos algunas medidas especiales que usaremos en el resto del texto. Unasmedidas muy importantes son la medida de probabilidad y la medida de Dirac. Sudefinicion formal es como sigue.

Definicion 11.24. Una medida tal que µ (Ω) = 1 se llama medida de prob-abilidad.

Veamos el ejemplo de la medida de Dirac.

Ejemplo 11.25. Medida de Dirac. Sea (Ω,F) espacio medible y δx tal queδx : F [0,∞), con

δx (A) :=

1 si x ∈ A0 si x ∈ Ac

para toda A ∈ F . Veamos que δx es una medida. Primero es facil ver que δx (Ω) =1, por lo que δx es una medida de probabilidad, ademas, es claro que δx (A) ≥ 0para toda A ∈ F . Sean A1, A2, · · · , Ai, · · · ∈ F con Ai ∩Aj = φ i 6= j, entonces

δx

(∪i∈IAi

)= 1

sı y solo sı x ∈ ∪i∈IAi, esto es sı y solo sı existe algun Ai tal que x ∈ Ai, pero noen los restantes Aj , j 6= i, esto implica que

δx

(∪i∈IAi

)=

∞∑

i=1

δx (Ai) = 1

Por otro lado, δx (∪i∈IAi) = 0, sı y solo sı x ∈ (∪i∈IAi)c, esto es sı y solo sıx ∈ ∩i∈IAci , sı y solo sı x ∈ Aci para toda i, lo que implica que δx (Ai) = 0 paratoda i. Por lo tanto

∞∑

i=1

δx (Ai) = 0, i.e. δx

(∪i∈IAi

)=

∞∑

i=1

δx (Ai)

Ejemplo 11.26. Sean ℜ los reales y F los conjuntos de Borel en los reales.Entonces la funcion l1 : F → ℜ+ tal que l1 es la longitud del intervalo, es decirl1((a, b)) = b − a, es una medida. Veamos esto: l1 (φ) = 0, ademas, si A1 yA2 son dos intervalos disjuntos, se tiene que l1 (A1 ∪A2) = l1 ((a, b) ∪ (c, d)) =d− a− (c− b) = b − a + d− c = l1 ((a, b)) + l1 ((c, d)). A esta medida se le llamala medida de Lebesgue.

Ejemplo 11.27. Sea Ω = a, b, c, d y

F = φ, a, b , a, b, c, d, a, c, d, b, c, d,Ω .Entonces la funcion µ : F → [0,∞), tal que µ(A) = numero de elementos de A.Esto implica que µ(φ) = 0 y

µ(a ∪ b) = µ(a, b) = 2 = µ(a) + µ(b).Ademas

µ(a ∪ c, d) = µ(a, c, d) = 3 = µ(a) + µ(c, d),µ(b ∪ c, d) = µ(b, c, d) = 3 = µ(b) + µ(c, d),µ(a ∪ b, c, d) = µ(a, b, c, d) = 4 = µ(a) + µ(b, c, d).Por otro lado,µ(a ∪ a, b) = µ(a, b) = 2 < µ(a) + µ(a, b),etc. Por tanto µ(A) es una medida.

Page 189: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. INTEGRACION EN ESPACIOS CON MEDIDA 177

Ejemplo 11.28. Si en el ejemplo anterior definimos µ : F → [0,∞), tal queµ(A) =numero de elementos de A/4, µ(A) se vuelve una medida de probabilidad.

Ejemplo 11.29. Sea (Ω,F) espacio medible (xk)k=1,··· ,∞ una serie en Ω y

(ck)k=1···∞ una sucesion de numeros (ck)k=1,··· ,∞ ⊆ [0,∞). Tomamos µ =∑∞

k=1 ckδxk.

Entonces µ es una medida llamada la medida discreta. Si ademas∑∞k=1 ck = 1,

µ se llama medida discreta de probabilidad.

Ejercicio 11.30. Demuestren que µ =∑∞k=1 ckδxk

es una medida.

Ejercicio 11.31. Sea (ℜ, E) espacio medible, A ⊂ E los conjuntos de Borel deℜ y h : ℜ → ℜ real, positiva e integrable en A. Demuestren que µ(A) =

∫A h dx es

una medida.

2. Integracion en espacios con Medida

En esta seccion veremos como se puede integrar en espacios con medida. Real-mente estamos interesados en la integracion de Lebesgue y para ello tenemos queintroducir algunas definiciones. Empecemos por la definicion de funcion indicadora.

Definicion 11.32. Sea δx (A) la medida de Dirac. La funcion indicadoraχA se define como χA : Ω [0,+∞), x χA (x) = δx (A) .

De hecho, toda funcion para la cual la imagen inversa de los conjuntos deBorel es un elemento de la algebra-σ en el conjunto, se le llama funcion medible,formalmente esta se define como

Definicion 11.33. Sea (Ω,F) espacio medible. A toda funcion f : Ω ℜ sele llama funcion medible, si f−1(X) ∈ F , para toda X ∈ E .

Ejemplo 11.34. Vamos a ver aqui que las funciones indicadoras χA son fun-ciones medibles. Veamos primero que, para una A fija se tiene que χA(x) = δx(A) :Ω → ℜ. Observemos que esta funcion es 1 para toda x ∈ A, y 0 de lo contrario.De hecho χA es una funcion escalon. Sea X ∈ E, y veamos cuanto vale χ−1

A (X).Se tiene que, X = 1 o X = 0. Entonces

χ−1A (1) = A ∈ F y χ−1

A (0) = Ac ∈ Fpor lo que χA es una funcion medible.

Finalmente, la integracion en espacios con medida se hara en base a las fun-ciones simples, su definicion es

Definicion 11.35. Sea (Ω,F) espacio medible y sea fn una funcion medibleahı. fn se dice simple si existen a1, · · · , an ∈ ℜ con n ≥ 1, A1, · · · , An ∈ F talque

fn =

n∑

i=1

aiχAi

en el espacio medible (Ω,F) .

Esto quiere decir que toda funcion simple se puede escribir como la super-posicion de funciones indicadoras por cada intervalo. Las funciones simples estanformadas por porsiones constantes en cada intervalo Ai para i = 1, · · · , n. Lo masinteresante de las funciones medibles es que ellas pueden escribirse como el lımitede funciones simples. Esto lo veremos en la siguiente proposicion.

Page 190: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

178 11. ESPACIOS CON MEDIDA

Proposicion 11.36. Sea f medible, f ≥ 0. Entonces existe (fn)n=1,...,∞ con

1) fn : Ω→ ℜ para todo n2) fn simple para todo n3) fn > 0 para todo n4) fn ≤ fn+1 para todo n5) f = lim

n→∞fn

Demostracion 11.37. Vamos a construir las funciones (fn)n=1,··· ,∞. Seanlas funciones

fn =

4n∑

i=1

i− 1

2nχf−1([ i−1

2n , i2n )) + 2nχf−1([2n,∞))

las cuales se puede tambien descomponer en sus partes. Sea ω ∈ Ω, se obtiene:

fn (ω) =

i−12n para i−1

2n ≤ f (ω) < i2n con i = 1, · · · , 4n

2n para f (ω) ≥ 2n

Claramente esta funcion cumple con las condiciones 1) a 4) de la proposicion.Queda por demostrar que f = lim

n→∞fn. Sea ω ∈ f−1

([i−12n ,

i2n

)), esto implica que

fn (ω) = i−12n , por la definicion de fn. Se tiene que:

i− 1

2n≤ f (ω) <

i

2n,

y por tanto

0 ≤ |fn (ω)− f (ω)| ≤ 1

2n

lo que implica quelimn→∞

fn = f (ω)

Vean la figura 1 donde se muestra un ejemplo de las funciones simples f .

Definicion 11.38 (Integral de Lebesgue de funciones simples). Sea (Ω,F , µ)espacio con medida y fn : (Ω,F) (ℜ, E), funcion simple donde E es la algebra-σde Borel de ℜ. Sea Ak = x ∈ Ω | fn (x) = ck ∈ ℜ k = 1, · · · , n. Se define

Ω

fn (ω)µ (dω) :=

n∑

k=1

ckµ (Ak)

En general, puede tomarse cualquier secuencia (Bi)i=1,...,n de elementos de F .La integral de Lebesgue tiene varias propiedades, vamos a enumerar y demostraralgunas de ellas.

Proposicion 11.39. Sean f1,y f2 funciones simples. Entonces1)∫

(α1f1 + α2f2)µ(dω) = α1

∫f1µ(dω) + α2

∫f2µ(dω)

2) Si 0 ≤ f1 ≤ f2, entonces∫f1µ(dω) ≤

∫f2µ(dω)

Es decir, la integral es un funcional lineal y monotona.

Demostracion 11.40. Solo veremos una idea de la demostracion.1) Se sigue por construccion. Sea

bi =

b1i 1 ≤ i ≤ k1

b2i − k1 k1 + 1 ≤ i ≤ k2 + k1f1 + f2 =

k1+k2∑

i=1

biχBi.

Page 191: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. INTEGRACION EN ESPACIOS CON MEDIDA 179

0

0.5

1

1.5

2

2.5

3

3.5

4

4.5

-1 0 1 2 3 4 5 6

f

x

f

f1

0

0.5

1

1.5

2

2.5

3

3.5

4

4.5

-1 0 1 2 3 4 5 6

f

x

f

f2

Figure 1. La funcion f = 18x

3 − x2 + 2x+ 32 (linea continua) y

sus correspondientes funciones simples (cruces) f1, en al figura dearriba y f2, en al figura de abajo. Las fn se aproximan a la funcionoriginal f para n grande. En estas dos figuras esto es muy notorio.

entonces

∫(f1 + f2)µ(dω) =

k1+k2∑

i=1

biµ (Bi)

=

k1∑

i=1

b1iµ(B1i

)+

k2∑

i=1

b2iµ(B2i

)

=

∫f1µ(dω) +

∫f2µ(dω).

2) Tenemos f2 − f1 ≥ 0, f2 = (f2 − f1) + f1

Page 192: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

180 11. ESPACIOS CON MEDIDA

Entonces

0 ≤∫f2µ(dω) =

∫(f2 − f1)µ(dω) +

∫f1µ(dω),

pero∫

(f2 − f1)µ(dω) ≥ 0 por lo tanto∫f2µ(dω) ≥

∫f1µ(dω).

Despues de esta proposicion ya estamos en posicion de definir la integral deLebesgue. Esta se realiza utilizando funciones simples, esto es:

Definicion 11.41 (Integral de Lebesgue). Sea f : (Ω,F) (ℜ, E) funciony (Ω,F) espacio medible y E el algebra-σ de Borel. Sea (fk)k=1,··· ,n una serie defunciones simples, tal que fk ≤ fk+1 para toda k, y f = lim

k→∞fk. Entonces:

∫f (ω)µ (dω) := lim

n→∞

∫fn (ω)µ (dω) .

Debido a la proposicion anterior, aqui tambien se sigue que la integral es linealy monotona. El teorema mas importante correspondiente a la integral de Lebesgue,el cual daremos sin demostracion, es el siguiente.

Teorema 11.42 (de Lebesgue). Sean g, fn : (Ω,F) (ℜ, E) tal que | fn |≤ gpara toda n,

∫gµ(dω) es finita y f = lim

n→∞fn. Se sigue que

∫fµ(dω) = lim

n→∞

∫fnµ(dω)

es decir, f es integrable y∫fµ(dω) es finita.

Para comprender el teorema y aprender a manipular la integral de Lebesgue,es conveninte ver algunos ejemplos simples.

Ejemplo 11.43. Sea (ℜ, E) el espacio medible con E el algebra-σ de Borel yl1 : E [0,+∞) tal que l1 ((a, b)) = b− a (con a < b por facilidad) es la medida deLebesgue. Entonces, si f : ℜ ℜ, se tiene

(a,b)

f(x)l1 (dx) =

∫ b

a

f (x) dx

Vamos a explicar este punto. Sabemos que existe una serie de funciones simplesfk con f = lim

n→∞fn tal que en los intervalos Ak, la funcion sea constante, es decir,

Ak = (ak, bk) = x ∈ Ω | fk (x) = ck ∈ ℜ. Se sigue que∫

(a,b)

f (x) l1 (dx) = limn→∞

∫fn (x) l1 (dx)

= limn→∞

n∑

k=1

ckl1 (Ak)

= limn→∞

n∑

k=1

fk(x) (bk − ak) =

∫ b

a

f (x) dx.

Es decir, la integral de Lebesgue con la medida de Lebesgue es la integral de Rie-mann.

Page 193: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. ESPACIOS Lp 181

Ejemplo 11.44. Sea (ℜ, E) el espacio medible con E el algebra-σ de Borel yµ : E [0,+∞) tal que µ (A) =

∫A h dx con h : ℜ ℜ. Entonces, si f : ℜ ℜ,

se tiene ∫

(a,b)

f(x)µ (dx) =

∫ b

a

f (x) h(x)dx

Tomemos de nuevo la serie de funciones simples fk con f = limn→∞

fn tal que en

los intervalos Ak, la funcion sea constante, es decir, Ak = (ak, bk) = x ∈ Ω | fk (x) = ck ∈ ℜ.Se sigue que

(a,b)

f (x)µ (dx) = limn→∞

∫fn (x)µ (dx)

= limn→∞

n∑

k=1

ckµ (Ak)

= limn→∞

n∑

k=1

ck

∫ bk

ak

h (x) dx

= limn→∞

n∑

k=1

ck limm→∞

m∑

l=1

h (xl)(bk − ak)

m.

Observemos que m se puede cambiar por n, ya que los dos van a infinito, aun mas,si adaptamos la segunda suma a la primera poniendo los puntos xl’s junto con losck’s, ya que los dos son contados por un numero infinito de puntos, obtenemos:

(a,b)

f (x)µ (dx) = limn→∞

n∑

k=1

ck

n∑

l=1

h (xl)(bk − ak)

n

= limn→∞

n∑

k=1

fk(x)h (xk)(bk − ak)

n

=

∫ b

a

f (x)h(x) dx.

Es decir, la integral de Lebesgue con la medida µ(A) =∫Ah dx es la integral de

Riemann con un peso.

Ejercicio 11.45. Realizar la misma integral pero con la medida de Dirac.

3. Espacios Lp

Finalmente vamos a introducir la definicion de espacios Lp, para despues dedi-carnos a estos espacios con p = 2. Para eso, vamos a introducir una relacion deequivalencia en los espacios con medida para poder definir los espacios que quere-mos.

Definicion 11.46. Sea (Ω,F) espacio medible y µ medida en (Ω,F) . Se defineL0 (Ω,F) = f : Ω ℜ | f es funcion medible, i.e. f−1 (X) ∈ F , para todaX ∈ E.

Se puede ver entonces que el espacio L0 forma un espacio vectorial con lasoperaciones canonicas entre funciones. Es decir:

Proposicion 11.47. L0 es un espacio lineal.

Page 194: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

182 11. ESPACIOS CON MEDIDA

Los espacios Lp se basan en el hecho de que los espacios de todas las funcionesmedibles se pueden separar en clases de equivalencia. La relacion de equivalenciaque separa estos espacios en clases se introduce en la siguiente definicion.

Definicion 11.48. Sean f, g,∈ L0 y µ medida. Sea ∼µ la relacion f ∼µ g siµ (x ∈ Ω | f(x) 6= g(x)) = 0, con µ medida en (Ω,F) .

Proposicion 11.49. La relacion ∼µ es de equivalencia

Demostracion 11.50. Veamos las tres condiciones de relacion de equivalencia1) f ∼µ f ya que µ (x ∈ Ω | f(x) 6= f(x)) = µ(φ) = 02) f ∼µ g implica que µ (x ∈ Ω | f(x) 6= g(x)) = 0, por tanto g ∼µ f3) Sean f, g, h ∈ L0 tales que f ∼µ g y g ∼µ h. Denotemos por

A = x ∈ Ω | f(x) = g(x),B = x ∈ Ω | g(x) = h(x)M = x ∈ Ω | f(x) = h(x)

Como f ∼µ g y g ∼µ h se sigue que µ(Ac) = 0 y µ(Bc) = 0. De lo anterior setiene que f = h sı y solo sı f = g y g = h asi que M = A ∩ B lo que implica queM c = Ac ∪Bc. Entonces

µ (x ∈ Ω | f(x) 6= h(x)) = µ(M c) = µ (Ac ∪Bc) ≤ µ (Ac) + µ (Bc) = 0

lo que implica que f ∼µ h.

Con esto ya podemos introducir la definicion de los espacios Lp, su definicionse basa en el conjunto de clases de equivalencia con la relacion ∼µ. Se definen comosigue.

Definicion 11.51. Sea L0 (Ω,F , µ) = L0 (Ω,F) / ∼µ . Se define

Lp = f ∈ L0 (Ω,F , µ)

∣∣∣∣∫

Ω

| f (x) |p µ (dx) , es finita,

de tal forma que Lp es un espacio normado, con la norma ‖ f ‖p=(∫

Ω| f |p µ(dx)

)1/p

La propiedad mas importante de estos espacios es que son espacios normadosy completos, o sea, de Banach. Vamos a enunciar este importante teorema sindemostracion:

Teorema 11.52. Para todo 1 ≤ p < ∞, Lp es lineal y completo, es decir, Lpes espacio de Banach.

Los casos especiales mas interesantes son sin dudap = 1, L1 = Espacio de las funciones integrables.p = 2, L2 = Espacio de Banach de las funciones cuadraticas integrables bajo la

medida µ.Estos dos espacios son de suma importancia en fısica, quımica, matematicas,

mecanica cuantica, etc. Particularmete, en L2 tambien es posible defirnir un pro-ducto interno, convirtiendo estos espacios en espacios de Hilbert. Esto se ve en lasiguiente proposicion.

Proposicion 11.53. L2 es un espacio de Hilbert con el producto escalar(f, g) =

∫Ωf (x) g (x)µ (dx)

Page 195: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. DESARROLLO DE FOURIER EN L2 183

Demostracion 11.54. Claramente las propiedades de producto escalar se cumplenpara (f, g) . Como LP es de Banach, es completo y lineal, por lo tanto es espaciode Hilbert con (f, g) su producto interno.

Observemos que en L2 la norma esta dada por

‖ f ‖L2=

(∫

Ω

| f |2 µ(dx)

)1/2

= [(f, f)]1/2

por lo que, la norma y el producto interno en estos espacios, son compatibles.Las generalizacion a espacios complejos se sigue del hecho que f = u + iv ,

en tal caso, usando la linealidad de la integral de Lebergue, se siguen las mismaspropiedaes equivalentemente como para f real.

4. Desarrollo de Fourier en L2

Los espacios de interes para la fısica, como ya dijimos, son los espacios L2. Enestos espacios se definen las series de Fourier, entre otras. Vamos a dedicarles estaseccion dada su importancia. Empecemos con la siguiente definicion.

Definicion 11.55. Sea L2 = L2 (Ω,F , µ) espacio de Hilbert tal que existe unsistema (fi)i=1,...,n ortonormal completo. Sea f ∈ L2, cuyo coeficiente de Fourierestan dados por

ai = (f, fi) =

Ω

f (x) fi (x)µ (dx) .

A la serie f =∑∞i=1 aifi se le llama serie de Fourier de f.

Ejemplo 11.56. Consideramos el espacio L2 ([−π, π]) con la medida de Lebesgue.

Como ya hemos visto, el sistema Tn =

1√2π, 1√

πsin(kx), 1√

πcos(kx)

k=1,··· ,nes

ortonormal y es completo en

T ([−π, π]) = f | f (x) =

n∑

k=0

ak cos (kx) + bk sin (kx)

llamado el conjunto de las funciones trigonometricas. En general (Tn)n=1,...,∞es un sistema ortonormal completo en Lp.

Ejercicio 11.57. Demuestre que (Tn)n=1,...,∞ es un sistema ortonormal enL2.

Definicion 11.58. Sea E espacio de Hilbert y E una algebra-σ sobre E. Sedefine

B (E, E) = f : (E, E) ℜ | f es medible y acotadaCℜ (E) = f : E ℜ | f es continua y acotada

Se puede mostrar que Cℜ (E) ⊂ B (E, E) ⊂ Lp, y ambas son subconjuntoslineales de Lp. Es mas, estos espacios son densos, por lo que podemos acercarnostanto como queramos por medio de una base ortonomal completa a cada elementode estos espacios, esto se ve en la siguiente proposicion.

Proposicion 11.59. Sea E espacio de Hilbert y E los conjuntos de Borel delos reales.

1) B (E, E) es denso en Lp2) Cℜ (E) es denso en Lp

Page 196: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

184 11. ESPACIOS CON MEDIDA

Con esta proposicion se puede mostrar que T ([−π, π]) es denso en Lp ([−π, π]).Unos ejemplos de mucha importancia para la teorıa de ecuaciones diferenciales sonlos siguientes.

Ejemplo 11.60. El sistemafk =

1√2xeikx

k∈Z

es un sistema ortonormal completo en el espacio L2 complejo ([−π, π]) .

Ejemplo 11.61. El sistemaPn = cn ·

dn

dxn(x2 − 1

)n, con cn =

1

n! 2n

√2n+ 1

2

n∈N

es un sistema ortonormal completo en L2 ([a, b]) con la medida de Lebesgue. A estospolonomios se les llama Polinomios de Legendre.

Ejemplo 11.62. Tomemos L2 (ℜ, µ) con la medida

µ (A) =

A

h (x) dx,

A ∈ E con h (x) = e−x2

. Entonces el sistema1, x, x2, · · ·

es un sistema ortonor-

mal completo en este espacio. Si

Hn = ckex2 dn

dxne−x

2

n ≥ 0, L (H0, · · · , Hn) = L(

1, x, · · · , x2n).

A Hn se les llama los Polinomios de Hermite.

5. Funciones Especiales

Existen una serie de funciones que tienen caracteristicas muy particulares. Loimportante de estas funciones es que son solucion de diferentes ecuaciones diferen-ciales muy comunes en fısica, quımica, ingenierıa, etc., por eso su estudio requierede una seccion aparte. Hay una forma de estudiar todas estas funciones especialesde una forma unificada, es la version que adoptaremos aqui. Todas estas funcionestienen caracteristicas comunes y adoptando esta version unificada es posible estu-diar sus caracteristicas comunes de una sola vez.

Definicion 11.63 (Formula de Rodriques). Sea

(11.1) Pn(x) = cn1

h

dn

dxn(hsn),

tal que1) Pn es un polinomio de grado n y cn una constante.2) s(x) es un polinomio de raices reales de grado menor o igual a 23) h : ℜ → ℜ es una funcion real, positiva e integrable en el intervalo [a, b] ⊂ ℜ,

(llamada peso) tal que h(a)s(a) = h(b)s(b) = 0.

Con esta definicion es posible definir la mayoria de las funciones especiales mascomunes. Daremos algunos ejemplos.

Page 197: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. FUNCIONES ESPECIALES 185

Ejemplo 11.64. Los polinomios de Hermite Hn estan dados por h = e−x2

,s = −1, cn = 1, en el intervalo (−∞,∞), es decir

Hn(x) = (−1)nex

2 dn

dxn(e−x

2

)

por lo que los primeros terminos seran:H0 = 1,H1 = 2x,H2 = 2− 4x2,H3 = 4x(−3 + 2x2),H4 = 12− 48x2 + 16x4, etc.

Ejemplo 11.65. Los polinomios de Legendre Pn estan dados por h = 1, s =

1− x2, cn = 1n! 2n

√2n+1

2 , en el intervalo [−1, 1], es decir

Pn(x) =(−1)

n

2nn!

dn

dxn((1− x2

)n)

por lo que los primeros terminos seran:P0 = 1, P1 = x,P2 = 1

2

(3x2 − 1

),

P3 = 12x(5x

2 − 3),

P4 = 18

(35x4 − 30x2 + 3

), etc.

Ejemplo 11.66. Los polinomios de Laguerre Ln dados por h = e−x, s = x,cn = 1, en el intervalo (−∞,∞), es decir

Ln(x) = exdn

dxn(xne−x)

por lo que los primeros terminos seran:L0 = 1,L1 = −x+ 1,L2 = x2 − 4x+ 2,L3 = −x3 + 9x2 − 18x+ 6,L4 = x4 − 16x3 + 72x2 + 96x+ 24, etc.

Ejercicio 11.67. Escriba los primeros 4 terminos y de una ecuacion diferencialcaracteristica de los polinomios de Tchebichef de primera clase Tn dados porh = (1− x2)−1/2, s = 1− x2, en el intervalo [−1, 1].

Ejercicio 11.68. Escriba los primeros 4 terminos y de una ecuacion diferencialcaracteristica de los polinomios de Jacobi P ν,µn dados por h = (1− x)ν(1 + x)µ,ν > −1, µ > −1, s = 1− x2, en el intervalo [−1, 1] .

Ejercicio 11.69. Escriba los primeros 4 terminos y de una ecuacion diferencialcaracteristica de los polinomios de Gegenbauer Cλn dados por h = (1−x2)λ−1/2,λ > − 1

2 , s = 1− x2, en el intervalo [−1, 1] .

Ejercicio 11.70. Escriba los primeros 4 terminos y de una ecuacion diferencialcaracteristica de los polinomios de Tchebichef de segunda clase Un dados porh = (1− x2)1/2, s = 1− x2, en el intervalo [−1, 1] .

Todos estos polinomios especiales tienen la caracteristica de formar sistemascompletos en el espacio de funciones suaves. En fısica y quımica, las ecuaciones

Page 198: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

186 11. ESPACIOS CON MEDIDA

diferenciales anteriores son muy comunes y como sus soluciones forman sistemascompletos, podemos escribir las funciones suaves como combinacion lineal de estasfunciones especiales. Esta proceso es muy conveniente cuando se trabaja con estasecuaciones diferenciales. Para ver que estas forma sistemas completos, mostraremosprimero una serie de proposiciones.

Proposicion 11.71. Sea s, polinomio de grado dos y h funcion real, positivae integrable. Denotemos por pk a un polinomio arbitrario de grado k, entonces

(11.2)dm

dxm(hsnpk) = hsn−mpk+m

Demostracion 11.72. Primero observemos que para n = 1 en (11.1), secumple que

P1(x) = c11

h

d

dx(hs) = c1s

1

h

dh

dx+ c1

ds

dx,

de donde que

sdh

dx= h

(1

c1P1 −

ds

dx

).

Ahora tomemos la derivada

d

dx(hsnpk) = snpk

dh

dx+ hnsn−1pk

ds

dx+ hsn

dpkdx

= sn−1h

[pk

(1

c1P1 + (n− 1)

ds

dx

)+ s

dpkdx

].

Como pk es cualquier polinomio de grado k y por definicion P1es un polinomiode grado 1 y s es un polinomio de grado 2, se tiene que

d

dx(hsnpk) = hsn−1pk+1.

Si se sigue derivando la expresion entre parentesis y siguiendo los mismos pasos,se llega al resultado.

Observemos que del resultado anterior se tiene que

Pn = cn1

h

dn

dxn(hsn) = cnpn.

De aqui es entonces facil demostrar que

Proposicion 11.73. Todas las derivadas dm

dxm (hsn) con m < n, son cero enx = a y x = b.

Demostracion 11.74. Como

dm

dxm(hsnpk)|x=a = h(a)sn−m(a)pk+m = 0.

Usando las prorposiciones anteriores ya podemos demostrar el teorema prin-cipal de esta seccion que afirma que todo polinomio deducible de una formula deRodrigues, forma un conjunto ortonormal completo (una base ortonormal) en elespacio de Hilbert correspondiente.

Page 199: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. FUNCIONES ESPECIALES 187

Teorema 11.75. Sea

Pn(x) = cn1

h

dn

dxn(hsn).

Entonces los polinomios Pnn=1,··· forman un sistema ortonormal completo enL2 ([a, b]) en el intervalo [a, b], con el producto interno

(f, g) =

A

f(x)g(x)h(x)dx.

Demostracion 11.76. Es claro que L (P0, · · · ,Pn) = L (1, x, · · · , xn) , yaque ambos forman una base del espacio de polinomios de grado n. Veamos quePnn=1,··· son ortonormales en L2 ([a, b]) con el producto interno

(Pn,Pm) =

A

Pn(x)Pm(x)h(x)dx.

Veamos primero que (pn,Pm) = 0 para todo polinomio pn con n < m. Como

(pn,Pm) = cm

A

pn(x)dm

dxm(hsm)dx

integramos por partes m veces, como todas las derivadas de hsn son cero, se tieneque

(pn,Pm) = cm

A

h(x)s(x)mdmpndxm

dx = 0.

Ahora bien, si en la integracion anterior n = m, obtenemos:

(11.3) (pn,Pn) = cn

A

h(x)s(x)ndnpndxn

dx = cnn! an

A

h(x)s(x)ndx,

donde an es el coeficiente principal del polinomio pn. Podemos escoger

1

cn= n! an

A

h(x)s(x)ndx

y entonces se tiene que (Pn,Pm) = δnm.

Es decir, basta con definir el producto interno para cada base de polinomios,para poder escribir la serie de Fourier correspondiente. Demos algunos ejemplos.

Ejemplo 11.77. Los polinomios de Hermite Hn estan dados por h = e−x2

,s = −1, cn = 1, en el intervalo (−∞,∞), su producto interno esta definido por

aj = (f,Hj) =

∫ ∞

−∞f(x)Hj(x)e

−x2

dx

entonces, cualquier funcion se puede escribir como f =∑∞i=1 aiHi.

Ejemplo 11.78. Los polinomios de Legendre Pn estan dados por h = 1, s =1−x2, cn = (−1)

n/ (2nn!), en el intervalo [−1, 1], su producto interno esta definido

por

aj = (f, Pj) =

∫ 1

−1

f(x)Pj(x)dx

entonces, cualquier funcion se puede escribir como f =∑∞

i=1 aiPj

Page 200: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

188 11. ESPACIOS CON MEDIDA

Ejemplo 11.79. Los polinomios de Laguerre Ln dados por h = e−x, s = x,cn = 1, en el intervalo (−∞,∞), su producto interno esta definido por

Ln(x) = aj = (f, Lj) =

∫ ∞

−∞f(x)Lj(x)e

−xdx

entonces, cualquier funcion se puede escribir como f =∑∞

i=1 aiLi

Ejercicio 11.80. Defina un producto interno de los polinomios de Tchebichefde primera clase Tn.

Ejercicio 11.81. Defina un producto interno de los polinomios de Jacobi P.

Ejercicio 11.82. Defina un producto interno de los polinomios de GegenbauerCλn .

Ejercicio 11.83. Defina un producto interno de los polinomios de Tchebichefde segunda clase Un.

Todos esto polinomios son solucion de alguna ecuacion diferencial. La ecuaciondiferencial correspondiente se da en el siguiente teorema.

Teorema 11.84. Sea

Pn(x) = cn1

h

dn

dxn(hsn),

entoncesd

dx

(shdPndx

)+ λnhPn = 0

donde λn es un coeficiente dado por

λn = −n[

1

c1

dP1

dx+

1

2(n− 1)

d2s

dx2

]

Demostracion 11.85. Observemos que

1

h

d

dx

(shdPndx

)=

1

h

d

dx(shpn−1)

donde pn−1 es un polinomio de grado n− 1. Por (11.2) se tiene que

1

h

d

dx

(shdPndx

)= pn.

Entonces podemos escribir esta relacion como una combinacion lineal de polinomiosPj, es decir

(11.4)d

dx

(shdPndx

)= −h

n∑

j=0

λjnPj .

Multiplicamos esta ecuacion en ambos lados por Pm, con m < n e integramos

A

Pmd

dx

(shdPndx

)dx = −

n∑

j=1

λjn

A

hPjPmdx = −n∑

j=1

λjnδjm = −λmn

Page 201: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. FUNCIONES ESPECIALES 189

mientras que si integramos dos veces por partes el lado izquierdo, obtenemos∫

A

Pmd

dx

(shdPndx

)dx = −

A

(d

dxPm

)shdPndx

dx

=

A

[1

h

d

dx

(sh

d

dxPm

)]Pnhdx = 0,

ya que de nuevo llegamos a un polinomio de grado m < n dentro del parentesiscuadrado. Entonces (11.4) se puede escribir como

d

dx

(shdPndx

)= −hλnnPn := −hλnPn.

De nuevo calculamos la integral∫

A

Pmd

dx

(shdPndx

)dx,

pero ahora para m = n, se tiene:∫

A

Pnd

dx

(shdPndx

)dx =

A

Pn

[d

dx(sh)

dPndx

+ shd2Pn

dx2

]dx

=

A

Pn

[1

c1P1(x)

dPndx

+ sd2Pn

dx2

]hdx

ya que

P1(x) = c11

h

d

dx(hs).

Ahora supongamos que P1(x) = l0+l1x, s(x) = s0+s1x+s2x2 y Pn(x) = anx

n+· · · ,entonces la integral sera

A

Pnd

dx

(shdPndx

)dx =

A

Pn

[1

c1(l1annx

n + · · · ) + (s2ann (n− 1)xn + · · · )]hdx

=

[1

c1l1n+ s2n (n− 1)

]∫

A

anxnPnhdx+

A

Kxn−1Pnhdx+ · · ·

donde K es alguna constante. Sin embargo, como podemos ver en (11.3 ), solo losterminos de grado n del polinomio pn son diferentes de cero. Entonces

A

Pnd

dx

(shdPndx

)dx =

[1

c1l1n+ s2n (n− 1)

]∫

A

PnPnhdx

por lo que

λn = −[

1

c1l1n+ s2n (n− 1)

]= −n

[1

c1

dP1

dx+

1

2(n− 1)

d2s

dx2

]

Ejemplo 11.86. Los polinomios de Hermite Hn estan dados por h = e−x2

,s = −1, cn = 1, por lo que los primeros terminos son: H0 = 1, H1 = 2x, etc.Entonces

dH1

dx= 2,

d2s

dx2= 0.

Se tiene que λn = −2n, la ecuacion diferencial sera

d

dx

(−e−x2 dHn

dx

)− 2ne−x

2

Hn = 0

Page 202: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

190 11. ESPACIOS CON MEDIDA

o sead2

dx2Hn − 2x

d

dxHn + 2nHn = 0

para toda n = 0, 1, · · · . A esta ecuacion diferencial se le conoce como la ecuaciondiferencial de Hermite.

Ejemplo 11.87. Los polinomios de Legendre Pn estan dados por h = 1, s =1 − x2, c1 = −1/2, por lo que los primeros terminos son: P0 = 1, P1 = x, etc.Entonces

dP1

dx= 1,

d2s

dx2= −2.

Se tiene que λn = −n [−2− (n− 1)] la ecuacion diferencial sera

d

dx

((1− x2

) dPndx

)+ n (n+ 1)Pn = 0

o sea(1− x2

) d2

dx2Pn − 2x

d

dxPn + n (n+ 1)Pn = 0

para toda n = 0, 1, · · · . A esta ecuacion diferencial se le conoce como la ecuaciondiferencial de Legendre.

Ejemplo 11.88. Los polinomios de Laguerre Ln dados por h = e−x, s = x,cn = 1, por lo que los primeros terminos son: L0 = 1, L1 = −x+ 1, etc. Entonces

dL1

dx= −1,

d2s

dx2= 0.

Se tiene que λn = −n (−1) y la ecuacion diferencial de Laguerre sera

d

dx

(xe−x

dLndx

)+ ne−xLn = 0

o sea

xd2

dx2Ln + (1− x) d

dxLn + nLn = 0

para toda n = 0, 1, · · · . A esta ecuacion diferencial se le conoce como la ecuaciondiferencial de Laguerre. Suelen definirse tambien los polinomios asociadosde Laguerre Lmn por la ecuacion

Lmn (x) =dm

dxmLn

las cuales son solucion de la ecuacion diferencial

xd2

dx2Lmn − (m+ 1− x) d

dxLmn + (n−m)Lmn = 0

Ejercicio 11.89. Escriba la ecuacion diferencial de los polinomios de Tchebichefde primera clase Tn.

Ejercicio 11.90. Escriba la ecuacion diferencial de los polinomios de JacobiP.

Ejercicio 11.91. Escriba la ecuacion diferencial de los polinomios de Gegen-bauer Cλn .

Ejercicio 11.92. Escriba la ecuacion diferencial de los polinomios de Tchebichefde segunda clase Un.

Page 203: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

Part 5

ECUACIONES DIFERENCIALES

Page 204: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 205: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 12

ECUACIONES DIFERENCIALES ORDINARIAS

1. Metodos de Solucion

Las ecuaciones diferenciales son de una importancia escencial en todas las ramasde las ciencias. La razon es muy simple, todas las leyes fundamentales de las cienciastienen que ver con la caracteristica mas importante de la materia: el movimiento.Las leyes fundamentales de las ciencias son relaciones entre movimientos en el es-pacio, el tiempo, la temperatura, la presion, los momentos, las luminosidades, etc.,las cuales se representan con derivadas. Estas relaciones entre el movimiento dacomo resultado relaciones entre derivadas, es decir, da como resultado ecuacionesdiferenciales. Toda la materia esta en movimiento, esta es su caracteristica enscen-cial. Lo estatico es solo una aproximacion del estado de la materia que en ocacionesnos da resultados suficientemente buenos para entender algun fenomeno. Pero elmovimiento esta inherente en toda la materia y las relaciones entre este movimintonos da las leyes fundamentales de la naturaleza. Es por eso que estas leyes puedencasi siempre ser representadas por ecuaciones diferenciales. Una solucion de estasecuaciones diferenciales es un caso particular, una aplicacion de la ley que estasiendo estudiada. En los dos capitulos que siguen estudiaremos las lineas mas ele-mentales para la solucion de ecuaciones diferenciales. Vamos a iniciar con las massencillas de estas, las ecuaciones diferenciales lineales. Por simplicidad iniciaremoscon ecuaciones diferenciales en donde el argumento, la incognita, solo depende deuna variable. A estas ecuaciones diferenciales se les llama ordinarias.

Definicion 12.1. Sea y : ℜ → ℜ tal que y = y(x), funcion continua y derivable.Una ecuacion diferencial ordinaria es una relacion tal que

F = F (x, y, y′, y′′, · · · ) = f(x), para toda F : ℜ × C ([a, b])× · · · → ℜNotacion 12.2. En estos dos capitulos, y′ representa la derivada de y respecto

de alguna variable, y′′ representa la segunda derivada de y, etc.

Definicion 12.3. Se dice que la ecuacion diferencial es lineal, si F es linealen todas las entradas que contengan a y y sus derivadas.

Definicion 12.4. Se dice que la ecuacion diferencial es de orden n, si la max-ima derivada de y que aparece en la ecuacion diferencial es la n-esima.

Definicion 12.5. Se dice que la ecuacion diferencial es homogenea, si f(x) =0.

Ejemplo 12.6. Sea F : ℜ×C ([a, b])×C ([a, b])→ ℜ, tal que y′+a(x)y = f(x).Se llama ecuacion lineal ordinaria de primer orden.

Ejemplo 12.7. Sea F : ℜ × C ([a, b]) × C ([a, b]) × C ([a, b]) → ℜ, tal quey′′ + a(x)y′ + b(x)y = f(x). Se llama ecuacion lineal ordinaria de segundoorden, etc.

193

Page 206: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

194 12. ECUACIONES DIFERENCIALES ORDINARIAS

Para ecuaciones diferenciales lineales, exiten dos proposiciones muy generales

Proposicion 12.8. La suma de dos soluciones de una ecuacion diferenciallineal homogenea, tambien es solucion.

Demostracion 12.9. Sea y(n) + an(x)y(n−1) + · · ·+ a1(x)y = 0 una ecuacion

diferencial lineal homogenea y sean y1 y y2 soluciones. Entonces

y(n)1 + an(x)y

(n−1)1 + · · ·+ a1(x)y1 = 0

y(n)2 + an(x)y

(n−1)2 + · · ·+ a1(x)y2 = 0

implica(y(n)1 + y

(n)2

)+ an(x)

(y(n−1)1 + y

(n−1)2

)+ · · ·+ a1(x) (y1 + y2) = 0

Proposicion 12.10. La suma de una solucion homogenea de una ecuaciondiferenecial lineal cualquiera y la de una solucion general de la misma ecuaciondiferencial, tambien es solucion.

Demostracion 12.11. Sea y(n) + an(x)y(n−1) + · · · + a1(x)y = f(x) una

ecuacion diferencial lineal no-homogenea y sean y1 una solucion de la respectivaecuacion diferencial homogenea y y2 una solucion general de la ecuacion. Entonces

y(n)1 + an(x)y

(n−1)1 + · · ·+ a1(x)y1 = 0

y(n)2 + an(x)y

(n−1)2 + · · ·+ a1(x)y2 = f(x)

implica(y(n)1 + y

(n)2

)+ an(x)

(y(n−1)1 + y

(n−1)2

)+ · · ·+ a1(x) (y1 + y2) = f(x)

Otra proposicion que puede ser util es la siguiente:

Proposicion 12.12. Toda ecuacion diferencial ordinaria lineal de orden npuede ser escrita como un sistema de dos ecuaciones diferenciales de orden n− 1.

Demostracion 12.13. Sea y(n)+an(x)y(n−1)+· · ·+a1(x)y = f(x). Definamos

z = y′. Entonces la ecuacion se transforma en z(n−1)+an(x)z(n−2)+ · · ·+a1(x)y =

f(x).

Corolario 12.14. Toda ecuacion diferencial ordinaria lineal de orden n puedeser escrita como un sistema de n ecuaciones diferenciales de orden 1.

Demostracion 12.15. Definamos z1 = y′, z2 = y′′ = z′1, · · · , zn−1 = y(n−1) =z′n−2. Entonces la ecuacion diferencial se transforma en z′n−1+an(x)zn−1+an−1(x)zn−2+· · ·+ a1(x)y = f(x).

La soluciones de algunas ecuaciones diferenciales ordinarias puden ser enco-tradas utilizando mtodos sencillos. El metodo mas comun es dando un “ansatz”,esto es, proponiendo una funcion que nosotros creemos es muy parecida a la solucionque queremos encontrar, es un poco adivinando el resultado. Vamos a iniciar conel caso mas simple.

Proposicion 12.16. Sea y′ + a(x)y = f(x) una ecuacion lineal ordinaria deprimer orden. Su solucion esta dada por

(12.1) y(x) = exp(−A(x))

∫ x

x0

exp(A(z))f(z)dz

donde A′ = a(x).

Page 207: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. METODOS DE SOLUCION 195

Demostracion 12.17. La manera mas simple de demostrar que (12.1) es lasolucion de la ecuacion diferencial, es subtituyendo la solucion en la ecuacion. Otraforma es como sigue. Reescribamos la ecuacion diferencial como y′ + A′y = f(x)con A′ = a(x) y multipliquemos la ecuacion completa por exp(A). Obtenemos

exp(A)y′ + exp(A)A′y − exp(A)f(x) = (exp(A)y)′ − exp(A)f(x) = 0

De aqui obetenemos que exp(A)y =∫ xx0

exp(A(z))f(z)dz, de donde se obtieneel resultado.

A la funcion exp(A) se le suele llamar factor integrante, ya que gracias ael, una parte de la ecuacion diferencial se puede integrar. Entonces la solucionde la ecuacion diferencial linea ordinaria de primer orden se puede llevar a la res-olucion de una integral o tambien se dice, se reduce a cuadraturas. El problemaes ahora resolver la integral de la solucion, lo cual no siempre es posible hacerloanaliticamente.

Ejemplo 12.18. Sea y′ + 1xy − a0x

5 = 0. Entonces A′ = 1x , es decir A =

ln(x). Se tiene que exp(A) = x, por lo que la solucion de la ecuacion es y(x) =1x

∫ xx0zz5dz = a0

7x

(x7 + c

)

Ejercicio 12.19. Resolver :1) y′ + 1

xy − a0 exp(x) = 0.

2) y′ + 1xy − a0 sin(x) = 0.

3) y′ + xy − a0x = 0.4) y′ + xy − a0

1x = 0.

5) y′ + ln(x)y − a0x = 0.

La siguiente ecuacion en complejidad es la ecuacion lineal de cualquier ordenen coeficientes constantes.

Proposicion 12.20. Sea y(n) + any(n−1) + · · · + a1y = 0 una ecuacion lineal

ordinaria homogenea de orden n y aj ∈ C, con j = 1, · · · , n. Su solucion esta dadapor

y(x) = cn exp(rnx) + · · ·+ c1 exp(r1x)

donde r1, · · · , rn son las raices distintas del polinomio caracteristico de laecuacion diferencial dado por rn + anr

n−1 + · · ·+ a1r = 0, o

y(x) =(cix

i + · · · c1x+ c0)exp(rjx) + · · ·+ c1 exp(r1x)

para cada raiz de multiplicidad i− 1 del polinomio caracteristico.

Demostracion 12.21. Lo que en realidad nos dice el teorema es que un ansatzconveniente para resolver estas ecuaciones diferenciales es y(x) = c exp(rx), dondec y r son constantes a determinar. Subtituimos este ansatz en la ecuacion difer-encial y obtenemos presisamente el polinomio caracteristico. En el caso de queuna raiz se repita i veces, tenemos que

(cix

i + · · · c1x+ c)exp(rjx) es tambien una

solucion de la ecuacion diferencial. La solucion mas general, sera la suma de todaslas soluciones.

Ejemplo 12.22. Sea y′′ + 2y′ + y = 0. El ansatz conveniente es y(x) =c exp(rx). Substituimos en la ecuacion diferencial para obtener: c exp(rx)

(r2 + 2r + 1

)=

0, lo que implica que(r2 + 1

)2= 0. Las raices del polinomio caracteristico son de-

generadas (repetidas) y son r1,2 = −1. Se sigue que las soluciones de la ecuaciondiferencial son:

Page 208: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

196 12. ECUACIONES DIFERENCIALES ORDINARIAS

y1 = c1x exp(−x) y y2 = c0 exp(−x).La solucion general es entonces dada por:y(x) = (c1x+ c0) exp(−x)Ejemplo 12.23. La ecuacion del oscilador armonico es

(12.2) y′′ + ω2y = 0.

El polinomio caracteristico es r2 + ω2 = 0. Este polinomio tiene 2 raices, r =±√−ω2 = ±iω. Si ω es real, la solucion de la ecuacion diferencial es

y(x) = c1 exp(iωx) + c2 exp(−iωx)= c1 (cos (ωx) + i sin (ωx)) + c2 (cos (ωx)− i sin (ωx))

= (c1 + c2) cos (ωx) + i (c1 − c2) sin (ωx)

= A1 cos (ωx) +A2 sin (ωx)

= A sin (δ) cos (ωx) +A cos (δ) sin (ωx)

= A sin (ωx+ δ)

= B cos (σ) cos (ωx)−B sin (σ) sin (ωx)

= B cos (ωx+ σ)

donde c1 + c2 = A1 = A sin (δ) = B cos (σ) y i (c1 − c2) = A2 = A cos (δ) =B sin (σ). Esta solucion es una funcion oscilante. Si ω es imaginaria, la solucionsera

y(x) = c1 exp(ωx) + c2 exp(−ωx)que es una funcion monotona. Si ω es compleja, la solucion es una mezcla de lasdos anteriores. Vean la figura 1.

Figure 1. La grafica de las soluciones de la ecuacion deonda. La solucion graficada es exp(ix)+exp(−ix) (lnea continua),exp(x)+exp(−x) (lnea punteada) y exp((0.3+i)x)+exp((0.3−i)x)(lnea rayada). Observen como la primera solucion es periodica, asegunda es monotona y la tercera es mixta.

Page 209: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. METODOS DE SOLUCION 197

Ejercicio 12.24. La ecuacion del oscilador armonico amortiguado es y′′ +hy′ + ω2y = 0. Encontrar todas las soluciones de esta ecuacion. Hacer un analisisdel comportamiento de las soluciones.

Ejercicio 12.25. Resuelva la ecuacion del oscilador armonico para las condi-ciones iniciales y(0) = 0 , y′(0) = 1 y para y(0) = π, y′(0) = −2 y grafique lassoluciones para ω = 1.

Ejercicio 12.26. Resuelva la ecuacion del oscilador armonico amortiguadopara las condiciones iniciales y(0) = 0, y′(0) = 1 y para y(0) = π, y′(0) = −2 ycon ω = 1, grafique las soluciones para h = 10, 1, 0.1 y 0.01. Explique el compor-tamiento.

Para el caso de las ecuaciones de coeficientes constantes no homogeneas, existenvarios metodos para encontrar la solucion. Uno metodo muy usado es el de proponerun ansatz conveniente. Vamos a dar un ejemplo de como funciona este metodo.

Ejemplo 12.27. Tomemos la ecuacion del oscilador armonico reforzado, esdecir y′′ + ω2y = a sin(bx). Para encontrar las soluciones de esta ecuacion, pro-pongamos una solucion (un ansatz) del tipo y(x) = A sin(Ωx). Si substituimos enla ecuacion diferencial, obtenemos

−AΩ2 sin(Ωx) + ω2A sin(Ωx) = a sin(bx).

Lo primero que observamos es que si hacemos Ω = b, la ecuacion se reduce a unaecuacion algebraica −AΩ2 + ω2A = a, cuya solucion es A = a/

(ω2 − Ω2

). Por

lo que una solucion de la ecuacion del oscilador armonico reforzado sera y(x) =a/(ω2 − Ω2

)sin(bx). Por la proposicion 12.10 se tiene que la solucion general de la

ecuacion diferencial es y(x) = c1 sin(ωx) + c2 cos(ωx) + a/(ω2 − b2

)sin(bx). Vean

la figura 2.

Ejemplo 12.28. Se tiene una situacion equivalente si se quiere resolver laecuacion diferencial y′′ + ω2y = a exp(bx). Ahora el ansatz conveniente es y(x) =A exp(Ωx). Haciendo lo mismo que en el ejemplo anterior se obtiene que la soluciongeneral es y(x) = c1 sin(ωx) + c2 cos(ωx) + a/

(ω2 + b2

)exp(bx)

Ejercicio 12.29. Resolver las siguientes ecuaciones diferenciales no homoge-neas, usando un ansatz conveniente.

1) y′′ + ω2y = a1 sin(b1x) + a2 exp(b2x)2) y′′ + hy′ + ω2y = a1 sin(b1x)3) y′′ + hy′ + ω2y = a1 sin(b1x) + a2 exp(b2x)4) y′′ + hy′ + ω2y = a1x5) y′′ + hy′ + ω2y = a1x+ a2 exp(b2x)

Sin embargo, en ocaciones resulta practicamente imposible dar un ansatz conve-niente, entonces la ecuacion diferencial de segundo orden tambien se puede reducira cuadraturas. El metodo es el siguiente

Algoritmo 12.30. Sea la ecuacion diferencial

(12.3) y′′ + hy′ + ω2y = f(x)

y yhom(x) = c1y1(x) + c2y2(x) la solucion general de la ecuacion homogenea cor-respondiente. Entonces, la solucion no homogenea de (12.3) se puede buscar,

Page 210: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

198 12. ECUACIONES DIFERENCIALES ORDINARIAS

Figure 2. Soluciones de la ecuacion del oscilador armonico re-forzado. La soluciones graficadas son: cos(x) − 1/(1− b2) sin(bx),donde hemos hecho ω = 1 y a = 1. Las graficas corresponden ab = 1.1, 1.01 y 1.001, de la mas pequena a la mas grande. Observencomo la solucion se hace grande conforme nos acercamos a b = 1,que es el valor de la resonancia, es decir, cuando la frecuencia delreforzamiento se acerca a la frecuencia de la solucion homogenea.

suponiendo que c1 y c2 son funciones de x. Es decir yNo hom(x) = c1(x)y1(x) +c2(x)y2(x). Si subtituimos este ansatz en (12.3), obtenemos

yNo hom(x) = c1(x)y1(x) + c2(x)y2(x)

y′No hom(x) = c1(x)y′1(x) + c2(x)y

′2(x) + c′1(x)y1(x) + c′2(x)y2(x).

y′′No hom(x) = c1(x)y′′1 (x) + c2(x)y

′′2 (x) + c′1(x)y

′1(x) + c′2(x)y

′2(x) +

c′1(x)y′1(x) + c′2(x)y

′2(x) + c′′1 (x)y1(x) + c′′2(x)y2(x).

de donde obtenemos que

y′′No hom + hy′No hom + ω2yNohom =

h (c′1(x)y1(x) + c′2(x)y2(x)) + 2 (c′1(x)y′1(x) + c′2(x)y

′2(x)) + c′′1 (x)y1(x) + c′′2 (x)y2(x)

= f(x)(12.4)

Ahora supongamos que c′1(x)y1(x)+c′2(x)y2(x) = 0, lo que implica que tambienla derivada de este termino debe ser cero, es decir (c′1(x)y1(x) + c′2(x)y2(x))

′=

c′′1(x)y1(x)+c′′2 (x)y2(x)+c

′1(x)y

′1(x)+c

′2(x)y

′2(x) = 0. Si subtituimos este resultado

en la ecuacion diferencial (12.4), obetenemos que

c′1(x)y′1(x) + c′2(x)y

′2(x) = f(x)

Quiere decir que si encotramos dos funciones c1(x) y c2(x) que cumplan

c′1(x)y1(x) + c′2(x)y2(x) = 0

c′1(x)y′1(x) + c′2(x)y

′2(x) = f(x)

Page 211: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. TRANSFORMADAS INTEGRALES 199

obtendremos una solucion no homogenea. Podemos resolver el sistema para lasfunciones c1(x) y c2(x) usando el metodo de determinantes. El resultado es

c′1(x) = − y2(x)f(x)

W (y1, y2)

c′2(x) =y1(x)f(x)

W (y1, y2)

donde hemos definido el determinante del sistema como

W (y1, y2) = y1y′2 − y2y′1

con lo que ya podemos escribir la solucion particular de la ecuacion diferencial enforma de cuadraturas. Esta es

yNo hom(x) =

∫ x

x0

(y1(t)y2(x) − y2(t)y1(x))W (y1, y2) (t)

f(t)dt

Por tanto, la solucion general sera y(x) = c1y1(x) + c2y2(x) + yNo hom(x)

Notacion 12.31. Al determinante W (y1, y2) = y1y′2−y2y′1 se le llama Wron-

skiano

Ejercicio 12.32. Resuelva los Ejercicios 12.29 usando el algoritmo anterior.

Las ecuaciones diferenciales de segundo orden son especialmente interesantesya que en la mayoria de las teorıas fısicas, sus ecuaciones de campo son de segundoorden. Las ecuaciones de segundo orden mas comunes en todos los campos de lasciencias son las ecuaciones con coeficientes variables. El metodo de solucion esvariado, no hay un metodo unico para todas. Vamos a presentar algunos de losmetodos mas utilizados.

2. Transformadas Integrales

Las transformadas integrales son un mecanismo para simplificar ecuacionesdiferenciales. La idea es llevar a la ecuacion diferencial a otro espacio en donde sepueda resolver y luego con la transformacion inversa regresar al espacio original.Este ultimo paso no siempre es simple o en ocaciones sucede que la ecuacion diferen-cial es mas complicada en el espacio de llegada. Por eso no hay una receta universalpara todas las ecuaciones y por eso existen varias trasformaciones, cada una ade-cuada para algunas de estas. Vamos a inicar con la definicion de transformacionintegral.

Definicion 12.33. Sean f : C → C y g : C → C funciones y E un espacio

de Hilbert con producto interno (f, g) =∫ ba f g dx con xs ∈ E. La transformada

integral de una ecuacion diferencial lineal de segundo orden

eq = y′′ + a(x)y′ + ω(x)2y − f(x)

respecto a xs, se define como F (s) = (eq, xs).

El objetivo de esta transformada es el siguiente. Ya que

(yxs)′ = yx′s + y′xs,

el producto interno de y′ con xs se puede escribir como:

(y′, xs) =

∫ b

a

y′xs dx =

∫ b

a

(yxs)′ dx−

∫ b

a

yx′s dx = yxs|ba − (y, x′s) .

Page 212: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

200 12. ECUACIONES DIFERENCIALES ORDINARIAS

Entonces conviene escoger una funcion del espacio de Hilbert para la cual tambienconocemos el producto (y, x′s). Si esto es posible, en ocaciones se puede encotraruna solucion de la ecuacion diferencial. Veamos algunos ejemplos.

Ejemplo 12.34. E un espacio de Hilbert real con xs = exp(−sx) ∈ E y pro-ducto interno (f, g) =

∫∞0 fgdx. Para esta funcion se cumple que

(y, x′s) =

∫ ∞

0

y (exp(−sx))′ dx = −s (y, xs) .

De aquı se sigue

(y′, xs) =

∫ ∞

0

y′ exp(−sx)dx = y exp(−sx)|∞0 + s (y, xs) = sF (s)− y(0).

Analogamente se tiene que

(y′′, xs) = s2F (s)− y′(0)− sy(0).

A esta transformada integral se le llama la transformada de Laplace.

Ejercicio 12.35. Demuestre que para la trasformada de Laplace, (y′′, xs) =s2F (s)− y′(0)− sy(0).

Ejemplo 12.36. Sea E el espacio de Hilbert del conjunto de las funciones

periodicas en [0, 2π] con producto interno (f, g) =∫ l0 fgdx. Como se vio en el

capıtulo de analisis, ejemplo 10.25, un sistema ortonormal completo de este espacioes

xkk∈I =

1√2π,

1√π

sin(kt),1√π

cos(kt)

k=1,···

donde k = nπ/l y los coeficientes de Fourier estan dados por

(f, xk)k∈I =

(f, cos(kt)) =

∫ 2π

0f cos(kt)dt,

(f, sin(kt)) =∫ 2π

0 f sin(kt)dt,∈ E

Podemos clasificar a estas funciones como las funcione pares cos(kt)k∈I =xpk y las funciones impares sin(kt)k∈I = xik. Para estas funciones se tiene:

(y, (xpk)

′)

=1√π

∫ 2π

0

y (cos(kt))′dt = −k

(y, xik

).

Entonces se sigue

(y′, xpk) = −k (y, xk)− (y(0)− y(l) cos(nπ))

mientras que para las funciones impares se tiene

(y′, xik) = −k(y, xik

)

A esta transformada se le llama transformada finita de Fourier.

Ejercicio 12.37. Demuestren que para la transformada finita de Fourier sesiguen las identidades:

(y′′, xpk) = −k2 (y, xpk)− (y′(0)− y′(l) cos(nπ))

(y′′, xpk) = k2 (y, xpk) + k (y(0)− y(l) cos(nπ))

Page 213: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. TRANSFORMADAS INTEGRALES 201

Ejemplo 12.38. Sea E un espacio de Hilbert real con xk = exp(ikx) ∈ E yproducto interno (f, g) =

∫∞−∞ f gdx. Analogamente a la transformada de Laplace,

para esta funcion se cumple

(y, x′k) =

∫ ∞

−∞y (exp(−ikx))′ dx = −ik (y, xk) .

De donde se sigue que

(y′, xk) =

∫ ∞

−∞y′ exp(−ikx)dx = y exp(−ikx)|∞−∞ + ik (y, xk) = ikF (k),

para toda funcion tal que y(∞) = y(−∞) = 0. Estas condiciones son tıpicas en unamultitud de problemas fısicos, quımicos y de ingenierıa. Analogamente se tiene:

(y′′, xk) = −k2F (k).

A esta transformada integral se le llama la transformada continua de Fourier.

Estas transformadas integrales tienen varias propiedades. Algunas de estas son

Teorema 12.39 (Transformada de Laplace). Sea E espacio de Hilbert y y ∈ E,cuya transformada de Laplace es F (s) = (y, xs). Entonces

1) F es lineal2) La transformada de exp(ax)y(x) es

(exp(ax)y(x), xs) = F (s− a)

3) Si f(x) =

y(x− a) para x > a

0 para x < a, la transformada de f es

(f, xs) = exp(−as)F (s)

4) La transformada de y(ax) es

(y(ax), xs) =1

aF( sa

)

5) La transformada de∫ x0y(x)dx es

(∫ x

0

y(x)dx, xs

)=

1

sF (s)

6) La transformada de xny(x) es

(xny(x), xs) = (−1)n dn

dsnF (s)

7) La transformada de y(x)/x es(y(x)

x, xs

)=

∫ ∞

s

F (t)dt

Ejercicio 12.40. Demostrar el Teorema anterior.

Con la ayuda de este teorema es posible encotrar la transformada de Laplacede un sinnumero de funciones. Particularmente los incisos 6) y 7) del teorema nospermite encontrar la trasformada de Laplace de funciones multiplicadas por unexponente de x.

Page 214: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

202 12. ECUACIONES DIFERENCIALES ORDINARIAS

Ejemplo 12.41. Tomemos la ecuacion diferencial de Bessel

x2y′′ + xy′ + x2y = 0.

Dado que (y′, xs) = sF (s)− y(0), se tiene que

(xy′, xs) = (−1)d

ds(sF (s)− y(0)) .

Analogamente

(x2y′′, xs

)= (−1)

2 d2

ds2(s2F (s)− sy(0)− y′(0)

).

Ası, la transformada de Laplace de la ecuacion diferencial de Bessel es

(y′′ + xy′ + x2y, xs

)=

s2F ′′ + 4sF ′ + 2F − (sF ′ + F ) + F ′′ =(s2 + 1

)F ′′ + 3sF ′ + F = 0

La solucion de esta ecuacion diferencial es

F (s) =1√s2 + 1

.

En otras palabras, usando la propidad 4) del teorema de la transformada de Laplace,se tiene que para la funcion de Bessel

(J0(ax), xs) =1√

s2 + a2

Como vemos, al transformar una ecuacion diferencial al espacio de las funcionesde Laplace, generalmente se obtiene otra ecuacion diferencial. En ocaciones massimple de resolver, pero no siempre. Es por eso que existen en general variosmetodos de sulucion. De hecho, uno de los procesos mas complicados de llevara cabo al resolver una ecuacion diferencial con la transformada de Laplace, esencontrar la transformada inversa.

Ejercicio 12.42. Encuentre la transformada de Laplace de las siguientes fun-ciones

1) y(x) = 12) y(x) = xn

3) y(x) = exp(ax)4) y(x) = sin(ax)5) y(x) = cos(ax)6) y(x) = sinh(ax)7) y(x) = cosh(ax)

Una situacion analoga sucede con la transformada de Fourier. Daremos unejemplo:

Ejemplo 12.43. Sea f(x) =

1 para −a < x < a0 de otra forma

.

Page 215: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. TRANSFORMADAS INTEGRALES 203

La transformacion de Fourier de f(x) sera

(f, xk) =

∫ ∞

−∞f(x) exp(−ikx)dx

=

∫ a

−aexp(−ikx)dx =

1

−ik exp(−ikx)∣∣∣∣a

−a

=2

ksin(ka).

En este punto es interesante notar que la funcion f(x) es una linea paralela quepasa por uno y que va de −a a a, mientras que su transformada es una funcionsinosoidal que decae, vean la figura 3.

Figure 3. La transformada de Fourier de la funcion f = 1, parael intervalo [−a, a] y cero de lo contrario. Mientras que la funciones constante, su transformada de Fourier nos da una funcion os-cilante. Este comportamiento se repite constantemente en estatransformada y se utiliza mucho para hacer analisis de senales.

sirve

Teorema 12.44 (Transformada de Fourier). Sea E espacio de Hilbert y y ∈ E,cuya transformada de Fourier es F (k) = (y, xk). Entonces

1) F es lineal2) La transformada de exp(iax)y(bx) es

(exp(iax)y(bx), xk) =1

bF

(k − ab

)

Page 216: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

204 12. ECUACIONES DIFERENCIALES ORDINARIAS

3) La transformada de xny(x) es

(xny(x), xk) = indn

dknF (k)

Ejercicio 12.45. Demostrar el teorema anterior.

Lo que vamos a ver a continuacion es un teorema que nos dice que pasa con latransformada del producto de dos funciones. Este teorema es de gran importanciay aplica en las transformaciones de Fourier, se llama el teorema de la convolucion.Para introducir el teorema, primero vamos a definir que es la convolucion

Definicion 12.46. San E espacio de Hilbert y f : C → C y g : C → C funciones.La convolucion de f con g es la integral f ∗ g =

∫∞−∞ f(u)g(x− u)du

Entonces se sigue el teorema:

Teorema 12.47 (de Convolucion). San E espacio de Hilbert y f : C → C yg : C → C funciones. Sea F (k) y G(k) sus respectivas transformadas de Fourier.Entonces, la transformada de Fourier de la convolucion de f y g, es el producto delas tranformadas de f y g, es decir (f ∗ g, xk) = (f, xk) (g, xk)

Demostracion 12.48.∫∞−∞ f∗g exp(−ikx)dx =

∫∞−∞

∫∞−∞ f(u)g(x−u) exp(−ikx)dudx.

Hacemos entonces v = x− u para obtener

∫ ∞

−∞f ∗ g exp(−ikx)dx =

∫ ∞

−∞

∫ ∞

−∞f(u)g(v) exp(−ik (u+ v))dudv

=

∫ ∞

−∞f(u) exp(−iku)du

∫ ∞

−∞g(v) exp(−ikv)dv

3. Metodo de Series

El metodo de series o de polinomios es muy usado para resolver ecuaciones di-firenciales lineales de segundo orden con coeficientes variables. Consiste en proponeruna solucion en series, es decir, usando el hecho de que (P , ·) el conjunto de los poli-nomios de grado arbitrario con su producto canonico y pnn=0,1,··· = 1, x, x2, · · · es un sistema completo en Cℜ. Entonces, toda funcion suave, solucion de unaecuacion diferencial se puede escribir como

f(x) =∞∑

n=0

(p · xn)xn =∞∑

n=0

anxn.

La serie se propone como un ansatz para resolver la ecuacion diferencial y se en-cuetran los coeficientes an del polinomio. Veamos esto con unos ejemplos.

Ejemplo 12.49. Tomemos de nuevo la ecuacion diferencial de Bessel x2y′′ +xy′ + x2y = 0. Entonces usemos el ansatz y(x) =

∑∞n=0 anx

n. Si subtituimos el

Page 217: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. METODO DE SERIES 205

ansatz en la ecuacion, obtenemos

x2∞∑

n=0

n(n− 1)anxn−2 + x

∞∑

n=0

nanxn−1 + x2

∞∑

n=0

anxn =

∞∑

n=0

(n(n− 1)anx

n + nanxn + anx

n+2)

=

∞∑

n=0

(n2anx

n + anxn+2)

= 0

Si escribimos los primeros terminos de esta serie, vemos que

∑∞n=0

(n(n− 1)anx

n + nanxn + anx

n+2)

=

0 + a0x2+ n = 0

a1x+ a1x3+ n = 1

4a2x2 + a2x

4+ n = 29a3x

3 + a3x5+ n = 3

16a4x4 + a4x

6+ n = 425a5x

5 + a5x7+ n = 5

=

a1x+ (a0 + 4a2)x2 + (a1 + 9a3)x

3 + (a2 + 16a4)x4 + (a3 + 25a5)x

5 + · · · = 0

Como el espacio de polinomios (P , ·) es l.i. , los coeficientes de la suma deben deser igual a cero para cada n. Lo primero que observamos es que a1 = 0. Perodespues se tiene que:

an + (n+ 2)2 an+2 = 0

lo que implica la relacion

an+2 = − an

(n+ 2)2

Esta realcion se llama la relacion de recurrencia de la ecuacion diferencial, yaque conociendo los coeficientes a0 y a1, es posible conocer todos los demas. Elpolinomio queda entonces como

y(x) = a0

∞∑

n=0

(−1)n

22n (n!)2x

2n

A estos polinomios se les llama Polinomios de Bessel J0.

Ejemplo 12.50. Tomemos de nuevo la ecuacion diferencial de Besselcompleta

x2y′′ + xy′ +(x2 − k2

)y = 0.

Para resolver esta ecuacion conviene tomar el ansatz del polinomio un poco modi-ficado. Para este caso tomemos y(x) =

∑∞n=0 anx

n+l. Subtituyendo este ansatz enla ecuacion diferencial se obtiene,

x2∞∑

n=0

(n+ l) (n+ l − 1)anxn+l−2 + x

∞∑

n=0

(n+ l)anxn+l−1 +

(x2 − k2

) ∞∑

n=0

anxn+l =

∞∑

n=0

[((n+ l) (n+ l − 1) + (n+ l)− k2

)anx

n+l + anxn+l+2

]= 0

Page 218: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

206 12. ECUACIONES DIFERENCIALES ORDINARIAS

y hagamos el mismo analisis que hicimos en el caso anterior,

∞∑

n=0

[((n+ l) (n+ l − 1) + (n+ l)− k2

)anx

n+l + anxn+l+2

]

=

(l(l − 1) + l − k2

)a0x

l + a0xl+2 n = 0(

(1 + l) (1 + l − 1) + (1 + l)− k2)a1x

1+l + a1x1+l+2 n = 1(

(2 + l) (2 + l − 1) + (2 + l)− k2)a2x

2+l + a2x2+l+2 n = 2(

(3 + l) (3 + l − 1) + (3 + l)− k2)a3x

3+l + a3x3+l+2 n = 3

y hacemos la comparacion de los coeficientes tal que se obtiene para el exponentede x mas bajo (

l2 − k2)a0 = 0

lo que implica l = ±k. El siguiente exponente implica((1 + l) (1 + l − 1) + (1 + l)− k2

)a1 = 0

De nuevo, como l = ±k, esta identidad se cumple solo si a1 = 0. Para el resto delos coeficientes se cumple la realcion de recurrecia

an+2 = − an(n+ 2) (n+ 2 + 2k)

por lo que los polinomios de Bessel completos estan dados por:

Jk(x) =

∞∑

n=0

(−1)n

22nn! (n+ k)!x2n+k

la solucion de la ecuacion de Bessel es entonces y(x) = a0Jk+ a′0J−k, vean la figura4.

Figure 4. . Funciones de Bessel para diferentes valores de k.

De la misma forma se pueden resolver una gran cantidad de ecuaciones difer-enciales con coeficientes variables. Algunas de ellas quedaran como ejercicios.

Page 219: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. METODO DE SERIES 207

Ejercicio 12.51. Usando el ansatz polinomial, resuelva la ecuacion diferencial1) De Hermite y′′ − 2xy′ + 2ky = 0

2) De Legendre(1− x2

)y′′ − 2xy′ +

(l (l + 1)− m2

1−x2

)y = 0

3) De Laguerre xy′′ + (1− x) y′ + ky = 0

En las fuguras 5, 6, 7 se muestran los polinomios de Hermite, Legendre yLaguerre respectivamente para diferentes valores de sus parametros.

Figure 5. Polinomios de Hermite para diferentes valores de k.

Figure 6. Polinomios de Legendre para diferentes valores de lcon m = 0.

Page 220: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

208 12. ECUACIONES DIFERENCIALES ORDINARIAS

Figure 7. Polinomios de Laguerre para diferentes valores de k.

Page 221: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 13

ECUACIONES DIFERENCIALES PARCIALES

1. Metodos de Solucion

Las ecuaciones fundamentales de la fısica, la quımica y la ingenierıa son ecua-ciones diferenciales parciales. En esta parte vamos a ocuparnos de las ecuacionesmas usadas en la literatura de las ciencias fısicas, que son a su vez muy represen-tativas de las ecuaciones diferenciales parciales lineales en general. Esta secciones tal vez la mas limitada de este curso, puesto que la cantidad de material sobreeste tema es muy basto. Aqui nos limitaremos a utilizar algunos metodos para laresolucion de estas ecuaciones diferenciales en los casos mas simples y comunes quehay. Las ecuaciones diferenciales que vamos a tratar en esta parte son:

: 1) La ecuacion de onda

(13.1) u = ∇2u− 1

v2

∂2u

∂t2= d(x, y, z)

: 2) La ecuacion de Difusion

(13.2)∂u

∂t= ∇ · (D∇u)

: 3) La ecuacion de Poisson

(13.3) ∇2u = d(x, y, z)

donde u, d y D son funciones tales que u = u(x, y, z, t), d = d(x, y, z, t) yla funcion D = D(x, y, z). A la funcion d se le llama la fuente.

Notacion 13.1. El operador nabla se define como

(13.4) ∇ =

(∂

∂x,∂

∂y,∂

∂z

)

y el operador = ∇2 − 1/v2∂2/∂t2

es el operador d’Alabertiano

Notacion 13.2. Al operador ∇2 = ∇ · ∇ se le conoce como Laplaciano.

Notacion 13.3. En general denotaremos a los operadores diferenciales por L,de tal forma que si por ejemplo L = , la ecuacion de onda se escribe como Lu = d,o si L = ∇2, la ecuacion de Poisson se escribe como Lu = d, etc.

Notacion 13.4. A la ecuacion homogenea de Poisson se le conoce como laecuacion de Laplace.

Notacion 13.5. Se suele clasificar a las ecuaciones diferenciales como ecua-ciones hiperbolicas, como la ecuacion de onda, ecuaciones parabolicas, comola ecuacion de difusion y ecuaciones elipticas, como la ecuacion de Poisson.

209

Page 222: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

210 13. ECUACIONES DIFERENCIALES PARCIALES

En la mayoria de los casos, es conveniente utilizar las simetrias del sistemapara resolver la ecuacion diferencial en cuestion. Para utilizar las simetrias esconveniente tener en mente las forma del operador nabla y del operador laplaciano∇2 en diferentes sistemas coordenados. Uno de los mas usados son las coordenadasesfericas, en donde

x = r sin(θ) cos(ϕ)

y = r sin(θ) sin(ϕ)

z = r cos(θ)

∇2 =1

r2∂

∂r

(r2∂

∂r

)+

1

r2 sin(θ)

∂θ

(sin(θ)

∂θ

)+

1

r2 sin2(θ)

∂2

∂ϕ2

y las coordenadas cilindricas, en donde

x = ρ cos(θ)

y = ρ sin(θ)

z = z

∇2 =1

ρ

∂ρ

(ρ∂

∂ρ

)+

1

ρ2

∂2

∂θ2+

∂2

∂z2

Las tres ecuaciones diferenciales (13.1-13.3) tienen gran importancia en fısicay quımica, aunque aquı no nos ocuparemos de esto, solo de sus soluciones. Existentambien una gran cantidad de metodos de solucion para estas ecuaciones. En estecapıtulo nosotros nos limitaremos a tres metodos: separacion de variables, desar-rollos de Fourier y funcıon de Green. Vamos a iniciar con el metodo de separacionde variables.

2. Separacion de Variables

El metodo de separacion de variables consiste en proponer un ansatz en el quela funcion u se puede escribir como una funcion que depende del tiempo y otrasque dependen de las demas variables, es decir, como

u = X(x)Y (y)Z(z)T (t)

Ejemplo 13.6. Supongamos una cuerda de guitarra estirada y que se sueltapara sonar. La ecuacion de la cuerda es la ecuacion de onda sin fuente en unadimension, digamos x. La ecuacion de onda es

(13.5)∂2u

∂x2− 1

v2

∂2u

∂t2= 0

Ahora tomemos el ansatz u = X(x)T (t) y substituimos en la ecuacion de onda

T∂2X

∂x2− 1

v2X∂2T

∂t2= 0

Si dividimos entre TX toda la ecuacion, nos queda una parte que solo depende dex y otra que solo depende de t. Como x y t son variables independientes, se sigueque

1

X

∂2X

∂x2=

1

v2T

∂2T

∂t2= −c

Page 223: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. SEPARACION DE VARIABLES 211

donde c es una constante arbitraria. La ecuacion de onda se separa en dos ecua-ciones diferenciales como la ecuacion del oscilador armonico

d2X

dx2+ cX = 0

d2T

dt2+ cv2T = 0

cuyas soluciones son X(x) = c1 sin(√c (x+ x0)) y T (x) = c2 sin(

√cv2 (t+ t0)). La

solucion de la ecuacion de onda es entonces

u(x, t) = c1 sin(√c (x+ x0)

)sin(√cv2 (t+ t0)).

Vamos a suponer que al tiempo t = 0, el guitarrista pulsa la cuerda una elon-gacion pequena l. Si la cuerda tiene una longitud L, se tiene que sin(0) = sin(x =L) = 0. Esto quiere decir que al timpo t = 0, la cuerda tiene una elongacion tiposin(x), con los extremos fijos y puestos en x = 0 y x = L. Es decir, u(x, 0) =

c1 sin(√c (x+ x0)) sin(

√cv2t0) = l sin(xπ/L). Esto implica que c1 = l, x0 = 0,√

c = π/L y√cv2t0 = π/2, es decir c = 1, t0 = L/ (2v). La solucion sera entonces

u(x, t) = l sin(πx

L

)sin

(vπ

L

(t+

L

2v&

)),

vean la figura 1. Si en vez de una cuerda de guitarra se tuviera una cuerda deviolin, el arco en la cuerda causa no una elongacion, sino una vibracion. En estecaso,

√c no seria igual a π/L, sino estaria determinado por el numero de ondas

causadas por el arco en la cuerda al tiempo t = 0.

Figure 1. La solucion de la cuerda vibrando. La longitud de lacuerda aquı es L = 1, la elongacion inicial es l = 0.1 y la velocidadde propagacion de la onda v = 0.2. Se grafican varios momentosde la vibracion de la cuerda.

Comentario 13.7. Observemos que sin(vπL(t+ L

2v

)) = cos(πvL t)

Page 224: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

212 13. ECUACIONES DIFERENCIALES PARCIALES

Comentario 13.8. Un metodo equivalente para resolver la ecuacion de ondaes proponiendo el ansatz u(x, t) = X(x) exp(−ikt). Subtituyendo este ansatz en laecuacion (13.5) se obtiene

d2X

dx2+k2

v2X = 0

que es la ecuacion del oscilador armonico de nuevo. La solucion es la misma queen el ejemplo, haciendo c = k2/v2. Sin embargo, utilizando este ansatz es posibleescribir la solucion general (sin condiciones iniciales) en forma de una suma. Paracada k se tiene una solucion de la ecuacion de onda. Por eso, la solucion generalse puede escribir como

(13.6) u(x, t) =∑

k

uk sin

(k

v(x+ xk)

)e−ikt

Observemos que el conjunto sin(kx)k=0,··· ,∞ es un conjunto completo. Es poreso que a t = 0 uno puede ajustar alguna funcion que determine las condicionesiniciales del problema. Igualmente se podrıa escoger otra forma de la solucion dela ecuacion del oscilador armonico y escribir en terminos de esta nueva forma lascondiciones iniciales del problema.

Ejemplo 13.9. Supongamos que en vez de una guitarra se tiene un violin talque al frotar el arco en la cuerda, produce una forma inicial de la cuerda de la forma

u(x, 0) =3∑

k=−3

uk sin (k/v (x+ xk)). Explicitamente, la solucion a todo tiempo se

ve como

u(x, t) = u1 sin

(k

v(x+ x1)

)(eit + e−it

)+

u2 sin

(2

v(x+ x2)

)(ei2t + e−i2t

)+

u3 sin

(3

v(x+ x3)

)(ei3t + e−i3t

)

Supongamos que u0 = 0, u±1 = 4, u±2 = 2 y u±3 = 1 y que x1 = −1, x2 = 1 yx3 = 0, entonces la solucion a tiempo t = 2 se ve como en la figura 2. Los modos1, 2 y 3 se suman a cada instante. Cada uno de ellos es una funcion sinusoidalperfecta, una onda monocromatica, pero al sumarse, la onda final es distorcionadapor la suma de todas. Las ondas reales son ası, sumas de ondas monocromaticas,de funciones senos o cosenos con diferentes frecuencias y fases.

Ejercicio 13.10. Resuelvan el sistema con las condiciones iniciales u0 = 0,u±1 = 1, u±2 = 2 y u±3 = 4. Grafiquen la solucion a todo tiempo con v = 1,modificando los valores de las constantes xk.

Ejercicio 13.11. Resuelvan la ecuacion de la cuerda pero ahora con las condi-

ciones iniciales u(x, 0) =2∑

k=−2

uk cos (kx/v), donde de nuevo u0 = 0, u±1 = 4 y

u±2 = 1. Grafiquen la solucion a todo tiempo con v = 1.

Notacion 13.12. A las componentes de la sumatoria (13.6) se les conoce comomodos normales de vibracion de la cuerda.

Page 225: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. SEPARACION DE VARIABLES 213

Figure 2. . Grafica de la solucion de la ecuacion de onda contres modos, aquı hemos puesto las condiciones iniciales con lasconstantes u0 = 0, u1 = 4, u2 = 2 y u3 = 1, las fases de cada modoson x1 = −1, x2 = 1 y x3 = 0. La solucion se grafico al tiempot = 2.

Ejemplo 13.13. Vamos a suponer que la cuerda tiene una fuente. Es decir,alguien o algo esta provocando la onda. En tal caso la ecuacion de la onda se vecomo

∂2u

∂x2− 1

v2

∂2u

∂t2= d(x, t)

Si la fuente es del tipo d = σ(x) sin(kt), podemos utilizar el ansatz u(x, t) =X(x) sin(kt). Si subtituimos en la ecuacion anterior se obtiene

d2X

dx2+k2

v2X = σ(x)

que es la ecuacion del oscilador armonico con fuentes. Esta ultima ecuacion seresuelve entonces como en la seccion anterior.

Ejemplo 13.14. Vamos a resolver la ecuacion de la cuerda (X(0) = 0, X(L) =0) suponiendo que la fuente de sonido es de un arco de violin tal que d(x, t) =A cos(lx) sin(kt). La ecuacion de onda, con el ansatz u = X(x) sin(kt), se reduce aresolver la ecuacion del oscilador con la fuente

d2X

dx2+k2

v2X = A cos(lx)

Usando las tecnicas estudiadas para resolver la ecuacion del oscilador con fuentes,encontramos que la solucion es

X (x) = − A(l2 − k2

v2

)[B sin

(kx

v

)− cos

(kx

v

)+ cos (lx)

]

Page 226: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

214 13. ECUACIONES DIFERENCIALES PARCIALES

donde

B =cos(kLv

)− cos (lL)

sin(kLv

) .

Lo primero que llama la atencion es que cuando la frecuencia de la fuente k seaproxima al valor lv, el factor fuera del parentesis crece sin lımite. Sin embargo, eltermino dentro del parentesis va a cero, de tal forma que en el lımite

limk→lv

X =A

2

sin(lx) (x− L)

l,

por lo que la vibracion es finita para todos los valores de k. La solucion u(x, t) =X(x) sin(kt), es una cuerda vibrante con extremos en el origen y en L, que se muevesegun la amplitud de vibracion l.

Ejercicio 13.15. Grafiquen la solucion anterior para k = 1, 2, con v = 1,variando la longitud de la cuerda l y la amplitud de la fuente A.

Ejemplo 13.16. Supongamos ahora que hacemos resonar un tambor, es decir,una membrana circular. Un tambor tiene simetria cilindrica (de hecho es un cilin-dro), asi es que usaremos coordenadas cilindricas. La membrana no tiene espesor,asi que u = u(ρ, θ, t). La ecuacion de onda es para este caso

1

ρ

∂ρ

(ρ∂u

∂ρ

)+

1

ρ2

∂2u

∂θ2− 1

v2

∂2u

∂t2= 0

Vamos a utilizar el mismo ansatz que en el ejemplo anterior, pero ahora en tresdimensiones, u = R(ρ)Θ(θ)T (t). Substituimos y encotramos de nuevo que

1

R

1

ρ

∂ρ

(ρ∂R

∂ρ

)+

1

Θ

1

ρ2

∂2Θ

∂θ2=

1

v2T

∂2T

∂t2= −c

lo cual implica tres ecuaciones, una para cada funcion. Primero, la ecuacion sesepara como sigue

∂2T

∂t2+ c0v

2T = 0

1

R

1

ρ

∂ρ

(ρ∂R

∂ρ

)+

1

Θ

1

ρ2

∂2Θ

∂θ2= −c0

Ahora buscamos separar las dos variable restantes, es decir

1

Rρ∂

∂ρ

(ρ∂R

∂ρ

)+ c0ρ

2 = − 1

Θ

∂2Θ

∂θ2= c1

de donde se obtiene una ecuacion para cada variable

d2Θ

dθ2+ c1Θ = 0

ρ∂

∂ρ

(ρ∂R

∂ρ

)+(c0ρ

2 − c1)R = 0

Las ecuaciones para T y Θ son de nuevo la ecuacion del oscilador armonico. Laecuacion para R es la ecuacion de Bessel, haciendo el cambio de variable c0ρ

2 = x2,es facil ver que la solucion para la ecuacion de R es R(ρ) = J√c1(

√c0ρ). La solucion

general sera entonces

u(ρ, θ, t) = u0J√c1(√c0ρ) sin (

√c1 (θ + θ0)) sin (

√c0v (t+ t0)) .

Page 227: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. SEPARACION DE VARIABLES 215

Supongamos que al tiempo t = 0 se le da un golpe al tambor que le provoca unaelongacion de tamano l en el centro de la membrana. Como la membrana que vibraesta fija en los extremos del cırculo, se tendra que

u(ρ, θ, t) = u0J√c1(√c0ρ) sin (

√c1 (θ + θ0)) sin (

√c0vt0) = lF (πρ/L),

por ejemplo. De hecho, el unico problema al que ahora nos enfrentamos es el derepresentar la funcion F (πρ/L) en terminos de los polinomios de Bessel. Eso esposible, porque los polinomios de Bessel son un conjunto completo. Finalmentela solucion quedara como la expresion de la funcion F (πρ/L) en terminos de lospolinomios de Bessel u(ρ, θ, t) =

∑k∈I

ukJk(πρ/L) sin (kθ) cos(πvL t), donde las con-

stentes uk son los coeficientes que determinan la elongacion inicial de la membranaen terminos de las funciones de Bessel lF (πρ/L) =

∑k∈I

ukJk(πρ/L) sin (kθ).

Ejercicio 13.17. Resuelvan la ecuacion de la cuerda pero ahora con las condi-

ciones iniciales lF (πρ/L) =2∑

k=−2

ukJk(πρ/L) sin (kθ), donde de nuevo u0 = 0,

u±1 = 4 y u±2 = 1. Grafiquen la solucion a todo tiempo con l = 1 y variando eltamano del tambor L.

Notacion 13.18. A la ecuacion

∇2u+ k2u = ρ

se le llama la ecuacion de Helmholtz

Ejemplo 13.19. Vamos a resolver la ecuacion homogenea de Helmholtz encoordenadas esfericas. Usamos para esto, el metodo de separacion de variables.Proponemos el ansatz u(r, θ, ϕ) = R(r)Θ(θ)Φ(ϕ). Si subtituimos en la ecuaciondiferencial, se obtiene

1

R

1

r2∂

∂r

(r2∂R

∂r

)+

1

Θ

1

r2 sin(θ)

∂θ

(sin(θ)

∂Θ

∂θ

)+

1

Φ

1

r2 sin2(θ)

∂2Φ

∂ϕ2+ k2 = 0

Para separar las variables, primero multiplicamos toda la ecuacion por r2 sin2(θ)y separamos la ecuacion para Φ. Se obtiene

1

Rsin2(θ)

∂r

(r2∂R

∂r

)+

1

Θsin(θ)

∂θ

(sin(θ)

∂Θ

∂θ

)+ r2 sin2(θ)k2 = m2

d2Φ

dϕ2+m2Φ = 0

la cual es otra vez la ecuacion del oscilador armonico para la funcion Φ. Ahoraseparamos las ecuaciones para R y para Θ . Se obtiene

1

R

∂r

(r2∂R

∂r

)+ k2r2 = − 1

Θ

1

sin(θ)

∂θ

(sin(θ)

∂Θ

∂θ

)+

m2

sin2(θ)= l (l+ 1)

en donde la constante la hemos llamado l (l + 1) por conveniencia. Nos queda unaecuacion para cada variable, estas son

d

dr

(r2dR

dr

)+(k2r2 − l (l + 1)

)R = 0

1

sin(θ)

d

(sin(θ)

)+

(l (l+ 1)− m2

sin2(θ)

)Θ = 0

Page 228: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

216 13. ECUACIONES DIFERENCIALES PARCIALES

Estas dos ecuaciones diferenciales pueden resolverse usando los metodos de la seccionanterior. Sin embargo, estas dos ecuaciones ya son conocidas. Vamos a hacer uncambio de variable. En la primera hagamos R = S/

√r y en la segunda hagamos

x = cos(θ). La ecuacion para R se convierte entonces en la ecuacion de Bessel y laecuacion para Θ en la ecuacion de Legendre, esto es

r2d2S

dr2+ r

dS

dr+

(k2r2 −

(l +

1

2

)2)S = 0

(1− x2

) d2Θ

dx2− 2x

dx+

(l (l + 1)− m2

1− x2

)Θ = 0

La solucion general de la ecuacion de Helmholtz es entonces

u(r, θ, ϕ) =∑

l,m

Jl+1/2 (kr)√r

Pml (cos (θ)) e±imϕ

Las condiciones de frontera de esta ecuacion se deberan escribir en terminos deestos polinomios.

Ejercicio 13.20. Grafiquen en coordenadas polares las superficies generadaspor las soluciones de la ecuacion de Helmholtz para m = 0 y l = 0, 1, 2, variando elvalor de k.

Ejemplo 13.21. Ahora utilizaremos el metodo de separacion de variables en laecuacion de difusion en una dimension. Subtituyamos el ansatz u(x, t) = X(x)T (t)en la ecuacion (13.2) para obtener

1

T

∂T

∂t=D

X

∂2X

∂x2= −c

donde estamos suponiendo que D es una constante. Separamos las variables yobtenemos las dos ecuaciones

dT

dt+ cT = 0

d2X

dx2+

c

DX = 0

La ecuacion para T se pude resolver integrando directamente. Se obtiene queT (t) = T0e

−ct mientras que la segunda es la ecuacion del oscilador armonico. Susolucion es

X (x) = c1e√

−c/D x + c2e−√

−c/D x,

por lo que la solucion de la ecuacion de difusion es

u(x, t) = c1e√

−c/D x−ct + c2e−√

−c/D x−ct.

Los comportamientos de esta funcion son muy diversos segun se tomen los valoresde los parametros que la determinan. Observemos primero el caso en que c/D espositivo. Si c1 = c2, la parte espacial de la solucion es oscilante. La onda se dis-olvera si c es tambien positivo, es decir, se disipa la onda, como en la figura 3. Sic fuera negativa, la onda crece indefinidamente. El comportamiento es muy difer-ente si c/D es negativo. Entonces la solucion no es una onda, sino una funcionmonotona. Aunque si c es positivo, esta solucion tambien se disipa, como se mues-tra en la figura 4.

Page 229: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. SEPARACION DE VARIABLES 217

Figure 3. . Solucion de la ecuacion de difusion unidimensional.Se grafica la funcion u(x, t) = [c1 exp(dx)+ c2 exp(−dx)] exp(−ct),donde d2 = −c/D. Aquı se toma d imaginario con d = i y c = 1.c1 = c2 = 1 por facilidad. La onda se disipa en el tiempo.

Figure 4. . Otra solucion de la ecuacion de difusion uni-dimensional. Se grafica la funcion u(x, t) = [c1 exp(dx) +c2 exp(−dx)] exp(−ct), donde d2 = −c/D. Aquı se toma d realcon d = 1 y c = 1. c1 = c2 = 1 por facilidad. Tambien aquı laonda se disipa en el tiempo.

Comentario 13.22. De la misma forma que en la ecuacion de onda, uno puedeiniciar con el ansatz u(x, t) = X(x) exp(−kt). El resultado es que la funcion X essolucion de la ecuacion del oscilador armonico y la solucion general se puede poner

Page 230: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

218 13. ECUACIONES DIFERENCIALES PARCIALES

como una serie, es decir

(13.7) u(x, t) =∑

k

(cke√

−k/Dx + dke−√

−k/Dx)e−kt

La funcion entre parentesis es la forma de la funcion u al tiempo t = 0 (o acualquier tiempo fijo), escrita en terminos de las soluciones de la ecuacion deloscilador armonico.

Ejercicio 13.23. Hagan un analisis de esta solucion para D > 0 y para D < 0con la serie hasta k = 3. Grafiquen las soluciones para diferentes valores de lasconstantes y traten de dar una interpretacion en cada caso.

Ejemplo 13.24. La ecuacion de Poisson es la ecuacion diferencial elipticamas importante de la fısica. Vamos a usar el metodo de separacion de variablespara resolverla. Vamos a iniciar primero utilizando el metodo para la ecuacion deLaplace en dos dimensiones, esto es

∂2u

∂x2+∂2u

∂y2= 0

Apliquemos el ansatz u(x, y) = X(x)Y (y) en la ecuacion diferencial, esto nos da

1

X

∂2X

∂x2= − 1

Y

∂2u

∂y2= c

lo que nos da dos ecuaciones separadas de la forma

d2X

dx2− cX = 0

d2Y

dy2+ cY = 0

cuyas soluciones son X = X0 sinh (√c (x+ x0)) y Y = Y0 sin (

√c (y + y0)).

Ejemplo 13.25. Hay otra forma de resolver la ecuacion de Poisson. Vamos aefectuar el cambio de variable ζ = x + iy en la ecuacion de Posson de dos dimen-siones. Utilizando la regla de la cadena, la ecuacion de Poisson se reduce a

∂u

∂ζ∂ζ= 0

Si integramos esta ecuacion obtenemos que u = Z (ζ)+ Z(ζ)

es la solucion generalde esta ecuacion, donde la funcion Z es arbitraria y debe de escogerse segun lascondiciones de frontera del sistema.

Ejercicio 13.26. Haciendo un procedimiento analogo a la ecuacion de onda,den la expresion para la solucion en series de la ecuacion de Laplace.

Comentario 13.27. Observemos que si hacemos el cambio de variable ξ =x+ vt y η = x− vt en la ecuacion de onda, esta se transforma en la ecuacion

∂2u

∂ξ∂η= 0

Por lo que la ecuacion de onda tambien admite una solucion con dos funcionesarbitrarias u = f1 (ξ) + f2 (η) = f1 (x+ vt) + f2 (x− vt).

Notacion 13.28. A las coordenadas ξ = x + vt y η = x − vt se les llamacoordenadas nulas.

Page 231: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. SEPARACION DE VARIABLES 219

Ejercicio 13.29. Usando el metodo de separacion de variables, demuestre queen coordenadas cilindricas, la ecuacion de Laplace se reduce a las tres ecuaciones

d2Θ

dθ2+ c1Θ = 0

ρ∂

∂ρ

(ρ∂R

∂ρ

)+(c0ρ

2 − c1)R = 0

∂2Z

∂z2− c0Z = 0

donde u = R(r)Θ(θ)Z(z). De la forma de la solucion general de la ecuacion.

Ejercicio 13.30. Usando el metodo de separacion de variables, demuestre queen coordenadas esfericas, la ecuacion de Laplace se reduce a las tres ecuaciones

d2Φ

dϕ2+m2Φ = 0

d

dr

(r2dR

dr

)− l (l + 1)R = 0

(1− x2

) d2Θ

dx2− 2x

dx+

(l (l + 1)− m2

1− x2

)Θ = 0

donde u = R(r)Θ(θ)Φ(ϕ), con x = cos (θ).

Ejemplo 13.31. Vamos a resolver la ecuacion de Poisson para un problemacon simetria esferica, es decir, donde u = R(r) y d = d(r) solamente. Se tieneentonces

∇2u =1

r2d

dr

(r2dR

dr

)= d

Podemos reducir este problema hasta cuadraturas, obtenemos

R =

∫ (1

r2dr

∫d r2dr

)dr

Por ejemplo, si la densidad es d = d0/r2 se obtiene que R = d0 ln (r) − c1/r + c2,

donde c1 y c2 son constantes arbitrarias. Si se tratara de un problema gravitacional,u serıa el potencial gravitacional y −∇u seria la fuerza. En nuestro caso, la fuerzaejercida por este potencial es

−dRdr

= −ρ0

r− c1r2

Ejercicio 13.32. Supongan que la densidad de un objeto es1) d = d0

r(r+1)2

2) d = d0(r2+1)

3) d = d0(r+1)3

Integren la ecuacion de Poisson para estos casos y hagan un analisis cualitativo delcomportamiento de la solucion para cada uno. Calculen F = −du/dr para cadainciso y grafiquen la funcion F .

Page 232: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

220 13. ECUACIONES DIFERENCIALES PARCIALES

3. Metodo de series de Fourier

Otro metodo muy utilizado para resolver las ecuaciones diferenciales es de nuevoel metodo de desarrollo de Fourier. Usaremos los resultados del capıtulo anteriorpara resolver las ecuaciones en derivadas parciales. Para esto es mejor estudiaralgunos ejemplos.

Ejemplo 13.33. La ecuacion de onda tambien se puede resolver usando losdesarrollos de Fourier. Escribamos la transformada de Fourier de la ecuacion deonda, es decir

∫ ∞

−∞

(∇2u− 1

v2

∂2u

∂t2

)exp(−ikt)dt =

∇2U +k2

v2U = ρ(13.8)

donde U es la tranformada de Fourier de u, es decir

U = (u, xk) =

∫ ∞

−∞u exp(−ikt)dt

y hemos usado las propiedades de la transformada de Fourier del ejemplo 12.38.Por lo que se sigue

(13.9) u =1

∫ ∞

−∞U exp(ikt)dk

En este caso, el problema de resolver la ecuacion de onda se ha reducido a lasolucion de la ecuacion (13.8). Por ejemplo, en una dimension, esta ecuacion esla ecuacion del oscilador armonico.

Comentario 13.34. Observemos que la solucion (13.8) es de hecho la mismasolucion (13.6) en donde ahora la suma sobre k es llevada al lımite continuo. Lasuma se convierte en una integral.

Ejemplo 13.35. De la misma forma en que la ecuacion de onda se puede re-solver por medio de transformadas integrales, la ecuacion de difusion tambien puedeser reducida usando estas transformadas. Vamos a aplicar una transformacion deLaplace a la ecuacion de difusion. Esto es

∫ ∞

0

(∂u

∂t−∇ · (D∇u)

)exp(−st)dt = 0

implica sU − u(x, 0)−∇ · (D∇U) = 0(13.10)

donde U es la transformada de Laplace de u, es decir

(13.11) U =

∫ ∞

0

u exp(−st)dt

Si D es una constante, la ecuacion (13.10) se convierte en la ecuacion de Helmholtz.

Comentario 13.36. Analogo al caso de la tranformacion de Fourier, observe-mos que la solucion (13.11) es la misma que la solucion (13.7), solo que en (13.11)se ha tomado la suma continua de todos los modos de k, pasando la suma a unaintegral.

Page 233: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. FUNCIONES DE GREEN 221

4. Funciones de Green

Para la resolucion de ecuaciones diferenciales no homogeneas existe una tecnicallamada funcion de Green. Basicamente consiste en escribir la funcion solucion y lafuncion de la parte no homogenea, en terminos de una base del espacio de Hilbertcorrespondiente. Por sencillez se escoge la base correspondiente a las soluciones dela ecuacion homogenea. Vamos a ver esto.

Algoritmo 13.37. Sea Lu = 0 una ecuacion diferencial. Sea Luk − λkuk = 0una ecuacion diferencial con soluciones uk en un espacio de Hilbert con el productointerno (f, g) =

∫f g, siendo ukk∈I una base de este espacio de Hilbert. Sea

Lu− λu = f

la ecuacion diferencial no homogenea que queremos resolver. Podemos escribir lafuncion u y la funcion f en terminos de la base ukk∈I , usando la serie de Fourieren la base ukk∈I , es decir

u =∑

kǫI

(u, uk)uk :=∑

k∈Ickuk

y

f =∑

kǫI

(f, uk)uk :=∑

k∈Ifkuk.

Si substituimos esto en la ecuacion diferencial no homogenea, se obtiene∑

k∈Ick (λk − λ) uk =

k∈Ifkuk

como uk es una base del espacio de Hilbert, se sigue que las constantes ck debencumplir

ck =fk

λk − λ=

(f, uk)

λk − λ=

1

λk − λ

∫fuk

Entonces la solucion de la ecuacion diferencial no homogenea sera

u =∑

kǫI

ukλk − λ

∫fuk

=

∫ ∑

kǫI

uk(x)

λk − λuk (y) f (y) dy

Definicion 13.38. A la funcion

G(x,y) =∑

kǫI

uk(x)uk(y)

λk − λ

se le llama funcion de Green.

Definicion 13.39. A las funciones uk soluciones de la ecuacion Luk−λkuk = 0se les llama funciones propias del operador L y a las constantes λk se les conocecomo valores propios del operador L.

Page 234: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

222 13. ECUACIONES DIFERENCIALES PARCIALES

En terminos de la funcion de Green, la solucion de la ecuacion diferencial nohomogenea se escribe como

(13.12) u (x) =

∫G(x,y)f (y) dy.

Ejemplo 13.40. Tomemos primero una ecuacion sencilla. Vamos a deducir lafuncion de Green de la ecuacion del oscilador armonico. Esto es

d2

dx2u+ ω2u = 0

El operador L = d2

dx2 y las fuciones propias de este operador, son las soluciones deloscilador armonico

d2

dx2uk − λkuk = 0

Si las condiciones de frontera son tales que u (0) = u (l) = 0, como el de una cuerda

fija vibrando, las funciones propias del operador son u (x) =√

2/l sin(kπx/l) y los

valores propios seran λk = − (kπ/l)2. De donde la funcion de Green es

G (x, y) =2

l

∞∑

k=0

sin(kπxl ) sin(kπyl )

ω2 −(kπl

)2

Formalmente la solucion de la ecuacion del osclilador inhomogenea sera

u (x) =

∫ l

0

2

l

∞∑

k=0

sin(kπxl ) sin(kπyl )

ω2 −(kπl

)2 f (y) dy

Ejemplo 13.41. Vamos a obtener la funcion de Green de la ecuacion diferencialde Legendre. La ecuacion es

d

dx

((1− x2

) dudx

)− λu = 0

Si tomamos al operador diferencial L = ddx

((1− x2

)ddx

)en el intervalo [−1, 1], los

valores propios del operador L seran λn = −n (n+ 1) y las funciones propias seranlos polinomios de Legendre. Eso implica que la funcion de Green para la ecuaciondiferencial de Legendre es

G (x, y) =2n+ 1

2

∞∑

n=0

Pn (x)Pn (y)

λ+ n (n+ 1)

Entonces la solucion de la ecuacion de Legendre inhomogenea sera

u (x) =

∫ 1

−1

2n+ 1

2

∞∑

k=0

Pn (x)Pn (y)

λ+ n (n+ 1)f (y) dy

Ejercicio 13.42. Escriban explicitamente la funcion de Green de las ecua-ciones de

1) Laguerre2) Bessel completa3) Hermite

Page 235: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. FUNCIONES DE GREEN 223

Comentario 13.43. Si utilizamos las propiedades de la delta de Dirac,

1.- δ (x) =

0 si x 6= 0∞ si x = 0

2.-∫δ (x) dx = 1

3.-∫f(z)δ (z − x) dz = f (x)

4.- δ (x− y) = 1(2π)n

∫∞−∞ dnk exp (ik · (x− y)), para k, x, y ∈ ℜn

podemos dar un metodo alternativo para encontrar la funcion de Green. Usando lapropidad 3.-, observamos que

∫G(x, z)δ (z − y) dz = G (x, y)

Si comparamos este resultado con (13.12), observamos que la funcion de Green esuna solucion de la ecuacion diferencial

LG(x, y)− λG(x, y) = δ (x− y)Comentario 13.44. En tres dimensiones, la delta de Dirac se escribe como

δ (r1 − r2) = δ (x1 − x2) δ (y1 − y2) δ (z1 − z2) en coordenadas cartesianas

=1

r21δ (r1 − r2) δ (ϕ1 − ϕ2) δ (cos (θ1)− cos (θ2)) en coordenadas esfericas

= δ (ρ1 − ρ1) δ (ϕ1 − ϕ2) δ (z1 − z2) en coordenadas cilindricas

En muchas ocaciones es mas conveniente encontrar la funcion de Green usandoestas propiedades. Usando la propiedad 1.- de la delta de Dirac, se resuelve laecuacion homogenea y luego esta solucion se une a la solucion de la ecuacion conla delta de Dirac. Vamos a estudiar un ejemplo.

Ejemplo 13.45. Regresemos una vez mas a la ecuacion del oscilador armonicono homogeneo, con

(13.13)d2

dx2u+ ω2u = δ (x− y)

Para x 6= y, la ecuacion diferencial es simplemente

d2

dx2u+ ω2u = 0

y por lo tanto tiene soluciones tales que u = A sin (ω (x+ x0)). Supongamos que

u =

A sin (ω (x+ xA)) para x < yB sin (ω (x+ xB)) para x > y

Si las condiciones de frontera son como antes, u (0) = u (l) = 0, debemos tener quexA = 0 y xB = −l. Ademas observemos lo siguiente. Si integramos la ecuacion(13.13) en una region infinitecimal alrededor de y, obtenemos

∫ y+ε

y−ε

d2

dx2u+

∫ y+ε

y−εω2u =

∫ y+ε

y−εδ (x− y) =

d

dxu

∣∣∣∣y+ε

y−ε= 1

para cuando ε→ 0. Esto implica que la derivada de u tiene una descontinuidad eny igual a 1. Si volvemos a integrar esta ecuacion, obtenemos que

u|y+εy−ε = 0

Page 236: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

224 13. ECUACIONES DIFERENCIALES PARCIALES

lo que implica que la funcion u misma no es discontinua. Si usamos este hecho,debe cumplirse que en el punto y se sigue

A sin (ωy) = B sin (ω (y − l))Aω cos (ωy) + 1 = Bω cos (ω (y − l))

Este es un sistema de ecuaciones que se puede resolver para A y B. El resultado es

A =sin (ω (y − l))ω sin (ωy)

B =sin (ωy)

ω sin (ωy)

Por lo que la funcion de Green es

G (x, y) =1

ω sin (ωy)

sin (ω (y − l)) sin (ωx) para 0 < x < ysin (ωy) sin (ω (x− l)) para y < x < l

Para el caso de una ecuacion diferencial de varias dimensiones pero con coe-ficientes constantes, podemos dar una forma general de la funcion de Green en laforma de su transformada de Fourier.

Proposicion 13.46. La funcion de Green del operador

L = a0 + a1∂

∂x1+ · · ·+ an

∂xn+ b1

∂2

∂x21

+ · · ·+ bn∂2

∂x2n

es

G (x,y) =1

(2π)n

∫ ∞

−∞

dnk exp (ik · (x− y))

a0 + ia1k1 + · · ·+ iankn + b1 (ik1)2

+ · · ·+ bn (ikn)2 ,

para k = (k1, . . . , kn), x = (x1, . . . , xn) y y = (y1, . . . , yn)

Demostracion 13.47. Observemos que

∂xsG (x,y) =

1

(2π)n

∫ ∞

−∞

dnk ∂∂xs

exp(i∑j kj (xj − yj)

)

a0 + ia1k1 + · · ·+ iankn + b1 (ik1)2 + · · ·+ bn (ikn)

2 =

1

(2π)n

∫ ∞

−∞

dnk iks exp(i∑j kj (xj − yj)

)

a0 + ia1k1 + · · ·+ iankn + b1 (ik1)2

+ · · ·+ bn (ikn)2 =

Por lo que al subtituir G (x,y) en el operador L, se llega a LG (x,y) = δ (x− y).

Como ejemplo vamos a encontrar la funcion de Green del operador nabla y dealgunos operadores relacionados con el.

Ejemplo 13.48. Encontremos la funcion de Green del operador ∇2 en coorde-nadas cartesianas. Como ya vimos en la proposicion anterior, la funcion de Greentiene la forma

G (x,y) =1

(2π)3

∫ ∞

−∞

d3k exp (ik · (x− y))

(ik1)2 + (ik2)

2 + (ik3)2

Ahora hagamos la integral. Para hacer la integral nos conviene utilizar coordenadasesfericas en la variable k, esto es k1 = k sin (θ) cos (ϕ), k2 = k sin (θ) sin (ϕ) y

Page 237: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. FUNCIONES DE GREEN 225

k3 = k cos (θ). Y por conveniencia podemos escoger k3 en la direccion x − y paraobterner solo k · (x− y) = k |x− y| cos (θ). Entonces la integral se reduce a

G (x,y) =1

(2π)3

∫ ∞

0

dk

∫ 2π

0

∫ π

0

sin (θ) dθ exp (ikR cos (θ))

donde hemos escrito R = |x− y|. La integral∫ π0 sin (θ) dθ exp (ikR cos (θ)) =

2 sin (kR) /kR, por lo que

G (x,y) = − 4π

(2π)3

∫ ∞

0

dk 2 sin (kR) /kR = − 1

4πR

Es decir, la funcion de Green para el operador Laplaciano es

G (x,y) = − 1

4π |x− y|Ejercicio 13.49. Encuentre por este metodo la funcion de Green del operador

de Helmholtz ∇2 + k2

Ejemplo 13.50. Ahora procedamos a encontrar la funcion de Green del oper-ador D’Alambertiano

= ∇2 − 1

v2

∂2

∂t2.

Usando de nuevo la proposicion 13.46, la funcion de Green tiene la forma

G (x4,y4) =1

(2π)4

∫ ∞

−∞

d4k exp (ik4 · (x4 − y4))

(ik1)2

+ (ik2)2

+ (ik3)2 − 1/v2 (ik4)

2

donde x4 = (x1, x2, x3, t) y y4 = (y1, y2, y3, t′). Vamos a llamar a k = (k1, k2, k3)

a k24/v

2 = ω2 y como en el ejemplo anterior R = x− y ∈ℜ3. Ademas llamemosT = t− t′. Con estas definiciones se obtiene que

G (x4,y4) = − 1

(2π)3

∫ ∞

−∞d3k exp (ik ·R)

∫ ∞

−∞

exp (−iωvT )

k2 − ω2dω

La integral∫ ∞

−∞

exp (−iωv (t− t′))k2 − ω2

dω =

2π sin (kv (t− t′)) / (kv) para t > t′

0 para t < t′

resuelta en el ejemplo 7.53 (en el capitulo de series de variable compleja). Si usamoseste resultado obtenemos

G (x4,y4) =

− 12π

∫∞−∞ d3k exp (ik ·R) 1

kv sin (kv (t− t′)) para T > 0

0 para T < 0

Usando un procedimiento semejante al del ejemplo anterior para evaluar la primeraintegral, obtenemos que

∫ ∞

−∞d3k exp (ik ·R)

1

kvsin (kvT ) =

−πvR

∫ ∞

−∞dk [exp (ik (R+ vT ))− exp (ik (R− vT ))] =

−2π2v

R[δ (R+ vT )− δ (R− vT )] =

2π2v

Rδ (R− vT )

donde hemos usado la propiedad 4.- de la delta de Dirac del comentario 13.43y donde tambien hemos quitado la primera delta de Dirac del resultado ya que

Page 238: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

226 13. ECUACIONES DIFERENCIALES PARCIALES

para T > 0 esta no contribuye. Entonces, la funcion de Green del operadorD’Alambertiano es

G (x4,y4) =

− v

4πRδ (R− vT ) para T > 00 para T < 0

Ejemplo 13.51. Para el operador de difusion, el procedimiento es semejante.Sea

L =∂2

∂x2− 1

D

∂tClaramente su funcion de Green esta dada por

G (x, t, y, t′) =1

(2π)2

∫ ∞

−∞

exp (ik1 (x− y) + ik2 (t− t′))(ik1)

2 − i/Dk2

dk1dk2

=

− 1

2

√D

π|t−t′| exp(− (x−y)2

4D|t−t′|

)para t > t′

0 para t < t′

integral que fue evaluada en el ejemplo 7.53.

Ejercicio 13.52. Encuentren por este metodo la funcion de Green del operadorde difusion completo

L = ∇2 − 1

D

∂t

Ejercicio 13.53. Encuentren por este metodo la funcion de Green del operadorde Schrodinger sin potencial

L = iℏ∂

∂t+

ℏ2

2m∇2

en coordenadas cartesianas.

Page 239: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

Part 6

TOPOLOGIA

Page 240: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 241: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 14

ESPACIOS TOPOLOGICOS

1. Definicion y Ejemplos

Los espacios topologicos son la base, entre otras cosas, de la estructura matematicaque le dara forma a los conjuntos. Como veremos en esta seccion, basicamente dosespacios topologicos son los mismos (homeomorficos), si se puede moldear uno deellos en plastilina y transformar este hasta llegar al otro sin romper la plastilina,sin hacerle agujeros. Por ejemplo, un vaso para tomar agua y una pelota, serıanlos mismos desde el punto de vista de la topologıa, ası mismo, una taza con unaaza es equivalente a una dona, etc. Estos espacios han adquirido importancia envarias ramas de la fısica y la ingenierıa para poder hacer modelos. Por ejemplo, enla ingenierıa, las imagenes que se obtienen en la computadora son dijitales, estanhechas por pixeles discontinuos. En este caso, resulta muy inexacto para algunasaplicaciones tomar el espacio metrico correspondiente. En la actualidad existenvarios modelos topologicos que prometen ser mas eficientes. En fısica, los camposestan cuantizados, el campo gravitacional es el espacio tiempo mismo, si este estacuantizado, no pude ser metrizable y por tanto no hay una metrica que lo repre-sente, el campo gravitacional vive entonces en espacios que no pueden ser modeladospor espacios metricos simples. Los espacios topologicos podrıan ser mas exactosen modelar espacios cuantizados o los espacios cuanticos mismos. La geometrıadiferencial es una herramienta que se utiliza hoy en dıa intensivamente en variasramas de la ciencia. El control automatico necesita de esta herramienta en granmedida. En este capıtulo veremos tanto la topologıa como la geometrıa diferencial.Iniciemos con la definicion de espacio topologico.

Definicion 14.1. Sea X conjunto y τX ⊂ P (X) subconjunto del conjunto po-tencia P (X) . Un espacio topologico es el par (X, τX) , tal que: φ y X pertenecena τX y τX es cerrado bajo uniones arbitrarias e intersecciones finitas.

Vamos a entender esta definicion. Explicitamente, un espacio topologico es unsubconjunto del conjunto potencia que cumple con los siguientes axiomas:

i) φ,X ∈ τX es decir, el vacio y todo el conjunto siempre estan en la topologıaτX de X .

ii) Si Uα ∈ τX con α ∈ J (J un conjunto de ındices) entonces ∪α∈J

Uα ∈ τX , es

decir, la union arbitraria de elementos de τX es un elemento de τX .iii) Ui ∈ τX con i = 1, · · · , n implica que ∩ni=1Ui ∈ τX , es decir, la interseccion

finita de elementos de τX es un elemento de τX .

Notacion 14.2. A los elementos de τX se les llama abiertos, a sus comple-mentos cerrados y a τX se le llama topologıa sobre X.

229

Page 242: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

230 14. ESPACIOS TOPOLOGICOS

Comentario 14.3. Noten que tanto el conjungo vacio φ como todo el conjuntoX son abiertos y cerrados a la vez, ya que φc = X y Xc = φ. Esta es una propiedadde todos los espacios topologicos.

Mas adelante veremos algunos ejemplos de espacios topologicos para ser masexplicitos, pero por ahora vamos a definir algunos conceptos que nos van a servirdurante nuestra discusion.

Definicion 14.4. Sea (X, τX) espacio topologico, U ∈ τX y x ∈ U . Se diceentonces que U es una vecindad de x, se denota x ∈ Ux. Un entorno de x ∈ Xes un sobconjunto N ⊂ X, tal que x ∈ N y existe Ux ⊂ N , vean la figura 1.

Es decir, una vecindad de algun punto es siempre un abierto que contieneal punto, mientras el entorno es un conjunto mas grande que algun abierto, quecontiene al punto, pero no es un abierto el mismo.

Figure 1. Ux es una vecindad de x, es decir, es un abierto quecontiene a x. Un entorno de x, en cambio, es un sobconjunto deX tal que x esta en N y N contiene a una vecindad de x.

Definicion 14.5. Sea (X, τX) espacio topologico. Una cubierta de A ⊂ X,es una familia de abiertos U = Uαα∈K tal que ∪

α∈KUα = A. Una subcubierta V

de U , es una familia V = Vββ∈J tal que V es cubierta de A y Vα ∈ V implica

Vα ∈ U .En forma sencilla, una cubierta de A es simplemente un conjunto de abiertos

que cubre todo el conjunto A y una subcubierta de la cubierta es un subconjuntode la cubierta que tambien cubre A. Ahora veamos algunos ejemplos de espaciostopologicos.

Ejemplo 14.6. τX = P (X) es siempre una topologıa llamada la topologıadiscreta de X en donde cada elemento es un abierto de X.

Ejemplo 14.7. τX = φ,X es llamada la topologıa indiscreta de X.

Estos dos ejemplos nos dicen que todo conjunto tiene al menos dos topologıas,la discreta y la indiscreta. Es decir, se puede hacer de cualquier conjunto un espaciotopologico, incluso de un conjunto de borreguitos del campo.

Page 243: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. DEFINICION Y EJEMPLOS 231

Ejemplo 14.8. Si X = x , la unica topologıa que existe es τX = x , φEjemplo 14.9. Si X = a, b , existen 4 topologıas

a) τ1

X = P (X) = φ, a , b , a, bb) τ2

X = a, b , φc) τ3

X = φ, a , a, bd) τ4

X = φ, b , a, bA las topologıas τ3

X y τ4X se les llama topologıas de Sierpinski.

Estos son, tal vez, los espacios topologicos mas simples que podemos construir.Ahora veremos otros espacios mas interesantes. Vamos a iniciar con los espaciosℜn. Estos son espacios topologicos y tienen, claramente, muchas topologıas. Sinembargo, la topologıa que generalmente usaremos aquı es la siguiente:

Ejemplo 14.10. X = ℜn, τX = union de bolas Br (x0), donde Br (x0) =x ∈ ℜn | |x− x0| < r . Esta es la topologıa canonica de ℜn.

Observen que la construccion de esta topologıa se basa de hecho en la estructurametrica de ℜn. La demostracion de que esta ultima es una topologıa para ℜn laincluimos en la construccion de una topologıa para todo espacio metrico en lasiguiente proposicion.

Proposicion 14.11. Sea (X, d) espacio metrico y τ = conjuntos abiertos en (X, d) .Entonces (X, τ) es un espacio topologico.

Demostracion 14.12. Se tiene que:i) X y φ son abiertos en (X, d) , ya que la bola Bǫ (x) = y ∈ X | d (x, y) |< ǫ

⊂ X y φ es abierto trivialmente.ii) Sea Aαα∈I una familia arbitraria de conjuntos abiertos en (X, d) . Para

cada α, Aα es union de bolas, Aα = ∪β∈K

Bβ (Aα) y la union de la union de bolas

es abierto en (X, d) .

iii) Sean Ai, i = 1, · · · , n conjuntos abiertos en (X, d) y V =n∩i=1Ai. Si x ∈ V

implica que x ∈ Ai para todo i = 1, · · · , n. Entonces existen ri > 0i=1,··· ,n tales

que Bri(x) ⊂ Ai. Tomemos r = min rii=1,··· ,n , entonces Br (x) ⊂ Bri

(x) para

todo i = 1, · · · , n y por tanto Br(x) ⊂ Ai para todo i = 1, · · · , n. Esto implica queBr (x) ⊂ V , i.e. V es conjunto abierto en (X, d) .

Ejercicio 14.13. Demuestren que en todo espacio topologico la inteseccionarbitraria de cerrados es cerrada y la union finita de cerrados es cerrada.

En los espacios metricos y normados es posible definir algunos conceptos comocontinuidad o lımite debido a la existencia de la metrica o de la norma. En losespacios topologicos esto tambien es posible, debido a la existencia de los abiertos.Vamos a ejemplificar esto dando el concepto de lımite de una susecion. Veamos:

Definicion 14.14. Sea (X, τX) espacio topologico y (xi) una sucesion en X,i ∈ Z+. Se dice que (xi) tiene el lımite x (o converge a x) si para todo vecindadde x, Ux ∈ τX existe un entero positivo N ∈ Z+ tal que xi ∈ Ux para todo indicei ≥ N. Se denota como xi x o limxi = x.

Como ya vimos, todo espacio metrico es topologico, usando los abiertos definidospor su metrica. Sin embargo, lo contrario no siempre se cumple, no todo espacio

Page 244: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

232 14. ESPACIOS TOPOLOGICOS

topologico es metrico. Es en este sentido que los espacios topologicos son mas gen-erales que los espacios metricos. A veces es posible definir una metrica en un espaciotopologico, en este caso se dice que el espacio topologico es metrizable, formalmentese dice que:

Definicion 14.15. Un espacio topologico (X, τX) cuyos abiertos son los con-juntos abiertos del espacio metrico (X, d), se dice metrizable. A la topologıa τXsobre X se le llama topologıa inducida por la distancia d.

Veamos la siguiente interesante proposicion:

Proposicion 14.16. En todo espacio topologico (X, τX) metrizable, para cualquierpar de puntos, siempre existen dos vecindades disjuntas.

Demostracion 14.17. (X, τX) es metrizable, implica que existe una distanciad que induce τX . Sean x, y ∈ X con x 6= y, entonces d (x, y) = 2ǫ para algun ǫ > 0.Tomemos las bolas Bǫ (x) = z ∈ X | d (x, z) < ǫ y Bǫ (y) = w ∈ X | d (w, y) < ǫ ,los cuales son abiertos de τX . Supongamos z ∈ Bǫ (x) ∩ Bǫ (y) , se sigue qued (x, y) ≤ d (x, z) + d (z, y) < ǫ + ǫ = 2ǫ, pero d (x, y) = 2ǫ, lo cual es una con-tradiccion. Por tanto z /∈ Bǫ (x)∩Bǫ (y) se sigue entonces que Bǫ (x)∩Bǫ (y) = φ.

De esta proposicion se desprende que si queremos construir un espacio topologicometrizable, le tenemos que pedir primero que existan dos vecindades disjuntaspara cada punto. Mas adelante veremos que a estos espacios se les llama espa-cios topologicos tipo T2 o Hausdorff.

En ocaciones los conjuntos son productos cartesianos de espacios topologicos ose pueden descomponer en productos cartesianos de estos. En ese caso, si cada com-ponente es un espacio topologico, el espacio total tambien lo sera. Este resultadose sigue de la proposicion:

Proposicion 14.18. El producto cartesiano de espacios topologicos es un es-pacio topologico.

Demostracion 14.19. Sean (X, τX) y (Y, τY ) espacios y (X × Y, τX×Y ) conτX×Y = uniones de elementos U × V ∈ τX × τY . Entonces

i) φ ∈ τX×Y ya que φ = φ× φ, y X × Y ∈ τX×Y ya que X × Y ∈ τX × τY .ii) Sean W = ∪

α∈jUα × Vα y W ′ = ∪

β∈kU

β × V′

β, Uα,U′

β ∈ τX , Vα,V′

β ∈ τY ,

para toda α ∈ J, β ∈ K. Entonces W ∩ W ′ = ∪α∈J

Uα × Vα ∩ ∪β∈k

U′

β × V′

β =

∪(α,β)∈J×K

Uα ∩ U′

β × Vα ∩ V′

β ∈ τX×Y .

iii) Sea Wα = ∪γ∈M

(Uαγ × Vαγ) ∈ τX×Y . Entonces ∪α∈L

Wα = ∪(α,γ)∈L×M

Uαγ

×Vαγ∈ τX×Y .

Al par (X × Y, τX×Y ) se le llama producto topologico de los espacios (X, τX)y (Y, τY ).

Ası mismo, se puede construir un espacio topologico de un subconjunto de unespacio topologico utilizando la topologıa del espacio original. Esto se ve en lasiguiente proposicion:

Page 245: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. CERRADURA, INTERIOR Y FRONTERA 233

Proposicion 14.20. Sea (X, τX) espacio topologico y A ⊂ X. Sea τA =A ∩ U,U ∈ τX. Entonces el par (A, τA) es un espacio llamado subespacio topologicode X.

Demostracion 14.21. i) φ ∈ τA ya que φ∩A = φ y A ∈ τA ya que A∩X = A.ii) Sean Uα ∈ τX y A∩Uα ∈ τA, α ∈ J . Entonces ∪

α∈JA∩Uα = A∩ ∪

α∈JUα ∈ τA.

iii) Sean Ui ∈ τX , i = 1, · · · , n y A ∩ Ui ∈ τA. Entoncesn∩i=1A ∩ Ui =

A ∩ n∩i=1Ui ∈ τA. Se sigue que (A, τA) es espacio topologico.

Notacion 14.22. A τA se le llama la topologıa relativa o inducida por τXsobre X.

Con esta proposicion es entonces facil ver que muchos espacios son topologicosporque heredan la topolgia de algun espacio mayor. Veamos un ejemplo importanteque usaremos a lo largo de este capıtulo.

Ejemplo 14.23. Sea n ∈ Z. La n-esfera Sn se define como un subespacio deℜn+1 como

Sn =

x ∈ ℜn+1 |

n+1∑

i=1

(xi)2

= 1

x = (x1, · · · , xn+1)

Ası,S0 =

x ∈ ℜ | x2 = 1

= 1,−1 ,

S1 =(x, y) ∈ ℜ2 | x2 + y2 = 1

,

S2 =(x, y, z) ∈ ℜ3 | x2 + y2 + z2 = 1

etc.

La topologıa de Sn sera τSn = Sn ∩ U | U ∈ τℜn+1 .De la misma forma se pueden conocer los cerrados de un subespacio topologico,

conociendo los cerrados del espacio original, usando la proposicion siguiente:

Proposicion 14.24. Sea (A, τA) subespacio topologico de (X, τX) . V ⊂ A escerrado en A sı y solo sı V = A ∩R con R cerrado en X.

Demostracion 14.25. =⇒) V cerrado en A implica que existe W ∈ τA talque V = A \W, con W = A ∩ U , lo que implica que V = A \A ∩ U = A ∩ U c conU c cerrado en X.⇐=) Sea R cerrado en X. Consideremos B = A ∩ R esto implica que Bc =

A \ B = A \ A ∩ R = A ∩ Rc, y como Rc es abierto en X, Bc es abierto en A, esdecir B es cerrado en A.

2. Cerradura, Interior y Frontera

En esta seccion veremos tres conceptos para distinguir regiones de nuestroespacio topologico. Si nuestro conjunto tiene una topologıa, podemos distinguir laregion en donde termina el espacio, donde es adentro y afuera. Vamos a definirestos conceptos. Iniciemos por definir un punto de adherencia.

Definicion 14.26. Sea (X, τX) espacio topologico, A ⊂ X y p ∈ X. Un puntode adherencia p de A es aquel que toda vecindad de p no es disjunta con A, esdecir p es punto de adherencia si para toda Up ∈ τX se cumple Up ∩A 6= φ, vean lafigura 2.

Page 246: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

234 14. ESPACIOS TOPOLOGICOS

Figure 2. Los puntos de adherencia del conjunto A. En la figurase muestran puntos de adherencia y puntos que no son de adheren-cia del conjunto A.

Al conjunto de todos los puntos de adherencia se le llama la clausura, que nosservir’a para definir el interior del espacio.

Definicion 14.27. Al conjunto de puntos de adherencia se le llama clausuray se denota por A, vean la figura 3

Figure 3. Los puntos de adherencia forman la clausura del con-junto A. Hay que comparar esta figura con la figura 2, en dondese muestran los puntos de adherencia del conjunto A.

Comentario 14.28. Noten que si p ∈ A, implica que Up ∩ A 6= φ, por tanto

A ⊂ AVeamos una serie de proposiciones referentes a la cerradura de un conjunto,

con el objetivo de concluir que la clausura es un conjunto cerrado. Veamos esto.

Page 247: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. CERRADURA, INTERIOR Y FRONTERA 235

Proposicion 14.29. A es cerrado ssi A = A.

Demostracion 14.30. =⇒) Sea p ∈ A, i.e. para todo Up ∈ τX se cumpleUp ∩ A 6= φ. Supongamos que p /∈ A, entonces p ∈ Ac = X \ A ∈ τX , ya que Aes cerrado. Entonces existe Vp ∈ τX con Vp ⊂ X \ A o sea Vp ∩ A = φ, lo cual

contradice el hecho que p ∈ A, entonces p ∈ A, i.e. A ⊂ A.⇐=) Sea q ∈ Ac y por tanto q /∈ A, entonces existe Vq ∈ τX con Vq ∩ A = φ

i.e. Vq ⊂ Ac para toda q. Entonces Ac es abierto.

Corolario 14.31. A cerrado implica que A es cerrado.

Proposicion 14.32. A es la interseccion de todos los cerrados en X que con-tienen a A.

Demostracion 14.33. Sea R = Rα | A ⊂ Rα, Rα cerradoα∈J . Sea x ∈∩α∈j

Rα. Demostremos que x es punto de adherencia de A, o sea que x ∈ A. Sea

M ∈ τX con x ∈ M . Supongamos M ∩ A = φ esto implica que A ⊂ M c que es uncerrado que contiene a A, entonces x ∈ M c ya que M c = Rα para algun α, lo quees una contradiccion. Por lo tanto M ∩ A 6= φ. Sea q ∈ A y sea Rα para algunα ∈ J . A ⊂ Rα implica que A ⊂ Rα = Rα se sigue entonces que q ∈ Rα paratodo α ∈ J es decir q ∈ ∩

α∈JRα.

Corolario 14.34. A es cerrado.

Ejemplo 14.35. Los ejemplos mas representativos y simples son en la rectareal con la topologıa canonica. Es claro que [a, b] es cerrado. La cerradura de

(a, b) = [a, b], etc.

Ejemplo 14.36. La cerradura del conjunto de los racionales o del conjunto delos irracionales son los reales, ya que junto a un racional siempre hay un irracionaly junto a un irracional hay un racional.

Ejemplo 14.37. Un ejemplo mas interesante es el conjunto ℜ\Z. Observemos

que ℜ\Z = ℜ.

Ejercicio 14.38. Demuestren quea) A ∪B ⊃ A ∪Bb) A ∩B ⊂ A ∩BDe una manera analoga se puede hacer lo mismo para puntos interiores de un

conjunto. Estos se definen como:

Definicion 14.39. Sea (X, τX) espacio topologico y p ∈ X. p es punto inte-rior de A ⊂ X si existe Vp ∈ τX con Vp ⊂ A, vean la figura 4.

Definicion 14.40. Al conjunto de puntos interiores de A ⊂ X se le llamainterior y se denota por A. Note que p ∈A implica que existe Vp ∈ τX con

p ∈ Vp ⊂ A, es decir A⊂ A, vean la figura 5

Proposicion 14.41. A es abierto ssı A =A.

Demostracion 14.42. =⇒) Sea p ∈ A, implica que existe Vp ∈ τX con Vp ⊂ A,

es decir p ∈A se sigue entonces que A ⊂A.⇐=) Sea p ∈ A, como A =A, entonces existe Vp ∈ τX con Vp ⊂ A, esto es, A

es abierto.

Page 248: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

236 14. ESPACIOS TOPOLOGICOS

Figure 4. La figura muestra los puntos interiores de A y algunosque no son puntos interiores de A. Compare esta figura con lasfiguras 2 y 3 anteriores sobre puntos de adherencia.

Figure 5. El interior de A. Compare esta figura con la figura 3que muestra la cerradura de A.

Proposicion 14.43. A es la union de todos los abiertos de X contenidos enA .

Demostracion 14.44. Sea U = Uα | Uα ⊂ A. Uα abiertoα∈J . Sea q ∈∪α∈J

Uα entonces q ∈ Uβ para algun β ∈ J tal que Uβ ⊂ A, por tanto q ∈A, sea

x ∈A. Esto implica que existe Vx ∈ τX con x ∈ Vx ⊂ A, o sea x ∈ ∪x∈J

Uα, por lo

tanto A= ∪α∈J

Uα.

Corolario 14.45. A es abierto.

Page 249: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. CERRADURA, INTERIOR Y FRONTERA 237

Ejemplo 14.46. Los ejemplos mas representativos y simples de nuevo son enla recta real con la topologıa canonica. Es claro que (a, b) es abierto. El interior de[a, b]o = (a, b), etc.

Ejemplo 14.47. El interior del conjunto de los racionales o del conjunto de losirracionales es vacio, ya que no hay abiertos que contengan racionales o irracionalessolamente.

Ejemplo 14.48. Un ejemplo mas interesante es de nuevo el conjunto ℜ\Z.Observemos que (ℜ\Z)o = ℜ\Z

Entonces, el interior es abierto y la cerradura es un cerrado. Para dar uncriterio de donde termina el espacio topologico, se define la frontera del conjunto.La idea intiutiva es simple y su definicion formal es como sigue:

Definicion 14.49. La frontera (topologica) de A es la interseccion de lascerraduras de A y su complemento, se denota ∂A, i.e.

∂A = A ∩Ac

La frontera de A tiene las siguientes propiedades:i) ∂A es cerrado, ya que es interseccion de cerrados.

ii) ∂Ac = Ac ∩ (Ac)c

= Ac ∩A = ∂Aiii) A = A∪∂A ya que si p ∈ A y p /∈ A se sigue que p ∈ Ac∩A ⊂ Ac∩A = ∂A,

lo que implica que A ⊂ A∪∂A, de la misma forma, si p ∈ A esto implica que p ∈ Ao y si p ∈ ∂A implica que p ∈ A ya que ∂A = A ∩Ac.

iv) ∂A = φ ssı A es cerrado y abierto a la vez. Esto es debido a que si ∂A = φse sigue que A = A ya que A = A ∪ ∂A, es decir A es cerrado. Por otro lado comoA = A, si A ∩Ac = φ esto implica que Ac ⊂ Ac, pero como Ac ⊂ Ac, se sigue queAc = Ac, entonces Ac es cerrado, por lo que A es abierto. Al contrario, si A escerrado, se sigue que A = A, A abierto implica que Ac es cerrado y por lo tantoAc = Ac. Entonces A ∩Ac = A ∩Ac = φ.

v) ∂X = ∂φ = φ ya que X y φ son abiertos y cerrados.vi) A es cerrado ssı ∂A ⊂ A, ya que A cerrado implica que A = A = A ∪ ∂A y

por lo tanto ∂A ⊂ A. A la inversa ∂A ⊂ A implica que A ∪ ∂A = A = A de dondese sigue que A es cerrado.

Ejemplo 14.50. Tomemos de nuevo un ejemplo sobre la recta real con la

topologıa canonica. La frontera de ∂(a, b) = (a, b)⋂

(a, b)c = [a, b]⋂

(−∞, a] ∪[b,∞) = a, b, etc.

Ejemplo 14.51. Regresemos al conjunto ℜ\Z. Observemos que

∂(ℜ\Z) = (ℜ\Z)⋂

(ℜ\Z)c = ℜ⋂Z = Z.

Es decir, el conjunto ℜ\Z es un conjunto abierto, cuya cerradura es ℜ y sufrontera es Z. Esto tambien quiere decir que Z es un conjunto cerrado, pues es lafrontera de ℜ\Z.

Ejercicio 14.52. Demuestre que la frontera del conjunto de los racionales odel conjunto de los irracionales son los reales.

Para terminar esta seccion, vamos a definir un conjunto denso. Un conjunto esdenso si su cerradura es todo el espacio, esto es:

Definicion 14.53. A es denso en X si A = X.

Page 250: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

238 14. ESPACIOS TOPOLOGICOS

Ejemplo 14.54. Claramente ℜ\Z es denso en los reales, pues su cerradura sonlos reales.

Comentario 14.55. Note que si A es un espacio metrico, A es denso si paratodo x ∈ X y para todo ǫ > 0 existe p ∈ A tal que p ∈ Bǫ(x).

3. Funciones Continuas

En esta seccion vamos a introducir conceptos tıpicos de espacios normadoso metricos relacionados con funciones, pero usando solo la topologıa del espacio.Vamos a iniciar con el concepto de continuidad de funciones en espacios topologicos.Basicamente la idea es la misma que en espacios metricos, pero como aquı notenemos una distancia, tenemos que usar solo la existencia de los abiertos. Laidea es entonces, que si podemos mapear un abierto, tan arbitrario (“pequeno”)como sea, y este es tambien abierto en el dominio, entonces la funcion es continua.Formalmente se tiene:

Definicion 14.56. Sean (X, τX) y (Y, τy) espacios topologicos. Se dice que elmapeo f : X → Y x→ f(x) es una funcion continua, si f−1(V ) ∈ τX para todoV ∈ τY , i.e. preimagenes de abiertos son abiertas.

Notacion 14.57. Al conjunto de funciones continuas se denota por Map(X,Y ) =C0(X,Y ).

Dado que en un espacio metrico la topologıa se construye con los abiertos delespacio, podemos demostrar una serie de proposiciones en espacios topologicos quedespues se pueden extender a espacios metricos o normados. Veamos la siguienteproposicion.

Proposicion 14.58. Sean (X, τX) y (Y, τY ) espacios topologicos f : X → Y,funcion. Son equivalentes

1) f es continua.2) Para todo x ∈ X y Wf(x) ∈ τY existe Vx ∈ τX tal que f(Vx) ⊂Wf(x)

3) f(A) ⊂ f(A) para todo A ⊂ X4) f−1(B) ⊂ f−1(B) para todo B ⊂ Y5) Si A es cerrado en Y implica que f−1(a) es cerrado en X.

Demostracion 14.59. 1) =⇒ 2) Sean x ∈ X y Wf(x) ⊂ τY ; como f es

continua x ∈ f−1(Wf(x)) ∈ τx y entonces existe Vx ∈ τX tal que Vx ⊂ f−1(Wf(x)),se sigue entonces que f(Vx) ⊂Wf(x) .

2) =⇒ 3) Sea b ∈ A, entonces para todo Ub ∈ τX se sigue que Ub ∩ A 6= φ,entonces φ 6= f(Ub ∩A) ⊂ f(Ub) ∩f(A). Sea Wf(b) ∈ τY arbitrario, por 2) existeVb ∈ τX con f(Vb) ⊂ Wf(b), por lo que f(Vb) ∩ f(A) ⊂ Wf(b) ∩f(A) es decir

f(b) ∈ f(A).

3) =⇒ 4) Sea a = f−1(B) con B ⊂ Y ; por 3 f(A) ⊂ f(A) = f (f−1(B)) ⊂ B,

ya que f(f−1(B)

)⊂ B. Por lo tanto, tambien f−1

(f(A)

)⊂ f−1(B) y como

A ⊂ f−1(f(A)

)tenemos A ⊂ f−1(B); o sea f−1(B) ⊂ f−1(B).

4) =⇒ 5) Sea B cerrado en Y , por 4) f−1(B) ⊂ f−1(B) = f−1(B) ⊂ f−1(B)

por lo que f−1(B) = f−1(B), entonces f−1(B) es cerrado en X.5) =⇒ 1) Sea B ∈ τY , entonces Bc es cerrado en Y , como f−1(Bc) =

(f−1(B))c, por 5) se tiene que(f−1(B)

)ces cerrado en X, o sea f−1(B) ∈ τX .

Page 251: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. FUNCIONES CONTINUAS 239

Proposicion 14.60. La composicion de funciones continuas es continua.

Demostracion 14.61. Sean (X, τX) , (Y, τY ) y (Z, τz) espacios y f : X →Y, g : Y → Z funciones continuas. Se tiene que si U ′′ ∈ τz entonces g−1(U ′′) ∈ τYy por lo tanto f−1(g−1(U ′′)) = f g (U ′′) ∈ τZ .

Las funciones en espacios que son productos cartesianos tambien tienen un cri-terio de continuidad. Estas funciones son interesantes y seran usadas mas adelante,por ahora veamos este criterio de continuidad usando la siguiente proposicion:

Proposicion 14.62. Sean (X, τX) , (Y, τY ) y (Z, τZ) espacios y f : X×Y → Zfuncion. f es continua ssı para todo Wf(x,y) ∈ τz existe Ux ∈ τX y Vy ∈ τY talesque f(Ux × Uy) ⊂Wf(x,y).

Demostracion 14.63. ⇐=) Sea Wf(x,y) ∈ τZ esto implica que existe Ux ∈τX , Vy ∈ τY con f(Ux×Vy) ⊂Wf(x,y) con Ux×Vy ∈ τX × Y , esto implica que para

todo (x, y) ∈ X × Y existe Ux × Vy ∈ τX × Y tal que Ux × Vy ⊂ f−1(Wf(x,y)) por

lo que f−1(Wf(x,y)) ∈ τX×Y .

=⇒) Sea Wf(x,y) ∈ τZ , entonces f−1(Wf(x,y)) ∈ τX×Y esto implica que para

todo (x, y) ∈ f(Wf(x,y)) existe Ux × Vy ∈ τX×Y tal que Ux × Vy ⊂ f−1(Wf(x,y)),por tanto f(Ux × Vy) ⊂Wf(x,y).

Mas adelante, en la construccion de los haces, vamos a necesitar el uso de laproyeccion, que es una funcion que mapea solo una parte de un producto cartesianode espacios topologicos. Vamos a introducir ahora este concepto.

Definicion 14.64. Sea (X×Y, τX×Y ) espacio producto de los espacios (X, τX)y (Y, τY ). A las funciones Πx : X×Y → X, (x, y)→ x y Πy : X×Y → Y, (x, y)→ yse les llama las proyecciones de X × Y , ver figura 6.

Figure 6. La proyeccion del producto cartesiano de X y Y . Elmapeo va de X × Y a X , y mapea el punto (x, y) en x.

Page 252: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

240 14. ESPACIOS TOPOLOGICOS

Proposicion 14.65. Πx y Πy son continuas.

Ejercicio 14.66. Demostrar la proposicion.

Definicion 14.67. Sea (A, τA) subespacio topologico de (X, τX). La inclusionde A en X es la funcion identidad restringida a A , i.e.

i : A → X

x → i(x) ≡ id |X |ATambien se denota como i : A → X.

Proposicion 14.68. Sea f continua, f = X → Y y (A, τA) subespacio topologicode (X, τX). Entonces la restriccion de f a A es continua.

Ejercicio 14.69. Demostrar la proposicion

Ejercicio 14.70. Demostar que i es continua.

El concepto mas importante en espacios topologicos es tal vez este que nosda el concepto de isomorfismo entre ellos. Los isomorfismos aquı son llamadoshomeomorfismos. Ahora vamos a introducirlos, para esto necesitamos primero elconcepto de funcion abierta. Iniciemos con este.

Definicion 14.71. Sea f : X → Y funcion. f se llama abierta si imagenesde abiertos son abiertas, i.e. si para todo U ∈ τX se tiene que f(U) ∈ τY .

Definicion 14.72. Un homeomorfismo es una funcion continua, biyectiva yabierta.

Esta difinicion nos garantiza entonces que la inversa es una funcion continua yabierta. Es decir:

Proposicion 14.73. Sea f homeomorfismo, entonces f−1 es continua.

Demostracion 14.74. Por ser biyectiva existe f−1 con f−1 f = Id |X . Porser abierta se sigue que f(U) = V ∈ τY para todo U ∈ τx ya que la inversa de f−1

es f . De donde que f−1 es continua.

Definicion 14.75. Dos espacios topologicos se dicen homeomorfos si en-tre ellos existe un homeomorfismo. A las propiedades invariantes bajo homeomor-fismos se les llama propiedad topologica.

Es decir, los homeomorfismos me dan un criterio para decir cuando dos espaciostopologicos son el mismo, desde el punto de vista de espacio topologico. Es mas,los homeomorfismos separan el conjunto de los espacios topologicos en clases deequivalencia. Vamos a ver esto, primero veamos que la relacion: dos espacios estanrelacionados entre si, si son homeomorfos, es una relacion de equivalencia.

Proposicion 14.76. Sean (X, τX), (Y, τY ), (Z, τZ) espacios. La relacion Xhom∼

Y “dos espacios son homeomorfos”, es una relacion de equivalencia.

Ejercicio 14.77. Demostrar la proposicion.

Entonces los espacios homeomorficos forman clases de equivalencia en las cualesse conservan sus propiedades topologicas. Estas clases sirven para clasificar a losespacios topologicos. Otra propiedad interesante y muy importante es el hecho quelos homeomorfismos con la operacion de composicion de funciones forma un grupo,llamado el grupo de automorfismos. Veamos esto.

Page 253: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. TOPOLOGIA COCIENTE 241

Proposicion 14.78. Sea (X, τX) espacio topologico yAut (X) = f | f : X −X homeomorfismo. Entonces el par (Aut(X), ) es

un grupo llamado el grupo de automorfismos de X.

Ejercicio 14.79. Demostrar la proposicion.

Para terminar esta seccion veamos ahora el concepto de camino y trayectoria.Estos conceptos son muy usados para definir geodesicas y conceptos relacionadoscon estas. Formalmente, la definicion de camino o trayectoria es:

Definicion 14.80. Sea (X, τX) espacio topologico e I ⊂ ℜ. A una funcionc : I → X se le llama un camino o trayectoria en X.

Entonces, una curva es la imagen de una trayectoria, esto es:

Definicion 14.81. Sea c ∈ C0(I,X). A la imagen de c se le llama la curvade c.

Estos dos conceptos deben quedar claros, un camino es la funcion misma mien-tras que la curva es la imagen de la funcion. Son conceptos muy distintos, el primeroes un elemento del conjunto de funciones y el segundo es un subconjunto del codo-minio de la funcion. Por otro lado, una reparametrizacion es una composicion dela curva con un automorfismo monotono creciente del dominio I de ℜ de la curva,es decir:

Definicion 14.82. Sea ϕ ∈ Aut+(I) = f ∈ Aut(I) | f(t′) > f(t), t′ > t yc ∈ C0(I,X). A la funcion ϕ∗ : C0(I,X) → C0(I,X), c → ϕ∗(c) = c ϕ se lellama una reparametrizacion de c.

Lo interesante de este concepto es que las curvas (no los caminos) son invari-antes ante estos automorfismos, es decir:

Proposicion 14.83. Las curvas son invariantes bajo reparametrizaciones.

Demostracion 14.84. Sea c ∈ C0(I,X) trayectoria y Γc = c(I) la curvacorrespondiente. Entonces Γϕ∗(c) = ϕ∗(c)(I) = c ϕ(I) = c(ϕ(I)) = c(I) = Γc.

Ejemplo 14.85. Al camino c(t) = p para todo t ∈ I se le llama caminoconstante.

Ejemplo 14.86. Sea c : [0, 1] → X con c(0) = c(1) = p. A este camino se lellama lazo o loop en X.

4. Topologıa cociente

Imaginemos que podemos construir una funcion entre dos conjuntos y que eldominio tiene una topologıa. Entonces podemos mapear los abiertos del dominioal codominio y definir estos como abiertos del codominio. Surge la pregunta siahora las imagenes de estos abiertos forman una topologıa para el codominio. Larespuesta la podemos dar en la siguiente proposicion.

Proposicion 14.87. Sean (X, τX) espacios Y conjunto y f : X → Y funcionsobre. El conjunto τf =

V ∈ P (Y ) | f−1(V ) ∈ τX

es una topologıa para Y , lla-

mada topologıa cociente de Y respecto a f .

Page 254: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

242 14. ESPACIOS TOPOLOGICOS

Demostracion 14.88. i) φ ∈ τf ya que f−1(φ) = φ ∈ τX y Y esta en τf yaque f es sobre y por lo tanto f−1(Y ) = X ;

ii) Sean V1, · · · , Vn ∈ τf , entonces f−1(∪ni=1Vi) = ∪ni=1f−1(Vi) ∈ τX se sigue

que ∩ni=1Vi ∈ τf ya que cada f−1(Vi) ∈ τX ;iii) Sea Vαα∈K con Vα ∈ τf . Entonces f−1( ∪

α∈KVα) = ∪

α∈Kf−1(Vα) ∈ τX

pues cada f−1(Vα) ∈ τX , se sigue entonces que ∪α∈K

Vα ∈ τf .

Vamos a estudiar unos ejemplos de como podemos construir espacios topologicosusando mapeos sobre. Para hacer esto, lo importante es construir la funcion sobrecon la cual construimos el espacio topologico del codominio. Sea (X, τX) espaciotopologico y ∼ una relacion de equivalencia en X . La funcion p = X → X/ ∼ esuna funcion sobre que asocia a cada elemento de X, x→ [x] su clase. La topologıaτX/∼ = V ∈ P (X/ ∼) | p−1(V ) ∈ τX es una topologıa para el conjunto de clasesde equivancia X/ ∼.

Sea I × I =(x, y) ∈ ℜ2 | 0 ≤ x ≤ 1, 0 < y < 1

subespacio topologico de ℜ2.

Entonces:

Ejemplo 14.89. Sea la relacion de equivalencia pr1q si p = q ∈ ℜ2 i.e. (x, y) =

(x′, y′) , o si p 6= q (p, q) = ((0, y), (1, y)) o ((1, y), (0, y)) y la relacion pr2q como

p = q o si p 6= q, (p, q) = ((0, y), (1, 1− y)) o ((1, y), (0, 1− y)) . Graficamente seve en las figura 7 y figura 8.

Figure 7. El producto cartesiano de los intervalos [1, 1] × [1, 1]con la relacion r1, es topologicamente igual al cilindro.

Cilindro=

(I × I/r1, τI×I/r1

)Cinta de Mobius=

(I × I/r2, τI×I/r2

)

Ejemplo 14.90. Sea I2

=(x, y) ∈ ℜ2 | 0 ≤ x, y ≤ 1

. Sea la relacion pr3q

si p = q, o p 6= q, (p, q) = ((0, y), (1, y)) o ((1, y), (0, y)) y (p, q) = ((x, 0), (x, 1)) o((x, 1), (x, 0)). Y la relacion pr4q si p = q o (p, q) = ((0, y), (1, y)) o ((1, y), (0, y))y (p, q) = ((x, 0), (1− x, 1)) o ((1− x, 1), (x, 0)). Graficamente se ve en las figura9 y figura 10

Toro=(I2/r3, τI2/r3

)Botella de Klein=

(I2/r4, τI2/r4

)

Page 255: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. ESPACIOS COMPACTOS 243

Figure 8. De la misma forma, el producto cartesiano de los in-tervalos [1, 1]× [1, 1] con la relacion r2, es topologicamente igual ala cinta de Mobius

Figure 9. El producto cartesiano de los intervalos [1, 1] × [1, 1]con la relacion r3, es topologicamente igual al Toro.

5. Espacios Compactos

Entre las nociones intuitivas que tenemos de conjuntos, existen dos clases quese diferencian notablemente. Existen espacios como ℜ que no tienen fin y otroscomo la esfera que son finitos. Por supuesto, desde el punto de vista matematicopodemos dar una diferenciacion de estos espacios, ya que no es lo mismo que unconjunto no tenga fin o principio o que este conjunto sea simplemeten muy grande.Para dar una nocion concreta de estos conceptos, diremos que los conjuntos comola esfera, son compactos. Basicamente la diferencia es que a la esfera la podemoscubrir con un numero finito de abiertos. La definicion formal es:

Definicion 14.91. Sean (X, τX) espacio topologico y A ⊂ X. A es un con-junto compacto si toda cubierta U de A contiene una subcubierta finita.

Page 256: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

244 14. ESPACIOS TOPOLOGICOS

Figure 10. De la misma forma, el producto cartesiano de los in-tervalos [1, 1]× [1, 1] con la relacion r4, es topologicamente igual ala Botella de Klein.

Proposicion 14.92. Sean (X, τX), (Y, τY ) espacios y f : X → Y funcion con-tinua. Entonces la imagen de subconjuntos compactos de X son subconjuntos com-pactos de Y .

Demostracion 14.93. Sea A subconjunto compacto de X y sea V = Vαα∈Kuna cubierta de f(A), entonces V−1 =

f−1(Vα)

α∈K es una cubierta de A. Como

A es compacto, existe una cubierta finita de A, U =f−1(Vj)

NJ=1

, subcubierta

de V−1 . Como f(f−1(Vj)

)⊂ Vj tenemos que f(A) ⊂ f

(∪Nj=1f

−1(Vj))⊂ ∪Nj=1

f(f−1(Vj)

)⊂ ∪Nj=1Vj, por lo que VjNJ=1 es una cubierta finita de f(A).

El punto mas importante de los espacio compacto es el hecho que:

Proposicion 14.94. Ser espacio compacto es una propiedad topologica.

Demostracion 14.95. Solo daremos una idea de la demostracion. Se de-sprende del hecho que si X es compacto, f(X) lo es y si f es homeomorfismo,f−1(X) tambien es compacto.

En lo que sigue hablaremos de algunas propiedades de los espacios compactosy de como se puede saber si un espacio es o no compacto. Por lo general no es facildemostrar que un espacio es o no compacto. Pero usando las dos siguientes proposi-ciones, de la segunda no daremos su demostracion, se puede verificar la propiedadde compacto en muchas ocaciones. Comencemos por la siguiente proposicion.

Proposicion 14.96. Si (X, τX) es compacto y Y tiene la topologıa cociente τfcon respecto a f : X → Y , sobre, entonces se sigue que (Y, τf ) es compacto.

Demostracion 14.97. Como τY = τf , f es continua y como f es sobref(X) = Y . Entonces Y es imagen continua de un compacto por lo tanto es com-pacto.

Proposicion 14.98. [0, 1] ∈ ℜ es compacto.

Otra propiedad que ayuda a verificar si un espacio es o no compoacto es lasiquiente:

Page 257: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. ESPACIOS COMPACTOS 245

Proposicion 14.99. Todo subconjunto cerrado de un espacio compacto, escompacto.

Demostracion 14.100. Sea A subconjunto cerrado de X y sea U = Uαα∈Juna cubierta de A. A cerrado implica que Ac ∈ τX y Uext = Uα, Acα∈J esuna cubierta de X, ya que A ⊂ ∪

α∈JUα. Si X es compacto, entonces existe una

subcubierta finita V de Uext. Vext = Vi, Acni=1 que cubre X. Por tanto V =

ViNi=1 es cubierta finita de A, ya que para todo Vj ∈ Vext existe Ur ∈ Uext tal queVj = Ur, es decir, A es compacto.

Tambien es facil imaginarse que el producto cartesiano de espacios compactos,es compacto. Formalmente se tiene la siguiente proposicion:

Proposicion 14.101. El producto topologico (X × Y, τx×y) es compacto sı cada(X, τX) y (Y, τy) es compacto.

Demostracion 14.102. Solo demostraremos una direccion. =⇒) Como X×Yes compacto, entonces Π1 : X × Y = X y Π2 : X × Y → Y son compactos, ya queΠ1 y Π2 son continuas.

De estas propiedades resultan algunos ejemplos y resultados sencillos. Por

ejemplo tenemos que el n-cubo es compacto, i.e. IN ⊂ ℜn es compacto.

Otro concepto relacionado con espacios compactos, es el concepto de conjuntoacotado, concepto que se puede dar en un espacio normado. Entonces podemosdefinir conjuntos acotados en los reales, utilizando su norma canonica. Intuiti-vamente, un espacio compacto debe ser acotado, finito. Formalmente se tiene ladefinicion:

Definicion 14.103. Sea A subconjunto de (ℜn, τℜn) y n ∈ Z+. Se dice que Aes un conjunto acotado si para todo x = (x1, · · · , xn) ∈ A, existe K ∈ ℜ+, talque

∣∣xi∣∣ ≤ K para todo i = 1, · · · , xm.

Con el siguiente teorema podemos relacionar entonces ambos conceptos.

Teorema 14.104 (de Heine-Borel). Todo subconjunto de ℜn cerrado y acotado,es compacto.

Demostracion 14.105. A acotado ⇒ A ⊂ [−K,K]n hom

≅ In

para algun K. Acerrado y [−K,K]

ncompacto implica A compacto.

Ahora usemos lo anterior para verificar si algunos espacios son compactos,veamos algunos ejemplos.

Ejemplo 14.106. In ⊂ ℜn es cerrado y acotado, por lo tanto es compacto.

Ejemplo 14.107. Sn ⊂ Rn+1 es cerrado y acotado, por lo tanto es compacto,etc.

Otro concepto interesante, que solo mencionaremos, es el de espacios paracom-pactos. Para definirlo, es necesario introducir la siguiente definicion.

Definicion 14.108. Una familia F de subconjuntos de (X, τX) es localmentefinita o finita por vecindades, si para todo x ∈ X existe Ux ∈ τX tal que Uxintersecta a lo mas un numero finito de elementos de F .

Page 258: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

246 14. ESPACIOS TOPOLOGICOS

Definicion 14.109. Un refinamiento de U es una cubierta V = Vββ∈Kde (X, τX) tel que para todo Vβ ∈ V existe Uα ∈ U con Vβ ⊂ Uα. Se denota porVββ∈J < Uαα∈J .

Proposicion 14.110. Toda subcubierta de una cubierta es un refinamiento.

Demostracion 14.111. Sea V una subcubierta de U , esto implica que paratodo Vβ ∈ V existe Uα ∈ U con Vβ = Uα ⊂ Uα.

Definicion 14.112. Un espacio es paracompacto si toda cubierta tiene unrefinamiento finito por vecindades.

Este concepto, en cierta forma, es mas general que el concepto de espacioscompactos, ya que:

Proposicion 14.113. Todo espacio compacto es paracompacto.

Demostracion 14.114. X compacto implica que toda cubierta U de X tieneuna subcubierta finita, esto quiere decir que cualquier vecindad Ux de x ∈ X inter-secta a lo mas un numero finito de elementos del refinamiento V de U .

Los espacios que no son compactos, se pueden en ocaciones, compactificar. Laforma mas simple de entenderlo es dando un ejemplo sencillo. Imaginemos la rectareal, la cual se extiende indefinidamente hacia los numeros positivos y negativos.Ahora tomemos la recta real y unamos los puntos extremos, tanto de lado negativocomo del lado positivo. Lo que se tendra es un cırculo, que puede ser de radio 1,por simplicidad. Este cırculo es una forma compacta de escribir la recta real, dondeahora si tenemos un numero que representa el infinito (en los reales, el infinito no esun numero, es solo un concepto para designar muy grande). Formalmente se puedehacer este proceso, siguiendo los pasos de la siguiente proposicion que enunciaremossin demostracion.

Proposicion 14.115. Sea (X, τX) espacio topologico y ∗ /∈ X. Sea∧τ = τX ∪

V ∪ ∗V ∈K con K = abiertos con complemento compacto en X. Entonces

1)∧τ es una topologıa para

∧X = X ∪ ∗

2) (X, τX) es subespacio topologico de

( ∧X,

∧τ

)

3)

( ∧X,

∧τ

)es compacto

4) X es denso en

( ∧X,

∧τ

)si X no es compacto.

Notacion 14.116. A la topologıa∧τ = τX ∪ V ∪ ∗V ∈K con K = abiertos

con complemento compacto en X se le llama la compactificacion por un puntode (X, τX) o simplemente compactificacion de X.

Ahora veamos el ejmplo de la compactificacion de la recta real formalmente. Loque vamos a hacer es agregarle un punto a la recta real, que podemos llamar tambienel infinito, pero puede ser lo que sea. Y luego definimos un homeomorfismo que vayadel cırculo a la recta real. Ası demostramos que el cırculo es una compactificacionde la recta real. Aquı estudiaremos el ejemplo mas general de la compactificacionde ℜn, esto es:

Page 259: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. ESPACIOS COMPACTOS 247

Ejemplo 14.117. La compactificacion por un punto de ℜn esta dada por∧ℜn =

ℜn ∪ ∞, veamos esto.Consideremos la funcion:

σ : Sn→∧ℜn

es decir

σ :(x1, · · · , xn+1

)→ (

x1, · · · , xn)/(1− xn+1

)si x 6= (0, · · · , 0, 1)

∞ si x = (0, · · · , 0, 1)

el cual es un homeomorfismo, con inversa σ−1 : ℜn → Sn dada por

σ−1 :

(x1, · · · , xn

)→ 1

1+(x1)2+···+(xn)2

(2x1, · · · , 2xn, (x1)2 + · · ·+ (xn)2 − 1

)

∞ → (0, · · · , 0, 1)

Entonces Snhom∼= ℜn. Ejemplos de esto son el cırculo S1

hom∼= ℜ y la esfera S2hom∼=

ℜ2 = ℜ2 ∪ ∞ ∼= C ∪ ∞ llamada esfera de Riemann, etc. A la funcion σ sele llama proyeccion estereografica . Vean la figura 11

Figure 11. La proyeccion estereografica en el plano. Esta funcionproyecta los puntos del cırculo 1 -1 en la lınea recta. De la mismaforma, la proyeccion estereografica proyecta 1 -1 cualquier esferade dimension arbitraria (finita) en un plano de la misma dimension.

Para terminar esta seccion daremos una clasificacion interesante de los espaciostopologicos segun su estructura.

Definicion 14.118. Sea(X, τX) espacio topologico.· Se dice que X es espacio T0 si para todo x, y ∈ X , x 6= y, existe Ux con

y /∈ Ux o existe Uy con x /∈ Uy· Se dice que X es espacio T1 si para todo x, y ∈ X, x 6= y, existe Ux y Uy

con y /∈ Ux y x /∈ Uy· Se dice que X es espacio T2 o Hausdorff si para todo x, y ∈ X, x 6= y,

existe Ux, Uy con Ux ∩ Uy = φ· Se dice que X es espacio T3 o espacio regular, si X es T1 y si para todo

x ∈ X y F cerrado en X con x /∈ F , existe Ux y U en τX con F ⊂ U y Ux∩U = φ

Page 260: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

248 14. ESPACIOS TOPOLOGICOS

· Se dice que X es espacio T4 o espacio normal , si X es T1 y para todoF,G cerrados disjuntos en X, existe U, V ∈ τX tal que U ∩V = φ y F ⊂ U, G ⊂ V ,ver figura 12.

Figure 12. Clasificacion de los espacios topologicos.

Ejercicio 14.119. Muestre que todo espacio T2 es T1

Ejercicio 14.120. Muestre que todo espacio T1 es T0

Ejercicio 14.121. Muestre que todo espacio metrizables es T2

Ejercicio 14.122. Muestre que todo espacio metrico es Hausdorff.

6. Espacios Conexos

Un espacio topologico puede ser tambien hecho de piezas separadas, o pedazossin union. Cuando los espacios son hechos de una sola pieza, se dice que son espa-cios conexos. Para definir los espacios conexos es mas sencillo definir los espaciosdisconexos, es decir:

Page 261: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

6. ESPACIOS CONEXOS 249

Definicion 14.123. Un espacio topologico (X, τX) es disconexo si existenA,B ∈ τX tales que A,B 6= φ, A ∪B = X y A ∩B = φ.

Definicion 14.124. Un espacio es conexo si no es disconexo.

Definicion 14.125. Sea (X, τX) espacio topologico y A ⊂ X (subespacio). Aes conexo si lo es como subespacio topologico de X.

Algunos ejemplos simples son:

Ejemplo 14.126. El espacio de Sierpinski es conexo, ya que X = a, b yτX = φ, a, b , a, siempre, ya que a, b ∪ a = X y a, b ∩ a 6= φ.

Ejemplo 14.127. La topologıa discreta es disconexa, ya que para todo A 6= φ,X con A ∈ P (X), Ac ∈ P (X) y A ∩Ac = φ, con A ∪Ac = X

Por definicion, en un espacio topologico el vacio y todo el espacio son abiertosy cerrados a la vez. En base a esto, un criterio para decidir si un espacio es conexo,es el siguiente.

Proposicion 14.128. Sea (X, τX) espacio. X es conexo, ssı los unicos abiertosy cerrados a la vez son X y φ, ademas no existe f ∈ C0 (X, 0, 1) sobre.

Finalmente, ser conexo es tambien una propiedad topolologica. Para ver esto,veamos la siguiente proposicion.

Proposicion 14.129. La imagen continua de conexos es conexa.

Demostracion 14.130. Sea f : X → Y continua y (X, τX) espacio conexo.Supongamos que

(f(X), τf(x)

)⊂ (Y, τY ) no es conexo. Entonces existe g : f(X)→

0, 1 continua y sobre y por lo tanto gf ∈ C0 (X, 0, 1) y es sobre, lo que implicaque (X, τX) no es conexo, lo que contradice la hipotesis.

Proposicion 14.131. Ser conexo es una propiedad topologica.

Demostracion 14.132. Basta tomar un homeomorfismo, como es sobre y con-tinuo, la imagen de un conexo sera conexa y lo mismo para la inversa.

Vamos a ver algunos ejemplos representativos:

Ejemplo 14.133. Todos los intervalos en ℜ son conexos.

Ejemplo 14.134. ℜ es conexo, ya que ℜhom∼= (−1, 1) que es conexo.

Ejemplo 14.135. S1 es conexo ya que f : [0, 1]→ S1, τ → (cos (2πt) , sen (2πt))es continua.

Page 262: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 263: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 15

VARIEDADES DIFERENCIALES

1. Variedades

Las variedades son espacios topologicos que son localmente igual a ℜn . Estehecho permite entonces utilizar conceptos que conocemos de ℜn y usarlos en la var-iedad, al menos localmente (es decir, al menos para cada abierto). Por ejemplo, ladiferencial es un concepto bien importante de ℜn porque nos da un modelo simplede movimiento. El movimiento es la propiedad mas importante de todo objeto enla naturaleza, de hecho la fısica se dedica a estudiar principalmente esta caracter-istica, el movimiento. Ya sea el movimiento de un objeto o el movimiento de loscampos en el espacio tiempo o el movimiento de las cantidades termodinamicas enun solido. Esa es la razon de la importancia del calculo diferencial, tanto en cien-cias exactas, como en su aplicacion mas directa, que es la tecnologıa avanzada. Lasvariedades diferenciales son una generalizacion del calculo diferencial a variedades,que llamamos variedades diferenciales. En la actualidad, las variedades diferen-ciales tienen aplicacion en un gran numero de areas de la ciencia y la tecnologıa.Por solo nombrar algunas, diremos que el mejor modelo que se tiene hasta el mo-mento del espacio tiempo es el de una variedad diferenciable. El estudio de teorıade campos en espacios curvos necesita para su mejor comprension de las variedadesdiferenciables. La funcion de calor en termodinamica es una fafiana, es decir, una1-forma, que es un concepto formal de variedades diferenciables. O el estudio mod-erno del control automatico en ingenierıa, usa intensivamente la herramienta de lasvariedades diferenciales, etc. En este capıtulo daremos los conceptos mas impor-tantes de las variedades y de las variedades diferenciables. Vamos a empezar porsu definicion.

Definicion 15.1. Una variedad real de dimension n es un espacio topologicode Hausdorff (Mn, τMN ), tal que para todo elemento p ∈ Mn existe una ternac = (Up, ψ, V ) donde Up ∈ τMn , V ∈ τℜn y ψ : Up → V , homeomorfismo. Verfigura 1.

Es decir, una variedad es un espacio topologico que localmente es ℜn (o sea,para todo p ∈Mn, se tiene que Up ∈ τMn , es homeomorfo a ℜn). Si en la definicioncambiamos real por complejo, tenemos variedades complejas de dimension n. Por

ejemplo, Chom∼= ℜ2 es una variedad compleja de dimension uno.

Para trabajar con variedades se acostumbra definir algunos conceptos de lavariedad, que estaremos usando en el futuro.

Definicion 15.2. Sea Mn una variedad, a:· cα = (Uα, ψα, Vα) , ∪

α∈JUα = Mn se le denomina carta sobre Mn

· Uα se le llama dominio de la carta.· (Uα, ψα) se le llama sistema de coordenadas sobre Uα

251

Page 264: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

252 15. VARIEDADES DIFERENCIALES

Figure 1. Una variedad real de dimension n es un espaciotopologico de Hausdorff localmente homeomorfo a ℜn .

·(ψ−1α , Vα

)se le llama parametrizacion de Uα

· Vα = ψα (Uα) se le llama imagen de la carta cα· ri : ℜn → ℜ,

(λ1, · · · , λn

)→ ri

(λ1, · · · , λn

)= λi se llama la i-esima

funcion coordenada sobre ℜn· xiα := ri ψα es la i-esima funcion coordenada del sistema de coorde-

nadas· Sean cα y cβ dos cartas cα = (Uα, ψα, Vα) y cβ = (Uρ, ψβ, Vβ). A las funciones

ψαβ := ψβ ψ−1α : ψα (Uα ∩ Uβ) → ψβ (Uα ∩ Uβ) y se les llama funciones de

transicion, donde ψαβ es un homeomorfismo, ver figura 2.

Comentario 15.3. Las funciones(x1α, · · · , xnα

): Uα → ℜn

p→(x1α, · · · , xnα

)(p)

se pueden representar como ψα =(x1α, · · · , xnα

)

Comentario 15.4. Todos los conceptos de la definicion 15.2 dependen de losabiertos del espacio topologico. Se dice entonces que son conceptos locales.

Es decir, cuando hablemos de algun concepto local, significa que este conceptovale en los abiertos del espacio. Veamos algunos ejemplos de variedades.

Page 265: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. VARIEDADES 253

Figure 2. En esta figura se muestran dos cartas, con sus dominios,sus sistemas coordenados, sus imagenes y sus funciones de tran-sicion.

Ejemplo 15.5. (ℜ, τℜn) es una variedad real de dimension n con una sola cartac = (ℜn, id|ℜn ,ℜn) .

Ejemplo 15.6 (Pelota). Vamos a estudiar un ejemplo que vamos a utilizar alo largo de estos capıtulos. Se trata de las pelotas o

(S2, τS2

), con su topologıa

heredada de ℜ3. La pelota es una 3-esfera y es una variedad 2-dimesional real queal menos tiene dos cartas. Estas son:

c1 =(U1, σ+,ℜ2

)con U1 = S2\ (0, 0, 1) .

donde el homeomorfismo σ+ esta definido como:

σ+ (x, y, z) =1

1− z (x, y)

cuya inversa esta dada por:

σ−1+ (x, y) =

1

1 + x2 + y2

(2x, 2y, x2 + y2 − 1

)

Analogamente, la segunda carta, ahora sin el polo sur, esta dada por:

c2 =(U2, σ−,ℜ2

)con U2 = S2\ (0, 0,−1) .

Page 266: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

254 15. VARIEDADES DIFERENCIALES

donde el homeomorfismo σ− esta definido como:

σ− (x, y, z) =1

1 + z(x, y)

cuya inversa esta dada por:

σ−1− (x, y) =

1

1 + x2 + y2

(2x, 2y,−x2 − y2 + 1

)

Entonces U1 ∪ U2 = S2 y σ+ y σ− son homeomorfismos. A σ+ se le llama laproyeccion estereografica desde el norte y a σ− desde el sur.

Ejemplo 15.7 (Esferas). Vamos ahora a generalizar el ejemplo anterior acualquier dimension, y formemos la variedad de las esferas. La esfera con sutopologıa heredada de ℜn, es el espacio topologico (Sn, τSn). La n-esfera es unavariedad n-dimesional, real que al menos tiene dos cartas. Estas son:

c1 = (U1, σ+, V1) con U1 = Sn\ (0, · · · , 0, 1) , V1 = ℜndonde el homeomorfismo σ+ esta definido como:

σ+

(x1, · · · , xn+1

)=

1

1− xn+1

(x1, · · · , xn

)

cuya inversa esta dada por:

σ−1+

(x1, · · · , xn

)=

1

1 + x12 + · · ·+ xn2

(2x1, · · · , 2xn, x12

+ · · ·+ xn2 − 1)

Hay que comparar estos homeomorfismos con los de la compactificacion de ℜnen el ejemplo 14.117. Analogamente, la segunda carta, ahora sin el polo sur, estadada por:

c2 = (U2, σ−, V2) con U2 = Sn\ (0, · · · , 0,−1) , V2 = ℜndonde el homeomorfismo σ− esta definido como:

σ−(x1, · · · , xn+1

)=

1

1 + xn+1

(x1, · · · , xn

)

cuya inversa esta dada por:

σ−1−(x1, · · · , xn

)=

1

1 + x12 + · · ·+ xn2

(2x1, · · · , 2xn,−x12 − · · · − xn2 + 1

)

Entonces U1 ∪ U2 = Sn y σ+ y σ− son homeomorfismos. Igual que en el casode las pelotas, a σ+ se le llama la proyeccion estereografica desde el norte y aσ− desde el sur.

En lo que sigue, vamos a trasladar el concepto de diferencial a la variedadutilizando los homeomofismos de esta en ℜn. Como sabemos como diferenciar enℜn, podemos definir diferenciales en la variedad. Cuando esto se puede, se dice quela variedad es suave. Recordemos la definicion de suave en ℜn.

Definicion 15.8. Sean U y V abiertos de ℜn y ℜm respectivamente y f : U →V . Se dice que f es suave si ri f : U → ℜ tiene derivadas de todos los ordenes.

Page 267: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. VARIEDADES 255

Vamos a entender lo que es una variedad diferenciable. En una forma simple sepuede decir que una variedad diferenciable es basicamente una variedad en dondelas funciones de transicion son suaves. Otra manera de decirlo es la siguiente.Dos cartas se dicen compatibles si su funcion de transicion es suave, es decir, unavariedad se dice diferenciable si esta cubierta con cartas compatibles. Formalmentese tiene:

Definicion 15.9. Dos cartas cα y cβ son compatibles sii) Uα ∩ Uβ = φ oii) Uα ∩ Uβ 6= φ y las funciones de transicion son suaves.

Definicion 15.10. Un atlas sobre Mn es una coleccion de cartas compatiblesque cubran Mn.

Definicion 15.11. Una variedad real diferenciable o suave de dimensionn es un par (Mn,A) donde Mn es una variedad real de dimension n y A es unatlas sobre Mn, ver figura 3.

Figure 3. Una variedad real diferenciable suave de dimension nes una variedad real de dimension n en donde las funciones detransicion son suaves.

Definicion 15.12. Dos atlas A y A′ sobre Mn son equivalentes si cα y c′βson compatibles para toda cα ∈ A y c′β ∈ A′.

Page 268: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

256 15. VARIEDADES DIFERENCIALES

Si tomamos todo el conjunto de atlas sobre Mn, la relacion A ∼ A′ con Aes equivalente a A′, es una relacion de equivalencia, la cual separa el conjunto decartas equivalentes en clases de equivalencia. Si solo usamos los representantes delas clases, lo que se tiene es una estructura direrenciable.

Definicion 15.13. [A], el conjunto de clases de atlas sobre Mn se llama unaestructura diferenciable sobre Mn

Intiutivamente, una variedad suave es aquella que tiene una forma suave, esdecir, sin aristas o puntas como las del cuadrado o el cubo, sino es suave como elcırculo o la esfera.

Ejercicio 15.14. Sean (Mn,A) y (Nn,B) variedades diferenciables. Demuestreque (Mn ×Nn,A× B) es variedad diferenciable.

Ejercicio 15.15. Sea (Sn,A) , A = c1, c2 del ejercicio 15.7 de esferas. De-muestre que (Sn,A) es variedad diferenciable.

2. Funciones suaves

El siguiente paso es definir la diferencial en una variedad diferenciable. Parahacer esto, lo que se acostumbra es transladar a ℜn por medio de los homeomor-fismos, la diferenciabilidad de una funcion. Vamos a iniciar con la definicion dediferencial de una funcion.

Definicion 15.16. Sea f : Mn → ℜ una funcion en una variedad (Mn, A). fes suave o diferenciable si f ψ−1

α : ψα (Uα) → ℜ es suave para toda carta deA, ver figura 4.

Es decir, una funcion f que va de la variedad a los reales es suave, si su funcioncorrespondiente, la que va de ℜn a los reales, es suave. Para analizar la funcion fentonces, es necesario estudiar su funcion f ψ−1

α correspondiente.

Notacion 15.17. Se denota al conjunto de funciones suaves por C∞ (Mn,ℜ)o al conjunto de funciones suaves en la vecindad de x por C∞ (Mn, x,ℜ)

Comentario 15.18. Observe quea) (C∞ (Mn,ℜ) ,+, ·,ℜ, ·) es un algebra conmutativa con unidad.b) (C∞ (Mn,ℜ) ,+, ·) es anilloc) (ℜ, C∞ (Mn,ℜ) ,+, ·) es espacio vectorial.

Definicion 15.19. Si f es suave en todo punto x ∈ W ⊂ Mn, se dice que fes una funcion suave en W.

Proposicion 15.20. f suave implica f continua.

Demostracion 15.21. Sin dem.

En base a la definicion de una funcion podemos definir la diferencial de unafuncion vectorial. Primero introduciremos la definicion formal y luego explicaremoscon cuidado el significado de esta.

Definicion 15.22. Sean Mm y Nn variedades y F : Mm → Nn funcion. F essuave si para toda f ∈ C∞ (Nn,ℜ) F ∗ : C∞ (Nn,ℜ) → C∞ (Mm,ℜ) F ∗(f) =f F es suave.

Para simplificar la notacion es conveniente definir el full-back de una funcion.

Page 269: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. FUNCIONES SUAVES 257

Figure 4. Esta figura muestra la representacion de una funcionf suave en una variedad de dimension n.

Notacion 15.23. A F ∗ se le llama imagen recıproca o “full-back” de fy se denota al conjunto de “full backs” como C∞ (Mm, Nn), ver figura 5.

Figure 5. La representacion del Full-back F ∗ de una funcion F .

Como en el caso de una funcion de una variedad a los reales, la diferenciabilidadde una funcion que va de una variedad a otra se traduce a la diferenciabilidad dela funcion correspondiente, en este caso es la funcion f F , llamado el full-back,

Page 270: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

258 15. VARIEDADES DIFERENCIALES

que va de la variedad a los reales. Ası podemos ver su diferenciabilidad tomandoen cuenta la definicion 15.16 anterior.

Una consecuencia interesante de las funciones suaves es que la composicion defunciones suaves es tambien suave.

Proposicion 15.24. La composicion de funciones suaves es suave.

Demostracion 15.25. Sean Mm, Nn y Ss variedades y F : Mm → Nn, G :Nn → Ss y f : Ss → ℜ funciones suaves. Entonces, G suave implica G∗(f) =f G ∈ C∞ (Nn,ℜ) es suave y F suave implica a su vez que F ∗(G∗(f)) = G∗(f)F= (f G) F = f (G F ) = (G F )

∗(f) es suave. Entonces G F es suave, se

tiene que (G F )∗

= F ∗ G∗.

Ejercicio 15.26. Sea cα = (Uα, ψα, Vα) carta sobre Mn variedad. Mostrarque ψα es suave y xiα = ri ψα es suave.

Ejercicio 15.27. Demuestre que funciones suaves entre variedades son con-tinuas.

Ahora podemos definir los isomorfismos de variedades diferenciables, aquı sonllamados difeomorfismos. Su definicion es clara.

Definicion 15.28. Sea F ∈ C∞ (Mm, Nn) biyectiva. F se dice difeomorfismosi F−1 ∈ C∞ (Nn,Mm).

Definicion 15.29. Dos variedades se dicen difeomorficas si existe un difeo-

morfismo entre ellas. Se denota Mmdif∼= Nn.

Notacion 15.30. Si dos variedades Mm y Nn son difeomorficas, se denota

como Mmdif∼= Nn.

La relacion Mm ∼ Nn si Mm y Nn son difeomorficas Mmdif∼= Nn, es de

nuevo una relacion de equivalencia. Entonces las variedades difeomorficas estanclasificadas en clases de equivalencia, lo cual ayuda mucho para su estudio.

3. Vectores Tangentes.

En esta seccion vamos a construir los vectores tangentes a una variedad difer-enciable. Esta construccion tiene varios objetivos, pero el mas importante es quecon los vectores tangente podemos construir un espacio vectorial en cada punto dela variedad. A este espacio se le llama el espacio tangente. Es necesario construirtantos vectores base del espacio tangente a la variedad diferenciable como la di-mension de la variedad, o sea, tantos como la dimension al espacio ℜn al cual lavariedad diferenciable es homeomorfica. Ya construido el espacio tangente podemosconstruir el dual a este espacio vectorial, o sea, el espacio de las transformacioneslineales en el espacio tangente. A este espacio se le llama el espacio contangente dela variedad. Estos dos espacios son muy importantes en modelos del espacio tiempo,ya que la metrica de una variedad, es un elemento del espacio contangente, comoveremos mas adelante. Para simplificar un poco, cuando hablemos de variedad,vamos a referirnos realmente a variedad diferenciable, aunque ya no se especifiqueen el texto. Vamos a iniciar con la definicion de vector tangente a una variedad.

Page 271: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. VECTORES TANGENTES. 259

Definicion 15.31. Sea Mn variedad y x ∈ Mn. Un vector tangente a lavariedad en x ∈ Mn es una funcion vx : C∞(Mn, x,ℜ) → ℜ tal que para unacarta c := (U,ψ, V ) ∈ A con x ∈ U , existe (a1, · · · , an) ∈ ℜn tal que para toda

f ∈ C∞ (Mn, x,ℜ) se cumple vx (f) =n∑i=1

ai ∂∂ri

(f ψ−1

)∣∣ψ(x)

(ver figura 6).

Figure 6. El vector tangente formado por la funcion f y el espaciotangente formado por este vector tangente.

Vamos a entender la definicion. Primero notemos que la funcion(f ψ−1

)|ψ(x)

es una funcion que va de ℜn a los reales y esta evaluada en el punto ψ(x). Portanto sabemos tratar con ella. Tambien sabemos que el gradiente de una funcionen ℜn es un vector tangente a la superficie que forma la funcion. Es por eso quepodemos interpretrar a la funcion vx(f) como un vector tengente a la variedad.

Notacion 15.32. Al conjunto de vectores tangentes sobre Mn en x ∈ Mn sele denota por TxM

n y se le llama espacio tangente en x.

Notacion 15.33. Al vector con la u-upla (0, · · · , 1, 0, · · · ) se le denota ∂∂xi

∣∣x

de tal forma que ∂∂xi

∣∣x

(f) := ∂∂ri

(f ψ−1

)∣∣ψ(x)

.

El conjunto

∂∂xi

∣∣x

i=1,··· ,n es entonces una base de TxM

n, todo vector vx se

escribe como vx =n∑i=1

ai ∂∂xi

∣∣x. Sea xi = ri ψ ∈ C∞ (Mn, x,ℜ) observemos que

∂xi

∣∣∣∣x

(xj ) =∂

∂ri(xj ψ−1

)∣∣ψ(x)

=∂

∂ri

(rj)∣∣ψ(x)

= δji .

La funcion vx es una derivacion, es decir, cumple con la ley de superposicion y conla regla de Leibnitz, esto es:

Proposicion 15.34. vx ∈ TxMn es una derivacion, es decir:i) vx (f + g) = vx (f) + vx (g)ii) vx (λf) = λvx (f)iii) vx (fg) = vx (f) g(x) + f (x) vx (g) para todo f, g ∈ C∞ (Mn, x,ℜ) y para

todo λ ∈ ℜ.

Ejercicio 15.35. Demostrar la proposicion.

Solo queda ver que el espacio formado por los vectores tangentes es, como seespera, un espacio vectorial. Este se demuestra en la siguiente proposicion.

Page 272: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

260 15. VARIEDADES DIFERENCIALES

Proposicion 15.36. La estructura (ℜ, TxMn,+, ·) es un espacio vectorial dedimension n, con

1.- (vx + wx) (f) = vx (f) + wx (f)2.- (λvx) (f) = λ (vx (f)) .El conjunto

∂∂xi

∣∣x

i=1,··· ,n es una base del espacio vectorial llamado base

coordenada.

Ejercicio 15.37. Demuestren la proposicion anterior.

Comentario 15.38. Observen que si (U,ϕ, V ) y (U ′, ψ′, V ′) son cartas de Mn

en x, entonces

∂∂xi

∣∣x

i=1,··· ,n y

∂∂x′i

∣∣x

i=1,··· ,n son bases del espacio tangente de

la variedad en x. Se tiene que

∂x′i

∣∣∣∣x

(xk)

=

n∑

j=1

αji∂

∂xj

∣∣∣∣x

(xk)

=

n∑

j=1

αji δkj = αki ,

es decir∂

∂x′i

∣∣∣∣x

=n∑

j=1

∂x′i

∣∣∣∣x

(xj) ∂

∂xj

∣∣∣∣x

.

El resultado anterior nos da una formula, como la regla de la cadena, paracambiar de homeomorfismo en la variedad, o sea, para cambiar de sistema de co-ordenadas. En el lenguaje de variedades, hacer un cambio de coordenadas significacambiar de homeomorfismo de la variedad a los reales. Hay otro tipo de cambio decoordenadas que tiene un significado dinamico, pero de eso no platicaremos aqui.Algunos ejemplos simples de variedades son los siguientes.

Ejemplo 15.39. La variedad (ℜn,A = (ℜn, id|ℜn ,ℜn)). Como ψ = id|ℜn

se sigue que xi = ri id|ℜn = ri entonces

vx =n∑

i=1

ai∂

∂ri

∣∣∣∣x

=n∑

i=1

ai∂

∂ri.

En tal caso Txℜniso∼= ℜn, donde el isomorfismo esta dado por la funcion iso definida

como iso : Txℜn → ℜn,n∑i=1

ai ∂∂ri →

(a1, · · · , an

)

Ejemplo 15.40. Sean x = (x1, · · · , xn+1) y vx = (v1x, · · · , vn+1

x). El espacio

tangente de Sn es

TxSn =

vx ∈ ℜn+1 | x · vx =

n+1∑

i=1

xivix

= 0

x ∈ Sn ⊂ ℜn−1.

La demostracion detallada de esto la veremos mas adelante.

4. Uno formas

En todo espacio vectorial se pueden definir transformaciones lineales que formana la vez un espacio vectorial de la misma dimension, llamado el espacio dual (vercapıtulo 3). Entoces podemos formar el conjunto de transformaciones lineales enel espacio tangente a una variedad y formar el espacio dual. A este espacio se lellama espacio contangente y a sus elementos, las transformaciones lineales, se lesllama formas. Vamos a ver todo esto formalmente.

Sean Mm y Nn variedades y F ∈ C∞ (Mm, Nn) con x ∈Mm.

Page 273: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. UNO FORMAS 261

Definicion 15.41. La diferencial de F en x es la funcion definida pordFx : TxM

m → TF (x)Nn

vx → dFx(vx) : C∞ (Nn, F (x) ,ℜ) → ℜg → dFx (vx) (g) := vx (F ∗ (g))

ver figura 7.

Notacion 15.42. Si denotamos dFx = Fx∗, podemos escribir

Fx∗ (vx) (g) := vx (F ∗ (g))

Notacion 15.43. Tambien lo podemos denotar como

dFx (vx) (g) = vx (g F ) = vx F ∗ (g)

o

dFx (vx) = vx F ∗

Veamos con cuidado el significado de la diferencial de una funcion. Sea c =(U,ψ, V ) carta de Mm que contiene a x ∈ U ⊂ Mm y C′ = (W,ψ, V ′) carta en

Nn que contiene a F (x) ∈ W ⊂ Nn. Sea vx ∈ TxMm con vx =m∑z=1

ai∂∂xi

∣∣x

y sea

g ∈ C∞ (Nn, F (x) ,ℜ). Vamos a escribir explicitamente la definicion anterior enterminos de las cantidades como las leemos en ℜn, para poder entender mejor elsignificado de la diferencial. Entonces,

dFx (vx) (g) = vx (g F )

=

(m∑

i=1

ai∂

∂xi

∣∣∣∣x

)(g F )

=

m∑

i=1

ai∂

∂ri(g F ϕ−1

)∣∣ϕ(x)

=

m∑

i=1

ai∂

∂ri(g ψ−1 ψ F ϕ−1

)∣∣ϕ(x)

=

m∑

i=1

ai

n∑

j=1

∂sj(g ψ−1

)∣∣ψF(x)

∂ri(sj ψ F ϕ−1

)∣∣ϕ(x)

=

m∑

i=1

n∑

j=1

ai∂

∂yj

∣∣∣∣F (x)

(g)∂

∂xi

∣∣∣∣x

(yj F

)

=

n∑

j=1

(m∑

i=1

ai∂

∂xi

∣∣∣∣x

(yj F

))

∂yj

∣∣∣∣F (x)

(g)

=n∑

J=1

vx(yj F

) ∂

∂yj

∣∣∣∣F (x)

(g)

Vean la figura 8. Podemos escribir

dFx (vx) =

n∑

j=1

(dFx (vx))j ∂

∂yj

∣∣∣∣F (x)

de donde se sigue que (dFx (vx))j

= vx(yj F

)

Page 274: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

262 15. VARIEDADES DIFERENCIALES

Figure 7. La diferencial dF de una funcion F . La diferencial deF es un mapeo entre los espacios tangente de la variedad en x yde la variedad imagen en F (x).

Figure 8. Figura que representa la construccion de la diferencialde F . Aquı se representan las variedades y mapeos que tomanparte en la explicacion de la definicion.

Solo falta demostrar que efectivamente la diferencial dFx es una transformacionlineal. Esta demostracion la dejaremos como ejercicio.

Ejercicio 15.44. Demostrar que dFx es lineal.

Para poder decir que la diferencial dFx es realmente una diferencial, serıa deesperarse que se cumpliera la regla de la cadena. Este es el caso, vamos a demostrarla siguiente proposicion.

Proposicion 15.45 (La regla de la cadena). d (G F )x = dGF (x) dFx

Page 275: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. UNO FORMAS 263

Demostracion 15.46. Sea Mm, Nn y Ss variedades y F ∈ C∞ (Mm, Nn) yG ∈ C∞ (Nn, Ss). Sea x ∈Mm y vx ∈ TxMm, entonces

d (G F )x (vx) = vx (G F )∗

= vx (F ∗ G∗)

= (vx F ∗) G∗ = dGF (x) (vx F ∗)

= dGF (x) (dFx (vx)) = dGF (x) dFx (vx)

Un ejemplo simple es la diferencial de la indentidad.

Ejemplo 15.47. d id|Mn = id|TxMn ya que

d id|Mn : TxMm → TxM

m

vx → d id|Mn (vx) : C∞ (Mm,ℜ) → ℜg → d id|Mn (vx) (g)

= vx(id|∗Mn (g)

)= vx (g id|Mn) = vx (g) es decir

d id|Mn (vx) = vx

Un caso especial de diferencial muy importante es cuando la diferencial es unafuncion inyectiva, entonces se dice que la diferencial es una inmersion: esto es:

Definicion 15.48. Una inmersion de Mm en Nn, es una funcion suave F :Mm → Nn con diferencial dFx inyectiva.

Ahora vamos a definir las formas formalmente. Las formas son diferencialesde una funcion que va de la variedad a los reales. Como los reales tambien sonuna variedad, podemos usar la definicion de la diferencial en estas funciones. Ladiferencia es que vamos a identificar al espacio tangente de los reales con los realesmismos. De hecho son el mismo espacio. Veamos esto formalmente.

Definicion 15.49. Sea Mn variedad, f ∈ C∞ (Mn,ℜ) y x ∈Mn. Entonces

dfx : TxMn → Tf(x)ℜ,

vx → dfx (vx) = λd

dr∈ Tf(x)ℜ, λ ∈ ℜ

con

dfx (vx) (r) = λd

dr(r) = λ = vx (f∗ (r)) = vx (r f) = vx (f)

(recuerden que r : ℜ → ℜ tal que r (x) = x). Esto es

dfx (vx) = vx (f)d

dr∈ Tf(x)ℜ.

Consideremos el isomorfismo J : Tf(x)ℜ → ℜ, λ d

dr → J(λ ddr

)= λ, entonces

la composicion J dfx : TxMn → ℜ, vx → J (df (vx)) = J

(vx (f) d

dr

)= vx (f) es

un homomorfismo de espacios lineales y J dfx es un elemento del espacio dual deT ∗xM

n que llamaremos el espacio cotangente de la variedad en x. A los elementosde este espacio, que denotamos como T ∗

xMn, se llaman 1-formas en x y se denotan

como wx ∈ T ∗xM

n. Identificamos entonces Tf(x)ℜ con ℜ (a traves del isomorfismo

J), por lo que podemos escribir

dfx : TxMn → ℜ,

vx → dfx (vx) = vx (f) .

Page 276: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

264 15. VARIEDADES DIFERENCIALES

Comentario 15.50. Tomemos f = xi ∈ C∞ (U,ℜ), dxi∣∣x

: TxMn → ℜ tal

que

vx → dxi∣∣x(vx) = vx

(xi)

=

n∑

j=1

aj∂

∂xj

∣∣∣∣x

(xi)

= ai.

En particular tomemos vx = ∂∂xj

∣∣x, entonces

dxi∣∣x

(∂

∂xj

∣∣∣∣x

)=

∂xj

∣∣∣∣x

(xi)

= δij ,

se sigue quedxi∣∣x

i=1,··· ,n es una base del espacio T ∗

xMn llamada la base coorde-

nada dual o base de las 1-formas.

De una forma natural podemos definir campos vectoriales o campos de formas,simplemente definiendo los espacios vectoriales para cada punto de la variedad.Vamos a definir entoces los campos vectoriales y de formas.

Definicion 15.51. Sea Mn variedad y

∂∂xi

∣∣x

base de TxM

n. Un campovectorial, es una asignacion suave de vectores para cada punto x ∈Mn.

Notacion 15.52. Se denota v (f) : Mn → ℜ, suave, tal que v (f) (x) := vx (f).

Se tiene que v =n∑r−1

ai ∂∂xi , tal que

v (f) (x) =n∑

i=1

ai (x)∂

∂xi

∣∣∣∣x

(f) ,

donde ai : Mn → ℜ son funciones suaves para toda i = 1, · · · , n.Notacion 15.53. Al conjunto de campos vectoriales en Mn se denota por

TMn.

Comentario 15.54. Observen que v : C∞ (Mn,ℜ)→ C∞ (Mn,ℜ).

Definicion 15.55. Sea Mn variedad ydxi∣∣x

i=1,··· ,n base de T ∗

xMn. Una

1-forma en Mn es una transformacion lineal para cada TxMn con x ∈ Mn. Se

denota

df(v) : Mn → ℜdf(v) = v(f)

suave, tal que df(v)(x) = dfx(vx).

Notacion 15.56. Al conjunto de las 1-formas en Mn se denota por∧n

. Ten-emos que

df =n∑

j=1

bj dxj

tal que

df(v)(x) = dfx(vx) =

n∑

j=1

bj(x) dxj∣∣x

(vx),

con bj : Mn → ℜ funciones suaves.

Page 277: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. UNO FORMAS 265

Notacion 15.57. Se suele denotar al “producto” de 1-formas con vectores como

〈w, v〉 = w(v). Si w =n∑j=1

bj dxj y v =

n∑i=1

ai ∂∂xj , entonces

〈w, v〉 =

⟨n∑

j=1

bjdxj ,

n∑

i=1

ai∂

∂xi

⟩:=

n∑

j=1

n∑

i=1

aibj

⟨dxj ,

∂xi

=

n∑

j=1

n∑

i=1

aibjdxj

(∂

∂xi

),

como para cada punto x ∈Mn se cumple dxj∣∣x

(∂∂xi

∣∣x

)= δji , tenemos que

〈w, v〉 =

n∑

i=1

aibi.

Observen que df : TM → C∞ (Mn,ℜ).

Tenemos que T ∗Mn es un espacio vectorial para cada punto x ∈Mn. Su dualen cada punto sera isomorfico a TMn en ese punto. Nosotros vamos a identificarambos espacios.

Definicion 15.58. Como (T ∗xM

n)∗

= TxMn para toda x ∈Mn. Se tiene que si

w ∈ T ∗Mn y v ∈ TxMn, entonces vx (wx) ∈ ℜ, con vx (wx) = wx (vx) = 〈wx, vx〉.El ejemplo de las esferas es muy representativo y simple para entender el ma-

terial anterior. Vamos a tomar de nuevo este ejemplo.

Ejemplo 15.59. Sea S2 =(x, y, z) ∈ ℜ3 | x2 + y2 + z2 = 1

. Ya sabemos que

los homeomorfismos de la esfera son σ± : ℜ3 → S2 σ−1± : S2 → ℜ3 dados por

σ± (x, y, z) =(x, y)

1∓ z = (u, v)

σ−1± (u, v) =

(2u, 2v,±(u2 + v2 − 1)

)

1 + u2 + v2

Entonces los vectores tangentes en S2 estaran dados por

∂x1+

∣∣∣∣x

(f) =∂

∂u

(f σ−1

+

)∣∣∣∣σ+(x)

=∂

∂uf

(2u

1 + u2 + v2,

2v

1 + u2 + v2,,u2 + v2 − 1

1 + u2 + v2

)∣∣∣∣σ+(x)

=∂

∂uf (x, y, z)

∣∣∣∣σ+(x)

=∂x

∂u

∂f

∂x+∂y

∂u

∂f

∂y+∂z

∂u

∂f

∂z

∣∣∣∣σ+(x)

=1

(1 + u2 + v2)2

[2(1− u2 + v2

) ∂

∂x− 4uv

∂y+ 4u

∂z

]∣∣∣∣σ+(x)

(f)

Podemos escribir

∂x1+

=(1− z − x2

) ∂

∂x− xy ∂

∂y+ x(1− z) ∂

∂z

ya que

Page 278: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

266 15. VARIEDADES DIFERENCIALES

u2 + v2∣∣σ+(x)

=x2 + y2

(1− z)2y 1− u2 + v2

∣∣σ+(x)

=(1− z)2 − x2 + y2

(1− z)2

Analogamente

∂x2+

= −xy ∂∂x

+(1− z − y2

) ∂

∂y+ y(1− z) ∂

∂z

Como era de esperarse, los vectores base del espacio tangente de S2 son perpendic-ulares al radio vector, es decir:

(x, y, z) ·(1− z − x2,−xy, x (1− z)

)= 0 = r · ∂

∂x1+

(x, y, z) ·(−xy, 1− z − y2, y (1− z)

)= 0 = r · ∂

∂x2+

Es decir, los vectores tangente, son realmente tangentes a la esfera en cada punto,pues son perpendiculares al radio vector r. Entonces el espacio tangente en el puntox a una pelota es TxS

2 =y ∈ ℜ3|y · x = 0

Ejercicio 15.60. Calcular ∂∂x1

, ∂∂x2

. Demostrar que

∂∂x1

±

, ∂∂x2

±

son li.

Ejemplo 15.61. Los duales al espacio tangente, el espacio contangente, se

encuentran usando la regla⟨dxi, ∂

∂xj

⟩= δij, se obtiene

dx1+ =

dx

1− z +xdz

(1− z)2, dx2

+ =dy

1− z +ydz

(1− z)2

Estos dos vectores (transformaciones lineales) del espacio contangente son dos uno-formas definidas en la carta sin polo norte.

Ejercicio 15.62. Calcular dx1−, dx

2−. Demostrar que

dx1

±, dx2±

son li.

Ejemplo 15.63. Vamos a encontrar los vectores base de TxS2 cambiando las

coordenadas a coorenadas esfericas, definidas por

x = r sin(θ) cos(ϕ)

y = r sin(θ) sin(ϕ)

x = r cos(θ)(15.1)

Claramente, para r constante, las coordenadas cumplen que x2 + y2 + z2 = r2 , osea, ya estan restringidas a la esfera. Con esta coordenadas se puede ver que losvectores tangente

∂x= − y

x2 + y2

∂ϕ

∂y=

x

x2 + y2

∂ϕ

∂z= − 1√

x2 + y2

∂θ

Page 279: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. UNO FORMAS 267

Usando estos resultados, los vectores base del espacio tangente en coordenadasesfericas se leen:

∂x1+

= (cos(θ)− 1)

(cos(ϕ)

∂θ+

sin(ϕ)

sin(θ)

∂ϕ

)

∂x2+

= (cos(θ)− 1)

(sin(ϕ)

∂θ− cos(ϕ)

sin(θ)

∂ϕ

)

De la misma forma podemos ahora calcular los duales, las uno formas del espaciocotangente. Se obtiene:

dx1+ =

1

cos(θ) − 1(cos(ϕ)dθ + sin(ϕ) sin(θ)dϕ)

dx2+ =

1

cos(θ) − 1(sin(ϕ)dθ − cos(ϕ) sin(θ)dϕ)

Claramente podriamos definir como bases del espacio tangente y cotangente unacombinacion lineal de estos vectores, por ejemplo w1

+ = (cos(θ) − 1)dx1+ w2

+ =(cos(θ)−1)dx2

+ y a los vectores X1+, X

2+ como sus duales, de tal forma que podamos

hacer lo mismo con los correspondientes vectores w1− w2

− X1+, X

2+, al multiplicar

los vectores base por (cos(θ) + 1). Entonces los vectores w′s y X ′s obtendran lamisma forma en ambas cartas, ambos serıan

X1 =1

r

(cos(ϕ)

∂θ+

sin(ϕ)

sin(θ)

∂ϕ

)

X2 =1

r

(sin(ϕ)

∂θ− cos(ϕ)

sin(θ)

∂ϕ

)

dw1 = r (cos(ϕ)dθ + sin(ϕ) sin(θ)dϕ)

dw2 = r (sin(ϕ)dθ − cos(ϕ) sin(θ)dϕ)(15.2)

donde hemos puesto el factor r en caso de que el radio de la esfera no sea 1 sino r.

Ejercicio 15.64. Calcular ∂∂x1

+, ∂∂x2

+y dx1

−, dx2− en coordenadas esfericas.

En lo que sigue vamos a introducir otros dos conceptos en variedades diferen-ciales. El primero es el parentesis de Lie y el segundo es el concepto de vectoresϕ-relacionados. Ambos conceptos son muy usados en ciencias e ingenierıa. Con elparentesis de Lie los espacios tangente pueden tener estructura de algebra. Estaestructura puede ser muy importante para caracterizar a la variedad, si por ejem-plo, los vectores estan asociados a alguna simetrıa de la variedad. Esto lo veremosmas adelante. Por ahora definamos los parentesis de Lie.

Definicion 15.65. Sea Mn variedad y X y Y ∈ TMn. Se define [X,Y ] =X Y − Y X. A la funcion [ , ] : TMn × TMn → TMn (X,Y ) → [X,Y ] sedenomina producto o parentesis de Lie de los campos vectoriales.

De la definicion se siguen sus propiedades y el hecho que con el parentesis deLie, el espacio tangente es una algebra.

Proposicion 15.66. El parentesis de Lie tiene las siguientes propiedadesi) [X,Y ] = − [Y,X ]ii) [αX + βY, Z] = α [X,Z] + β [Y, Z] , [X,αY + βZ] = α [X,Y ] + β [X,Z]iii) [[X,Y ] , Z] + [[Y, Z] , X ] + [[Z,X ] , Y ] = 0 (Identidad de Jacobi).

Page 280: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

268 15. VARIEDADES DIFERENCIALES

iv) La estructura (TMn,+, [, ];ℜ, ·) es una algebra, llamada Algebra de Lie delos vectores tangentes.

Ejercicio 15.67. Demostrar la proposicion.

Por supuesto los vectores coordenados conmutan, esto se ve en la siguienteproposicion.

Proposicion 15.68.[∂∂xi ,

∂∂xj

]= 0

Demostracion 15.69. Tomamos ∂∂xi

(∂∂xj f

)= ∂

∂xi

(∂∂rj

(f ψ−1

))ψ para la

carta c = (U,ψ, V )

=∂

∂ri

((∂

∂rj(f ψ−1) ψ

) ψ−1

) ψ

=∂

∂ri

(∂

∂rj(f ψ−1)

) ψ

=∂

∂rj

(∂

∂ri(f ψ−1)

) ψ

=∂

∂rj

((∂

∂ri(f ψ−1) ψ

) ψ−1

) ψ

=∂

∂xj

(∂

∂xi(f)

)

(Hay que recordar que ∂∂xi (f) = ∂

∂ri (f ψ−1) ψ, ya que para cada punto x ∈ Mn

se tiene ∂∂xi (f)(x) = ∂

∂xi

∣∣x(f) = ∂

∂ri (f ψ−1)|ψ(x)).

Para calcular con los parentesis de Lie, es conveniente trabajar en una basecoordenada. En terminos de una base coordenada, se puede ver que los parentesisde Lie de dos vectores se ven como:

Proposicion 15.70. [X,Y ] =n∑i=1

[X,Y ]i ∂∂xi , con

[X,Y ]i=

n∑

j=1

(Xj ∂

∂xj(Y i)− Y j ∂

∂xj(X i))

Demostracion 15.71. Por substitucion directa.

Supongamos que existe una funcion ϕ que va de una variedad a otra. En laprimera variedad se tiene un vector X y en la segunda variedad se tiene un vectorY . Si mapeamos el vector X con la diferencial dϕ, este mapeo no necesariamentetiene algo que ver con el vector Y . Sin embargo, si para todo punto de la variedad setiene que el mapeo del vector X por medio de dϕ corresponde al vector Y evaluadoen el punto por ϕ, se dice que estos dos vectores estan relacionados por medio deϕ, que estan ϕ-relacionados. Es decir, se tiene la definicion:

Definicion 15.72. Sean Mm y Nn variedades y ϕ ∈ C∞(Mm, Nn). Se diceque X ∈ TMm y Y ∈ TNn estan ϕ -relacionados si para toda x ∈ Mm se sigueque dϕx(Xx) = Yϕ(x), vean la figura 9.

De aquı se desprenden varias propiedades muy interesantes que despues seusaran. Vamos a ver las mas importantes.

Page 281: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. UNO FORMAS 269

Figure 9. Los vectores X y Y estan ϕ relacionados, si para todoelemento x de la variedad Mm se sigue que dϕx(Xx) = Yϕ(x).

Proposicion 15.73. Sean X ∈ TMm y Y ∈ TNn. X y Y estan ϕ -relacionadosssı ϕ∗ Y = X ϕ∗

Demostracion 15.74. Sea f ∈ C∞ (Nn,ℜ) y x ∈Mm. Se sigue que

dϕα(Xx)(f) = Xx (ϕ∗(f)) = Xx ϕ∗(f) = X (ϕ∗ (f)) (x) = X ϕ∗(f)(x)

= Xx (f ϕ) = Yϕ(x) (f) = Y (f) (ϕ(x)) = Y (f) ϕ (x) = ϕ∗ (Y (f)) (x)

= ϕ∗ Y (f)(x) ssi ϕ∗ Y = X ϕ∗,

es decir, el diagrama

C∞ (Mm,ℜ)ϕ∗

←− C∞ (Nn,ℜ)X ↓ Y ↓

C∞ (Mm,ℜ)ϕ∗

←− C∞ (Nn,ℜ)

conmuta.

Si ahora aplicamos la definicion de vectores ϕ-relacionados al mismo vector,obtenemos la definicion de ϕ-invariante. Formalmente la definicion es:

Definicion 15.75. Sean X ∈ TMn y ϕ ∈ C∞(Mm,Mm). X se llama ϕ-invariante o invariante bajo ϕ si X ϕ∗ = ϕ∗ X, es decir si dϕx(Xx) = Xϕ(x)

para toda x ∈Mn

Comentario 15.76. Observemos que si ϕ : Mm → Nn, entonces

dϕ : TMm → TNn

Page 282: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

270 15. VARIEDADES DIFERENCIALES

tal que dϕ(X)(g)(y) = dϕ(X)y(g) con ϕ(x) = y ∈ Nn, x ∈ Mm. Si ϕ es un

difeomorfismo entre Mmdif∼= Nn, entonces

dϕx (Xx) (g) = Xx(g ϕ) = dϕϕ−1(y)

(Xϕ−1(y)

)(g)

= Xϕ−1(y) (g ϕ)

= X (ϕ∗ (g))(ϕ−1 (y)

)

= X (ϕ∗ (g)) ϕ−1(y),

entonces se tiene la identidad

dϕ (X) (g) = X (ϕ∗ (g)) ϕ−1

Para terminar este capıtulo vamos a introducir una transformacion lineal equiv-alente a la diferencial, pero ahora en los espacios contangente a una variedad. Lamanipulacion y sus propiedades son muy parecidas a las de la diferencial.

Definicion 15.77. Sean Mm y Nn variedades y F : Mm → Nn suave. Seax ∈Mm y y = F (x) ∈ Nn. Con F podemos inducir la funcion

F ∗y : T ∗

yNn → T ∗

xMm,

wy → F ∗y (wy) : TxM

m → ℜ,Xx → F ∗

y (wy) (Xx) := wy (dF |x (Xx))

y notemos que wy (dF |x (Xx)) = wy dF |x (Xx) = wy Fx∗ (Xx), es decir, se tienela identidad F ∗

y (wy) = wy Fx∗.

A esta funcion tambien se le conoce con el nombre de pull-back, su definiciones:

Definicion 15.78. A F ∗y (wy) se le denomina la imagen reciproca o “pull-

back” de la 1 forma wy por F .

El Pull-back es una tranformacion lineal entre los espacios contangentes.

Proposicion 15.79. F xy es una transformacion lineal.

Ejercicio 15.80. Demostrar la proposicion.

A esta transformacion lineal a veces tambien se le llama la diferencial del espaciocotangente, ya que tiene propiedades de una diferencial, por ejemplo cumple la reglade la cadena, veamos.

Proposicion 15.81. (G F )∗GF (x) = F ∗F (x) G∗

GF (x)

Demostracion 15.82. Sea Mm, Nn y Ss variedades, F ∈ C∞(Mm, Nn), G ∈C∞(Nn, Ss), x ∈ Mm, wF (x) ∈ T ∗

F (x)Nn, vGF (x) ∈ T ∗

GF (x)Ss. Entonces se tiene

Page 283: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. UNO FORMAS 271

si wF (x) = G∗GF (x)

(vGF (x)

),

F ∗F (x)

(wF (x)

)= F ∗

F (x)

(G∗GF (x)

(vGF (x)

))

= F ∗F (x) G∗

GF (x)

(vGF (x)

)

= wF (x) dF |x= G∗

GF (x)

(vGF (x)

) dF |x

=(vGF (x) dG|F (x)

) dF |x

= vGF (x) d (G F ) |x= (G F )

∗GF (x)

(vGF (x)

),

vean la figura 10.

Figure 10. Esquema de la demostracion de la proposicion 15.81.

Page 284: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 285: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 16

TENSORES Y P-FORMAS

1. Tensores

El material de los dos capıtulos anteriores es fundamentalmente para estudiarlos tensores. La importancia de los tensores en ciencias exactas e ingenierıa, es elhecho de que los tensores son cantidades matematicas que no dependen del sistemacoordenado. El significado de “no depende” del sistema de coordenadas la daremosen este capıtulo, pero estas cantidades matematicas han servido bien para modelarcantidades fısicas importantes, como los campos. La idea es que estas cantidadesfısicas realmente no dependen del observador, es decir, las cantidades fısicas no im-porta si el observador las mide con una vara de un metro o una de un centimetro,o con coordenadas catesianas o esfericas. El objeto fısico no se ve afectado por laforma de medirlo o de observarlo. Esta condicion la cumplen los tensores, por esose usan para modelar las cantidades fısicas observables. Desde el punto de vistamatematico, un tensor es una funcion multilineal, es decir, una funcion de variasvariables, pero la funcion es lineal en cada entrada. El dominio es el productocartesiano de un espacio vectorial varias veces, con su dual, tambien varias veces.Nosotros vamos a tomar ese espacio vectorial como el espacio tangente a una var-iedad y su dual como el espacio cotangente a la variedad. Asi, la idea es definirtensores que viven en variedades. Empecemos por la definicion formal de un tensor.

Definicion 16.1. Sea V espacio vectorial y V ∗ su espacio dual. Un tensordel tipo (r, s) es una transformacion multilineal T tal que

T : V ∗ × · · · × V ∗︸ ︷︷ ︸

r veces

× V × · · · × V︸ ︷︷ ︸s veces

→ ℜ,

(w1, · · · ,wr,v1, · · · ,vs

)→ T

(w1, · · · ,wr,v1, · · · ,vs

)

Es decir, se tiene que si v1, · · · ,vs ∈ V y w1, · · · ,wr ∈ V ∗, son transforma-ciones lineales en el espacio vectorial V , se sigue que

T(w1, · · · ,wr, αv + βw,v2, · · · ,vs

)= αT

(w1, · · · ,wr,v,v2, · · · ,vs

)+

βT(w1, · · · ,wr,w,v2, · · · ,vs

)

para cada entrada del tensor.

Notacion 16.2. Al conjunto de tensores lo denotamos como T ∈ V ⊗ · · · ⊗V ⊗ V ∗ ⊗ · · · ⊗ V ∗ y se le llama producto tensorial.

Con la suma

(T + T ′)(w1, · · · ,wr,v1, · · · ,vs

)= T

(w1, · · · ,wr,v1, · · · ,vs

)

+ T ′ (w1, · · · ,wr,v1, · · · ,vs)

273

Page 286: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

274 16. TENSORES Y P-FORMAS

y el producto por escalar

(αT )(w1, · · · ,wr,v1, · · · ,vs

)= αT

(w1, · · · ,wr,v1, · · · ,vs

),

para todo

T, T ′ ∈ V ⊗ · · · ⊗ V ⊗ V ∗ ⊗ · · · ⊗ V ∗, α ∈ ℜ,la estructura

(ℜ, V ⊗ · · · ⊗ V ⊗ V ∗ ⊗ · · · ⊗ V ∗,+, ·)es un espacio vectorial. A los elementos del espacio tensorial se les denota porX1 ⊗ · · · ⊗Xr ⊗ µ1 ⊗ · · · ⊗ µs, este elemento denota el tensor tal que

X1 ⊗ · · · ⊗Xr ⊗ µ1 ⊗ · · · ⊗ µs(w1, · · · ,wr,v1, · · · ,vs

)

= X1

(w1)· · ·Xr (wr)µ1 (v1) · · ·µs (vs)

=⟨w1, X1

⟩· · · 〈wr, Xr〉

⟨µ1,v1

⟩· · · 〈µs,vs〉

dados X1, · · · ,Xr ∈ V y µ1, · · · , µs ∈ V ∗. Al espacio de tensores lo denotamostambien por

T rs = V ⊗ · · · ⊗ V︸ ︷︷ ︸r veces

⊗ V ∗ ⊗ · · · ⊗ V ∗︸ ︷︷ ︸

s veces

.

Sean R ∈ T rs y S ∈ T pq , el producto entre tensores se define entonces como el tensor

T r+ps+q tal que

R⊗ S(µ1, · · · , µr+p,v1, · · · ,vs+q

)= R

(µ1, · · · , µr,v1, · · · ,vs

S(µr+1, · · · , µr+p,vs+1, · · · ,vs+q

)

La estructura (T rs ,+, ·,⊗,ℜ, ·) es una algebra llamada Algebra tensorial.Sea eaa=1,··· ,n y eaa=1,··· ,n bases de V y V ∗, espacios vectoriales de di-

mension n y su dual. Entonces podemos escribir tensores T ∈ T rs en terminos deesa base como

T =

n∑

a1···ar,b1···bs

T a1···ar

b1···bsea1 ⊗ · · · ⊗ ear

⊗ ebi ⊗ · · · ⊗ ebs ,

ya que ea1 ⊗ · · · ⊗ ear

⊗ ebj ⊗ · · · ⊗ ebs⊂ T rs

sera una base del espacio tensorial y las componentes de T estan dadas por

T a1···ar

b1···bs= T (ea1 , · · · , ear , eb1 , · · · ebs

) .

Como se ve, debido a la definicion de tensores, la notacion es muy extensa. Masadelante cambiaremos de notacion por una mas simple, para reducir la escritura,pero por ahora la mantendremos con el objetivo de que no vaya a haber confusion.

La propiedad importante de los tensores es la de no depender del sistema coor-denado. Aquı vamos a ser mas generales, vamos a demostrar que los tensores soninvariates al cambiar la base.

Proposicion 16.3. Los tensores son invaraintes bajo cambios de base.

Demostracion 16.4. Sean eaa=1,··· ,n y e′aa=1,··· ,n bases de V y eaa=1,··· ,ny e′aa=1,··· ,n bases de V ∗ tal que eaa=1,··· ,n sea dual a eaa=1,··· ,n y e′aa=1,··· ,n,

sea dual a e′aa=1,··· ,n. Se sigue que e′a =n∑b=1

Λbaeb y e′a =n∑b=1

Λabeb donde Λba y

Page 287: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. TENSORES 275

Λab son coeficientes de matrices no singulares n× n. Por la dualidad de las bases,se sigue que

δba =⟨eb, ea

⟩=⟨e′b, e′a

⟩=

⟨n∑

c=1

Λbcec,

n∑

d=1

Λdaed

⟩n∑

c=1

n∑

d=1

ΛbcΛdaδcd =

n∑

c=1

ΛbcΛca.

Es decirn∑c=1

ΛbcΛca = δba, por lo que Λbc y Λca son una la inversa de otra como matrices.

Ahora escribimos un tensor T rs en terminos de estas bases, esto es

T =

n∑

a1···bs=1

T ′a1···ar

b1···bse′a1⊗ · · · ⊗ e′ar

⊗ e′b1 ⊗ · · · ⊗ e′bs

=n∑

a1···bs=1

T ′a1···ar

b1···bs

n∑

c1=1

Λc1a1ec1 ⊗ · · · ⊗

n∑

cr=1

Λcrar

ecr

⊗n∑

d1=1

Λb1d1ed1 ⊗ · · · ⊗

n∑

ds=1

Λbs

dseds

=

n∑

a1···bs=1

n∑· · ·

c1=1

n∑

cr=1

n∑

d1=1

· · ·n∑

ds=1

Λc1a1· · ·Λcr

arΛb1d1 · · ·Λ

bs

dsT ′a1···ar

b1···bsec1

⊗ · · · ⊗ ecr⊗ edr ⊗ · · · ⊗ eds

=

n∑

c1···ds=1

T c1···cr

d1···dsec1 ⊗ · · · ⊗ ecr

⊗ edr ⊗ · · · ⊗ eds

donde hemos llamado

(16.1) T c1···cr

d1···ds=

n∑

a1=1

· · ·n∑

ar=1

n∑

b1=1

· · ·n∑

bs=1

Λc1a1· · ·Λcr

arΛb1d1 · · ·Λ

bs

dsT ′a1···ar

b1···bs.

Comentario 16.5. Note que en cada caso se tiene que

T ′a1···ar

b1···bs= T

(e′a1 , · · · , e′ar , e′b1 , · · · , e′bs

)

y

T c1···cr

d1···ds= T (ec1 , · · ·ecr , ed1 , · · · , eds

) .

Es decir, debido al cambio de base las componentes del tensor cambiaron,pero el tensor mismo se quedo inalterado. Es en este sentido que los tensores soninvariantes ante cambios de base y por tanto de coordenadas. En ciencias fısicaseste hecho se usa continuamente. Una operacion tambien muy usada en cienciasfısicas es la contraccion de tensores. A partir de uno o varios tensores, se construyeotro usando la contraccion. Vamos a definirla.

Definicion 16.6. Sea T ∈ T rs en un espacio vectorial V . La contraccion C11 (T )

de un tensor en las bases duales eaea es un tensor (r − 1, s − 1) tal que las

componentes de C11 (T ) son

n∑a=1

T aa2...ar

ab2···bs, i.e. C1

1 (T ) =n∑a=1

n∑a2···arb2···bs=1

T aa2...ar

ab2···bs

eas⊗ · · · ⊗ ear

⊗ eb2 ⊗ · · · ⊗ ebs

Proposicion 16.7. La contraccion es independiente de las bases.

Page 288: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

276 16. TENSORES Y P-FORMAS

Demostracion 16.8. Sean eaea y e′ae′a bases duales de V . Entonces

C′11 (T ) =

n∑

a=1

n∑

a2···arb2···bs=1

T ′aa2...ar

ab2···bse′as⊗ · · · ⊗ e′ar

⊗ e′b2 ⊗ · · · ⊗ e′bs

=n∑

a1=1

· · ·n∑

ar=1

n∑

b1=1

· · ·n∑

bs=1

Λc2a2· · ·Λcr

arΛb2d2 · · ·Λ

bs

ds

n∑

a=1

T ′a...ar

a···bsecs

⊗ · · · ⊗ ecr⊗ ed2 ⊗ · · · ⊗ eds

=

n∑

c1=1

n∑

d1=1

δc1d1

n∑

c2···crd2···ss=1

T c1c2...cr

d1d2···dsecs⊗ · · · ⊗ ecr

⊗ ed2 ⊗ · · · ⊗ eds

= C′11 (T )

De la misma forma se pueden definir las contracciones de los demas ındices.Suele llamarse a los ındices superiores de un tensor ındices covariantes y a losinferiores, ındices contravariantes. Ası la contraccion queda definida entreındices covariantes con indices contravariantes.

Notacion 16.9. Del mismo modo, se suele llamar a los vectores ea vectorescovariantes o uno-formas y a los ea vectores contravariantes o simplementevectores.

En lo que sigue vamos a estudiar algunos ejemplos simples de tensores usadosen fısica.

Ejemplo 16.10. El tensor de campo electromagnetico es un tensor definidocomo

A =

3∑

µ=0

Aµdxµ + dΛ

donde Λ es una funcion arbitraria que va de los reales a los reales.

Ejemplo 16.11. El tensor de energia momento es un tensor definido como

T =3∑

µ,ν=0

Tµνdxµ ⊗ dxν

en donde las componentes Tµν son basicamente las presiones y la densidad en ladiagonal, y los flujos de energia y momento en las componentes fuera de la diagonal.

Ejemplo 16.12. El tensor metrico es un tensor definido como

g =

3∑

µ,ν=0

gµνdxµ ⊗ dxν

el cual define una metrica en la variedad, a traves del producto escalar entre vec-tores. Mas adelante daremos los detalles de esta tensor, por el momento vamos adiscutir dos ejemplos simples. Primero tomemos las componentes gij = δij i, j =1, 2, 3, y con las componentes con subindice 0 igual a cero. Lo que se obtiene esuna metrica Euclidiana, esta es:

g = dx⊗ dx+ dy ⊗ dy + dz ⊗ dz

Page 289: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. TENSORES 277

Tomemos el vector X = 2 ∂∂x − ∂

∂y y el vector Y = − ∂∂x + 2 ∂

∂z . El producto interno

entre X y Y esta dado por:

g(X,Y ) = dx(X)⊗ dx(Y ) + dy(X)⊗ dy(Y ) + dz(X)⊗ dz(Y )

= 2 · (−1) + (−1) · 0 + 0 · 2 = −2

Mientras que la norma de los vectores es

g(X,X) = dx(X)⊗ dx(X) + dy(X)⊗ dy(X) + dz(X)⊗ dz(X) = 5 = ||X ||2g(Y, Y ) = dx(Y )⊗ dx(Y ) + dy(Y )⊗ dy(Y ) + dz(Y )⊗ dz(Y ) = 5 = ||Y ||2

La norma de los vectores siempre va a ser positiva. La distancia entre estos vectoressera (X − Y = ∂

∂x − ∂∂y + 2 ∂

∂z )

g(X − Y,X − Y ) =

= dx(X − Y )⊗ dx(X − Y ) + dy(X − Y )⊗ dy(X − Y ) + dz(X − Y )⊗ dz(X − Y )

= ||X − Y ||2 = 1 + 1 + 4 = 6

Un ejemplo mas interesante es la metrica de Minkowski, esta esta definida por

g = dx⊗ dx + dy ⊗ dy + dz ⊗ dz − dt⊗ dt

Tomemos ahora los vectores X = ∂∂x − ∂

∂t y Y = ∂∂x + ∂

∂t . El producto interno entreX y Y ahora esta dado por:

g(X,Y ) = dx(X)⊗ dx(Y ) + dy(X)⊗ dy(Y ) + dz(X)⊗ dz(Y )− dt(X)⊗ dt(Y )

= 1 + 1 = 2

Pero ahora las normas de los vectores es

g(X,X) = dx(X)⊗ dx(X) + dy(X)⊗ dy(X) + dz(X)⊗ dz(X)− dt(X)⊗ dt(X) = 0

g(Y, Y ) = dx(Y )⊗ dx(Y ) + dy(Y )⊗ dy(Y ) + dz(Y )⊗ dz(Y )− dt(Y )⊗ dt(Y ) = 0

O sea, estos vectores tienen norma nula, sus tamanos son nulos, a pesar de que losvectores no lo son. Esta es la principal caracteristica de la metrica de Minkowsky,en este espacio existe vectores no nulos con norma nula o negativa. Esta metricapodria ser vista como algo exotico, como una invencion de algun matematico condemasiada imaginacion. Pero no lo es, es el mejor modelo del espacio tiempo quetenemos, es algo muy real.

Vamos a tomar las componentes del ejemplo de la pelota 15.63. Tomemos a lametrica para una pelota como

g = dw1 ⊗ dw1 + dw2 ⊗ dw2 = r2(dθ ⊗ dθ + sin2(θ)dϕ ⊗ dϕ

)

Se suele denotar (abusando de la notacion) a una metrica tambien como

g = dΩ2 = r2(dθ2 + sin2(θ)dϕ2

)

el cual puede ser confuso, pues los elementos dθ2 y dϕ2 no son el cuadrado de unadiferencial, sino el producto tensorial de dos formas. Hay que tomar esto siempreen cuenta.

Page 290: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

278 16. TENSORES Y P-FORMAS

2. p-Formas

En esta seccion hablaremos de las p-formas. Las formas son productos tensori-ales de uno-formas antisimetrizados. Su importancia tambien viene de la fısica y delas ciencias naturales. Con las p-formas es posible hacer oparaciones con mucha massincillez y en muchos casos, las cantidades que se estudian adquieren un significadomas claro y presiso. En esta seccion estudiaremos algunos ejemplos en la fısica, conaplicaciones directas a la ingenierıa. Vamos primero a definir las p-formas.

Definicion 16.13. Sea V ∗ el conjunto de uno-formas. Al conjunto de tensores(0, p) antisimetricos en cada entrada se llama p-formas.

Vamos a ser mas explıcitos, sean w1, w2, w3 ∈ V ∗, entonces las p-formas seconstruyen como en los ejemplos siguientes.

Ejemplo 16.14. Una dos-forma se escribe como w = 12

(w1 ⊗ w2 − w2 ⊗ w1

)

Ejemplo 16.15. Una tres-forma w = 16 (w1 ⊗ w2 ⊗ w3 +w3 ⊗w1 ⊗w2 +w2 ⊗

w3 ⊗ w1 −w3 ⊗ w2 ⊗ w1 −w1 ⊗ w3 ⊗ w2 − w2 ⊗ w1 ⊗ w3), etc.

En lo que sigue vamos a construir el algebra de las p-formas. Primero vamos aconstruir un producto entre p-formas, llamado el producto wedge. Su definicion escomo sigue.

Definicion 16.16. Sean w y µ una p y q-formas respectivamente. El productow ∧ µ es una (p+ q)-forma, donde ∧ es antisimetrico i.e.

w ∧ µ = (−1)pqµ ∧w

Esto quiere decir, que si ea es base de las uno-formas, entonces una 2-formase escribe como

w =

n∑

a1a2=1

wa1a2 ea1 ∧ ea2 donde ea1 ∧ ea2 =

1

2(ea1 ⊗ ea2 − ea2 ⊗ ea1)

Analogamente, una tres forma se escribe como

w =

n∑

a1a2a3=1

wa1a2a3ea1∧ea2∧ea3donde ea1∧ea2∧ea3 =

1

6

[P ]

(−1)[P ]ea1⊗ea2⊗ea3

donde [P ] significa permutacion de (a1, a2,a3). De esta forma, se pueden construir(np

)p-formas en un espacio V ∗ n-dimensional. Al conjunto de las p-formas se

denota como ∧p.Proposicion 16.17. Toda (n+k)-forma en un espacio n-dimensional es identicamente

cero, para k > 1.

Demostracion 16.18. Sean V ∗ un espacio n-dimensional y α ∈ V ∗ una n+1forma. Entonces

α = αai···ajak···an+1eai ∧ · · · ∧ eaj ∧ eak ∧ · · · ∧ ean+1 pero algun kj se repite. Ası

que intercambiandolos α = −αai···ajak···an+1eai ∧ · · · ∧ eak ∧ eaj ∧ · · · ∧ ean+1 = −α

por lo tanto α = 0.

Page 291: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. DIFERENCIACION E INTEGRACION EN VARIEDADES 279

Ası como construimos el campo de las uno-formas y de los vectores, se puedeconstruir el campo de los tensores, simplemente definiendo los tensores en cadapunto de la variedad. Formalmente se tiene:

Definicion 16.19. Un tensor T del tipo (r, s) sobre una variedad Mn, es untensor construido sobre el espacio tangente TMn y el espacio cotangente T ∗Mn deMn.

3. Diferenciacion e integracion en variedades

Para evitar un poco la notacion de los indices con sumandos y factores extensos,a partir de esta seccion usaremos la convencion de suma sobre ındices repetidos deEinstein, es decir, si dos indices se repiten en un tensor, es que estos indices seestan sumando, a menos que se especifique lo contrario. En esta seccion vamos adefinir la diferencial y la integral de p-formas y tensores sobre la variedad. Vamosa definir tres tipos de operadores diferenciales y la integracion de estos, en especialveremos el teorema de Stokes. Para iniciar vamos a introducir la notacion sobre lasdiferenciales, ası todo sera mas compacto.

Notacion 16.20. En esta seccion denotaremos la derivada por una coma, esdecir

∂f

∂xk= f,k

∂2f

∂xk∂xl= f,kl

etc.

Primero vamos a definir la diferencial de p-formas, la cual es la mas usada y lamas simple de los operadores diferenciales que veremos.

Definicion 16.21. Sea Mn variedad y w una p-forma sobre Mn. La diferen-cial exterior d es un mapeo d : ∧p → ∧p+1 tal que a

w = wi1···ipdxi1 ∧ · · · ∧ dxip → dw

= d(wi1···ip

)∧ dxi1 ∧ · · · ∧ dxip

paradxii=1,··· ,n base coordenada de T ∗Mn = ∧1. Se tiene que

dw = wi1···ip,kdxk ∧ dxij ∧ · · · ∧ dxip.

La primera propiedad importante de este operador es que la diferencial de ladiferencial de una p-forma, es cero. Como veremos esta propiedad es muy impor-tante.

Proposicion 16.22. d (dw) = 0 para toda p-forma w ∈ ∧p, y para toda p ∈ Z+.

Demostracion 16.23. Tenemos dw = wi1···ip,kdxk∧dxi1 ∧· · ·∧dxip, entonces

d (dw) = wi1···ip,kℓdxℓ ∧ dxk ∧ dxi1 ∧ · · · ∧ dxip

donde se estan sumando ındices simetricos k, ℓ, con ındices antisimetricos dxℓ∧dxk,por tanto d (dw) = 0.

Para calcular la diferencial de p-formas se aplica la siguiente formula.

Page 292: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

280 16. TENSORES Y P-FORMAS

Proposicion 16.24. Sean w y µ una p y q-formas respectivamente. Se sigueque d (w ∧ µ) = dw ∧ µ+ (−1)

pw ∧ dµ.

Demostracion 16.25. Sean w = wi1···ipdxi1 ∧ · · · ∧ dxip y µ = µji···jqdx

j1 ∧· · · ∧ dxjq

Entonces

d(wi1···ipdx

i1 ∧ · · · ∧ dxip ∧ µj1···jqdxj1 ∧ · · · ∧ dxjq)

= wi1···ip,kdxk ∧ dxi1 ∧ · · · ∧ dxip ∧ µj1···jqdxj1 ∧ · · · ∧ dxjq +

+wi1···ipµj1···jq,ℓdxℓ ∧ dxi1 · · · ∧ dxip ∧ dxj1 ∧ · · · ∧ dxjq

= dw ∧ µ+ (−1)pw ∧ dµ

Ejercicio 16.26. Muestre que dw (X,Y ) = X (w (Y ))−Y (w (X))−w ([X,Y ])

En el capıtulo anterior introdujimos el concepto de full-back. Ahora vamos aintroducir un concepto similar, pero no hay que confudirlos, con el que podemostrasladar formas o tensores covarientas de una variedad a otra. Vamos a escribir ladefinicion y luego daremos una breve explicacion.

Definicion 16.27. Sea φ : Mm → Nn, y Mm, Nn variedades. Entonces:· El pull-back de tensores covariantes se define como

φ∗T (v1, · · · , vs) |p = T (φ∗v1, · · · , φ∗vs) |φ(p) ,

v1, · · · , vs ∈ TMm, p ∈Mm donde y T ∈ T 0s .

· Analogamente para tensores contravariantes se tiene

φ∗T(w1, · · · , wr

)|φ(p) = T

(φ∗w1, · · · , φ∗wr

)|p

para T ∈ T r0 y w1, · · · , wr ∈ T ∗Nn

Vamos a ver primero el pull-back de una uno-forma.

Ejemplo 16.28. Sea w ∈ T ∗Nn y v ∈ TMm. Y sea ϕ : Mm → Nn. Entoncesel pull-back de w esta dado por

ϕ∗w : TMm → ℜ tal que

v → w(ϕ∗v) = w(dϕ(v)).

Esto quiere decir que ϕ∗ es una funcion tal que

ϕ∗ : T ∗Nn → T ∗Mm,

ya que φ∗w ∈ T ∗Mm y w ∈ T ∗Nn. Recordemos que dϕ = ϕ∗ : TM → TN , veanla figura 1.

Con el ejemplo anterior ya se puede proceder a encontrar el pull-back de untensor covariante en general. Y con este el de un tensor contravariante. Vamos ademostrar ahora que el pull-back y la diferencial conmutan.

Proposicion 16.29. Sea Mm y Nn variedades y φ : Mm → Nn y φ∗ el pull-back. La diferencial exterior conmuta con el pull-bak.

Page 293: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. DIFERENCIACION E INTEGRACION EN VARIEDADES 281

Figure 1. Representacion de la funcion ϕ, del pull-back ϕ∗ y dela diferencial de la funcion ϕ , dϕ = ϕ∗.

Demostracion 16.30. Sea w ∈ ∧p y f : Mn → ℜ suave. Entonces, por laregla de la cadena

d (f φ) = d (φ∗f) = df dφ= df φ∗ = φ∗ (df) i.e.

d (φ∗f) = φ∗ (df)

De la misma manera para 1-formas:

d (φ∗w) = d (w φ∗) = d (w dφ) = dw φ∗ = φ∗ (dw)

y analogamente para p -formas.

El rotacional de un vector es un concepto matematico muy utilizado en cienciasexactas. En si es definido como la diferencial totalmente antisimetrica de un vector.Vamos a introducir el tensor de Levi-Civita, que nos va a servir para trabajar conla antisimetrizacion de vectores y tensores. Es de hecho la generalizacion de laantisimetrizacion que se usa en algabra de vectores. Aqui lo podemos introducirpara cualquier variedad de dimension arbitraria.

Definicion 16.31. El tensor totalmente antisimetrico de Levi-Civita ǫi1,··· ,inse define como

ǫi1,··· ,in =

1 si i1, · · · , in es permutacion par de (1, 2, · · · , n)-1 si i1, · · · , in es permutacion impar de (1, 2, · · · , n)0 cualquier otro caso

Page 294: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

282 16. TENSORES Y P-FORMAS

Con el tensor de Levi-Civita podemos definir el operador de Hodge. Esteoperador es muy usado para poder simplificar la notacion. Vamos a escribir sudefinicion y luego estudiaremos algunos ejemplos de su uso.

Definicion 16.32. El operador * de Hodge o transformacion de duali-dad es una funcion que mapea ∗ : ∧p → ∧n−p tal que

∗(dxij ∧ · · · ∧ dxip

)=

1

(n− p)!ǫi1···ipip+1···indxip+1 ∧ · · · ∧ dxin

donde ǫi1,··· ,in es el tensor de Levi-Civita

Esta definicion es posible gracias a la dualidad que existe entre los espaciosvectoriales de uno-formas ∧p y ∧n−p, ambas son de la misma dimension. Es poreso que la aplicacion del operador de Hodge dos veces a una p-forma, es proporcionala la p-forma, es decir, se regresa al lugar de origen.

Proposicion 16.33. ∗ ∗ wp = (−1)p(n−p)

wp donde wp ∈ ∧p

Demostracion 16.34. Por substitucion directa.

Veamos algunos ejemplos simples.

Ejemplo 16.35. Sea w = fdx ∧ dy + g dy ∧ dz donde g, f : ℜ3 → ℜ en ℜ3.Entoncees, n = 3 y w ∈ ∧2

dw = f,zdz ∧ dx ∧ dy + g,xdx ∧ dy ∧ dz = (f,z + g,x) dx ∧ dy ∧ dz∗w = f ∗ dx ∧ dy + g ∗ dy ∧ dz

= f1

1!ǫ123dz + g

1

1!ǫ231dx

= fdz + gdx

∗dw = f,z + g,x

Es decir, la aplicacion del operador de Hodge a una p-forma, consiste en quitartodos los elementos de la base que tiene la p-forma y poner todos los restantes, losque no se usan, en el orden que nos da el tensor de Levi-Civita. Las funciones quevan enfrente de la base no son afectadas por el operador de Hodge. Con este oper-ador se define otro operador diferencial muy importante, llamado la codiferencial.

Definicion 16.36. La codiferencial exterior o derivada exterior ad-junta se define por δ = (−1)

np+n+1 ∗ d∗ para espacios n-dimensionales y parap-formas. Se tiene que δ = − ∗ d∗ en espacios de dimension par y δ = (−1)

p ∗ d∗en espacios de dimension impar.

Como en el caso de la diferencial, la doble aplicacion de la codiferencial tambienes cero.

Proposicion 16.37. δ (δwp) = 0

Demostracion 16.38. δ (−1)np+n+1 ∗ d ∗ wp = (−1)

2(np+n+1) ∗ d ∗ ∗d∗ =

(−1)2(np+n+1) ∗ (−1)

p(n−p)dd ∗ wp

Comentario 16.39. Se tiene entonces que

d : ∧p → ∧p+1

δ : ∧p → ∧p−1

Page 295: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. DIFERENCIACION E INTEGRACION EN VARIEDADES 283

Utilizando la definicion de la diferencial y la codiferencial se puede definir otrooperador diferencial que llamaremos Laplaciano. En ciertos casos este operador esel Laplaciano que se conoce en algebra vectorial, pero de hecho es una generalizacionde este para cualquier variedad de cualquier dimension.

Definicion 16.40. El Laplaciano ∆ sobre una variedad, es una funcion ∆ :∧p → ∧p definida por ∆ = dδ + δd

Vamos a mostrar algunos ejemplos con todos los operadores diferenciales quehemos definido, por facilidad lo haremos en ℜ2, que es donde el calculo nos es masfamiliar, con ellos estas definiciones adquiriran mas sentido.

Ejemplo 16.41. Sea M = ℜ2. Entonces una base para ∧0 ⊃ 1. Analoga-mente para ∧1 ⊃ dx, dy , y para ∧2 ⊃ dx ∧ dy. Tambien podemos obtener laaplicacion ∗, esta nos da:

∗1 = dx ∧ dy; ∗dx = dy; ∗dy = −dx; ∗dx ∧ dy = 1.Para las diferenciales obtenemos:

df (x, y) = f,x dx+ f,y dy

ddf = f,xy dy ∧ dx+ f,yx dx ∧ dy = 0

d (udx+ vdy) = (v,x−u,y ) dx ∧ dyAnalogamente, para las codiferenciales se obtiene:

δf (x, y) = − ∗ d ∗ f (x, y) = − ∗ d (f (x, y) dx ∧ dy) = 0

δ (udx+ vdy) = − ∗ d ∗ (udx+ vdy) = − ∗ d (udy − vdx)= − ∗ (u,x dx ∧ dy − v,y dy ∧ dx) =

= − ∗ ((u,x+v,y ) dx ∧ dy) = − (u,x+v,y )

δ (φdx ∧ dy) = − ∗ d ∗ (φdx ∧ dy) = − ∗ d (φ) = − ∗ (φ,x dx+ φ,y dy) =

= − (φ,x dy − φ,y dx) = −φ,x dy + φ,y dx

Y para los Laplacianos obtenemos:

∆f = (dδ + δd) f = d (0) + δ (f,x dx+ f,y dy) = − (f,xx +f,yy )

∆(udx+ vdy) = d [− (u,x+v,y )] + δ [(v,x−u,y ) dx ∧ dy]= − [u,xx dx+ v,xy dx+ u,yx dy + v,yy dy]− ∗ [(v,xx−u,yx )dx + (v,xy −u,yy )dy]

= − [(u,xx+v,xy )dx+ (v,yy +u,xy )dy]− [(v,xx−u,yx )dy − (v,xy−u,yy )dx]

= − [(u,xx+u,yy )dx+ (v,xx +v,yy )dy]

Estos ultimos ejemplos justifican el nombre del operador ∆ como Laplaciano.Para el caso de M = ℜ3 las bases respectivamente estan dadas como ∧0 ⊃ 1,

∧1 ⊃ dx, dy, dz , para ∧2 ⊃ dx ∧ dy, dx ∧ dz, dy ∧ dz y para ∧3 ⊃ dx ∧ dy ∧ dz.Igualmente podemos obtener la aplicacion ∗ , esta nos da:

∗1 = dx ∧ dy ∧ dz; ∗dx = dy ∧ dz; ∗dy = −dx ∧ dz; ∗dz = dx ∧ dy;∗dx ∧ dy = dz; ∗dy ∧ dz = dx; ∗dz ∧ dx = dy; ∗dx ∧ dy ∧ dz = 1.

Ejercicio 16.42. Muestren que

∗d (v1dx + v2dy + v3dz) = −∇× v · dx,donde v = (v1, v2, v3) y dx = (dx, dy, dz) es el radio vector.

Page 296: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

284 16. TENSORES Y P-FORMAS

Ejercicio 16.43. Muestren que

δ (v1dx+ v2dy + v3dz) = −∇ · v,donde v = (v1, v2, v3)

Ejercicio 16.44. Muestren que

∆(v1dx+ v2dy + v3dz) = − ∂2v

∂xk∂xk· dx = −∇2v · dx

donde v = (v1, v2, v3).

El espacio tiempo se modela generalmente como una variedad 4-dimensional.Los ejemplos en fısica son hechos en esta dimension, aunque hay teorıas modernas deunificacion que utilizan dimensiones mas altas. Por eso para trabajar en el espaciotiempo debemos trabajar en el espacio M = ℜ4, donde las bases respectivamenteestan dadas por

para ∧0 ⊃ 1para ∧1 ⊃ dx, dy, dz, dt ,para ∧2 ⊃ dx ∧ dy, dx ∧ dz, dy ∧ dz, dx ∧ dt, dy ∧ dt, dz ∧ dtpara ∧3 ⊃ dx ∧ dy ∧ dz, dx ∧ dy ∧ dt, dx ∧ dz ∧ dt, dy ∧ dz ∧ dtpara ∧4 ⊃ dx ∧ dy ∧ dz ∧ dt

Igualmente podemos obtener la aplicacion ∗ , esta nos da:

∗1 = dx ∧ dy ∧ dz ∧ dt∗dx = dy ∧ dz ∧ dt ∗ dy = −dx ∧ dz ∧ dt ∗ dz = −dx ∧ dy ∧ dt ∗ dt = dx ∧ dy ∧ dz∗dx ∧ dy = dz ∧ dt ∗ dy ∧ dz = dx ∧ dt dz ∧ dx = dy ∧ dt∗dx ∧ dt = dy ∧ dz ∗ dy ∧ dt = dx ∧ dz ∗ dz ∧ dt = dx ∧ dy∗dy ∧ dz ∧ dt = dx ∗ dx ∧ dz ∧ dt = −dy ∗ dx ∧ dy ∧ dt = dz ∗ dx ∧ dy ∧ dz = dt

∗dx ∧ dy ∧ dz ∧ dt = 1

Ejemplo 16.45. Sea F = Fidxi ∧ dt− 1

2ǫijkHidxj ∧ dxk = Fxdx∧ dt+Fydy ∧

dt + Fzdz ∧ dt −Hxdy ∧ dz +Hydx ∧ dz −Hzdx ∧ dy, donde ǫijk es el tensor deLevi-Civita y Hi = Hi para i = 1, 2, 3. Podemos calcular su diferencial

dF = [(Fz,y − Fy,z) dy ∧ dz + (Fz,x − Fx,z) dx ∧ dz + (Fy,x − Fx,y) dx ∧ dy] ∧ dt− (Hx,x +Hy,y +Hz,z) dx ∧ dy ∧ dz− [Hx,tdy ∧ dz −Hy,tdx ∧ dz +Hz,tdx ∧ dy] ∧ dt

Usando las expresiones anteriores, podemos calcular ∗dF∗dF = [(Fz,y − Fy,z) dx− (Fz,x − Fx,z) dy + (Fy,x − Fx,y) dz]

− (Hx,x +Hy,y +Hz,z) dt

− [Hx,tdx+Hy,tdy +Hz,tdz]

Si ahora definimos los vectores F = (Fx, Fy, Fz) y H = (Hx, Hy, Hz) obtenemos∗dF en representacion vectorial como

∗dF = −∇× F · dx−∇ ·Hdt− ∂

∂tH · dx

la cual es una expresion vectorial muy interesante que usaremos mas adelante.

Page 297: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. DIFERENCIACION E INTEGRACION EN VARIEDADES 285

En funcion de la accion de los operadores sobre las p-formas, podemos clasificarlas p-formas de la siguiente forma.

Definicion 16.46. Una p-forma wp ∈ ∧pse dice:· Armonica si ∆wp = 0· Cerrada si dwp = 0· Cocerrada si δwp = 0· Exacta si wp = dαp−1 αp−1 ∈ ∧p−1

· Coexacta si wp = δαp+1 αp+1 ∈ ∧p+1

La integracion de p-formas tiene dos teoremas que hacen de las p-formas objetosfacil de manipular. Vamos a presentar dos teoremas sin demostracion, el teorema deHodge, que dice que cualquier p-forma es la superposicion de una p-forma exacta,una mas coexata o otra amonica. Ası es posible escribir las p-formas en terminos deestas p-formas con caracteristicas muy especiales. Este teorema es de gran ayudacomo veremos. Y el segundo teorema es el teorema de Stokes, que como veremosen los ejemplos, es la generalizacion de una gran cantidad de teoremas matematicossobre integracion puestos todos en el mismo contexto. Empecemos por el teoremade Hodge, el cual estudiaremos sin demostrarlo.

Teorema 16.47 (Hodge). Sea Mn variedad compacta y sin frontera y ∧p elconjunto de p-formas sobre Mn. Entonces

wp = dαp−1 + δβp+1 + γp

para toda wp ∈ ∧p, con αp−1 ∈ ∧p−1, βp+1 ∈ ∧p+1 y γp ∈ ∧p armonica.

Y el teorema de Stokes, que tampoco demostraremos aquı.

Teorema 16.48 (Stokes). Sea Mn variedad con frontera no vacıa. Sea wp−1 ∈∧p−1 una p− 1-forma sobre Mn. Entonces

M

dwp−1 =

∂M

wp−1

Para ver este teorema, es mejor ver la manera de trabajar con el. Para famil-iarizarnos con el teorema de Stokes vamos a estudiar algunos ejemplos en variosespacios.

Ejemplo 16.49. En ℜ, n = 1, solo hay dos espacio de formas, las 0- y las1-formas, es decir ∧0 y ∧1. Sea f ∈ ∧0 y df ∈ ∧1. Entonces se tiene

M

df =

∫f

∂M

.

Sea M = (a, b), entonces el teorema de Stokes es simplemente∫

a

b

df = f |ba = f (b)− f (a)

que es el teorema fundamental del calculo.

Ejemplo 16.50. En ℜ2 hay tres espacios de formas, las 0-, 1-, y 2-formas, esdecir, ∧0,∧1 y ∧2. Sea w = w1dx + w2dy una 1-forma en ℜ2. Entonces dw =

Page 298: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

286 16. TENSORES Y P-FORMAS

w1,ydy ∧ dx+w2,xdx∧ dy. La aplicacion del teorema de Stokes en este espacio nosda ∫

M

dw =

∂M

w.

Sea M una superficie, su frontera es una curva∫

M

(w2,x − w1,y) dx ∧ dy =

(w1dx+ w2dy) ,

Que es el teorema de Stokes en el plano, vean la figura 2

Figure 2. Region de integracion. M es una superficie y l es su contorno.

Ejemplo 16.51. En ℜ3 podemos definir 0-, 1-, 2- y 3-formas. Sea w una 1-forma en ℜ3, su diferencial esta dada por dw = d (w1dx+ w2dy + w3dz). Vamos aescribir esta diferencial explicitamente, veamos

dw = w1,ydy ∧ dx+ w1,zdz ∧ dx+w2,xdx ∧ dy + w2,zdz ∧ dy+w3,xdx ∧ dy + w3,ydy ∧ dz

= (w2,x − w1,y) dx ∧ dy+ (w3,x − w1,z) dx ∧ dz+ (w3,y − w2,z) dy ∧ dz

=1

2(wi,j − wj,i) dxi ∧ dxj

=1

2ǫijkBkdx

i ∧ dxj

Si denotamos w = (w1, w2, w3), obtenemos que B =rot w, siendo B = (B1, B2, B3) .La aplicacion del teorema de Stokes

∫M

dw =∫∂M

w implica que

M

rot w · dS =

M

B · dS =

∂M

w · dx =

∮w · dx

Page 299: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. DIFERENCIACION E INTEGRACION EN VARIEDADES 287

donde hemos usado el vector dS = (dy ∧ dz,−dx∧ dz, dx∧ dy). Esta es la formuladel flujo magnetico sobre una superficie o ley de Gauss.

Vamos a estudiar algunos ejemplos utilizando parte del material desarrolladohasta ahora.

Ejemplo 16.52. Vamos a iniciar de nuevo con el tensor electromagnetico delejemplo 16.10. Sea de nuevo el tensor A = Aµdx

µ + dΛ. Tomemos su diferencialF = dA = Aµ,νdx

ν ∧ dxµ, ya que ddΛ = 0. Debido a la antisimetria del operador∧, el nuevo tensor F es antisimetrico, es el tensor de Faraday. En componenteseste tensor se escribe como F = Fµνdx

ν ∧ dxµ, donde las componentes Fµν estandadas por

Fµν =1

2

0 Ax,t −At,x Ay,t −At,y Az,t −At,z− (Ax,t −At,x) 0 Ay,x −Ax,y Az,x −Ax,z− (Ay,t −At,y) − (Ay,x −Ax,y) 0 Az,y −Ay,z− (Az,t −At,z) − (Az,x −Ax,z) − (Az,y −Ay,z) 0

Por lo general tambien se escriben las componentes del tensor de Faraday enterminos de las componentes del campo electrico y magnetico como

Fµν =1

2

0 −Ex −Ey −EzEx 0 Bz −ByEy −Bz 0 BxEz By −Bx 0

Ası que

F = −Eidxi ∧ dt+ ǫijkBidxj ∧ dxk

= − (Exdx ∧ dt+ Eydy ∧ dt+ Ezdz ∧ dt)+ Bxdy ∧ dz −Bydx ∧ dz +Bzdx ∧ dy.

Comparando las componentes de las matrices, se puede ver que

−E =∂A

∂t+∇Φ

B = ∇×A

donde claramente se ha definido el vector A = (Ax, Ay, Az), y dos vectores mas,el vector electrico E = (Ex, Ey, Ez) y el vector magnetico B = (Bx, By, Bz), de talforma que las componentes del tensor electromagnetico son Aµ = (−Φ,A). Comose sigue que dF = ddA = 0, esto implica que ∗dF = 0. Usando el resultado delejercicio 16.45 se tiene que

∗dF = ∇×E · dx +∇ ·Bdt+ ∂

∂tB · dx = 0

Esta identidad implica que

∇×E +∂

∂tB = 0

∇ ·B = 0

las cuales son la ecuacion de Faraday y la ecuacion de Gauss para el campo magnetico,respectivamente. Analogamente, se puede obtener una expresion para δF . Paraesto, vamos a obtener primero ∗F∗F = Bxdx ∧ dt+Bydy ∧ dt+Bzdz ∧ dt− (Exdy ∧ dz − Eydx ∧ dz + Ezdx ∧ dy)

Page 300: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

288 16. TENSORES Y P-FORMAS

Si ahora usamos el resultado del ejercicio 16.45 obtenemos que

∗d ∗ F = −∇×B · dx +∇ · Edt+ ∂

∂tE · dx

de donde claramente se ven la ley de Ampere y la ley de Gauss para el campoelectrico, es decir

∇×B− ∂

∂tE = 4πj

∇ ·E = 4πρ

de donde concluimos que las ecuaciones de Maxwell en terminos de formas son

dF = 0

δF = −4πJ(16.2)

donde J = ρdt+ j · dxEjercicio 16.53. Muestre que la norma de Lorentz se puede representar como

δA = 0

Ejemplo 16.54 (Monopolo de Dirac). Ahora vamos a ver un ejemplo ya no enun espacio plano, sino en una variedad no trivial, por ejemplo sobre la pelota. Dadala generalidad de las formas, podemo incluso resolver las ecuaciones de Maxwell 16.2sobre la pelota. Sea M = S2, y ya sabemos que unas bases de T ∗S2 estan dadaspor

dx1± =

dx

1∓ z +xdz

(1∓ z)2

dx2± =

dy

1∓ z +ydz

(1∓ z)2

Cualquier 1-forma en T ∗S2 se escribe entonces como A± = A1±dx1± + A2±dx2

± ysu diferencial se obtiene como dA± = (A2±,2−A1±,1 ) dx1

± ∧ dx2±. Una expresion

equivalente para este resultado es que F = ddA = 0. Analogamente, la aplicaciondel operador de Hodge a la 1-forma A± nos da ∗A± = A1±dx2

± − A2±dx1±. De

aqui podemos obtener la diferencial de esta ultima forma, obtenemos d ∗ A± =(A1±,1 +A2±,2 ) dx1

± ∧ dx2±. Para obtener la segunda ecuacion de Maxwell, vamos

a obtener la aplicacion del operador δ se obtiene entonces

dA± = (A1±,2−A2±,1 ) dx1± ∧ dx2

±δA± = A1±,1 +A2±,2 .

Si ahora usamos la Norma de Lorentz δA = 0, podemos reducir las ecuacioneselectromagneticas sobre la esfera sustancialmente. Vamos a escribir la segundaecuacion de Maxwell. Se tiene que

δF = − ∗ d ∗ F = − ∗ d (A1±,2−A2±,1 )

= − ∗(A1±,21 dx

1± +A1±,22 dx

2± −A2±,11 dx

1± −A2±,12 dx

2±)

= − ∗[− (A2±,22 +A2±,11 ) dx1

± + (A1±,22 +A1±,11 ) dx2±]

= (A1±,11 +A1±,22 ) dx1± + (A2±,11 +A2±,22 ) dx2

±

donde ya hemos usado la norma de Lorentz para simplificar las ecuaciones. Unasolucion de las ecuaciones de Maxwell en el vacio δF = 0 sobre la esfera es:

A1± = A0x2±, A2± = −A0x

Page 301: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. DIFERENCIACION E INTEGRACION EN VARIEDADES 289

donde A0 es una constante. Observe que x1± = r1 σ±(p) = x/(1 ∓ z) and x2

± =r2 σ±(p) = y/(1∓ z). La solucion entoces es

A± = A0

(x2±dx

1± − x1

±dx2±)

=A0

(1∓ z)2(ydx− xdy)∓ A0

(1∓ z)3(xy − yx) dz

Si ahora cambiamos las coordenadas a coordenadas esfericas 15.1, las cuales sonmas convenientes para analizar este caso, se obtiene:

A± =A0

(1∓ z)2 (ydx− xdy) = A0(∓1− cos(θ))

(±1− cos(θ))dϕ

A+ = −A01− cos(θ)

1 + cos(θ)dϕ

A− = −A01 + cos(θ)

1− cos(θ)dϕ

la cual es una solucion a las ecuaciones de Maxwell en el vacio sobre la pelota.

Ejemplo 16.55. Vamos a tomar alguna solucion con fuentes. Supongamos quetenemos un tensor de corrientes dado por

J =x1

(x12 + x22 + 1)3dx1 +

x2

(x12 + x22 + 1)3dx2

(vamos a quitar en este ejemplo los subindices ± por comodidad). Igualando laecualcion δF = −4πJ se llega a un sistema de ecuaciones

A1,11 +A1,22 =−4πx1

(x12 + x22 + 1)3

A2,11 +A2,22 =−4πx2

(x12 + x22 + 1)3

Este sistema tiene una solucion dada por

A1 =πx1

2(x12 + x22 + 1)

A2 =πx2

2(x12 + x22 + 1)

En terminos de las coordenadas de ℜ3, la solucion (regresando a la notacion con±) es

A± =A0

(1∓ z) (ydx− xdy) = A0 (∓1− cos(θ)) dϕ

A+ = A0 (−1− cos(θ)) dϕ

A− = A0 (1− cos(θ)) dϕ

Es decir A+ = A−− 2A0dϕ. Por lo tanto A± es solamente un campo de norma.A± se llama el monopolo de Dirac

En la siguiente seccion vamos a introducir otros dos operadores diferenciales,uno es llamado derivada de Lie y el otro la derivada covariante. Ambos tienensu esfera de interes y se utilizan para diferentes objetivos. La derivada de Lie esmuy importante para encontrar simetrias en alguna variedad. Con ella es posibleencontrar los vectores de Killing, que son asociados a simetrias del espacio. Con la

Page 302: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

290 16. TENSORES Y P-FORMAS

derivada covariante se construye el tensor de curvatura, que es un tensor con el quepodemos medir esta en todo punto del espacio. Para poder introducir la derivadade Lie es necesario introducir algunos conceptos previos. Para esto necesitamosprimero algunas definiciones.

Definicion 16.56. Sea Mn variedad, U ⊂ Mn y (−ǫ, ǫ) ⊂ ℜ. Un grupouniparametrico de transformacion es una funcion suave ϕ : (−ǫ, ǫ)×U →Mn

tal que1) ϕ (0, x) = x2) ϕ (t+ s, x) = ϕ (t, ϕ (s, x)) para toda t, s ∈ ℜ, x ∈Mn

Comentario 16.57. Observe que ϕ (t+ s, x) = ϕ (s+ t, x) = ϕ (s, ϕ (t, x))

El nombre de grupo es porque con esta funcion efectivamente se puede formarun grupo, de un solo parametro, esto se hace en la siguiente proposicion.

Proposicion 16.58. Sea ϕ : ℜ × Mn → Mn un grupo uniparametrico detransformaciones y

Ψ = ϕt : Mn →Mn, x→ ϕt (x) = ϕ (t, x) .Entonces (Ψ, ) es un subgrupo del grupo de difeomorfismos.

Demostracion 16.59. Se tiene que

ϕt ϕs (x) = ϕt+s (x) = ϕ (t+ s, x) = ϕ (t, ϕ (s, x)) = ϕt (ϕs (x)) .

Entonces ϕ es cerrado. ϕt+s = ϕs+t implica que Ψ es abeliano, ϕ0 es la identidady ϕ−t = ϕ−1

t , ya que ϕt ϕ−t = ϕ0

Como el grupo uniparametrico de transformaciones es una funcion de los realesa la variedad, se puede construir una curva. Entonces con la curva se puede construirla tangente a esta curva que a su vez define un vector. Entonce se dice que esta curvaes la curva integral del vector tangente a la curva. Vamos a hacer esto formalmente.

Definicion 16.60. Sea Mn variedad. Una curva integral de X ∈TMn es

un camino suave γ : (a, b)→Mn tal que·γ (s) = Xγ(s), s ∈ (a, b) vean la figura 3.

Figure 3. La curva integral del vector X , es el camino suaverepresentado en la figura.

Vamos a aclarar esta definicion un poco. Sea c = (U,ψ, v) una carta y X ∈ TU .Entonces la funcion γ : (a, b)→ U es una curva que cumple con la propiedad

dγ : Tsℜ → Tγ(s)Mn

Page 303: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. DIFERENCIACION E INTEGRACION EN VARIEDADES 291

tal que explicitamente se cumple la siguiente igualdad

(d

dt

∣∣∣∣s

)= Xγ(s) :=

·γ(s) =

d

dt γ∗.

donde hemos definido la funcion·γ(s). Esto es, para una funcion cualquiera de la

variedad a los reales f : Mn → ℜ se tiene que esta funcion cumple con las siguientesigualdades

·γ (f) = dγ

(d

dt

∣∣∣∣s

)(f) =

d

dt

∣∣∣∣s

(f γ) = Xγ(s) (f) .

Vamos a tomar una funcion muy particular, sea f = xi, entonces se tiene lo sigu-iente:

·γ(xi)

= dγ

(d

dt

∣∣∣∣s

)(xi)

=d

dt

∣∣∣∣s

(xi γ

)

=d

dt

(xi γ

)(s) = Xj

γ(s)

∂xj

∣∣∣∣γ(s)

(xi)

= Xγ(s)

(xi)

= X(xj)(γ (s)) .

Ası es que se cumple ddt

(xi γ

)= X

(xj) γ. Esto quiere decir que, dado un

vector X en la variedad, para encontrar una curva integral, hay que resolver elsistema de ecuaciones diferenciales

(16.3)d

dt

(xi γ

)= X

(xi) γ

Ejemplo 16.61. Vamos a encontra la curva integral del vector

X = x2 ∂

∂x1− x1 ∂

∂x2

Entonces, de la ecuacion (16.3), las ecuaciones a resolver son (recuerden que r1 =x1 γ, r2 = x2 γ)

dr1

dt= X(x1) γ = r2

dr2

dt= X(x2) γ = −r1

Una solucion a este sistema es r1 = r sin(t), r2 = r cos(t). Es facil ver que la curva

integral es un cırculo de radio r, ya que r12

+ r22

= r2

Ejemplo 16.62. Veamos ahora la curva integral del vector del ejemplo 15.63

X = (cos(θ)− 1)

(cos(ϕ)

∂θ+

sin(ϕ)

sin(θ)

∂ϕ

)

Entonces, de la ecuacion (16.3), las ecuaciones a resolver son

dr1

dt= X(θ) γ =

(cos(r1)− 1

)cos(r2)

dr2

dt= X(ϕ) γ =

(cos(r1)− 1

) sin(r2)

sin(r1)

Si dividimos la primera ecuacion entre la segunda y separamos las variables, pode-mos integrar este sistema de ecuaciones. El resultado es que (csc(r1)− cot(r1)) =

Page 304: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

292 16. TENSORES Y P-FORMAS

c sin(r2). Una parametrizacion de esta curva esta dada por r1 = λ, r2 = 1/c arcsin(csc(λ)−cot(λ)). La curva es graficada en la figura 4

Figure 4. Curva integral del vector del ejemplo 16.62. Como estevector corresponde a uno de los vectores base de la pelota, estacurva esta sobre la pelota y hay que imaginarsela dando vueltaalrededor de ella y con los extremos que se juntan.

Ejercicio 16.63. Encuetre la curva integral de los vectores

1) X =∂

∂x1+m

∂x2sobre ℜ2

2) X = sin(θ)∂

∂ϕsobre S2

Otra propiedad importente del grupo unimarametrico de transformaciones esque induce dos importantes funciones. Con ellas vamos a poder construir la derivadade Lie. Vamos a definir estas funciones.

Page 305: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. DERIVADA DE LIE Y DERIVADA COVARIANTE 293

Definicion 16.64. Sea ϕ : ℜ ×Mn →Mn un grupo uniparametrico de trans-formaciones sobre Mn variedad. ϕ induce dos funciones

ϕt : Mn → Mn

x → ϕt (x) = ϕ (t, x)

ϕx : ℜ → Mn

t → ϕx (t) = ϕ (t, x) .

Entonces ϕt es un subgrupo abeliano del grupo de difeomorfismos y ϕx induce el

vector X =·ϕx.

Observe que el conjunto ϕx|ϕx(t) = ϕ (t, x) cumple que ϕx ϕy 6= ϕy ϕx engeneral, por lo que

d (ϕx ϕy)(d

dt

∣∣∣∣s

)= dϕx dϕy

(d

dt

∣∣∣∣s

)

= X Y 6= Y X

= d (ϕy ϕx)(d

dt

∣∣∣∣s

).

Esto es, la funcion ϕx induce un producto que en general es un producto no con-mutativo entre los vectores de la variedad.

4. Derivada de Lie y Derivada Covariante

Debido a la rica estructura que tienen los tensores, es posible definir varios oper-adores diferenciales. En esta seccion vamos a introducir dos operadores diferencialesmuy importantes y utilizados en fısica, son operadores que generalizan la derivadanormal. La derivada de Lie es conveniente para espacios que tinen isometrias osimetrias especiales. Con la derivada de Lie, como veremos, es posible encontrarestas simetrias. La derivada covariante es un operador que convierte a un tensoren otro tensor, por eso su importancia como operador diferencial. A la derivadade Lie la vamos a introducir sin demostraciones, pero para la derivada covariantedaremos las demostraciones mas importantes. Ahora estamos listos para definir laderivada de Lie.

Definicion 16.65. Sea Mn variedad y T ∈ T rs tensor sobre Mn. Sea ϕ en

grupo uniparametrico de transformaciones sobre Mn, X =·ϕx. La derivada de

Lie de T a lo largo de X se define como

LXT |p= limt→0

1

t(T |p −ϕt∗T |p)

donde ϕx y ϕt son las funciones inducidas por ϕ.

La derivada de Lie tiene varias propiedades, que aquı vamos a poner sin de-mostracion, y que podemos resumir en la siguiente proposicion.

Proposicion 16.66. Sea LX derivada de Lie del vector X, entonces se cumple:1) LX preserva el tipo de tensor, es decir mapea LX : T rs → T rs2) LX es lineal y preserva la contraccion3) Si S y T son tensores arbitarios, se cumple LX (S ⊗ T ) = (LXS)⊗T +S⊗

(LXT )4) LXf = X (f) para f : Mn → ℜ

Page 306: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

294 16. TENSORES Y P-FORMAS

5) LXY = −LYX = [X,Y ] para toda X,Y ∈ TMn

6) d (LXw) = LX(dw)

Finalmente, como dijimos, vamos a introducir otro operador diferencial, laderivada covariante. Para esto necesitamos introducir una nueva estructura llamadala conexion, y que vamos a denotar por ∇. La idea de la conexon es dar una formade conectar un vector que es trasladado paralelamente a traves de la variedad. Ası,si el vector base ea es traslado paralelamente a lo largo de la curva γ, que tienecomo vector tangente al vector eb, el vector final trasladado paralelamente sera∇eb

ea, vean la figura 5. Vamos a desarrolar esta idea con cuidado. Formalmentela definicion de conexion es:

Definicion 16.67. Una conexion ∇ para algun p ∈ Mn, variedad, es unmapeo que le asocia a cada tensor del tipo T ∈ T rs un tensor del tipo T rs+1 ∇ :T rs → T rs+1 tal que

1) ∇ es una derivacion en el algebra tensorial, i.e.∇ (αT + βT ′) = α∇T + β∇T ′ y∇ (S ⊗ T ) = ∇S ⊗ T + S ⊗∇T2) ∇f = df para toda f : Mn → ℜ3) ∇ = ea∇eb

donde eaa=1,··· ,n y ebb=1,··· ,n son bases duales de T ∗Mn yTMn respectivamente.

4) ∇X es lineal, i.e. ∇αX+βY = α∇X + β∇Y .

No hay una manera unica de definir la conexion en una variedad. La mas comunes la conexion que hace que la derivada covariante haga cero al tensor metrico, lacual introduciremos mas adelante. Pero en general, la forma de definir la conexiones usando la siguiente regla.

Sea eaa=1,...,n una base de TMn no necesariamente coordinada, es decir

ea = eia∂∂xi . Entonces

∇ebea = Γcabec ∈ TMn

donde los coeficientes Γcab son funciones suaves, vean la figura 5, que se obtienendel producto Γcab = 〈ec,∇eb

ea〉, dondeebb=1,··· ,n es la base dual a eaa=1,··· ,n,

es decir eb = ebjdxj y se cumple que

(16.4)⟨eb, ea

⟩= ebje

ja

⟨dxj ,

∂xj

⟩= δba.

De hecho, definir la conexion es equivalente a dar los valores de las funciones Γcabsobre la variedad. Para una base coordenada, los coeficientes de la conexion son

∇ ∂

∂xj

∂xi= Γkij

∂xk

nosotros vamos a tomar siempre conexiones simetricas, es decir, para las basescoordenadas se cumple que

Γkij = Γkji

Ejercicio 16.68. Estudien como se comportan los coeficientes Γcab bajo uncambio de base (de coordenadas).

Conociendo la conexion en la variedad, se puede conocer la derivada covariantede un vector. La forma de hacerlos se ve en la siguiente proposicion.

Page 307: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. DERIVADA DE LIE Y DERIVADA COVARIANTE 295

Figure 5. El desplazamiento paralelo de un vector. Este de-splazamiento en una variedad define los coeficientes de la derivadacovariante entre bases dadas.

Proposicion 16.69. Las componentes de la derivada covariante del vector Ya lo largo del vector X, se ven como

∇XY =(Y a|bX

b)ea

donde eaa=1,··· ,n es una base de TMn y Y a|b = eb(Ya) + ΓacbX

c

Demostracion 16.70. Tomemos X = Xbeb Y = Y aea, entonces

∇ebY = ∇eb

(Y aea)

= (∇ebY a) ea + Y a (∇eb

ea)

= eb (Y a) ea + ΓcabecYa

= (eb (Y a) + ΓacbYc) ea

= Y a|bea

por la linearidad del operador ∇ease obtiene el resultado deseado.

Notacion 16.71. En el caso que la base sea una base coordenada dxi, seacostumbra denotar a la derivada covariante no por el simbolo |, sino por ; entonces:

∇ ∂

∂xjY =

(Y i,j +ΓikjY

k) ∂

∂xi= Y i;j

∂xi

Por supuesto ∇Y = dxjY i;j∂∂xi no depende de las bases.

De hecho, la definicion de la conexion o del transporte paralelo es equivalente.Si se define una, se puede definir la otra. En este caso hemos definido a la conexion,entonces el trasporte paralelo se define como:

Definicion 16.72. Sea γ un camino en la variedad M , y sea X = γ el vectortangente a lo largo de γ. Se dice que el vector Y ha sido trasladado paralelamentea traves de X, si

∇XY = 0

Page 308: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

296 16. TENSORES Y P-FORMAS

Supongamos por facilidad que X = Xj ∂∂xj , y que Y = Y i ∂

∂xi . Si desarrollamosla formula de la definicion 16.72, se tiene

0 = ∇XY = ∇Xj ∂

∂xjY = Xj∇ ∂

∂xjY =

(XjY i,j +ΓikjX

jY k) ∂

∂xi

que puede escribirse de la forma equivalente

(X(Y i) + ΓikjX

jY k) γ =

d(Y i γ

)

dt+ ΓikjX

jY k γ = 0

donde hemos usado la formula de la cuarva integral de la ecuacion (16.3) de X enla igualdad.

Ejemplo 16.73. Vamos a discutir un ejemplo simple, para iniciar, vamos asuponer que la conexion es cero. Supongamos que tenemos el vector Y = Y 1 ∂

∂x1 +

Y 2 ∂∂x2 el cual queremos desplazar paralelamente a lo largo de una curva. Ahora

veamos la ecuacion del desplazamiento paralelo, se tiene

dY 1 γdt

= 0,dY 2 γdt

= 0

cuya solucion es Y 1 = Y 10 , Y

2 = Y 20 , donde ya hemos puesto las condiciones

iniciales a la solucion, es decir, el valor del vector Y |t=t0 en el punto donde seinicia el desplazamiento. Este vector sera siempre Y |t=t0 , es decir, si la conexiones cero, un vector se desplaza paralelamente sin cambiar.

Ejemplo 16.74. Ahora vamos a estudiar un ejemplo donde la conexion no escero. Sea la variedad M 2-dimensional, con coordenadas θ, ϕ y con la conexion

Γθθθ =sin(θ)

cos(θ) − 1Γθϕϕ = sin(θ) Γϕθϕ = Γϕϕθ = − 1

sin(θ)

y vamos a transportar paralelamente un vector sobre esta variedad a lo largo delvector X dado por

X = sin(θ)∂

∂ϕcuya curva integral es un desplazamiento solo en la direccion ϕ y esta dada por laparametrizacion θ = θ0 constante y ϕ = θ0t. Entonces encontremos el desplaza-miento paralelo de un vector en M a lo largo de este vector, obtenemos

0 =d(Y θ γ

)

dt+ ΓθθθX

θY θ γ + ΓθϕϕXϕY ϕ γ

=dy1

dt+ sin2(θ0)y

2

0 =d (Y ϕ γ)

dt+ ΓϕθϕX

θY ϕ γ + ΓϕϕθXϕY θ γ

=dy2

dt− y1

Para obtener el desplazamiento paralelo de Y , hay que resolver este sistema de ecua-ciones con las condiciones iniciales correspondientes al punto inicial. La soluciondel sistema esta dada por

y1 (t) = C1 sin (sin (θ0) t) + C2 cos (sin (θ0) t)

y2 (t) =C2

sin (θ0)sin (sin (θ0) t)−

C1

sin (θ0)cos (sin (θ0) t)

Page 309: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. DERIVADA DE LIE Y DERIVADA COVARIANTE 297

Dado el valor inicial de y1 y y2, se fijan las constantes y se puede encontrar elvector desplazado paralelamente en otro punto, para algun valor de t.

De la misma forma podemos calcular la derivada covariante de una 1-forma,dado que ya conocemos la conexion en la variedad. Esto se ve en la proposicionsiguiente.

Proposicion 16.75. Sea ∇ conexion en Mn. Si ∇ebea = Γcabec entonces

∇ebea = −Γacbe

c.

Demostracion 16.76. Sea Y = Y aea ∈ TMn y w = wcec ∈ T ∗Mn. Usemos

el hecho que ∇ y por lo tanto ∇ebson derivaciones, entonces

∇eb(wcY

c) = wc|bYc + wcY

c|b Y como wcY

c es una funcion, se tiene:

= eb (wc) Yc + wceb (Y c) Por otro lado, se sigue que:

= (eb (wc)− Γacbwa)Yc + wa (eb (Y a) + ΓacbY

c)

Por lo que entonces ∇ebw = wc|bec = (eb (wc)− Γacbwa) e

c

Ejercicio 16.77. Demuestre que las componentes de la derivada covariante∇eb

T , aplicada a un tensor T = T b1···bra1···as

eb1 ⊗ · · · ⊗ ebr⊗ ea1 ⊗ · · · ⊗ eas estan dadas

por

T b1···br

a1···as|b = eb(Tb1···bra1···as

) +

r∑

i=1

Γbi

cb Tb1···c···bra1···as

−s∑

j=1

Γcajb Tb1···bra1···c···as

Existe una relacion entre todas los operadores diferenciales que hemos definido,la diferencial de p-formas, la derivada de Lie y la derivada covariante. Entre ladiferencial de p-formas y la derivada covariante la relacion es que la diferencial sepuede facilmente generalizar a espacios con conexion ∇. La diferencial exterior,definicion 16.21, en espacios con conexion es

dw = ∇ ∂

∂xj

(wi1,··· ,ip

)∧ dxi1 ∧ · · · ∧ dxip ,

que, por ejemplo, para una 1-forma w = wi dxi se obtiene

dw = ∇ ∂

∂xj(wi)dx

i = (wi,j − Γkijwk)dxi ∧ dxj .

Todas las proposiciones y teoremas que se aplican a la derivada exterior se siguenigualmente con la definicion extendida. Por lo general, los coeficientes de conexonen un sistema coordenado dxi son simetricos, es decir Γkij = Γkji, en tal caso ladefinicion anterior es exactamente la definicion 16.21.

La relacion entre la derivada de Lie y la derivada covariante, la cual veremossin demostracion, se sigue de la siguiente proposicon.

Proposicion 16.78. Sea

T = T b1···bra1···as

eb1 ⊗ · · · ⊗ ebr⊗ ea1 ⊗ · · · ⊗ eas

tensor. Entonces la derivada de Lie a lo largo del vector X = Xc ec de este tensoresta dada por

(16.5) LXTb1···bra1···as

= XcT b1···br

a1···as|c −r∑

n=1

T b1···c···bra1···as

Xbn

|c +s∑

m=1

T b1···bra1···c···as

Xc|am

Vamos a ver algunos ejemplos de como usar la formula (16.5).

Page 310: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

298 16. TENSORES Y P-FORMAS

Ejemplo 16.79. Vamos a encontrar la derivada de Lie de un vector Y = Y beba lo largo del vector X = Xcec. Usando la formula (16.5) se tiene

LXYb = XcY b|c − Y cXb

|c = [X,Y ]b −DbcdX

cY d

donde Dbcd = Γbdc−Γbcd. Si las componentes de la conexion son simetricas Db

cd = 0,la ultima igualdad fue dada en la proposcion 16.66 sobre las propiedades de laderivada de Lie. Vamos a encontrar ahora la derivada de Lie de una uno formaw = wae

a a lo largo del mismo vector X = Xcec. Usando la formula (16.5) setiene

LXwa = Xcwa|c + wcXc|a

Si ej = ∂∂xj , ei = dxi son bases coordenadas, entoces solo hay que cambiar

el simbolo | por ; y Dijk = 0 generalmente.

Ejemplo 16.80. Ahora vamos a buscar la derivada de Lie a lo largo del vectorX = Xcec de un tensor T = Tabe

a ⊗ eb. De nuevo, usando la formula (16.5) setiene

LXTab = XcTab|c + TcbXc|a + TacX

c|b

Este resultado lo usaremos mas adelante.

El interes de la derivada de Lie radica en lo siguiente. Supongamos que ϕ esuna isometria (ver capıtulo 9 definicion 9.71). Es decir, esta funcion deja invariatela metrica ρ ϕ(X,Y ) = ρ(ϕ(X), ϕ(Y )) = ρ(X,Y ). La presencia de isometriases comun en problemas reales, por ejemplo, si un prblema tiene simetria axial, lametrica del problema permanece inalterada alrededor del eje z, o si el prblema atratar es periodico, la metrica (Lorentziana) del problema tiene una isometria enel tiempo. Ahora bien, si ϕ es una isometria, la derivada de Lie de la metrica alo largo de su vector tangente ϕ = X es cero, lo cual se ve de la definicion 16.65.Es decir, las simetrias de un problema conducen siempre a derivadas de Lie de lametrica a lo largo del vector de la isometria igual a cero. A los vectores tangentegenerados por una isometria se les llama vectores de Killing. Su definicion formales la siguiente.

Definicion 16.81. Sea ϕ un grupo uniparametrico de trasformaciones que asu vez es una isomentria ϕ∗

t g = g. Entonces el vector generado por ϕx = X sellama vector de Killing

La manera de encontrar los vectores de Killing de una variedadM , es utilizandoel ejmplo 16.80. Para esto, supongamos que se tiene una metrica como la definidaen el ejemplo 16.12. Entonces se sigue que

Proposicion 16.82. Un vector de Killing X = X i ∂∂xi cumple con la ecuacion

diferencialLXgij = Xkgij;k + gkjX

k;i + gikX

k;j = 0

donde la mıetrica esta dada como g = gijdxi ⊗ dxj .

Demostracion 16.83. Por sustitucion directa en el ejercicio 16.80

Comentario 16.84. Mas adelante veremos que una metrica es compatible conla conexion si su derivada covariante es cero, es decir, ∇g = 0. Para estas metricas,las que mas nos interesan a nosotros, la ecuacion anterior se reduce a

Xj;i +Xi;j = 0

Page 311: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. DERIVADA DE LIE Y DERIVADA COVARIANTE 299

donde hemos definido Xk;i = gkjXk;i. A esta ecuacion se le llama la ecuacion de

Killing

Existen varias propiedades de los tensores cuando se les aplican los operadoresdiferenciales que hemos visto. En lo que sigue, vamos a deducir solo algunas de laspropiedades mas importantes. Vamos a iniciar con la siguiente proposicion.

Proposicion 16.85. Sean ea = eai dxi 1-formas base del espacio cotangente

T ∗M y ∇ la derivada covariante en M , tal que Γabc es su conexion asociada. En-tonces se sigue que

dea = Γabceb ∧ ec

Demostracion 16.86. Sea eb = ekb∂∂xk la base dual a ea = eai dx

i en TM .De la definicion de la conexion Γabc, se sigue que

Γabc = 〈ea,∇ceb〉 = 〈eai dxi, ekb;jejc∂

∂xk〉 = eake

jcekb;j

De una forma analoga se puede ver que

−Γabc = 〈∇cea, eb〉 = 〈eai;jejcdxi, ekb∂

∂xk〉 = eak;je

jcekb

Donde hemos usado para simplificar, la notacion ∇ec= ∇c. Si juntamos los dos

resultados anteriores se tiene

Γabc = eakejcekb;j = −eak;jejcekb

De la definicion de diferencial exterior se sigue que

dea = eak;idxi ∧ dxk

= eak;iδijδkl dx

j ∧ dxl

= eak;iebjeibecl ekcdx

j ∧ dxl

= −eak;ieicekb eb ∧ ec

= Γabceb ∧ ec

Esta es la llamada primera forma fundamental de Cartan.

Notacion 16.87. Es conveniente definir la 1-forma de conexon por

Γab = Γabcec

de tal forma que

dea + Γab ∧ eb = 0

Para terminar esta seccion, vamos a definir las curvas geodesicas. Una curvageodesica es aquella que transporta paralelamente su vector tangente. Es decir:

Definicion 16.88. Sea γ una trayectoria en una variedad M y X su vectortangente, γ = X. Se dice que la curva descrita por esta trayectoria es una geodesicasi

∇XX = 0

Page 312: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

300 16. TENSORES Y P-FORMAS

Comentario 16.89. La ecuacion geodesica tambien puede escribirse usando laformula (16.3) de la curva integral del vector X.

(16.6)dX i γdt

+ ΓijkXjXk γ =

d2ri

dt2+ Γijk

drj

dt

drk

dt= 0

donde hemos usado la formula dri/dt = X i γ de la curva integral de X.

Vamos a estudiar un ejemplo sencillo.

Ejemplo 16.90. Vamos a estudiar un ejemplo donde la conexion es de la var-iedad M 2-dimensional, con coordenadas θ, ϕ del ejemplo 16.74. Recordando lasecuaciones del desplazamiento paralelo, podemos escribir las ecuaciones para lasgeodesicas en este espacio como

d2rθ

dt2+

sin(θ)

cos(θ)− 1

(drθ

dt

)2

+ sin(θ)

(drϕ

dt

)2

= 0

d2rϕ

dt2− 2

sin(θ)

drθ

dt

drϕ

dt= 0

La resolucion de este sistema no es simple y en algunos casos se pueden dar solu-ciones parciales o se resuelven estos sistemas numericamente.

5. El Tensor Metrico y el Tensor de Curvatura

La definicion de la conexion es, en general totalmente independiente de lametrica de la variedad. En esta seccion vamos a definir al tensor de curvaturaen terminos de la conexion. Eso quiere decir que la curvatura de la variedad es,en general, totalmente independiente de la metrica. El transporte paralelo, equiv-alente a la conexion, asi como la curvatura, son cantidades que no dependen, engeneral, de la metrica de la variedad. Estrictamente hablando, no hay forma defijar la conexion de una manera universal. En fısica, y mas concretamente en rela-tividad general, la conexion se fija utilizando las ecuaciones de Einstein. La razonpor la que introducimos al tensor metrico y al tensor de curvatura en la mismaseccion, es porque hay una manera particular de fijar la conexon conociendo el ten-sor metrico, que es la manera canonica utilzada en fısica para relacionar a los dostensores. Ası, las ecuaciones de Einstein son ecuaciones diferenciales para las com-ponentes del tensor metrico, que a la vez fija la conexion y con ello a la curvatura.Esta conexion es la que mas nos va a interesar aquı. Sin embargo, empezaremosintroduciendo al tensor de curvatura sin relacion con el tensor metrico, y despuesdiscutiremos el caso especial en el que si estan relacionados. Este ultimo caso es demucho interes porque la metrica fija la conexion y la curvatura de manera unica ynos limitaremos a estudiar las propiedades del tensor de curvatura solo para estecaso. Vamos a iniciar introduciendo el tensor metrico.

Definicion 16.91. Sea Mn una variedad n-dimensional y waa=1,··· ,n unabase de T ∗M . Un tensor del tipo (0, 2) simetrico tal que

g = ηabwa ⊗ wb

donde (η)ab = ηab = diag(±1, · · · ,±1), es un tensor metrico de M .

Notacion 16.92. A la matriz ηab se le llama la signatura de la variedad.Si η es la matriz identidad, se dice que la variedad es Euclidiana. Si hay solo ununo con signo diferente a los demas, se dice que la variedad es Riemanniana.

Page 313: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. EL TENSOR METRICO Y EL TENSOR DE CURVATURA 301

Sin embargo, en algunos libros (de matematicas) lo que aquı llamamos variedadEuclidiana lo llaman variedad Riemanniana y lo que aqui llamamos Riemannianalo llaman variedad Pseudoriemanniana o variedad Lorenziana.

Con el tensor metrico, la variedad y su espacio tangente adquieren varias es-tructuras. Si Mn es una variedad con metrica, entonces g es un producto internoentre vectores g(X,Y ). El espacio (TM, g) es un espacio Euclidiano y g su pro-ducto interno. Con este producto se define una norma tal que la norma del vectorX es ||X || =

√g(X,X). Entoces (TM, || · ||) es un espacio normado. Con la norma

definimos la metrica sobre TM como

ρ(X,Y ) = ||X − Y || =√g(X − Y,X − Y ),

entoces (TM, ρ) es un espacio metrico (vea el capıtulo 9). Sin embargo, debe quedarclaro que solo si la sigatura corresponde a una variedad Euclidiana (y solo en estecaso), este tensor define un espacio Euclidiano. En el caso de la signatura Loren-ziana, el espacio (TM, g) se llama espacio pseudoeuclidiano, (TM, ||||), ||X || =g(X,X) es un espacio pseudonormado y (TM, ρ), ρ(X,Y ) = ||X − Y || es unespacio pseudometrico o Riemanniano en la variedad. Claramente, si tomamosuna base eb dual a wa, se tiene que ηab = g(ea, eb). El caso mas interesanteen fısica es el de signatura Lorenziana, ya que corresponde al modelo del espaciotiempo. El espacio tiempo es una variedad Riemanniana 4-dimensional, en estecaso a los 4 vectores base del espacio cotangente se le llama tetrada. En espacioscon signatura Lorenziana entonces los vectores pueden tener normas no positivas.Se clasifica a los vectores segun su norma, si la norma es positiva se dice que elvector es tipo tiempo, si su norma es nula, el vector es tipo nulo y si tienenorma negativa, se dice que el vector es tipo espacio. Para signaturas Loren-zianas podemos usar la signatura η = diag(1, 1, 1−1). Sin embargo, es posible usarsignaturas no diagonales, como

η =

0 1 0 01 0 0 00 0 0 −10 0 −1 0

Esta signatura define una base del espacio muy particular llamada tetrada nula, yaque g(ea, ea) = 0 (no sumatoria!) para todo a = 1, 2, 3, 4. Esto es, los vectores basedel espacio tangente tienen norma (magnitud) nula. Es mas, el producto internode los vectores e1 y e2 es g(e1, e2) = 1, y de los vectores e3 y e4 es g(e3, e4) = −1.Claramente, en este caso la norma y por tanto la distancia, no cumplen con elaxioma de ser definidas positivas. Esta signatura es de gran interes en relatividadgeneral.

En una base arbitraria, wa = wai dxi, el tensor metrico se escribe como

g = gabwa ⊗ wb = gabw

ai w

bjdx

i ⊗ dxj = gijdxi ⊗ dxj

donde hemos definido la cantidad gij = gabwai w

bj . En ocaciones se acostumba

designar por el simbolo ds2 a la metrica, es decir ds2 = gijdxi ⊗ dxj . Ahora vamos

a definir la metrica compatible con la conexion.

Definicion 16.93. Sea M variedad con conexion ∇ y metrica g. Se dice queg es una metrica compatible con la conexion ∇ si

∇cg = 0, ⇔ ec(gab)− Γbac − Γabc

Page 314: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

302 16. TENSORES Y P-FORMAS

para todo vector ec, donde hemos utilizado el resultado del ejercicio 16.77 y hemosdefinido la cantidad Γabc = gadΓ

dbc.

De aqui se desprende inmediatamente que si la conexion ∇ y la metrica g soncompatibles, se sigue entonces una relacion para las componentes de la metricadada por

(16.7) dgab = Γba + Γab

ya que si multiplicamos la relacion de la definicion 16.93 por los duales ec de losvectores base ec, se llega a la relacion anterior, recordemos que Γcb = Γcbde

d.Esta definicion tambien trae como consecuencia que un tensor metrico compat-

ible con la conexion, define la univocamente la conexion en la variedad. Esto se veen la siguiente proposicion.

Proposicion 16.94. Sea Mn variedad n-dimensional con conexion ∇ y metricag compatible con la conexion. Entonces las componentes de la conexion son deter-minadas univocamente por las componentes del tensor metrico.

Demostracion 16.95. Sea ∂∂xi i=1,··· ,n una base coordenada de la variedad

Mn. De la definicion de compatibilidad para esta base coordenada entre la metricay la conexion, se tiene que

−gij,k + Γjik + Γijk = 0

gki,j − Γikj − Γkij = 0

gkj,i − Γjki − Γkji = 0

Si sumamos estas tres ecuaciones, obtenemos

Γkij =1

2(gki,j + gkj,i − gij,k)

ya que Γkij es simetrica en los indices ij. Asi mismo podemos definir analogamentelos coeficientes de conexion

Γkij =1

2gkl (gli,j + glj,i − gij,l)

donde gkl es la matriz inversa a gij, es decir gklglj = δkj .

Notacion 16.96. A los coeficientes de conexion Γkij de una base coordenada seles llama simbolos de Christoffel.

Para poder obtener los coeficiente de conexion en otra base, observemos queeaΓ

abce

b ⊗ ec no depende de las bases, asi que

Γabcea ⊗ eb ⊗ ec = Γabceia

∂xi⊗ ebjeckdxj ⊗ dxk = Γijk

∂xi⊗ dxj ⊗ dxk

donde se ha definido la cantidad

Γijk = eiaΓabce

bjeck

Claramente hemos usado las bases duales ea y eb. Para escribir los coeficientesΓabc en terminos de los Γijk, se usan las relaciones de dualidad eiae

bi = δab y eibe

bj = δij ,

de donde obtenemosΓabc = eai Γ

ijke

jbekc

Ahora vamos a introducir la dos forma de curvatura. La curvatura se define enun espacio con conexion, no necesariamente con metrica. Formalmente su definiciones

Page 315: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. EL TENSOR METRICO Y EL TENSOR DE CURVATURA 303

Definicion 16.97. Sea Mn variedad y ∇ una conexion en Mn. Entoncesla dos forma de curvatura o segunda forma fundamental de Cartan, sedefine como

Θab = dΓab + Γac ∧ Γcb

En termino de sus componentes, podemos escribir a la dos forma de curvaturacomo ciertos coeficientes por la base de las 2-formas, es decir

Θab =

1

2Rabcde

c ∧ ed

donde claramente ea es una base de T ∗Mn. A las componentes Rabcd se les conocecomo tensor de curvatura, ya que a su vez son las componentes de un tensor quese puede escribir como R = Rabcdea ⊗ eb ⊗ ec ⊗ ed. Tambien podemos obtener lascomponentes de la dos forma de curvatura en terminos de las componentes de laconexion. Observemos que de su definicion se sigue

Θab =

(Γabc|d − ΓecdΓ

abe

)ed ∧ ec + ΓaecΓ

ebde

c ∧ ed

=1

2

(Γabc|d − Γabd|c

)ed ∧ ec +

1

2(ΓaecΓ

ebd − ΓaedΓ

ebc) e

c ∧ ed

+1

2(−ΓecdΓ

abe + ΓedcΓ

abe) e

d ∧ ec

=1

2

(Γabd|c − Γabc|d + ΓaecΓ

ebd − ΓaedΓ

ebc +De

cdΓabe

)ec ∧ ed

de donde obtenemos que las componentes estan dadas por

Rabcd = Γabd|c − Γabc|d + ΓaecΓebd − ΓaedΓ

ebc +De

cdΓabe

En un sistema coordenado, las componentes del tensor de curvatura estan dadaspor una expresion un poco mas simple

Rijkl = Γijl,k − Γijk,l + ΓinkΓnjl − ΓinlΓ

njk

El tensor de curvatura tiene una interpretacion geometrica doble. Por un lado,es una medida de la diferencia que existe entre un vector y el mismo al ser trans-portado paralelamente a lo largo de una curva cerrada. El tensor de curvatura nosda una medida de cuanto se diferencia el vector inicial y el final, despues de sertransportado. Si la curvatura es cero, esa diferencia tambien es cero. Y tambiennos da la separacion que experimentan dos geodesicas al propagarse paralelamente.Si se trata de un espacio de curvatura cero, las geodesicas no se separan o se juntan,se propagan paralelamente. Pero si la curvatura no es cero, estas suelen separarseo juntarse. El tensor de curvatura es una medida de esta separacion.

El tensor de curvatura cumple con varias identidades y relaciones que sirvenpara simplificar su calculo. Vamos a derivar las mas importantes, empecemos poruna relacion que aplica a la segunda derivada de un vector y al tensor de curvatura.

Proposicion 16.98. Sea Mn variedad y ∇ la conexion en la variedad. Seaw = widx

i una 1-forma en Mn. Entonces se sigue que

wi;j;k − wi;k;j = Rlijkwl

Page 316: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

304 16. TENSORES Y P-FORMAS

Demostracion 16.99. La demostracion es por calculo directo, se tiene quewi;j = wi,j − Γlijwl, entonces se sigue

wi;j;k =(wi,j − Γlijwl

),k− Γnik

(wn,j − Γlnjwl

)− Γnjk

(wi,n − Γlinwl

)

Recordemos que las componentes de la conexion en un sistema coordenado sonsimetricas, asi que

wi;j;k = wi,jk − Γlij,kwl − Γlijwl,k − Γlikwl,j − ΓnikΓlnjwl − Γnjk

(wi,n − Γlinwl

)

wi;k;j = wi,jk − Γlik,jwl − Γlikwl,j − Γlijwl,k − ΓnijΓlnkwl − Γnjk

(wi,n − Γlinwl

)

⇒ wi;j;k − wi;k;j = Γlik,jwl − Γlij,kwl + ΓnijΓlnkwl − ΓnikΓ

lnjwl = Rlijkwl

Ejercicio 16.100. Sea Mn variedad y X = X i ∂∂xi . Demuestre que

X i;j;k −X i

;k;j = −RiljkX l

Ejercicio 16.101. Sea Mn variedad y T = T j1···jri1···is∂

∂xj1⊗ · · · ⊗ ∂

∂xjr⊗ dxi1 ⊗

· · · ⊗ dxis un tensor en Mn. Demuestre por induccion que

T j1···jri1···is;j;k − Tj1···jri1···is;k;j =

s∑

l=1

RniljkTj1···jri1···n···is −

r∑

l=1

RjlnjkTj1···n···jri1···is

Observen que de la proposicion 16.98 y del ejercicio 16.100 se desprenden larelacion para las componentes del tensor de curvatura Rijkl = −Rijlk. Si aplicamosla relacion del ejercicio 16.77 al tensor de curvatura, obtenemos

gnm;j;k − gnm;k;j = Rlnjkglm +Rlmjkgnl

de donde se desprende que para una conexion compatible con la metrica g, se sigueque Rmnjk = −Rnmjk, donde Rmnjk = Rlnjkglm.

Otra relacion que debemos explorar es las consecuencias sobre la curvatura dela realcion ddw = 0 para una 1-forma w. Dado que dw = wi;jdx

j ∧ dxi, se sugueque

ddw =(wi,j − Γnijwn

);kdxk ∧ dxj ∧ dxi

=((wi,j − Γnijwn

),k− Γlik

(wl,j − Γnljwn

)− Γljk (wi,l − Γnilwn)

)dxk ∧ dxj ∧ dxi

=(−Γnij,kwn − Γnijwn,k − Γlikwl,j − ΓlikΓ

nljwn

)dxk ∧ dxj ∧ dxi

=(−Γnij,k − ΓlikΓ

nlj

)wndx

k ∧ dxj ∧ dxi

= Rnijkwndxk ∧ dxj ∧ dxi = 0

de donde se sigue la relacion

(16.8) Rnijk +Rnkij +Rnjki = 0.

Una relacion que es muy importante para entender la teorıa general de la rela-tividad, son las identidades de Bianchi. Estas identidades se obtienen en la siguienteproposicion.

Page 317: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. EL TENSOR METRICO Y EL TENSOR DE CURVATURA 305

Proposicion 16.102 (Identidades de Bianchi). Sea Mn variedad con conexion∇ y tensor de curvatura Rnijk. Entonces se sigue que

Rnijk;l +Rnikl:j +Rnilj;k = 0

Demostracion 16.103. Sea w = wldxl una 1-forma en Mn. Si usamos la

formula del ejercicio 16.101 para el tensor wi;l, se obtiene

wi;l;j;k − wi;l;k;j = Rnijkwn;l +Rnljkwi;n

Ahora aplicamos la derivada covariante al resultado de la proposicion 16.98, seobtiene

wi;j;k;l − wi;k;j;l = Rnijk;lwn +Rnijkwn;l

Ahora usamos el mismo procedimiento anterior, sumamos ambos resultados ante-riores cambiando los indices j, k, l circularmente. Se obtiene

wi;l;j;k − wi;l;k;j = Rnijkwn;l +Rnljkwi;n

wi;k;l;j − wi;k;j;l = Rniljwn;k +Rnkljwi;n

wi;j;k;l − wi;j;l;k = Rniklwn;j +Rnjklwi;n

wi;j;k;l − wi;k;j;l = Rnijk;lwn +Rnijkwn;l

wi;k;l;j − wi;l;k;j = Rnikl;jwn +Rniklwn;j

wi;l;j;k − wi;j;l;k = Rnilj;kwn +Rniljwn;k

y restamos las 3 identidades de arriba menos los 3 identidades de abajo, se obtiene

0 =(Rnljk +Rnklj +Rnjkl

)wi;n −

(Rnijk;l +Rnikl;j +Rnilj;k

)wn

pero lo que esta entre el primer parentesis es cero, por la relacion (16.8) que enco-tramos anteriormente, asi que se sigue lo que buscamos.

Notacion 16.104. A las relaciones anteriores se les llama las Identidadesde Bianchi.

Resumen 16.105. Vamos a resumir las identidades salidas del tensor de cur-vatura.

1.− Rijkl = −Rijlk2.− Rnljk +Rnklj +Rnjkl = 0

3.− Rnijk;l +Rnikl;j +Rnilj;k Identidades de Bianchi

4.− Rmnjk = −Rnmjk Conexiones Compatibles con la metrica

En lo que sigue veremos algunos ejemplos de curvatura, por supuesto, si conoce-mos la conexion, es sencillo calcular la curvartura usando su definicion o la segundaforma fundamental de Cartan. Pero nosotros vamos a utilizar solo conexiones queson compatibles con la metrica. Asi que para calcular la conexion conociendo lametrica, puede usarse la definicion de los simbolos de Christoffel o la primera formafundamental de Cartan. Vamos a resumir todas estas definciones en este espacio.

Page 318: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

306 16. TENSORES Y P-FORMAS

Resumen 16.106. Sea Mn variedad con metrica g = ηabdwa ⊗ dwb = gijdx

i ⊗dxj, donde w = widx

i es una base y dxi es una base coordenada del espaciocontangente T ∗Mn. Entonces, la conexion y la curvatura estan determinadas por

1.− dwa + Γab ∧ wb = 0

2.− Θab = dΓab + Γac ∧ Γcb Para una base no coordenada

3.− Γijk =1

2gil (glj,k + glk,j − gjk,l)

4.− Rijkl = Γijl,k − Γijk,l + ΓinkΓnjl − ΓinlΓ

njk Para una base coordenada

Ejemplo 16.107. En este ejemplo vamos a utilizar la notacion convencionaldw ⊗ dw → dw2. Vamos a buscar la metrica de la pelota S2. Como la pelotaesta inmersa en ℜ3, la forma mas simple de encotrar la metrica de la pelota essubstituyendo la ecuacion de la pelota de radio a, x2 + y2 + z2 = a2, en la metricaeuclidiana de ℜ3, dl2ℜ3 = dx2 + dy2 + dz2. Si substituimos

dz2 =(xdx + ydy)2

a2 − (x2 + y2)

obtenemos

dl2S2 = dx2 + dy2 +(xdx + ydy)2

a2 − (x2 + y2)

Ahora bien, podemos usar coordenadas polares x = R cos(θ), y = R sin(θ) en lametrica, para obtener

dl2S2 = R2dθ2 +a2dR2

a2 −R2

Conviene escribir la metrica de la pelota en terminos del cociente r = R/a, entoncesla metrica se ve como

dl2S2 = a2

[dr2

1− r2 + r2dθ2]

Para finalizar este ejemplo, vamos a escribir la metrica del espacio ℜ3 en terminosde las coordenadas esfericas 15.1 (vamos a cambiar la r de la definicion 15.1 pora, para denotar el radio de la esfera), se obtiene

dl2ℜ3 = dx2 + dy2 + dz2 = da2 + a2(dθ2 + sin2(θ)dϕ2

)

la cual es la metrica euclidiana, pero ahora escrita en coordenadas esfericas. Silimitamos esta metrica a la pelota, es decir, si hacemos a =constante, obtenemos

dl2S2 = a2(dθ2 + sin2(θ)dϕ2

)= a2dΩ2

que es la metrica de la pelota pero en coordenadas esfericas. Hay que comparala conla anterior forma que esta en coordenadas polares y con la metrica que se obtienesi g = dw1 ⊗ dw1 + dw2 ⊗ dw2, usando las formas de la pelota definidas en 15.2 enel ejemplo 15.63. Esta comparacion es la que justifica el uso de la notacion de esteejemplo.

Page 319: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. EL TENSOR METRICO Y EL TENSOR DE CURVATURA 307

Ahora vamos a calcular la conexion y la curvatura. Primero lo haremos usandola base coordenada. Usando las formulas del resumen 16.106, se obtiene

dl2S2 = a2

[dr2

1− r2 + r2dθ2]

Γrrr =r

1− r2 Γrθθ = −r(1 − r2) sin2(θ), Γθθθ = cot(θ), Γθrθ =1

r

Rθrrθ = − 1

1− r2 , Rrθrθ = r2 sin2(θ)

y todas las demas componentes igual a cero. Tambien podemos calcular estas can-tidades de la metrica en coodenadas esfericas, se obtiene

dl2S2 = a2(dθ2 + sin2(θ)dϕ2

)

Γϕθϕ = cot(θ), Γθϕϕ = − sin(θ) cos(θ)

Rθϕθϕ = sin2(θ), Rϕθθϕ = −1

Ejercicio 16.108. Siguiendo el ejemplo anterior, demuestre que la metrica deS3 en coordenadas esfericas esta dada por

dl2S3 = a2

[dr2

1− r2 + r2(dθ2 + sin2(θ)dϕ2

)]

donde a es el radio de la esfera S3 y r/a → r. Esta es la parte espacial de lametrica de Friedman-Robertson-Waker. Calcule la conexion y el tensor decurvatura de esta metrica.

Ejemplo 16.109. Sea M4 una variedad con metrica de signatura Lorenzianadada por g = ηabw

a ⊗ wb, ηab = diag(1, 1, 1, 1− 1), donde la tetrada esta dada por

w1 =t

x√xdx, w2 =

t

x√xdy, x > 0

w3 =

√3x

2dz +

√2

3xdt, w4 =

√2

3xdt

Lo primero que hay que notar, es que se debe cumplir la relacion 16.7, es decir,dηab = Γab + Γba = 0, entonces la conexion es antisimetrica en los indices ab.Recordemos que Γab = ηadΓ

db . Vamos a calcular la conexion utilizando las formulas

1 y 2 del resumen 16.106. Para esto encontremos primero la diferencial de latetrada, esta es

dw1 = x−3/2dt ∧ dx, dw2 = −3

2x−5/2t dx ∧ dy + x−3/2dt ∧ dy,

dw3 =1

2

(√3

2x−1/2dx ∧ dz −

√2

3x−3/2dx ∧ dt

)dw4 = −1

2

√2

3x−3/2dx ∧ dt

que en terminos de la tetrada, se obtiene

dw1 =√

6x w4 ∧w1, dw2 = −3

2

√x w1 ∧ w2 +

1

t

√6x w4 ∧w2

dw3 =1

2

√x w1 ∧w3 − 2

√x w1 ∧ w4, dw4 = −√x w1 ∧ w4

Page 320: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

308 16. TENSORES Y P-FORMAS

De aqui podemos entonces leer las componentes de la conexion

Γ14 = −

√6xw1 −√x w4

Γ21 =

3

2

√xw2, Γ2

4 = −1

t

√6x w2,

Γ31 = −1

2

√x w3 +

√x w4, Γ3

4 = −√x w1,

donde hemos tomado en cuenta la antisimetria de la conexion, por ejemplo, agre-gando terminos convenientes a las componentes Γ1

4 y Γ41. Ahora calculemos el tensor

de curvatura, obtenemos,

Θ14 = −1

2x w1 ∧ w4

Θ21 = x w2 ∧

((−3

4+

6

t

)w1 +

√6

tw4

)

Θ24 = x w2 ∧

(√3

2

(1

t− 3

)w1 − 3

(2

t2+

1

2

)w4

)

Θ31 = −1

4x w1 ∧

(w3 − 2 w4

)

Θ34 = x

(−√

3

2w1 ∧ w3 +

√6 w1 ∧ w4 +

1

2w3 ∧ w4

)

de donde se pueden leer las componentes de la curvatura en esta base.

Para terminar este capıtulo, vamos a introducir tres tensores mas, estos sonla contraccion del tensor de curvatura, la traza de este tensor y una combinacionmuy adecuada de estos dos. Vamos a iniciar con las contracciones del tensor decurvatura.

Definicion 16.110. Sea Mn variedad y sea ea una base del espacio tangentecon dual eb. Sea ∇ conexion en Mn y tensor de curvatura R = Rabcdea ⊗ eb ⊗ec⊗ ed. Entonces el tensor de Ricci es es la contraccion del tensor de curvatura,tal que

R = C12R = Rabade

b ⊗ ed = Rbdeb ⊗ ed

Analogamente, la traza del tensor de Ricci se llama escalar de Ricci, es decir

R = C11R = Rdd

donde Rcd = ηcbRbd

La importancia de estas dos nuevas cantidades radica en el siguiente proposicion

Proposicion 16.111. Sea Mn variedad y sea ea una base del espacio tan-gente con dual eb. Sea g = ηabw

a ⊗ wb una metrica en Mn compatible con laconexion. Sea ∇ conexion en Mn y tensor de curvatura R = Rabcdea⊗ eb⊗ ec⊗ ed.Entonces se sigue que

Gab|b =

(Rab − 1

2gab R

)

|b= 0

Page 321: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

5. EL TENSOR METRICO Y EL TENSOR DE CURVATURA 309

Demostracion 16.112. Vamos a demostrar la proposicion en el sistema co-ordenado, la demostracion en general es equivalente. Ecribamos las identidadesBianchi en componentes, contrayendo los indices adecuados para obtener el tensorde Ricci, esto es

0 = Rnink;l +Rnikl;n +Rniln;k = Rik;l + gnmRmikl;n −Ril;k = Rik;l − gnmRimkl;n−Ril;kY volvamos a contraer los indices

Rkk;l − gnmRkmkl;n −Rkl;k = R;l − gnmRml;n −Rkl;k = R;l − 2gnmRml;n = 0

Si multiplicamos por 1/2 y la inversa de las componentes de la metrica en estaultima expresion, llegamos al resultado deseado.

Este resultado es de suma importancia en fısica, ya que es la ralacion funda-mental para definir las ecuaciones de Einstein.

Notacion 16.113. Al tensor Gabea⊗eb cuyas componentes estan definidas por

Gab = Rab −1

2gab R

se le llama tensor de Einstein.

El hecho de que la contraccion del tensor de Einstein con la derivada covariatesea cero, hacen a este tensor el candidato idonea para ser la parte geometrica delas ecuaciones fundamentales de la gravitacion. Vamos a ver un ejemplo.

Ejemplo 16.114. Vamos a calcular el tensor de Ricci de la pelota S2 encoordenadas esfericas. Primero hay que usar las propiedades del tensor de cur-vatura del resumen 16.105 para encontrar todas las componentes no cero del ten-sor. Lo primero que hay que notar es que la unica componente no cero es Rθϕθϕ =

a2 sin2(θ), y con ellos calcular

Rθθ = Rθθθθ +Rϕθϕθ = 1, Rθϕ = Rθθθϕ +Rϕθϕϕ = 0,

Rϕθ = Rθϕθθ +Rϕϕϕθ = 0, Rϕϕ = Rθϕθϕ +Rϕϕϕϕ = sin2(θ),

Entonces podemos calcular el escalar de Ricci, haciendo R = Rθθ + Rϕϕ = 2/a2 ycon el finalmente calcular el tensor de Einstein. El resultado es que G = 0.

Ejercicio 16.115. Calcule el tensor de Ricci, el escalar de Ricci y el tensorde Einstein para la metrica de la pelota S2 en coordenadas polares.

Ejercicio 16.116. Calcule el tensor de Ricci, el escalar de Ricci y el tensorde Einstein para la metrica de la pelota S3 en coordenadas esfericas.

Ejercicio 16.117. Calcule el tensor de Ricci, el escalar de Ricci y el tensorde Einstein para la metrica del ejemplo 16.109

Page 322: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 323: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 17

HACES FIBRADOS

1. Haces

Los haces fibrados son unos de las estructruras matematicas mas fascinantesque hay. Son la generalizacion del producto cartesiano entre espacios topologicos.Ya sabemos que el producto cartesino de dos espacios topologicos es un espaciotopologico. Los haces son productos cartesianos de espacios topologicos localmente,aunque no necesariamente el espacio resultante, el haz, es un porducto cartesiano.El ejemplo mas simple es la cinta de Mobius. Localmente se puede ver comoproducto cartesiano de la recta con el cırculo, pero globalmente, es decir, toda lacinta no es un producto cartesiano. Vamos a iniciar este capıtulo con la definicionde haz, luego vamos a introducir el concepto de haz fibrado.

Definicion 17.1. Un haz es una terna ξ = (E,B, π) donde E y B son espaciostopologicos y π : E → B es una funcion contınua y sobre. Se llama:· A E espacio total,· A B espacio base y· A π la proyeccion.

La representacion grafica de los haces es como sigue

Eπ ↓

B

Notacion 17.2. Si b ∈ B, Fb (ζ) = π−1 (b) se le llama la fibra sobre b.

Comentario 17.3. Observe que si b 6= b′, entonces Fb ∩ Fb′ = φ, por esoE = ∪

b∈BFb (ξ), el espacio total es la union de las fibras disjuntas de B. (Fb, τFb

),

siendo τFb= Fb ∩ UU∈τE

un subespacio topologico de (E, τE).

Entre los haces existe tambien el concepto de isomorfismo, se puede clasificara los haces usando los isomorfismos entre haces, dos de estos son el mismo, si sonisomorficos.

Definicion 17.4. Dos haces ξ = (E,B, π) y ξ′ = (E′, B, π′) son isomorficos

ξf≡ ξ′, si existe f : E → E′ homeomorfismo, tal que π′ f = π. Graficamente se

tiene

Ef−→ E′

π ց ւ π′

B

Definicion 17.5. Un haz ξ = (E,B, π) se llama trivial si existen F , espacio

topologico y ϕ : E → B × F homeomorfismo y se cumple que ξϕ≃ (B × F,B, π1).

311

Page 324: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

312 17. HACES FIBRADOS

Graficamente, un haz es trivial si se ve como

Eϕ−→ B × F

π ց ւ π1

B

Definicion 17.6. Una seccion s del haz ξ = (E,B, π) es una funcion continuas : B → E tal que π s = id|B, es decir s(b) ∈ Fb tal que b ∈ B. Esto es

Es ↓ π

B

Los haces triviales tienen la caracteristica especial de tener una seccion, esdecir, se puede definir una funcion que vaya de la base del haz a todo el haz, a unpunto de cada fibra del haz. Esto se ve en la siguiente proposicion

Proposicion 17.7. Todo haz trivial tiene al menos una seccion.

Demostracion 17.8. Sea ζ = (E,B, π) un haz trivial, ϕ : E → B × F unhomeomorfismo y ψ : B → F una funcion continua arbitraria. Entonces s =B → E, b → s(b) := ϕ−1 (b, ψ(b)) es continua, pues ϕ−1 y ψ lo son, y π s(b) =π ϕ−1 (b, ψ(b)) = π1 (b, ψ(b)) = b. Graficamente

Eϕ−→ B × F

sտ π ց ւ π1

B

Definicion 17.9. Un haz fibrado es un haz ζ = (E,B, π) que es localmentetrivial, esto es, para toda cubierta Uαα∈J de B y cada sub-haz

(π−1 (Uα) , Uα, π|π−1(Uα)

)=

α, existe F tal que el haz (Uα × F,Uα, π1) := αF es isomorfico a α, es decir existeϕα : π−1 (Uα)→ Uα × F homemorfismo y π1 ϕα = π|π−1(Uα). Su grafica serıa

π−1 (Uα)ϕα−→ Uα × F

π|π−1(Uα) ց ւ π1

Notacion 17.10. A (Uα, ϕα) se le llama sistema de coordenada local delhaz, a F la fibra del haz y a ϕα se le llama la trivializacion local.

Comentario 17.11. Observe que un haz fibrado tiene siempre una seccionlocal, es decir, para cada Uα con α ∈ J el haz α tiene una funcion sα. sα : Uα →π−1 (Uα) con π sα = Id|Uα

, sin embargo, si el haz no es globalmente trivial, noexistira una seccion del haz (total).

Sea ξ = (E,B, π, F, U) haz fibrado con U = Uαα∈J una cubierta de B. SeanUα∩Uβ 6= φ α, β ∈ J, (Uα, ϕα) y (Uβ, ϕβ) dos sistemas de coordinadas locales en ξ yF la fibra del haz. Como ξ es un haz fibrado, es localmente trivial y por tanto poseeuna seccion en cada Uα ⊂ B. Sea sα y sβ secciones locales para cada (Uα, ϕα) y

(Uβ, ϕβ), tales que sα(b) = ϕ−1α (b, ψα(b)) y sβ(b) = ϕ−1

β (b, ψβ(b)). Las funciones

de transicion del haz son funciones gαβ : Uα∩Uβ → Aut(F ), b→ gαβ(b) : F → F,f → gαβ(b)(f) tales que la composicion de homeomorfismos

ϕβ ϕ−1α = (Uα ∩ Uβ)× F → (Uα × Uβ)× F, (b, f)→ ϕβ ϕ−1

α (b, f)

= (b, gαβ(b)(f)) ,

Page 325: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. ESPACIOS G 313

es decir gαβ queda definida por ϕβ ϕ−1α = Id|Ua∩Uβ

×gαβ. Observe que paracada F , (gαβ(b) ,) ⊂

subgr.Aut(F ) y por tanto es un grupo llamado el grupo de

estructura del haz. La identidad esta dada por gαα(b) y la inversa por gαβ(b) =

(gβα(b))−1

.

2. Espacios G

Los espacios topolgicos pueden tener a su vez, otras estructuras ya sea alge-braicas o analiticas. En el capıtulo anterior vimos espacios topologicos dotadosde metrica, norma y producto interno. Vamos a introducir aqui una estructuraalgebraica extra dentro de un espacio toplogico, dotando al conjunto que formael espacio topologico con una estructura de grupo. A estos espacios se les llamagrupos topolgicos. Su definicion es la siguiente.

Definicion 17.12. Un grupo topologico es una terna (G, ·, τg) en donde (G, ·)es un grupo y (G, τG) es un espacio topologico, y se cumple que las funciones

a) ·: G×G→ G, (a, b)→ a · bb) inv. : G→ G, a→ inv(a) = a−1

son continuas.

Hay una manera sencilla de saber si la estructura de grupo de un conjuntoes compatible con la topologıa. Vamos a presentar aquı la proposicion sin de-mostracion que nos da este criterio. Esta es:

Proposicion 17.13. La terna (G, ·, τG) con (G, ·) grupo y (G, τG) espaciotopologico, es un grupo topologico ssı para toda a, b ∈ G y para toda Uab−1 ∈ τGexiste Ua y Ub ∈ τG tal que Ua(Ub)

−1 =a · b−1|a ∈ Ua, b ∈ Ub

⊂ Uab−1 .

En lo que sigue vamos a introducir dos funciones que son de mucha utilidadpara mas adelante, pero que ahora nos ayudaran a introducir los espacios G. Estasson las funciones de traslacion. Su definicion es para cualquier grupo topologico,pero seran de gran utilidad cuando estudiemos grupos de Lie. La caracteristica masimportante de estas fuciones es que son automorfimos del grupo topologico. Vamosa ver esto en la siguiente proposicon.

Proposicion 17.14. Sea (G, ·, τG) grupo topologico y g ∈ G. Las funciones

Lg : G → G

x → Lg(x) := gx

y

Rg : G → G

x → Rg(x) := xg

llamadas traslacion izquierda y traslacion derecha por g respectivamente,son automorfismos de G.

Demostracion 17.15. Lg y Rg son continuas porque el producto y la inversason continuas. Ademas tienen inversa continua, ya que (Lg)−1 = Lg−1 y (Rg)−1 =Rg−1, ie. Lg Lg−1 (x) = Lg(g−1x) = gg−1x = x e igual para Rg.

Habiendo definido las traslaciones en un grupo topologico, ahora podemos in-troducir los espacios G. Los espacios G son estructuras en un espacio topologico, de

Page 326: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

314 17. HACES FIBRADOS

una manera sencilla, es la axion de un grupo topologico sobre un espacio topologico.Veamos esto formalmente.

Definicion 17.16. Un espacio G derecho es una terna (E,G, ψ), donde E esun espacio topologico, G es un grupo topologico y ψ : E×G→ E (x, g) −→ ψ(x, g)es una funcion continua tal que

1) ψ(x, e) = x2) ψ (x, g1 · g2) = ψ (ψ(x, g1), g2)

Notacion 17.17. Es comun denotar a ψ (x, g) como xg solamente.

Definicion 17.18. Analogamente, se define un espacio G izquierdo conϕ : G× E → E continua tal que:

1) ϕ(e, x) = x2) ϕ (g1 · g2, x) = ϕ (g1, ϕ (g2, x))

Aquı tambien, suele denotarse a ϕ(g, x) por gx. Estas funciones son analogasa las definidas cuando vimos los grupos uniparemetricos de trasformaciones, en elcapıtulo anterior. De la misma forma a los grupos uniparametricos, la funcion ψinduce la funcion

ψg : E → E

x → ψg(x) = ψg(x, g)

que cumple con las propiedades:i) ψe(x) = xii) ψg1g2(x) = ψg1 ψg2(x)Se dice entonces que G actua por la derecha sobre E o analogamente que

actua por la izquierda de E.A las acciones derecha e izquierda se les puede clasificar. Una clasificacion esta

dada como sigue.

Definicion 17.19. Sea (G,E, ψ) un espacio G derecho. La accion derechade G sobre E se dice :· Efectiva si ψ (x, g) = x para toda x ∈ E implica g = e· Libre si ψ (x, g) = x para algun x ∈ E implica g = e· Transitiva si para todo x, y ∈ E existe algun y ∈ E tal que y = Ψ (x, g)(Analogamente se hace la misma clasificacion para la accion por la izquierda)

La accion de grupos sobre espacios topologicos tiene algunas propiedades. Va-mos a discutir algunas de las mas importantes.

Proposicion 17.20. Si la accion de G sobre E es libre entonces es efectiva.

Demostracion 17.21. Supongamos que la accion no es efectiva, esto implicaque existe algun g0 ∈ G, g0 6= e tal que ψ (x, g0) = x para toda x ∈ E y por lo tantola accion no es libre.

Proposicion 17.22. Si la accion de G sobre E es libre y transitiva, entoncespara toda x, y ∈ E, existe un unico g ∈ G tal que ψ (x, g) = y,

Demostracion 17.23. Sean x, y ∈ E y g ∈ G tal que ψ (x, g) = y ya que ψes transitiva. Sea g′ ∈ G tal que tambien ϕ (x, g′) = y. Entonces x = ψ

(x, g g−1

)

= ψ(ψ (x, g) , g−1

)= ψ

(ψ (x, g′) , g−1

)= ψ

(x, g′g−1

), esto implica que g−1 = e, o

sea g′ = g.

Page 327: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. HACES FIBRADOS PRINCIPALES 315

Los isomorfismos en los espacios G son analogamente definidos en terminos desus estructuras separadas. Vamos a ver su definicion formal.

Definicion 17.24. Dos espacios G derechos γ = (E,G, ψ) y γ′ = (E′, G, ψ′)se dicen isomorficos si existe h : E → E′ homeomorfismo tal que

ψ′ (h× idG) = h ψ(h ψg = ψ′

g h).

Se denota como γh∼= γ′ o γ

h×id|G∼= γ′

Esta definicion se puede poner en terminos del diagrama

E ×G ψ−→ Eh× id|G ↓ ↓ hE′ ×G ψ′

−→ E′

Es decir, el diagrama anterior conmuta.

3. Haces Fibrados Principales

La seccion anterior tiene por objetivo introducir los haces fibrados principales.Estos son haces en donde la fibra y el grupo que actua en el son el mismo grupo.Su importancia radica en que estos haces son un excelente modelo para espaciostiempo multidimensionales. De tal forma que si el espacio tiempo 4 dimensionales la base del haz, el grupo del haz puede ser parte del grupo de alguna teorıa denorma, en donde actua el grupo. La descomposicion del haz da una teorıa naturalpara la unificacion de teorıas de norma y el espacio tiempo. Vamos a iniciar con ladefinicion de haces fibrados principales.

Definicion 17.25. Un haz fibrado principal es un sexteto (P,B, π,G;U,ψ)donde (P,B, π,G;U) es un haz fibrado y (P,G, ψ) es un espacio G derecho tal quese cumplen los isomorfismos de G espacios

(π−1 (Uα) , G, ψ

) (ϕα,ϕα× id |G)∼= (Uα ×G,G, δ)donde

δ : (Uα ×G)×G → Uα ×G((x, g) , g′) → δ ((x, g) , g′) := (x, g g′) .

El diagramaπ−1 (Uα)×G ψ−−−−−−→ π−1 (Uα)

ϕα × id |G ↓ ↓ ϕα(Uα ×G)×G s−−−−−−−→ Uα ×G

conmuta.

Entonces un haz fibrado principal, es un haz fibrado, es decir, un haz localmentetrivial, en el que el grupo G es lo mismo que la fibra y es lo mismo que el grupode estructura. Se representa como en la figura 1. De la definicion de δ, es claroentonces que G actua libre y transitivamente sobre el haz.

Proposicion 17.26. Un haz fibrado principal es trivial si tiene una seccion(global).

Page 328: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

316 17. HACES FIBRADOS

Figure 1. Un haz fibrado principal, es un haz fibrado, es decir,un haz localmente trivial, en el que el grupo G es lo mismo que lafibra y es lo mismo que el grupo de estructura. Estos haces sonmuy importantes en fısica.

Demostracion 17.27. ⇒) Un haz fibrado trivial tiene una seccion.⇐) Sea s : B → P en el haz ζ = (P,B, π,G;U ;ψ) y construyamos un homeo-

morfismo

ϕ : P → B ×Gx → ϕ(x) = (b, g)

con π (x) = b y x = ψ (s (b) , g) = s(b)g, es decir ϕ(s(b)g) = (b, g). (Esto es siempreposible, ya que G actua libre y transıtivamente en P ). Claramente ϕ es sobre. ϕes inyectiva, ya que

x 6= x′ ⇒ ϕ (x = s (b) g) =

= (b, g) 6= ϕ

(x′ =

s(b′)g, x′ /∈ Fbs(b)g′ x′ ∈ Fb

)=

(b′, g)(b, g′)

Ademas ϕ es continua, pues s lo es. Entonces ϕ es un homeomorfismo.

Ejemplo 17.28. El ejemplo mas simple es el producto cartesiano. Sea P =B × G, donde B es una variedad y G un grupo. La proyeccion es simplementeπ−1 (p) = b, con π (b) = Fb ∼= G. Supongamos que B = ℜ4 y G = U (1).

Recordemos que el grupo U (N) = U matriz compleja N ×N | UU+ = 1 porlo que U(1) =

U numero complejo | U U = 1

. Podemos representar los elemen-

tos de U(1) por g1 = eiϕ1 , 0 ≤ ϕ1 < 2π. La accion de U(1) sobre ℜ4 la definimoscomo

ψ : ℜ4 × U(1) → ℜ4

(x, g) → ψ (x, g) = x · eiϕ,la cual cumple con las propiedades (note que g1 · g2 = eiϕ1 ·eiϕ2 = ei(ϕ1+ϕ2)).

1.- ψ (x, e) = x · e0 = x2.- ψ (ψ (x, g1) , g2) = ψ

(x · eiϕ1 , g2

)= x · eiϕ1 · eiϕ2 =ψ (x, g1g2)

Page 329: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. HACES FIBRADOS PRINCIPALES 317

Los elementos de B × G = (x, g) | x ∈ ℜ4, g ∈ U (1). La fibra en un punto

x0 fijo sera Fx0 =x0 · eiϕ

iso∼=eiϕ≡ U(1).

Ejemplo 17.29. Tomemos el haz Pπ−→ S1 con fibra F = [−1, 1]. Tomemos

las cubiertas para el cırculo S1, U1 = (0, 2π) y U2 = (−π, π) y sean A = (0, π) yB = (π, 2π) en las intersecciones de estas, A,B ⊂ U1 ∩ U2. Cada una de estasintersecciones son difeomorficas a S1. Tomemos las trivializaciones en A tal queϕ1 (u) = (θ, t) y ϕ2 (u) = (θ, t). La funcion de transicion para θ ∈ A esta dada porg12 (θ) : F → F , t → g12 (θ) (t) = t. En B podemos escoger las trivalizaciones dedos formas

I. ϕ1(u) = (θ, t) ϕ2(u) = (θ, t) θ ∈ BII. ϕ1(u) = (θ, t) ϕ2(u) = (θ,−t) θ ∈ BPara el caso I, la funcion de transicion es de nuevo la identidad en F , pero

para el caso II la funcion de transicion es g12 (θ) (t) = −t , θ ∈ B. El grupo deestructura en el primer caso consta solo de un elemento G1 = e, mientras que elsegundo tiene 2 elementos G2 = e, g,

e : F → F

e(b) = t

y

g : F → F

g(t) = −t.

Observen que g2 = e, por lo que G2

iso∼= 1,−1 = Z2

iso∼= S0. Si en II reemplazamosel intervalo F = [−1, 1] por solo los dos puntos F = −1, 1, entonces tenemos unhaz fibrado principal, con fibra Z2 = 1,−1 = S0, el cual es un haz de cırculos. Elhaz I es un cilindro, mientras que el haz II es la banda de Mobius. Graficamenteserıa

S0

|P

π ↓S1

vean la figura 2.

Ejemplo 17.30. Otro ejemplo interesante es el haz de Hopf, el cual tambienes un haz de esferas. Graficamente es el haz

S1

|S3

π ↓S2

donde

S3 =x ∈ ℜ4 | (x1)2 + (x2)2 + (x3)2 + (x4)2 = 1 con

(x = (x1, x2, x3, x4

)

S2 =y ∈ ℜ3

∣∣ x2 + y2 + z2 = 1 y = (x, y, z)

Page 330: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

318 17. HACES FIBRADOS

Figure 2. El cilindro y la cinta de Mobius son haces fibradosprincipales si solo se toma a los elementos 1,-1 de la fibra. Elcilindro es un haz fibrado trivial mientras que la cinta de Mobiusno es trivial. El grupo de estructura y a la vez la fibra son el grupoZ2.

Las esferas pueden ser parametrizados utilizando numeros complejos como z0 =

x1 + ix2, z1 = x3 + ix4, ası que S3 =∣∣z0

∣∣2 +∣∣z1∣∣2 = 1

. La proyeccion

π : S3 → S2

π(x1, x2, x3, x4) =(

2(x1x3 + x2x4

), 2(x2x3 − x1x4

), (x1)2 + (x2)2 − (x3)2 − (x4)2

)

= (x, y, z)

es una proyeccion. Noten que x2 + y2 + z2 = (x1)2 + (x2)2 + (x3)2 + (x4)2 = 1.Usando la notacion del ejemplo 15.7 tenemos que si hacemos

Z = u+ iv =x+ iy

1− z =x1 + ix2

x3 + ix4=z0

z1y y = (x, y, z) ∈ S2\ N = UN

W = u+ iv =x+ iy

1 + z=x3 + ix4

x1 + ix2=z1

z0y ∈ S2\ S = US

es decir Z = 1/W en US ∩ UN . Las trivializaciones locales las definimos como

φN : π−1 (US) → Us × U(1)

(z0, z1) → φS(z0, z1

)=

(z0

z1,z1

|z1|

)

φS : π−1 (UN ) → UN × U (1)

(z0, z1

)→ φN

(z0, z1

)=

(z1

z0,z0

|z0|

)

En el ecuador z = 0, entonces∣∣z0∣∣ =

∣∣z1∣∣ = 1√

2. Ahı se tiene que las trivial-

izaciones se pueden escribir como

φN(z0, z1

)=

(z0

z1,√

2z1

), φS

(z0, z1

)=

(z1

z0,√

2z0

),

Page 331: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. HACES VECTORIALES 319

entonces la funcion de transicion en el ecuador estara dada por

gNS

(x−→)

=z0

z1= x+ iy ∈ U(1).

En la region UN∩US todos los puntos son equivalentes al ecuador, ası que U(1) serael grupo de estructura, por lo que tenemos un haz fibrado principal. Fısicamente,este haz describe un monopolo de carga 1. Otros ejemplos de haces de Hopf son

S3 → S7 π→ S4 y S7 → S15 π→ S8, aunque en este ultimo S7 no es un grupo como

S3 ∼= SU(2). El haz S3 → S7 π→ S4 puede ser interpretado como el haz de uninstanton de carga 1.

4. Haces Vectoriales

Al igual que los haces principales, los haces vectoriales son utilizados paradescribir estructuras fısicas. Con los haces vectoriles se pueden representar lossistemas de coordenadas de una variedad, los vectores del espacio tangente, etc. Espor eso de su importancia. Su definicion formal es como sigue.

Definicion 17.31. Un haz vectorial de dimension n es un haz fibrado dondecada fibra es un espacio vectorial de dimension n. Las funciones de transicionforman el grupo GL(n,ℜ). Vean la figura 3.

Figure 3. La representacion grafica de un haz vectorial.

Para enteder la definicion, vamos a ver algunos ejemplos sencillos.

Ejemplo 17.32. El cilindro S1 × ℜ es un haz vectorial trivial mientras que lacinta de Mobius es un haz vectorial no trivial, con fibra ℜ.

Page 332: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

320 17. HACES FIBRADOS

Ejemplo 17.33. Una variedad con su espacio tangente en cada punto formaun haz vectorial llamado el haz tangente. Sea u ∈ TM = ∪

p∈Mp × TpM

n

un punto en la interseccion Ui ∩ Uj tal que π (u) = p ∈ Ui ∩ Uj, donde Ui yUj son cubiertas abiertas de Mn, varidad. Sean ϕi : Ui → ℜn y ϕj : Uj →ℜn los homeomorfismos de la variedad, tal que ϕi(u) = (x1, · · · , xn) y ϕj(u) =(y1, · · · , yn

), son sistemas de coordenadas en cada abierto. Un vector v sobre el

espacio tangente TpM se puede escribir

vp = vµp = vµp∂

∂yµ

∣∣∣∣p

.

Las trivializaciones locales estaran dadas por

φi : π−1(Ui)| → Ui ×ℜnu → φi(u) =

(p,(v1p, · · · , vnp

))

φj : π−1(Uj)| → Uj ×ℜn

u → φj(u) =(p,(v1p, · · · , vnp

)),

π (u) = p donde hemos utilizado el isomorfismo natural

iso : TM → ℜn

vµ∂

∂xµ

∣∣∣∣p

→ iso

(vµ

∂xµ

∣∣∣∣p

)=(v1p, · · · , vNp

).

Comentario 17.34. Se puede dotar al haz tangente de una estructura difer-enciable.

Las funciones vµ y vµ estan relacionadas entre si por vµp = Gµpv vvp, dodeGµpv ∈ GL (n,ℜ) es una transformacion lineal de espacios vectoriales. Una con-struccion totalmente analoga se pude hacer con el espacio cotangente, llamada elhaz cotangente . En ambas, las secciones seran campos vectoriales

v : Ui → TM

p → v(p) =

(p, vµ

∂xµ

∣∣∣∣p

)

o campos de 1-formas

w : Ui → T ∗M

p → w (p) := (p, wµdxµ|p)

Ejemplo 17.35. Del ejemplo 15.6 podemos construir el haz vectorial TS2. Ten-emos

σN (x, y, z) =(x, y)

1− z = (uN , vN )

y llamemos

σS (x, y, z) =(x, y)

1 + z= (uS, vS) .

Ellos estan relacionados por

uN =u−

u2S + v2

S

, vN =v−

u2S + v2

S

.

Page 333: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. HACES VECTORIALES 321

Si escribimos uS = r cos (θ) y vS = r sin (θ), tenemos que uN = cos (θ) /r, yvN = sin (θ) /r, entonces las trivializaciones estaran dadas por

φN

(p, v1 ∂

∂uN+ u2 ∂

∂vN|p)

=(p, v1

p, v2p

),

φS

(p, v1 ∂

∂uS+ u2 ∂

∂vS|p)

=(p, v1

p, v2p

)

con la funcion de transicion

gSN =∂ (uN , vN )

∂ (uS, vS)=

1

r2

(− cos (2θ) − sin (2θ)sin (2θ) − cos (2θ)

)

Para terminar este capıtulo, vamos a ver como podemos asociar a cada vectordel haz vectorial un vector de ℜn, de esta manera podemos trabajar con la fibradel haz, que de hecho son vectores. Veamos esto.

Definicion 17.36. Sea ζ = (A,B, πB, F, Uα) haz fibrado y η = (P,B, π,G; Uα , ψ)un haz principal, ambos con la misma base y grupo de estructura. Se dice que ξ esun haz asociado a η, si las cubiertas Uα de ξ y η trivializan tanto a A como a Pcon las mismas funciones de estructura.

Un ejemplo sencillo de la definicion anterior es el siguiente.

Ejemplo 17.37. Si en el haz tangente asociamos a cada vector base ∂∂xµ =

(0, · · · ,µ

1, · · · , 0), lo que obtenemos es un marco de referencia para cada punto.Este haz es llamado el haz de marcos y es un haz asociado al haz tangente ocotangente.

Page 334: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 335: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 18

GRUPOS DE LIE

Desde el descubrimiento de las teorıas de norma, los grupo de Lie han tomadouna relevancia en todas las areas de la fısica, quımica y la ingenierıa. Ya ante-riormente se sabia que las simetrias de los problemas conducia a la existencia degrupos actuando en espacios asociados al problema. Esta asociacion esta presentetambien en las teorıas de norma, en donde un grupo de simetrıa esta actuando so-bre un espacio asociado al problema fısico, en este caso esta actuando en el espaciode isoespin. Los grupos de Lie son variedades suaves con estructura de grupo, enanalogıa a los grupos topologicos. En este campıtulo tambien vamos a introduciralgunos conceptos que vamos a necesitar para la comprencion de los grupos de Lie,como es el concepto de campos invariates por la izquierda.

1. Campos Invariantes por la Izquierda

La definicion de grupos de Lie es como sigue.

Definicion 18.1. Un grupo de Lie es una terna (G, ·,A) donde (G, ·) es ungrupo, (G,A) es una variedad y las funciones.

1) · : G×G→ G, (g1, g2)→ g1 · g22) inv : G→ G, g → g−1

son suaves.

En general es suficiente con checar que

µ : G×G → G

(g1, g2) → µ (g1, g2) = g1 · g−12

es suave. Un subgrupo de Lie H de G es un grupo en el que Hi→ G es un encaje,

o sea si i y di son inyectivas.

Ejemplo 18.2. Uno de los ejemplos mas simples de grupo de Lie es el cırculoS1. Como ya hemos visto, el cırculo es una variedad diferenciable sobre ℜ. Comogrupo, podemos asociar a cada punto su representacion polar, es decir z = eiθ,de tal forma que x2 + y2 = zz = 1. Ahora definimos el producto del grupo comoz1z2 = eθ1+θ2 . Claramente, con esta definicion S1 es un grupo abeliano. Y es ungrupo de Lie porque la funcion µ(z1, z2) = z1/z2 = e(θ1−θ2) es sueve.

Ejemplo 18.3. Un ejemplo que no es un grupo abeliano, es la esfera S3. Comoya vimos, podemos parametrizar la esfera S3 como (x1)2 + (x2)2 + (x3)2 + (x4)2 =z0z0+z1z1 = 1, donde z0 = x1 + ix2 y z1 = x3 + ix4. Ahora definamos las matrices

U =

(z0 −z1

z1 z0

)

323

Page 336: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

324 18. GRUPOS DE LIE

en donde el determinante de ellas esta dado por z0z0 + z1z1 = 1. Ahora definimosel producto en S3 dado por el producto de matrices. Como el determinante esuno, estas matrices forman un grupo no abeliano. Es decir, con este productola variedad diferenciable S3 es un grupo llamado SU(2), el grupo de las matricesunitarias complejas de dos dimensiones.

Ejercicio 18.4. Demuestre que el grupo SU(2) es un grupo de Lie con elproducto definido en el ejemplo anterior.

En lo que sigue veremos algunas estructuras en los grupos de Lie. Iniciaremoscon algunas propiedades de las traslaciones derecha e izquierda sobre los grupos.

Proposicion 18.5. Las traslaciones derecha e izquierda son difeomorfismos.

Demostracion 18.6. Sea (G, ·, A) grupo de Lie, con

Lg : G → G

g′ → Lg (g′) = gg′ y

Rg : G → G

g′ → Rg (g′) = g′g.

Claramente Lg y Rg son suaves con inversas Lg = Lg y Rg−1 = R−1g suaves.

Para ahorrar espacio, en lo que sigue estudiaremos todas las proposiciones yteoremas ası como sus demostraciones solo por la izquierda, las demostracionespor la derecha son completamente analogas. Daremos un pequeno comentario solocuando sea necesario, vamos a introducir el concepto de invariante por la izquierda.

Definicion 18.7. Sea X ∈ TG en donde (G, ·, A) es grupo de Lie. Se dice queX es invariante por la izquierda (por la derecha) o Lg -invariante (Rg-invariante)si

d Lg|g′ (Xg′) = Xg′ L∗g = Xgg′

(d Rg|g′ (Xg′) = Xg′ R∗

g = Xg′g

),

para todos g, g′ ∈ G.

La primera consecuencia de esta definicion, es que estos vectores quedan deter-minados si escogemos un solo punto de ellos. En particular se escoge su valor enla identidad, aunque cualquier punto podrıa ser igual de bueno para esto. Formal-mente tenemos.

Proposicion 18.8. Todo campo vectorial invariante por la izquierda o derechaes determinado por su valor en la identidad.

Demostracion 18.9. Sea (G, ·, A) grupo de Lie y X ∈ TG invariante por laizquierda. Se cumple d Lg|e (Xe) = Xg. Analogamente para Rg.

De la misma forma, si un vector se puede trasladar por la accion izquierda deese vector en la identidad, esto implica que el vector es invariante por la izquierda.Veamos esto.

Proposicion 18.10. Si X ∈ TG en un grupo de Lie y se cumple que Xg =d Lg|e (Xe) para todo g ∈ G, esto implica que X es invariante por la izquierda(analogamente por la derecha).

Page 337: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. CAMPOS INVARIANTES POR LA IZQUIERDA 325

Demostracion 18.11. Observemos que Lgg′ = Lg Lg′ , esto implica que

dLgg′ = dLg dLg′ = d Lg|g′o mas especıficamente

d Lg|g′ (Xg′) = d Lg|g′ d Lg′ |e (Xe)

= d (Lg Lg′)|e (Xe)

= d Lgg′ |e (Xe)

= Xgg′ ,

esto implica que X es invariante por la izquierda (lo mismo por la derecha).

De aquı en adelante solo consideraremos vectores invariantes por la izquierda opor la derecha. El espacio tangente sera un espacio exclisivamente de estos vectores.

Esto implica que TαGiso∼= TgG para todo g ∈ G . De hecho se puede demostrar

que para todo grupo de Lie, el haz tangente es un haz trivial, ya que la fibraesta formada por vectores invariantes por la izquierda, los cuales estan globalmentedefinidos y estos forman secciones globales en el haz.

Un resultado interesante que vamos a usar en este capıtulo para definir elalgebra de Lie, es que los parentesis de Poisson estan ϕ relacionados si los vectoreslo estan. Esto es.

Proposicion 18.12. Sean (X,Y ) y (X ′, Y ′) ∈ TMm × TNn, Mm, Nn var-iedades y ϕ ∈ C∞ (Mm, Nn) tal que X,Y y X ′, Y ′ estan ϕ relacionados. Entonces([X,X ′] , [Y, Y ′]) estan ϕ-relacionados.

Demostracion 18.13. Sea f ∈ C∞ (N,ℜ). Entonces

[Y, Y ′] (f) ϕ = (Y (Y ′ (f))− Y ′ (Y (f))) ϕ= Y (Y ′ (f)) ϕ− Y ′ (Y (f)) ϕ = ∗

pero se cumple que ϕ∗ Y = X ϕ∗, entonces

∗ = ϕ∗ (Y (Y ′ (f)))− ϕ∗ (Y ′ (Y (f)))

= ϕ∗ Y (Y ′ (f))− ϕ∗ Y ′ (Y (f))

= X ϕ∗ (Y ′ (f))−X ′ ϕ∗ (Y (f))

= X (ϕ∗ Y ′ (F ))−X ′ (ϕ∗ Y ′ (f))

= X (X ′ ϕ∗ (f))−X ′ (X ϕ∗ (f))

= [X,X ′] (f) ϕ,entonces [X,X ′] esta ϕ relacionado con [Y, Y ′].

Es decir, si nos limitamos a los vectores del espacio tangente que son ϕ rela-cionados por la accion izquierda, podemos tener una estructura de algebra en elespacio tangente del grupo de Lie. A esta algebra se le conoce como el algebrade Lie del grupo de Lie. Es decir, en un grupo de Lie, el subespacio del espaciotangente de los vectores asociados por la accion izquieda forman el algebra de Lieasociada al grupo. Veamos esto formalmente.

Corolario 18.14. Los campos invariatens por la izquierda forman una sub-algebra G de TG llamada Algebra de Lie correspondiente al grupo de Lie G.

Page 338: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

326 18. GRUPOS DE LIE

Esta subalgebra es isomorfica a TeG en cada punto g ∈ G. Se acostumbratomar el algebra de Lie G respecto a G como el algebra de vectores invariantes porla izquierda en la identidad e ∈ G . Si dLg (X) = X y dLg (Y ) = Y , resulta quedLg ([X,Y ]) = [X,Y ].

2. La Funcion Exponencial

En esta seccion vamos a introducir la funcion exponencial. Esta funcion mapeaelementos del algebra de Lie al grupo de Lie correspondiente. Sus propiedades nosrecuerdan a la funcion exponencial en ℜ, por eso su nombre. Para poder definiresta funcion, primero tenemos que introducir algunos conceptos y adaptar conceptosconocidos a los grupos de Lie. Vamos a iniciar con la introduccion de un grupouniparametrico de transformaciones en el grupo de Lie. Para esto vamos a verprimero una proposicion que utilizaremos aquı.

Proposicion 18.15. Sea (Mn,A) variedad diferenciable y F ∈ Dif (Mn). SeaX ∈ TMn y ψ el grupo 1-parametrico inducido por X. Entonces X es F-invariantessı ψt F = F ψt.

Demostracion 18.16. Xy = ψy(0), (tomando ψy (0) = y) y dF |y (Xy) =

Xy F ∗y , donde Xy es el vector tangente al camino ψ

yen y y dF |y (Xg) es el

vector tangente al camino ψF (y) = F ψy en F (g). Se tiene que

F ψy(t) = F ψt (y)= F ψt F−1 (F (y))

⇒) Si X es F-invariante

XF (y) = dF |y (Xg) , esto es ψF (y) (0) = XF (y)

por lo tanto

ψF (y) (f) = ψt (F (y))

= F ψt F−1 (F (y)) , i.e.

ψt = F ψt F−1

⇐) Si

ψt = F ψt F−1

esto implica que

ψF (t) (t) = ψt (F (y))

y esto implica que

ψF (y) (0) = XF (y)

es decir

XF (y) = dF |y (Xg)

Usando la proposicion anterior podemos definir la funcion exponencial. Sudefinicion es como sigue.

Page 339: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. LA FUNCION EXPONENCIAL 327

Definicion 18.17. Sea G grupo de Lie y X ∈ G el algebra correspondientea G. Sea ψ el grupo uniparametrico que induce a X y ψ1 ∈ ψt. La funcionexponencial se define como

exp : G → G

X → exp (X) := ψ1 (e) = ψe (1) .

Es decir

ψ : ℜ ×G → G

(t, g) → ψ (t, g) ;

coni) ψ (0, g) = g,

ii) ψ (t+ s, g) = ψ (t, ψ (s, g)); X = ψe y ψe (0) = e

La primera propiedad, la cual nos recuerda una de las propiedades de la expo-nencial de los reales, es que la exponencial del vector 0, es la identidad en el grupo.Veamos esto.

Proposicion 18.18. exp (0) = e

Demostracion 18.19. ψe = 0 implica que ψe (t) = cte ∈ G, pero ψe (0) = e,por lo tanto ψe (t) = e. Entonces exp (0) = ψe (1) = e.

El punto interesante ahora, es que con este valor se puede obtener el valor dela exponencial a lo largo de un parametro. Se sigue la proposicion:

Proposicion 18.20. exp (tX) = ψt (e) = ψe (t)

Demostracion 18.21. Sea ψe (t) = X, vamos a denotar ψe = ψX . Entonces

d

dt

(xi ψX

)= X i ψX

en las coordenadas locales de G. Probemos primero que ψrX(t) = ψX (rt), i.e.

ψrX(t) = (rX) = ψX (rt)

lo que implica que

d

dt

(xi ψrX

(t))

=d

dt

(xi ψX (rt)

)

= (rX)i ψrX (t)

= rX i ψX (rt) .

Hagamos t′ = rt, se obtiene

rd

dt′(xi ψrX (t)

)= r

d

dt

(xi ψX (t′)

)= rX i ψX (t′)

lo cual es correcto. Entonces exp (tX) = ψtX (1) = ψX (t). De esta ultima ex-presion se tiene que

d

dtexp (tX) = ψX (t) = XψX(t) o

d

dtexp (tX)|t=0 = Xe

y tambien

exp (tX + sX) = ψX (t+ s) = ψX (t) · ψX (s) = exp (sX) exp (tX) .

Page 340: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

328 18. GRUPOS DE LIE

La propiedad anterior es la que mas nos recuerda las propiedades de la ex-ponencial, y es la que usaremos al trabajar con esta funcion. Para finalizar estaseccion, vamos a mencionar mas propiedades de la funcion exponencial que seranutliles, algunas sin demostracion.

Proposicion 18.22. Sea ψ el grupo uniparametrico inducido por X ∈ G,algebra correspondiente a G, entonces ψt = Rexp(tX).

Demostracion 18.23.

ψt (g) = ψt (ge) = ψt Lg (e) = Lg ψt (e) = gψt (e) = g exp (tX) = Rexp(tX) (g) .

Proposicion 18.24. exp: G → G tiene las siguientes propiedades:i) exp es funcion suaveii) d exp|0 = id|Giii) Si U0 ∈ τG , exp|U0

es inyectiva

3. La representacion Adjunta y la Forma de Maurer Cartan.

Esta seccion la vamos a dedicar a una 1-forma que tiene gran importancia enteorıas de norma. Esta representacion es el campo de norma para una teorıa basadaen algun grupo de Lie, por eso su importancia. Aqui la vamos a introducir solodesde el punto de vista matematico. Para iniciar vamos a ver algunas definicionesque se van a utilizar mas adelante. Primero definamos la funcion Ag.

Definicion 18.25. Sea g ∈ G grupo de Lie y

Ag : G → G

g′ → Ag (g′) = gg′g−1

Lo interesante de Ag es que es un isomorfismo en el grupo de Lie.

Proposicion 18.26. Ag ∈ Dif (G) y es un homomorfismo de grupos, es decires un isomorfismo de grupos de Lie.

Demostracion 18.27. (Ag)−1 = Ag−1 y ambas Ag y Ag−1 son suaves, por

lo tanto Ag ∈ Dif (G). Ag(xy) = g(xy)g−1 = gxg−1gyg−1 = Ag(x)Ag(y), por lotanto Ag es un homomorfismo.

Comentario 18.28. Observen que Agg′ = Ag Ag′ para todos gg′ ∈ G.

Para trabajar con los grupos, se utiliza el hecho que estos forman clases deequivalencia, entonces lo mas sencillo es trabajar con algun representante de la clase.A este representante lo llamamos asi, un representante del grupo. Formalmente sudefinicion es como sigue.

Definicion 18.29. Sea V un espacio vectorial, G un grupo de Lie y Gℓ(V ) elconjunto de transformaciones lineales en V invertibles. Una representacion deG sobre V es un homomorfismo ϕ : G→ Gℓ (V ) del grupo G al grupo (Gℓ (V ) , ).

Un representante singular es la representacion adjunta del grupo, la cual sedefine con la siguiente proposicion.

Page 341: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. LA REPRESENTACION ADJUNTA Y LA FORMA DE MAURER CARTAN. 329

Proposicion 18.30. La funcion

ϕ : G → Gℓ (TeG)

g → ϕ (g) := d Ag|e := Adg

es una representacion de G sobre TeG, llamada la representacion adjunta.

Demostracion 18.31. d Ag|g′ : Tg′G→ Tgg′g−1G es un isomorfismo de espa-

cios vectoriales y d Ag|e (ve) = ve A∗g es una transformacion lineal d Ag|e : TeG→

TeG, i.e. d Ag|e ∈ Gℓ (TeG). Ademas

ϕ (gg′) = d Agg′ |e = d (Ag Ag′)| |e = d Ag|e=Ag′ (e) d Ag′ |e

por lo que ϕ es un homomorfismo de grupos.

Por otro lado, vamos a definir lo que es invarianza por la izquierda o por laderecha de una 1-forma sobre el grupo de Lie. Recordemos que sobre el grupo, losvectores interesantes son los vectores invariantes por la izquierda o la derecha, esteconcepto lo podemos transladar al espacio cotangente de la siguiente forma.

Definicion 18.32. Sea wg ∈ T ∗gG, G grupo de Lie. wg es invariante por

la izquierda si para todos g, g′ ∈ G,(L∗g

)g′

(wg′ ) = wg−1g′

o wg es invariante por la derecha si(R∗g

)g′

(wg′ ) = wg′g−1 .

Comentario 18.33. Noten que(L∗g

)g′

: T ∗g′G→ T ∗

L−1g (g′)

G = T ∗g−1g′G

y (R∗g

)g′

: T ∗g′G→ T ∗

R−1g (g′)

G = T ∗g′g−1G.

Al igual que los vectores invariantes por la izquierda o derecha, las 1-formasinvariantes quedan determinadas por su valor en un punto, donde normalmente seescoge la identidad. Veamos esto.

Proposicion 18.34. Si w ∈ TG es invariante por la izquierda o por la derecha,entonces w esta determinada por su valor en la identidad del grupo.

Demostracion 18.35. Sea w ∈ TG invariante por la izquierda, entonces wg =(L∗g−1

)

e(we), lo mismo por la derecha.

Ya estamos listos para introducir la forma canonica de Maurer-Cartan. Sudefinicion formal esta dada como sigue.

Definicion 18.36. Sea G grupo de Lie y G su respectiva algebra. La formacanonica o de Maurer-Cartan sobre el grupo de Lie G es la 1-forma wg ∈T ∗gG⊗ G, con

wg : TgG → TeG

Xg → wg (Xg) := dLg−1

∣∣g(Xg) .

La primera propiedad importante es que la forma de Maurer-Cartan esta de-terminada por su valor en la identidad. Es decir:

Page 342: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

330 18. GRUPOS DE LIE

Proposicion 18.37. Sea G grupo de Lie y w su forma de Maurer-Cartan.Entonces w es invariante por la izquierda.

Demostracion 18.38.(L∗g

)g′

(wg′ )(Xg−1g′

)=

(wg′ d Lg|g−1g′

) (Xg−1g′

)

= d Lg′−1

∣∣g′

(d Lg|g−1g′

(Xg−1g′

))

=(d Lg′−1

∣∣g′ d Lg|g−1g′

) (Xg−1g′

)

= d(Lg′−1 Lg

)∣∣g−1g′

(Xg−1g′

)

= d Lg′−1

∣∣g−1g′

(Xg−1g′

)= wg−1g′

(Xg−1g′

)

lo que implica que (L∗g

)g′

(wg′ ) = wg−1g′

Si la forma de Maurer-Cartan es invariante por la izquierda, cuando se tomala accion derecha de ella, el resultado es una formula utilizada mucho en teorıa denorma. Vamos a ver esta en la proposicion que sigue.

Proposicion 18.39. Sea G grupo de Lie y w su forma de Maurer-Cartan. Sesigue que: (

R∗g

)g′

(wg′) = Adg−1 wg′g−1

Demostracion 18.40.(R∗g

)g′

(wg′)(Xg′g−1

)=

(wg′ d Rg|g′g−1

) (Xg′g−1

)

= d Lg′−1

∣∣g′ d Rg|g′g−1

(Xg′g−1

)

= d(Lg′−1 Rg

)∣∣g′g−1

(Xg′g−1

)

= d(Lg′−1 Rg

)∣∣g′g−1 d

(L−1gg′−1 Lgg′−1

)∣∣∣g′g−1

(Xg′g−1

)

= d(Lg′−1 Rg

)∣∣g′g−1 d L−1

g′g−1

∣∣∣e wg′g−1

(Xg′g−1

)

= d(L−1g′ Rg Lg′g−1

)∣∣∣e wg′g−1

(Xg′g−1

)

= d Ag−1

∣∣e wg′g−1

(Xg′g−1

)

= Adg−1 wg′g−1

(Xg′g−1

)

Para trabajar en una variedad con estructura de grupo, en un grupo de Lie,se procede como sigue. Sean V1, · · · , Vn una base de TeG. Con esta basepodemos definir una base a traves de todo el espacio TG usando vectores invari-antes por la izquierda. Sea X1, · · · , Xn base de TG, tal que dLg (Vµ) = Xµ (g)(d Lg|e (Vµ) = Xµ ge

)y sean θµ ∈ T ∗G sus duales, es decir, 〈θµ, Xν〉 = δµν . Como

[Xµ, Xν ] es tambien invariante por la izquierda, se cumple que [Xµ, Xν ] = cλµνXλ

donde las cλµν son las constantes de estructura del algebra de Lie G, correspondiente

a G, ya que la cλµν puede ser determinada en e ∈ G. Esto se pude ver usando la

Page 343: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

3. LA REPRESENTACION ADJUNTA Y LA FORMA DE MAURER CARTAN. 331

invariacia por la izquierda. dLg ([Xµ, Xν ]) = cλµνXλ (g) para todo g ∈ G. En par-

ticular para e ∈ G, lo que hace que cλµν no depende de g. A las constentes cλµν se lesconoce como constantes de estructura del grupo. Estas constantes cumplencon algunas propiedades interesantes que quedaran como ejercicio.

Ejercicio 18.41. Demuestren quea) cλµν = cλµνb) cτµνc

λτσ + cτσµc

λτν + cτνσc

λτµ = 0, identidad de Jacobi

La ecuacion fundamental de las 1-formas en el espacio contangente de un grupode Lie es la que sigue.

Proposicion 18.42. Sea G grupo de Lie y θµ base⊂ T ∗G base del espaciocontangente de G. Entonces se cumple la ecuacion

dθµ = −1

2cµνλθ

ν ∧ θλ

donde las cµνλ son las constantes de estructura de G, el algebra correspondiente aG.

Demostracion 18.43. Sabemos que

dθµ (Xν , Xλ) = Xν (θµ (Xλ))−Xλ (θµ (Xν))− θµ ([Xν , Xλ])

= Xν (δµλ)−Xλ (δµν )− θµ (cνλαXα) = −cνλµ

se sigue que

−1

2cαβ

µθα ∧ θβ (Xν , Xλ) = −cµνλ

Asi mismo, la forma de Maurer-Cartan cumple con la misma ecuacion anterior,que se acostumbta escribir de una manera mas elegante. Esta forma la veremos enla siguiente proposicion.

Proposicion 18.44. Sea G grupo de Lie y w su forma de Maurer-Cartan. Laforma de Maurer-Cartan w se puede escribir como

w = Vν ⊗ θν ; w (g) := wg,

para toda g ∈ G, donde Vµ es la base del espacio tangente de G, TeGiso∼= G; θµ

es base del espacio cotangente de G, θµ base⊂ T ∗G y satisface la ecuacion

dθ +1

2[θ ∧ θ] = 0.

Demostracion 18.45. Sea Y = Y µXµ ∈ TgG, con Xµ la base invariante porla izquierda de TG, entonces

θ (Y ) = Y µθ (Xµ)

= Y µd Lg−1

∣∣g

(Xµ|g

)

= Y µd Lg−1

∣∣g dLg (Vµ)|e

= Y µd(Lg−1 Lg

)∣∣e(Vµ) = Y µVµ

Por otro ladoVν ⊗ θν (Y ) = Y µVνθ

µ (Xµ) = Y µVµ.

Page 344: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

332 18. GRUPOS DE LIE

Observen que [θ ∧ θ] = [Vµ, Vν ]⊗ θµ ∧ θν , se sigue entonces

dθ +1

2[θ ∧ θ] = −1

2Vµ ⊗ cµνλθν ∧ θλ +

1

2cµνλVµ ⊗ θν ∧ θλ = 0

4. Representacion de Grupos y Algebras de Lie

El espacio de las matrices es el espacio vectorial mas apropiado para usarse comorepresentantes de grupos y algebras. En esta seccion veremos los representantes delos grupos mas usados en fısica, quımica e ingenierıa. Primero vamos a ver ladefinicion formal.

Definicion 18.46. Sea G un grupo de Lie y H un grupo de Lie de matrices.Una representacion de G es un homomorfismo ϕ : G→ H.

Definicion 18.47. Sea G un algebra de Lie y H un algebra de Lie de matrices.Una representacion de G es un homomorfismo ϕ : G → H

Ya en la practica, por lo general se trabaja con las representaciones matricialesde los grupos o de las algebras. Vamos a resumir las algebras y grupos de matricesmas importantes.

Ejemplo 18.48. Sean GL (n,ℜ) y GL (n, C) los conjuntos de matrices no singu-lares n×n reales y complejas respectivamente. Estos conjuntos forman un grupo conla multiplicacion de matrices. Las coordenadas locales de ellos son las n2 entradas(Xij) = M ∈ GL, los cuales forman un grupo de Lie de dimension n2, real o com-pleja respectivamente. Topologicamente GL(n,ℜ) es un grupo no compacto, para-compacto y no-conexo. Sea c una trayectoria en GL(n,ℜ), c : (−ǫ, ǫ)→ GL (n,ℜ),c (0) = I la identidad en GL(n,ℜ). Cerca de cero c (s) = I+sA+O

(s2), A matriz

n × n, real. El vector tangente de c (s) en I es dcds =

.c (s)

∣∣s=0

= A . Entonces elalgebra correspondiente a GL(n,ℜ) es el conjunto gl (n,ℜ) de matrices reales n×n(singulares o no). Analogamente, el algebra gl (n, C) correspondiente a GL(n, C)es el conjunto de matrices complejas n× n.

Vamos a ver algunos ejemplos de los grupos de Lie mas usados en la fısica,quımica e ingenierıa. Primero vamos a estudiar ejemplos de subgrupos de GL (n,ℜ)

Ejemplo 18.49. O (n) :=M ∈ GL (n,ℜ)|MTM = M MT = I

llamadas

grupo ortogonal. Una curva en O (n) debe cumplir c (s)Tc (s) = I, por lo que si

la diferenciamos obtenemos c (s)Tc (s)+ c

(sT)c (s) = 0. En s = 0 uno obtiene que

AT + A = 0. Entonces el algebra correspondiente a O (n) es o (n), el conjunto dematrices antisimetricas.

Ejemplo 18.50. SL (n,ℜ) := M ∈ GL (n,ℜ)| det M = 1, llamado el grupoespecial lineal . Si c es una trayectoria en SL (n,ℜ) , det c (s) = 1+s tr (A) = 1, osea tr (A) = 0. Entonces el algebra correspondiente de SL (n,ℜ) es sl (n,ℜ), el con-junto de matrices con traza cero. La dimension de este conjunto es dimSL (n,ℜ) =n2 − 1.

Ejemplo 18.51. SO (n) = O (n) ∩ SL (n,ℜ), el grupo especial ortogonal,su algebra correspondiente es tambien o (n) = so (n). Ambas algebras tienen di-

mension dim o (n) = n(n−1)2 .

Page 345: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

4. REPRESENTACION DE GRUPOS Y ALGEBRAS DE LIE 333

Igualmente, los subgrupos de GL (n, C) pueden clasificarse como sigue:

Ejemplo 18.52. U (n) =M ∈ GL (n, C)|M MT = MTM = 1

, el grupo

unitario. Su algebra u (n) es el conjunto de matrices complejas antihermitianasAT +A = 0.

Ejemplo 18.53. SL (n, C) = M ∈ GL (n, C)| det M = 1, el grupo especiallineal complejo, su algebra sl (n, C) es un conjunto de matrices complejas contr (A) = 0.

Ejemplo 18.54. SU (n) = U (n) ∩ SL (n, C), grupo especial unitario, sualgebra su (n), es el conjunto de matrices complejas antihermitianas con traza cero.

Ejercicio 18.55. Demuestren con detalle que las algebras de U(n), SL(n, C)y SU(n) son respectivamente u(n), sl(n, C) y su(n).

Ademas existen una infinidad de grupos que se clasifican diferente. Veamosalgunos ejemplos explicitamente.

Ejemplo 18.56. El grupo de Lorentz se define como

O (1, 3) =M ∈ GL (4,ℜ) | MγMT = γ, γ = diag (−1, 1, 1, 1)

el cual no es compacto, es paracompacto y es no-conexo.

Ejercicio 18.57. Encuentren el algebra de Lorentz correspondiente.

Ejemplo 18.58. Los grupos:

O (2) =

(x −yy x

)| x2 + y2 = 1

; SO (2)

hom∼=(x, y) ∈ ℜ2 | x2 + y2 = 1

son homomorficos, es decir O (2) = SO (2) y ambos son topologicamente S1, queademas es una variedad diferenciable. Su algebra es

o (2) =

(0 −aa 0

)| a ∈ ℜ

= so(2).

Una base de esta algebra como espacio vectorial, es

o (2) =

(0 −11 0

).

Ejemplo 18.59. El grupo

U (1) = SU (1) = z ∈ C | zz = 1hom∼=

(x, y) ∈ ℜ | x2 + y2 = zz = 1, z = x+ iy

.

De nuevo U (1) es topologicamente S1.

Ejemplo 18.60. Como ya vimos anteriormente, el grupo

SU (2) =

(z0 −z1z1 z0

)|(z0, z1

)∈ C2, z0z0 + z1z1 = 1

hom∼= S3,

su correspondiente algebra esta dada por:

su (2) =

i

(c a− ib

a+ ib c

)| a, b, c,∈ ℜ

.

Una base de esta algebra 3-dimensional se puede escribir como sigue.σ1 = i

(0 11 0

), σ2 = i

(0 −ii 0

), σ3 = i

(1 00 −1

)

Page 346: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

334 18. GRUPOS DE LIE

Esta base se llama matrices de Pauli, y son la base canonica del algebra su. Lasmatrices de Pauli cumplen con las relaciones de conmutacion

[σ1, σ2] = 2iσ3,

[σ2, σ3] = 2iσ1,

[σ3, σ1] = 2iσ2.

y suelen ser la base del modelo estandar de partıculas elementales.

Ejercicio 18.61. Encuentren una base σi del algebra o(2) y calculen susconstantes de estructura ckij de la relacion [σi, σj ] = ckijσk.

Ejercicio 18.62. Encuentren una base del espacio tangente del grupo SU(2)y luego su base dual. Con ella construyan sus constantes de estructura. Contruyanuna base σii=1,2,3 del algebra su(2) y calculen tambien sus constantes de estruc-tura ckij de la relacion [σi, σj ] = ckijσk. Busquen una base del algebra en donde losdos conjuntos de bases de estructura sean iguales.

Ejercicio 18.63. Encuentren la forma de Maurer-Cartan para el grupo SU(2)utlilizando la traslacion izquierda sobre el grupo y luego calculen la traslacion derechasobre ella. Finalmente apliquen este resultado a un vector del espacio tangente deSU(2).

Ejercicio 18.64. Encuentren una base del espacio tangente del grupo de Lorentzy luego su base dual. Con ella construyan sus constantes de estructura. Contruyanuna base σii=1,2,3 del algebra su(2) y calculen tambien sus constantes de estruc-tura ckij de la relacion [σi, σj ] = ckijσk. Busquen una base del algebra en donde losdos conjuntos de bases de estructura sean iguales.

Ejercicio 18.65. Encuentren la forma de Maurer-Cartan para el grupo deLorentz utlilizando la traslacion izquierda sobre el grupo y luego calculen la traslacionderecha sobre ella. Finalmente apliquen este resultado a un vector del espacio tan-gente del grupo de Lorentz.

Page 347: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

Part 7

APLICACIONES

Page 348: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 349: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 19

APLICACIONES

En este capıtulo veremos un par de aplicaciones muy interesante de como sepuede usar todo el material que hemos aprendido a lo largo de este libro, primeropara resolver una clase de ecuaciones diferenciales, no lineales, en derivadas parcialesque son de mucha utilidad en fısica, quımica, ingenierıa, etc. y segundo de comose pueden entender espacios unificados en muchas dimensiones, geometrizando lasteorias de norma. Aquı vamos a ver de forma general y generica como utilizar estosmetodos y daremos un ejemplo para un caso sencillo.

1. Ecuaciones Quirales

La aplicacion a la que nos referimos es la resolucion de las ecuaciones quirales1.Estas ecuaciones son la generalizacion de la ecuacion de Laplace para un grupoarbitrario, aquı veremos como utilizando nuestro conocimientos de ecuaciones def-erenciales, variable compleja, grupos de Lie, etc, podemos resolver estas complica-disimas ecuaciones. El metodo se llama mapeos armonicos y su poder y eleganciason dignos de dedicarles esta capıtulo.

Las ecuaciones quirales se definen como sigue

Definicion 19.1. Sea G es un grupo de Lie paracompacto y g ∈ G un mapeotal que

g : C ⊗ C → G

g → g(z, z) ∈ G,Las ecuaciones quirales para g se definen como

(19.1) (αg,zg−1),z + (αg,zg

−1),z = 0

donde α2 = det g

Se utiliza que el grupo de Lie sea paracompacto para que podamos garantizarla existencia de una metrica en el espacio correspondiente. Normalmente g(z, z) seescribe en una representacion matricial de G. Las ecuaciones quirales es un sistemade ecuaciones de segundo orden, en derivadas parciales, no lineales. Si g es solo unafuncion g = eλ, la ecuacion quiral se transforma en la ecuacion:

(19.2) (αg,zg−1),z + (αg,zg

−1),z = (αλ,z),z + (αλ,z),z

Como veremos mas adelante, la funcion α = z+ z. Si hacemos el cambio de variablez = ρ+ iζ, la ecuacion (19.2) se transforma en

(19.3) (ρ λ,ρ),ρ + (ρ λ,ζ),ζ = 0

1Este capıtulo esta basado en el artıculo Tonatiuh Matos. Exact Solutions of G-invariantChiral Equations. Math. Notes, 58, (1995), 1178-1182. Se puede ver en: hep-th /9405082

337

Page 350: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

338 19. APLICACIONES

que es la ecuacion de Laplace en coordenadas cilındricas. Si ahora hacemos elcambio de variable ρ =

√r2 − 2mr + σ2 sin(θ), ζ = (r − m) cos(θ) la ecuacion

cambia a:

(19.4) ((r2 − 2mr + σ2)λ,r),r +1

sin(θ)(sin(θ)λ,θ),θ = 0

la cual se reduce para m = σ = 0 a la ecuaciacion de Laplace en coordenadasesfericas.

La primera propiedad de las ecuaciones quirales es que pueden ser derivadas deuna Lagrangiana dada por

(19.5) L = α tr(g,zg−1g,zg

−1).

Esta Lagrangiana representa una teoria topologica cuantica de campo con el grupode norma G y lo que vamos a hacer en este capıtulo es estudiar un metodo paraencontrar la forma explıcita de g ∈ G en terminos de las coordenadas z y z.

Comentario 19.2. Sea Gc un subgrupo de G, es decir, Gc ⊂ G tal que c ∈ Gcimplica que c,z = 0 y c,z = 0. Entonces la ecuacion (19.1) es invariante bajo laaccion izquierda Lc de Gc sobre G. Decimos que las ecuaciones quirales (19.1) soninvariantes bajo este grupo.

La primera consecuencia importante de las ecuaciones quirales la estudiaremosen la siguiente proposicion.

Proposicion 19.3. La funcion α = det g es armonica.

Demostracion 19.4. Vamos a utilizar la formula tr(A,xA−1) = ln(detA),x.

Si tomamos la traza de las ecuaciones quirales (19.1), se obtiene:

0 = tr[(αg,zg

−1),z + (αg,zg−1),z

]= (α ln(det g),z),z + (α ln(det g),z),z

= (α ln(α),z),z + (α ln(α),z),z

= 2α,zz

lo que implica que α,zz = 0.

Las ecuaciones quirales implican la existencia de un superpotencial β quees integrable si las ecuaciones quirales se cumplen. Veamos esto en la siguienteproposicion.

Proposicion 19.5. Sea β una funcion compleja definida por

(19.6) β,z =1

4(lnα),ztr(g,zg

−1)2, g ∈ G

y β,z con z en lugar de z. Si g cumple con las ecuaciones quirales, entonces β esintegrable.

Page 351: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. ECUACIONES QUIRALES 339

Demostracion 19.6. Vamos a usar que (g−1),x = −g−1g,xg−1 en lo que sigue.

Primero observemos lo siguiente.

β,zz =1

4tr

α,z(g,zg

−1g,zg−1)

]

,z

=1

4tr

[1

α,z(αg,zg

−1),z g,zg−1 +

1

α,zαg,zg

−1 g,zzg−1 − 1

α,zαg,zg

−1g,zg−1g,zg

−1

− α,zz(α,z)2

αg,zg−1g,zg

−1

]

=1

4

1

α,ztr[(

(αg,zg−1),z + α g,zzg

−1 − αg,zg−1g,zg−1)g,zg

−1]

=1

4

1

α,ztr[(

(αg,zg−1),z + (αg,zg

−1),z − α,zg,zg−1)g,zg

−1]

ya que las matrices dentro de la traza pueden conmutarse sin afectar el resultado.Si las ecuaciones chirales se cumplen para g, finalmente obtenemos:

β,zz = −1

4tr[g,zg

−1g,zg−1]

Lo cual implica que β,zz = β,zz

Ahora vamos a construir el metodo de solucion. Sea G el algebra correspon-diente del grupo de Lie G. Ya sabemos que la forma de Maurer-Cartan ωg en G,definda por ωg = Lg−1∗(g), es una 1-forma sobre G, que toma valores en G, esdecir ωg ∈ T ∗

gG⊗ GVamos a definir un mapeo sobre G.

Definicion 19.7. Se definen los mapeos Az y Az del grupo de Lie a su algebracorrespondiente, dados por

Az : G Gg Az(g) = g,zg

−1

Az : G Gg Az(g) = g,zg

−1

Si g es una representacion de grupo G, entonces la 1-forma de Marure-Cartanω(g) = ωg la podemos escribir como:

(19.7) ω = Azdz +Azdz

Usando el hecho de que ωg se puede escribir como en (19.7), vamos a definiruna metrica en el espacio tangente de G, es decir sobre G.

Definicion 19.8. El tensor

(19.8) l = tr(dgg−1 ⊗ dgg−1)

sobre G define una metrica sobre el haz tangente de G.

Con la definicion de una metrica en G podemos definir las conexion y el tensorde curvatura correspondientes. En particular la metrica (19.8) define la derivadacovariante. Particularmente, las matrices Az(g) y Az(g) su derviada covariantecumple una relacion muy interesante, la cual veremos en el siguiente lema.

Page 352: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

340 19. APLICACIONES

Lema 19.9. Sea G grupo de Lie y las matrices Az(g) y Az(g) definidas comoen la definicion 19.7 y l la metrica (19.8), con derivada covariante ∇. Entonces

(19.9) ∇aAb −∇bAa = [Ab, Aa]

Demostracion 19.10. De la definicion de Aa(g) = g,ag−1, se tiene

∇aAb −∇bAa = Ab,a −Aa,b − ΓcabAc + ΓcbaAc

= (gbg−1),a − (gag

−1),b

= g,abg−1 − g,ag−1g,bg

−1 − g,bag−1 + g,bg−1g,ag

−1

= AbAa −AaAb

Vale la pena definir el concepto de espacio simetrico en este punto.

Definicion 19.11. Sea M una variedad paracompacta con metrica l. Se diceque el espacio M es simetrico si el tensor de Riemman R derivado de l cumple con

∇R = 0

donde ∇ es la derivada covariante de M compatible con l

Con esto ya estamos listos para demostrar el siguiente teorema.

Teorema 19.12. La subvariedad de soluciones de las ecuaciones quirales S ⊂G es una variedad simetrica con metrica dada por (19.8)

Demostracion 19.13. Solo vamos a dar una guıa de la demostracion. Vamosa tomar la parametrizacion λa a = 1, · · ·n, sobre G. El conjunto λa es un sistemacoordenado de la variedad G n-dimensional. En terminos de esta parametrizacion,la forma de Maurer-Cartan ω puede escribirse como:

(19.10) ω = Aadλa,

donde Aa(g) = ( ∂∂λa g)g

−1. Entonces las ecuaciones quirales pueden ser escritascomo

(19.11) ∇bAa(g) +∇aAb(g) = 0,

donde ∇a es la derivada covariante definida por (19.8), es decir

(19.12) ∇aAb = Ab,a − ΓcabAc

Claramente la ecuacion (19.11) se sigue, ya que los coeficientes de conexion sonsimetricos. Observemos que

(19.13) l = tr[Aa(g)Ab(g)] dλa ⊗ dλb,

entonces los coeficientes metricos estan dados por gab = tr[Aa(g)Ab(g)]. Usemosla ecuacion (19.9) en (19.11), de aqui se infiere la realcion

(19.14) ∇bAa(g) =1

2[Aa, Ab](g).

De (19.13) podemos calcular la curvatura de Riemann R. Se obtiene

(19.15) Rabcd =1

4tr(A[aAb]A[cAd])

Page 353: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. ECUACIONES QUIRALES 341

donde [a, b] significa conmutacion de los ındices. Esto es posible gracias a que G esun espacio paracompacto. De aquı se sigue que

∇R = 0

Ya estamos listos para explicar el metodo para encontrar campos quirales ex-plicitamente.

Sea Vp una subvariedad de G y λi i = 1, · · · , p coordenadas locales total-mente geodesicas sobre Vp. La variedad G es conocida, entonces podemos conocera la subvariedad Vp. De hecho, Vp es un subgrupo de G y Vp es tambien simetrico.Las simetrias de G y Vp tambien son isometrias, ya que ambos son paracompactosy la metrica Riemanniana (19.13) y i∗l respectivamente, donde i es la restriccionde Vp sobre G heredan estas isometrias. Supongamos que Vp tiene d isometrias,entoces se sigue que:

(19.16) (αλi,z),z + (αλi,z),z + 2α∑

ijk

Γijkλj,zλ

k,z = 0

donde i, j, k = 1, · · · , p, Γijk son los sımbolos de Christoffel de i∗l y λi son parametros

totalmente geodesicos sobre Vp. En terminos de los parametros λi las ecuacionesquirales se pueden escribir como:

(19.17) ∇iAj(g) +∇jAi(g) = 0

donde ∇i es la derivada covariante sobre Vp. La ecuacion (19.17) es la ecuacion deKilling sobre Vp para las componentes de Ai. Puesto que conocemos de hecho a Vp,conocemos sus isometrias y por tanto conocemos sus vectores de Killing. Sea ξs,s = 1, · · · , d, una base del espacio de los vectores de Killing de Vp y Γs una base dela subalgebra correspondiente al espacio Vp. Entonces podemos escribir:

(19.18) Ai(g) =∑

s

ξis Γs

donde ξs =∑

j ξjs

∂∂λj y la derivada covariante de Vp esta dada por

(19.19) ∇jAi(g) = −1

2[Ai,Aj ](g)

Las matrices Ai cumplen con la condicion de integrabilidad Fij(g) = 0, donde

(19.20) Fij = ∇jAi −∇iAj − [Aj,Ai]

es decir, las Ai son puramente una norma.La accion izquierda de Gc sobre G, dada por L : Gc ⊗ G → G preserva las

propiedades de los elemetos de S. Conocidos los vectores ξs y Γs uno puedeintegrar los elementos de S, puesto que los Ai(g) ∈ G pueden ser mapeados deregreso al grupo G utilizando el mapeo exponencial. Sin embargo, no es posiblemapear todos los elementos uno por uno, pero podemos hacer uso de la siguienteproposicion.

Proposicion 19.14. La relacion Aci ∼ Ai ssi existe c ∈ Gc tal que Ac = ALc,es relacion de equivalencia.

Ejercicio 19.15. Demostrar la proposicion anterior.

Page 354: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

342 19. APLICACIONES

Esta relacion de equivalencia separa el conjuto Ai en clases que llamaremos[Ai]. Sea TB un conjunto de representantes de cada clase, es decir TB = [Ai].Podemos mapear el conjunto TB ⊂ G al subgrupo S por medio del mapeo exponcialo por integracion directa. Vamos a definir B como el conjunto de elmentos delgrupo mapeado por cada representante de las clases, es decir B = g ∈ S | g =exp(Ai), Ai ∈ TB ⊂ G. Los elementos de B son a su vez elementos de S porquelas Ai cumplen con las ecuaciones quirales i.e.B ⊂ S. Para construir el conjuntocompleto S podemos seguir el siguiente teorema.

Teorema 19.16. (S,B, π,Gc, L) es un haz fribrado principal con proyeccionπ(Lc(g)) = g donde L(c, g) = Lc(g).

Demostracion 19.17. Las fibras de G son las orbitas del grupo Gc sobre G,

Fg = g′ ∈ G | g′ = Lc(g)para algun g ∈ B. La topologıa de B es su topologıa relativa con respecto a G. SeaαF el espacio fibrado αF = (Gc × Uα,Uα, π), donde Uα es una cubierta abiertade B. Tenemos el siguiente lema.

Lema 19.18. El espacio fibrado αF y α = (π−1(Uα), Uα,π|π−1(Ua)) son isomorficos.

Demostracion 19.19. El mapeo

ψα : φ−1(Uα) = g ∈ S | g′ = Lc(g), g ∈ Uαc∈Gc→ Gc × Uα

g′ → ψα(g′) = (c, g)

es un homeomorfismo y π|π−1(Uα)(g′) = g = π2 ψα(g′).

Por el lema 19.18 se sigue que el haz fibrado α es localmente trivial. Paraterminar la demostracion del teorema es suficiente con probar que los espacios Gc,(S,Gc, L) y (Gc × Uα,Gc,δ) son isomorficos. Pero esto es cierto ya que

δ id|Gc× ψα = ψα L|Gc×π−1(Uα)

es un isomofirmo.

Usando este teorema es ya posible explicar el metodo que queremos estudiar.

Algoritmo 19.20. .a) Dadas las ecuaciones quirales (19.1), invariantes bajo el grupo de Lie G,

escojan un espacio Riemannian simetrico Vp con d vectores de Killing, tal quep ≤ n = dim G.

b) Encuentren una representacion del algebra de Lie correspondiente G com-patible con la relacion de conmutacion de los vectores de Killing, via la ecuacion(19.19).

c) Escriban las matrices Ai(g) explicitamente en terminos de los parametrosgeodesicos del espacio simetrico Vp.

d) Usen la proposicion 19.14 para escoger las clases de equivalencia de Ai yescogan un conjunto de representates

e) Mapen los representantes del algebra de Lie al grupo correspondiente.Las soluciones se pueden contruir usando la accion izquierda del grupo Gc sobre

el grupo G.

Este metodo quedara mas claro viendo un ejemplo.

Page 355: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

1. ECUACIONES QUIRALES 343

Ejemplo 19.21. Vamos a tomar el grupo de Lie G = SL(2,R) y vamos aseguir el metodo paso por paso.

a) Escogemos que V1 es el espacio unidimensional tal que i∗l = dλ2. Esteespacio es claramente un espacio Riemanniano simetrico con un vector de Killing.

b) El algebra de Lie correspondiente es sl(2,R) y es el conjunto de matricesreales 2×2 con traza cero. La ecuacion de Killing se reduce a la ecuacion de Laplace(19.2).

c) Usando la ecuacion (19.19), obtenemos que

g,λg−1 = A = constant.

d) Los representantes del conjunto de matrices reales 2× 2 con traza cero Aiestan dados por:

[Ai] =

(0 1a 0

)

e) El mapeo de los representantes del algebra de Lie al grupo se puede llevar acabo por la integracion de la ecuacion diferencial matricial

g,λ = [Ai]g.

Las soluciones dependen del polinomio caracteristico de [Ai]. Se obtienen tres casos:a > 0, a < 0 y a = 0. Para cada caso la matriz g se obtiene:

Para a > 0

(19.21) g = b

(1 aa a2

)eaλ + c

(1 −a−a a2

)e−aλ,

donde 4bca2 = 1Para a < 0

(19.22) g = b

(cos(aλ+ ψ0) −a sin(aλ+ ψ0)−a sin(aλ + ψ0) −a2 cos(aλ+ ψ0)

),

donde a2b2 = −1Y para a = 0 se tiene

(19.23) g =

(bλ+ c bb 0

)

con b2 = −1, a, b, c y ψ0 son constantes. Ası que para cada solucion λ de la ecuacionde Laplace (19.2) se tendra una solucion de la ecuacion quiral. La accion izquierdadel grupo SLc(2, R) sobre SL(2, R) se representa como

g′ = CgD,

donde C,D ∈ SLc(2, R). g′ va a ser tambien una solucion de las ecuaciones quirales(19.1).

Ejemplo 19.22. Si ahora escogemos una variedad V2 podemos obtener otraclase de soluciones de las ecuaciones quirales para el mismo grupo. Todos las var-iedades dos dimensionales V2 son conformalmente planas. Sean λ y τ dos paramet-ros del espacio V2, ası que la metrica mas general que podemos escribir para esteespacio es

dl2 =dτdλ

(l + kλz)2

Page 356: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

344 19. APLICACIONES

Pero que V2 se simetrica implica que k es una constante. Un espacio V2 con cur-vatura constante tiene tres vectores de Killing. Sean

ξ1 =1

2V 2[(kτ2 + 1)dλ+ (kλ+ 1)dτ ]

ξ2 =1

V 2[−τdλ+ λdτ ]

ξ3 =1

2V 2[(kτ2 − 1)dλ+ (1− kλ2)dτ ]

donde V = 1 + kλτ , una base de los vectores de Killing de V2. Las relaciones deconmutacion para estos tres vectores de Killing son:

[Γ1,Γ2

]= −4kΓ3,

[Γ2,Γ3

]= 4kΓ2,

[Γ3,Γ1

]= −4Γ2(19.24)

Pero para obtener las relaciones de conmutacion de sl(2, R) tenemos que poner k =−1. Una representacion compatible del grupo sl(2, R) con las reglas de conmutacion(19.24) son las matrices:

Γ1 = 2

(−1 00 1

), Γ2 =

(0 ba 0

), Γ3 =

(0 −ba 0

)

donde ab = 1. Entoces las ecuaciones (19.18) quedan como:

g,λg−1 = Aλ =

1

V 2

(τ2 − 1 b(1− τ)2−a(1 + τ)2 1− τ2

)

g,τg−1 = Aτ =

1

V 2

(λ2 − 1 b(1− λ)2−a(1 + λ)2 1− λ2

)

Integrando estas ecuaciones encontramos finalmente

(19.25) g =1

1− λτ

(c(1− λ)(1 − τ) e(τ − λ)e(τ − λ) d(1 + λ)(1 + τ)

)

donde cd = −e2, a = ec y b = − e

d . Para la ecuacion armonica se obtiene

(αλ,z),z + (αλ,z),z +4τ

1 + λταλ,zλ,z = 0

(ατ,z),z + (ατ,z),z +4λ

1 + λτατ,zτ,z = 0(19.26)

Igualmente como antes, para cada solucion de las ecuaciones (19.26) en la ecuacion(19.25) se obtiene una solucion distinta para las ecuaciones quirales para el grupoSL(2, R).

2. Geometrizacion de Teorias de Norma

En esta seccion2 veremos como geometrizar las teorias de norma y como usandoun espacio con mas dimensiones de las cuatro conocidas es posible unificar todaslas interacciones de la naturaleza. El problema que tienen estas teorias es que,como la relatividad general, no pueden ser cuantizadas con las tecnicas conocidas.El problema es mas profundo de lo que parece, pues algunas teorias de norma si se

2Una version completa de esta seccion se encuentra en Tonatiuh Matos and Antonio Nieto.Topics on Kaluza-Klein Theories. Rev. Mex. Fs. 39, (1993), S81-S131

Page 357: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. GEOMETRIZACION DE TEORIAS DE NORMA 345

pueden cuantizar, las teorias geometricas no. La razon puede ser la forma en quecada teoria entiende las interacciones de la naturaleza. Mientras que la interacciones un concepto puramente geometrico en la relatividad general y en las teoriasgeomtricas de unificacion, en teoria de norma la interaccion entre partıculas se dapor medio de intercambio de partıculas virtuales. Es posible que mientras no hayaun concepto unificado de como debe entenderse la interaccion en la naturaleza, nova a haber una teoria unificada de todas las fuerzas. Aquı nos vamos a concentraren las teorias geometricas de unificacon. Como veremos, la unificacion de todaslas interacciones requiere de la matematica estudiada en estes libro. La razon deestudiarla es puramente academico y no tiene un sentido fısico necesariamente. Aestas teorias geometricas de unificacion se les llama tambien teorias de Kaluza-Klein, por ser ellos los primeros en proponerlas.

Vamos a iniciar viendo como es posible geometrizar las teorias de norma. Elprincipio fundamental de la teoria general de la relatividad de Einstein es que lasinteracciones gravitacionales son producto de la geometria del espacio-tiempo. Lamateria le dicta al espacio-tiempo como curvarse, mientras que el espacio tiempodetermina la dinamica de la materia. Por supuesto queda abierta la pregunta sitodas las demas interacciones de la naturaleza tambien son geometricas. Estasinteracciones son modeladas con las teorias de norma. En principio uno puedegeometrizar las teorias de norma observando el principio de acoplamiento mınimo.Este principio consite en substituir el momento de una partıcula pµ, con el momento

(19.27) pµ pµ + eAaµta,

donde las Aaµ son los potenciales de Yang-Mills y ta ∈ G, es la base del espaciotangente a G, el grupo de invariancia de la teoria de norma. En un sistema coorde-nado, esto se puede interpretar como cambiar las derivadas parciales en el sistemapor la derivada coovariante Dµ = ∂µ + eAaµta en un espacio interno o espacio deisoespin. Sin embargo, lo que definimos es una conexion en este espacio interno,donde se cumple una relacion de conmutacion para la derivada covariante dada por:

(19.28) [Dµ, Dν ] = −eFµνdonde las funciones Fµν = F aµνta estan dadas por:

(19.29) F aµν = ∂µAaν − ∂νAaµ + efabcA

bµA

donde las constantes fabc son las constantes de estructura del algebra G, es decir

[tb, tc] = fabcta

Con esta conexion podemos definir la curvatura del espacio. La diferencia aquies que el espacio interno no necesariamente tiene una metrica y la conexion Aaµ esdiferente a los sımbolos de Christoffel.

Sea P el haz fibrado principal (P,B4, π,G, U, ψ), o graficamente dado por:

G

↓P

↓πB4

con conexion ω y cuya fibra es un grupo paracompacto G y su base es un espacioRiemanniano cuatro dimensional, vean la figura 1

Page 358: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

346 19. APLICACIONES

Figure 1. El haz fibrado principal P , invariante ante el grupo(la fibra) G y base el espacio tiempo plano B4. σ es una seccioncruzada del haz, π es la proyeccion y ϕ es una trivializacion, com-patible con σ.

Esta definicion induce una metrica en P , ya que las hipotesis anteriores separanel espacio en una parte vertical, dada por el grupo G y otra horizontal, determinadapor la seccion cruzada σ. Ası la metrica sobre P puede ser definida como

g(Uv, Vv) = g(Uv, Vv)

g(UH , Vv) = 0

g(UH , VH) = g(dπ(UH), dπ(VH))(19.30)

donde g, g y g son las metricas sobre G, sobre el espacio base B4 y sobre P ,respectivamente. Si ωA es una base de las 1-formas definidas sobre P , la metrica(19.30) puede ser escrita como

(19.31) g = gαβωα ⊗ ωβ + Iabω

a ⊗ ωb,

la cual es definida sobre todo P . Vamos a escribir la metrica g en coordenadaslocales. P es un haz fibrado y por tanto es localmente un producto cartesiano deun conjunto abierto U ∈ B4 con la fibra G. Es decir, como ya vimos, existe unhomeomorfismo ϕ, llamado la trivializacion de P tal que

ϕ : P → U ×Gx → (b, g)

con b ∈ U ⊂ B4 y g ∈ G.Sea ea una base del espacio tangente vertical de P y eα la base del espacio

complemento, el espacio horizontal, en nuestro caso de cuatro dimensiones. Pordefinicion, las proyecciones de los vectores base estan dadas por:

dπ(eα) = eα

dπ(ea) = 0(19.32)

donde eα es una base del espacio tangente del espacio base U .

Page 359: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. GEOMETRIZACION DE TEORIAS DE NORMA 347

Ahora vamos a proyectar los vectores base eα y ea al espacio tangente deU ×G usando la trivializacion. La proyeccon de U ×G sobre U es una proyeccioncanonica dada por

π1 : U ×G → U,

(x, a) → x

de tal forma que

(19.33) π = π1 ϕTomemos la proyeccion de eα, ea a T (U ×G) tal que

dϕ(eα) = Bβαeα −Amα emdϕ(ea) = Cβa eβ +Dm

a em(19.34)

donde em es una base invariante por la derecha del espacio tangente de G, tal queeα, em es una base del espacio tangente de U × G. Pero de la ecuacion (19.33)tenemos:

dπ(eα) = dπ1 dϕ(eα) = Bβαeβ = eα

ϕ(ea) = dπ1 dϕ(ea) = Cβa eβ = 0(19.35)

i.e. Bβα = δβα y Cβa = 0. El conjunto dϕ(ea) = Dma em es una base del espacio

tangente deG, el cual podemos reescribir simplemente comoDma em → ea. Entonces

obtenemos.

dϕ(eα) = eα −Amα em(19.36)

dϕ(ea) = ea.(19.37)

De (19.37) es sencillo obtener la base del espacio contangente correspondiente, estaes:

eA =

eα −Amα emem

(19.38)

ωA =

ωα

ωa +Aaαωα(19.39)

donde ωβ es la base dual de eα y ωm es la base dual de em. Con esta baseya podemos escribir la metrica g del haz P en la trivializacion U , obtenemos

(19.40) g = gαβωα ⊗ ωβ + Inm(ωn +Anαω

α)⊗ (ωm +Amβ ωβ)

Tambien podemos escribir la metrica (19.40) en un sistema coordenado, por ejem-plo, sea

ωα = dxα

ωn = dxn

Aaα = ekBaα

Iab = gab(19.41)

obtenemos

(19.42) g = gαβdxα ⊗ dxβ + gnm(dxn + ekBnαω

α)⊗ (dxm + ekBmβ ωβ)

Page 360: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

348 19. APLICACIONES

la cual se conoce como la metrica de Kaluza-Klein. A diferencia de la metrica origi-nal la cual fue postulada utilizando muchas hipotesis, esta es solo una construccionsiguiendo la filosofıa de las teorias de norma.

Para obterner g vamos a calcular el pull-back de ϕ, el cual esta dado por

(19.43) ϕ∗(X) = Xαωα +Xn(ω

n −Anβ ωβ)|ϕ−1

Entonces el pull-back de la base del espacio contangente de U ×G es

(19.44) ϕ∗(ωα) = ωα, ϕ∗(ωa +Aaαωα) = ωa

de donde obtenemos

(19.45) g = ϕ∗g = gαβωα ⊗ ωβ + Imnω

n ⊗ ωm|ϕ−1

i.e. (19.31). Es claro que g = gαβωα⊗ωβ es una metrica de B4 y g = Inmω

n⊗ωn esuna metrica de G. Finalmente vamos a ver que las componentes Aaβω

βta pertenecen

a la conexion del haz P proyectada en B4. Para hacer esto, recordemos que la 1-forma de coneccon ω asıgna un cero a los vectores horizontales y un elemento delalgebra de Lie correspondiente a los vectores verticales. Podemos escribir ω como

(19.46) ω = ωata

Esto es ası, ya que

ω(eα) = ωa(eα)ta = 0

ω(eb) = ωa(eb)ta = δab ta = tb.(19.47)

Con este resultado ya podemos proyectar la conexion ω de P a U ⊂ B4. Para haceresto, definimos una seccion cruzada usando la trivializacion ϕ

(19.48) σ = ϕ−1 Id : U P

donde Id es la funcion identidad definida por

Id : U → U ×G,(19.49)

x → (x, e)(19.50)

con e es la identidad en G. Entonces el pull-back de σ aplicado a ω esta dado por(vean la ecuacion (19.44))

σ∗(ω) = ( ¯Id∗ ϕ−1∗)(ωata)

= Id∗((ωa +Aaβω

β)ta) = Aaβωβta(19.51)

esto es, A = Aaβωβta es la proyeccion de la 1-forma de conexion hacia U y representa

el potencial de Yang-Mills en U .

Ejemplo 19.23. Vamos a construir el haz fibrado principal

G

↓P

↓πM4

en donde M4 es el espacio tiempo plano, vean la figura 2.Este haz fibrado tiene por fibra al grupo G. Ahi construimos la conexion del haz

utilizando las ideas anteriores. En un haz fibrado principal P , la conexion define a

Page 361: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. GEOMETRIZACION DE TEORIAS DE NORMA 349

Figure 2. El haz fibrado principal P , invariante ante el grupo(la fibra) G y base el espacio tiempo plano M4. σ es una seccioncruzada del haz.

la 1-forma Maurer-Cartan ω tomando valores en el algebra de Lie G correspondientea G. Toda teoria de norma esta basada en un grupo de Lie G. La teria de normamas representativa es tal vez aquella basada en el grupo G = SU(2). Existe unarelacion directa entre los elementos del algebra de Lie y los elementos del espaciotangente de G. Para SU(2) esta relacion esta dada por los vectores base

z∂

∂y− y ∂

∂z

0 0 00 0 10 −1 0

x∂

∂z− z ∂

∂z

0 0 −10 0 01 0 0

y∂

∂y− x ∂

∂y

0 1 0−1 0 00 0 0

(19.52)

La 1-forma ω de Maurer-Cartan se define con la relacion (19.52) y la asociacionde las matrices del algebra correspondiente de P en cada punto p ∈ P . El puntocrucial aqui es la proyeccion de la 1-forma ω al espacio base. Para hacer esto,tomemos una seccion cruzada σ en P , vean la figura 2. Con σ podemos proyectarla 1-forma de conexion al espacio base

(19.53) A = σ∗ω

Page 362: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

350 19. APLICACIONES

Otra seccion cruzada σ1, por supuesto, definira otra proyeccon de la conexion

A′

= σ∗1ω

pero la relacion entre A y A′ la obtenemos del siguiente teorema

Teorema 19.24. Sean A = σ∗ω y A′

= σ∗1ω las conexiones derivadas de las

secciones cruzadas σ∗ y σ∗1 , en un haz fibrado principal P , con grupo de estructura

G. Entonces

(19.54) A′

= aAa−1 + ada−1

donde a es un elemento de transicion de G.

Esta es una relacion bien conocida en teorias de norma. Por ejemplo, para elgrupo G = U(1), que topologicamente es U(1) = S1, se tiene que un elemento deS1 puede ser escrito como a = eiϕ, entonces

(19.55) A′

= eiϕA e−iϕ − eiϕde−iϕ = A+ dϕ.

O escrito en componentes

(19.56) A′

µ = Aµ + ∂µϕ,

que es justamente la relacion de norma del campo electromagnetico. Es mas, pode-mos escribir la 1-forma de conexion en general como:

(19.57) ω = a−1Aa+ a−1da

Por supuesto, bajo la accion derecha del grupo a a′ = ab sobre las fibras de P ,ω queda invariante

ω = a′−1Aa′ + a′−1da′

La curvatura se puede obtener de la relacion

Ω = dω + ω ∧ ω = a−1Ba

donde

(19.58) B = dA+A ∧A =1

2Baµνtadx

µ ∧ dxν

Naturalmente Ω obedece las identidades de Bianchi

(19.59) dΩ + ω ∧ Ω− Ω ∧ ω = 0.

Ejemplo 19.25. Vamos a recordar rapidamente como se ve una solucion delas ecuaciones de norma invariantes ante el grupo U(1), el cual es, como ya vimos,topologicamente el cırculo. El haz fibrado aquı consiste en una esfere S2 cubiertacon una conexion invariante ante U(1), dada por

A+ = A− + dϕ.

Como vimos antes, una solucion de las ecuaciones de Maxwell sobre la esfera S2

esta dada por

A± =1

2[±1− cos(θ)]dϕ

que representa el monopolo de Dirac. La curvatura de esta conexion es

(19.60) F = dA± =1

2sin(θ)dθ ∧ dϕ.

Page 363: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

2. GEOMETRIZACION DE TEORIAS DE NORMA 351

Ejemplo 19.26. Otro ejemplo interesante es el instanton, el cual es la conexionen un un haz fibrado

SU(2)

↓P

↓πS4(19.61)

Anque esta construccion no tiene que ver con fısica, es solo una construccionmatematica.

Por otro lado, se pueden construir a las teorias de Yang-Mills con el formalismode haces fibrados, en este caso la fibra es el grupo de invariancia y la base el grupo0(3, 1) o el grupo de Lorentz. Pero tambien se pueden construir las teorias de Yang-Mills usando una base curva arbitraria. En lo que sigue de este capıtulo vamos ahacer esto.

Esto demuestra que el llamado ansatz de Kaluza-Klein no es necesariamenteun ansatz, sino la generalizacion natural de la teoria de norma a espacios curvos.Sin embargo, algunos puntos deben de tomarse en cuenta.

Comentario 19.27. La descomposicion (19.30) o (19.31) puede ser hecha solosi g es invariante ante el grupo G. Pero tambien podemos tomar el grupo cocienteG/H, donde H es un grupo normal de G. Por ejemplo, si G = SU(3)× SU(2)×U(1), el grupo maximo normal de G es el grupo H = SU(2)×U(1)×U(1), ası quecomo la dimension de G es 12 y la dimension de H es 7, la dimension mınima deP para tener la metrica g invariante ante el grupo SU(3) × SU(2) × U(1) es 7 +4 = 11. Este parece ser un numero magico, pues es la dimension de la teoria M yde supergravedad.

Comentario 19.28. No hay un tratamiento mecanico cuantico de las teoriasde Kaluza-Klein, como no lo hay tampoco de la relatividad general. Pero al incorpo-rar partıculas del grupo SU(2), estas partıculas necesariamente son cuanticas y portanto el tratatamiento mostrado aquı no puede explicarse a esas partıculas. Pero lacontradiccion es mas profunda, pues si el campo gravitatorio son realmente las com-ponentes de la metrica del espacio tiempo, entonces la cuantizacion de este espacioimplicarıa que este es discreto. Pero para tener metrica deberıa ser un espacio T2,de Haussdorff. Por tanto, un espacio discreto no puede tener metrica. La preguntaque queda abierta es por supuesto si estamos interpretando bien las interaccionesde partıculas a nivel cuantico o si la interpretacion geometrica mostrada aquı es lacorrecta. Ojala que algun lector de este libro nos de algun dıa la respuesta.

Page 364: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …
Page 365: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

CHAPTER 20

Indice Analitico

A

Absolutamente convergenteAcotado por arribaAcotado por abajoActua por la derechaAccion EfectivaAccion LibreAccion TransitivaAlgebraAlgebra tensorialAlgebra de LieAlgebra sobre un conjuntoAnilloAnillo de los enterosAnillo de los realesAnillo conmutativoAnillo con unidadAnillo sin divisores de ceroAnillo cocienteAnillo idealArgumentoAtlasAtlas equivalentesAutomorfismo

B

BaseBase coordenadaBiyectivaBola

C

CaminoCamino constanteCampocombinacion linealCampo de norma

353

Page 366: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

354 20. INDICE ANALITICO

Campo ordenadoCartaCartasCartas compatiblesCerradura linealClase de equivalenciaClausuraCelula de JordanCerradura linealCodiferencial exteriorCoeficientes de FourierCofactores de una matrizCompactificacion por un puntoCompactificacionComposicion de mapeosComposicionComplejo conjugadoComplemento ortogonalConcatenacionConceptos localesCondiciones de Cauchy-RiemannConjunto abiertoConjunto cocienteConjunto compactoConjunto complementarioConjunto complementoConjunto densoConjunto densoConjuntos de BorelConjunto de las funciones trigonometricasConjunto de funciones suavesConjunto diferenciaConjunto parcialmente ordenadoConjunto potenciaConjunto universoConjunto vacioConexionConstantes de estructuraConvergeConvolucionCoordenadas nulasCoordenadas hiporbolicasCota superiorCota inferiorCriterio de comparacionCuadraturasCubiertaCurva

Page 367: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

20. INDICE ANALITICO 355

Curva integral de un vector

D

Delta de DiracDelta de KroneckerDerivadaDerivada exterior adjuntaDerivada de LieDesigualdad de BernoulliDeterminanteDiagramas de VennDiferencialDiension (vectorial)DistanciaDistancia canonicaDistancia discretaDiferencial exteriorDistancia maxDominio de definicionDominio de la cartaDominio integralDominio de valoresDos Forma de Curvatura

E

Ecuacion caracteristicaEcuacion de DifusionEcuacion de HelmholtzEcuacion de KillingEcuacion de LaplaceEcuacion de ondaEcuacion de PoissonEcuacion diferencial de HermiteEcuacion diferencial de LaguerreEcuacion diferencial de LegendreEcuacion diferencial ordinariaEcuacion lineal ordinaria de primer ordenEcuacion lineal ordinaria de segundo ordenEcuaciones elipticasEcuaciones hiperbolicasEcuaciones parabolicasElemento neutroEntornoEpimorfismoEscalar de RicciEspacio de BanachEspacio abiertos

Page 368: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

356 20. INDICE ANALITICO

Espacio baseEspacio cerradosEspacio conexoEspacio cotangenteEspacio con MedidaEspacio derechoEspacio de HausdorffEspacio de HilbertEspacio izquierdoEspacio de LorentzEspacio disconexoEspacio EuclidianoEspacio MedibleEspacio metricoEspacio metrizableEspacio metrico completoEspacio normalEspacio normadoEspacio ortogonalEspacio paracompactoEspacio Pseudo-EuclidianoEspacio PseudometricoEspacio PseudonormadoEspacio perpendicularEspacio regularEspacio tangenteEspacio topologicoEspacio totalEspacio vectorialEspacio UnitarioEspacios homeomorfosEspacios isomorfosEspacios topologicosEstructura diferenciableEigen valorEigen vector

F

Factor integranteFactores invariantesϕ−relacionadosϕ−invarianteFibra del hazFibra sobre un hazFinita por vecindadesForma ArmonicaForma canonica diagonalForma canonica

Page 369: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

20. INDICE ANALITICO 357

Forma CerradaForma CocerradaForma CoexactaForma ExactaForma de Maurer-CartanFull-backFrontera de una funcionFuncionFuncionFuncion abiertaFuncioon acotadaFuncion analıticaFuncion armonicaFuncion continuaFuncion continuaFuncion continuaFuncion exponencialFuncion holomorfaFuncion indicadoraFuncion medibleFuncion regularFuncion simpleFuncıon suaveFuncion suave en WFunciones ElementalesFuncion de GreenFunciones de transicionFunciones de transicionFunciones suaves en una vecindad

G

Grupo AbelianoGrupo ConmutativoGrupo de automorfismosGrupo de estructuraGrupo de isometrıasGrupo de LorentzGrupo OrtogonalGrupo TopologicoGrupo unitarioGrupo especial linealGrupo especial lineal complejoGrupo especial ortogonalGrupo especial unitarioGrupo uniparametrico de transformacion

H

Page 370: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

358 20. INDICE ANALITICO

Haces isomorficosHazHaz cotangenteHaz fibradoHaz fibrado principalHaz tangenteHaz trivialHaz vectorialHaz de HopfHaz de marcosHomomorfismoHomeomorfismo

I

Identidades de BianchiIdentidad de JacobiImagen de la cartaImagen de un conjunto bajo una funcionImagen inversa de un conjunto bajo una funcionImagen reciprocaImagen recıprocaInclusionInduccion matematicaIndices covariantesIndices contravariantesInfimoIntegral de GaussInterseccion de conjuntosInvariante bajo ϕInvariante por la izquierdaInvariante por la derechaInversa de una matrizInversion conformeInyectivaIsometrıaIsomorfismoI-esima funcion coordenadaI-esima funcion coordenada del sistema de coordenadas

L

LapacianoLaplacianoLazoLinealmente dependienteLinealmente independienteLımiteLocalmente finita

Page 371: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

20. INDICE ANALITICO 359

Loop1-forma1-forma

M

MapeoMapeo inversoMapeos linealesMatriz adjuntaMatriz antihermitianaMatriz antisimetricaMatriz asociada al polinomioMatriz caracteristicaMatriz cuasidiagonalMatriz de JordanMatrices de PauliMatriz diagonalMatriz hermitianaMatriz nilpotentes de grado nMatriz polinomialMatriz regularMatriz singularMatriz simetricaMatriz transpuestaMatriz triagonalMatrices equivalentesMatrices similaresMaximoMedidaMedida discretaMedida de DiracMedida de LebesgueMedida discreta de probabilidadMedida de probabilidadMedida discreta de probabilidadMetrica EuclideanaMetrica de Friedman-Robertson-WakerMetrizableMinimoModos normalesModuloMonoideMonomorfismoMonopolo de DiracMetodo de Gauss Jordan

N

Page 372: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

360 20. INDICE ANALITICO

NormaNorma EuclidianaNorma de LorentzN-formasN-formasNo pertenece al conjuntoNucleo

O

Operador adjuntoOperador d’AlabertianoOperador autoadjuntoOperador anti-autoadjuntoOperacion AsociativaOperacion binariaOperacion Invertible por la izquierdaOperacion Invertible por la derechaOperacion ConmutativaOperador * de HodgeOrden parcialOrtogonalesOrden

P

Parentesis de LieParte RealParte RealParte imaginariaParte imaginariaPertenece al conjuntoPolinomios de LegendrePolinomios de HermitePolinomios de LaguerrePolinomios de TchebichefPolinomios de JacobiPolinomios de GegenbauerPolinomios de Tchebichef de segunda clasePolinomios de LegendrePolinomios asociados de LaguerrePolinomio caraterizticoPolinomio minimoPolinomio caracteristico de la ecuacion diferencialPolinomios de BesselPolo de orden mPolo simplePotencia n-esima del conjuntoPrimera forma fundamental de Cartan

Page 373: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

20. INDICE ANALITICO 361

Producto entre clases de equivalenciaProducto escalarProducto internoProducto escalarProducto internoProducto escalarProducto cartesianoProducto de LieProducto tensorialPropiedad topologicaProyeccionProyeccion estereograficaPrueba del cocientePseudo-producto internoPull-backPull-back de tensores covariantesPunto singularPunto singular aisladoPunto de adherenciaPunto interiorP-formas

R

Radio de convergenciaRangoRealesnegativosRealespositivosRefinamientoRegion simplemente conexaRegion de conexion multipleReglade CramerReglasde MorganRelacionRelacion antireflexivaRelacion antisimetricaRelacion n-ariasobreRelacion binariaRelacion de equivalenciaRelacion de recurrenciaRelacion reflexivaRelacion transitivaRelacion simetricaReparametrizacionRepresentacion adjuntaRepresentacion de gruposRestriccion de mapeosRotacion conforme

Page 374: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

362 20. INDICE ANALITICO

S

SemicampoSegunda forma fundamental de CartanSerie de FourierSerie de FourierSeries de LaurentSerie de MaclaurinSerie de TaylorSeccionSimbolos de ChistoffelSemigrupoSignatura de la VariedadSingularidad removibleSingularidad evitableSistema completoSistema de coordenada local del hazSistema de coordenadasSistema de ecuaciones linealesSistema ortogonalSitema ortonormalSistema ortonormalSolucion unicamente determinadaSubanilloSubgrupoSubgrupo normalgrupoSubespacio VectorialSubconjuntoSubconjunto propioSubgrupo de LieSucesionSucesion de CauchySucesion convergenteSuperficie de RiemannSuryectivaSubgruposSubcubiertaSupremoSubespacio topologico

T

TensorTensor de CurvaturaTensor de EinsteinTensor de Levi-CivitaTensor de RicciTensor MetricoTetrada

Page 375: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

20. INDICE ANALITICO 363

Tetrada NulaTeorema de AbelTeorema de LaplaceTeorema de LeibnizTeorema del residuoTransformacion conformeTransformacion homograficaTransformada integralTransformada de LaplaceTransformada de FourierTransformada finita de FourierTransformacion de similaridadTransformaciones linealesTransformacion de dualidadTraslacion conformeTrayectoriaTrivializacion localTrazaTraslacion derechaTraslacion izquierdaTopologıa cocienteTopologıa discretaTopologıa inducidaTopologıa inducidaTopologıa indiscretaTopologıas de SierpinskiTopologıa relativa

U

Union de conjuntosUno-formas

V

Valor absolutoValor propioVariedad diferenciableVariedad EuclidianaVariedad LorenzianaVariedad PseudoriemannianaVariedad RiemannianaVariedad suaveVariedad suaveVariedades difeomorficasVariedad real de dimension nVariedad real diferenciableVector de KillingVector contravariant

Page 376: PRINCIPIOS MATEMATICOS´ PARA CIENCIAS EXACTAS´ Y …

364 20. INDICE ANALITICO

Vector covariantVector nuloVectores perpendicularesVector propioVector tangenteVector tipo espacioVector tipo nuloVector tipo tiempoVecindad

W

Wronskiano