239
INTRODUCCIÓN A LA TEORÍA DE CAMPOS CUÁNTICOS L. L. Salcedo Departamento de Física Atómica, Molecular y Nuclear, Universidad de Granada, E-18071 Granada, Spain E-mail: [email protected] 27 de mayo de 2020 Resumen Apuntes de la asignatura. Versión v3.35, 2010-2020. http://www.ugr.es/local/salcedo/public/tcc/curso.pdf Índice general 1 Teoría de campos clásicos 9 1.1 Invariancia Poincaré ...................................... 9 1.1.1 Notación relativista .................................. 9 1.1.2 Álgebras de Lie de Lorentz y Poincaré ........................ 13 1.2 Derivada funcional ....................................... 16 1.3 Formalismo lagrangiano .................................... 18 1.4 Formalismo canónico ..................................... 22 1.5 Simetrías ............................................ 26 1

INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

INTRODUCCIÓN A LA TEORÍA DE CAMPOS CUÁNTICOS

L. L. SalcedoDepartamento de Física Atómica, Molecular y Nuclear,

Universidad de Granada, E-18071 Granada, SpainE-mail: [email protected]

27 de mayo de 2020

Resumen

Apuntes de la asignatura. Versión v3.35, 2010-2020.http://www.ugr.es/local/salcedo/public/tcc/curso.pdf

Índice general

1 Teoría de campos clásicos 9

1.1 Invariancia Poincaré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.1.1 Notación relativista . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

1.1.2 Álgebras de Lie de Lorentz y Poincaré . . . . . . . . . . . . . . . . . . . . . . . . 13

1.2 Derivada funcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.3 Formalismo lagrangiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

1.4 Formalismo canónico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

1.5 Simetrías . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

1

Page 2: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

1.5.1 Transformaciones de simetría . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

1.5.2 Teorema de Noether . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

1.6 Simetrías cinemáticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

1.6.1 Traslaciones espacio-temporales . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

1.6.2 Rotaciones espacio-temporales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

1.7 Simetrías internas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

1.8 Corriente y acoplamiento gauge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

1.9 Generadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

2 Campo de radiación 42

2.1 Partículas idénticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

2.1.1 Espacio de Fock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

2.1.2 Operadores campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

2.1.3 Operadores de un cuerpo y dos cuerpos . . . . . . . . . . . . . . . . . . . . . . . 48

2.1.4 Orden normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

2.1.5 Segunda cuantización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

2.2 Ecuaciones de Maxwell e invariancia gauge . . . . . . . . . . . . . . . . . . . . . . . . . . 53

2.3 Cuantización del campo de radiación. Fotones. Espín del fotón . . . . . . . . . . . . . . . 59

2.3.1 Oscilador armónico cuántico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

2.3.2 Cuantización del campo de radiación . . . . . . . . . . . . . . . . . . . . . . . . . 60

2.3.3 Relaciones de conmutación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

2.3.4 Divergencias infrarroja y ultravioleta . . . . . . . . . . . . . . . . . . . . . . . . . 65

2

Page 3: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

2.4 Energía del vacío. Efecto Casimir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

2.5 Interacción radiación-materia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

2.5.1 Tratamiento clásico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

2.5.2 Tratamiento cuántico. Emisión espontánea . . . . . . . . . . . . . . . . . . . . . . 72

3 Campo de Klein-Gordon 76

3.1 Campo de Klein-Gordon real . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3.1.1 Cuantización del campo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

3.1.2 Invariancia relativista y unicidad del vacío . . . . . . . . . . . . . . . . . . . . . . 81

3.2 Campo de Klein-Gordon complejo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84

3.3 Cargas conservadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86

3.4 Simetrías internas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

3.5 Simetrías discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

3.5.1 Paridad en φ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

3.5.2 Paridad o inversión espacial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93

3.5.3 Conjugación de carga . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

3.5.4 Inversión temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

3.5.5 Transformación CPT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99

3.6 Relaciones de conmutación covariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

3.6.1 Propiedades generales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

3.6.2 Cálculo de ∆(x− y) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102

3.6.3 Microcausalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

3

Page 4: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

3.6.4 Ordenación cronológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106

3.6.5 Propagador de Feynman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

3.6.6 Cálculo del propagador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

3.7 Localizabilidad de partículas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

3.7.1 Interpretación del propagador de Feynman . . . . . . . . . . . . . . . . . . . . . . 110

3.7.2 Localizabilidad de partículas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

3.7.3 Operador posición para Klein-Gordon . . . . . . . . . . . . . . . . . . . . . . . . . 112

3.7.4 Operadores densidad de partículas y densidad de carga . . . . . . . . . . . . . . . 114

3.8 Conexión espín-estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

3.9 Representación de Schrödinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

3.9.1 Mecánica cuántica con número finito de grados de libertad . . . . . . . . . . . . . 115

3.9.2 Representación de Schrödinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116

3.9.3 Expresiones en una base ortonormal arbitraria . . . . . . . . . . . . . . . . . . . . 119

3.9.4 Espacio de Schrödinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

4 Campo de Dirac 124

4.1 Ecuación de Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124

4.2 Formulación lagrangiana del campo de Weyl . . . . . . . . . . . . . . . . . . . . . . . . . 127

4.3 Campo de Majorana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129

4.4 Ecuación de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130

4.5 Campo de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132

4.6 Soluciones tipo onda plana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134

4

Page 5: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

4.7 Relaciones de conmutación covariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

4.8 Paridad y conjugación de carga . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137

5 Campos con interacción 139

5.1 Diferencias con el caso libre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

5.2 Funciones de Green o de correlación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 141

5.3 Representación de Lehmann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

5.4 Funcional generador de las funciones de Green . . . . . . . . . . . . . . . . . . . . . . . . 148

5.4.1 Funcional generador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148

5.4.2 Operador de evolución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

5.4.3 Función de partición . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

5.5 Formulación basada en integración funcional . . . . . . . . . . . . . . . . . . . . . . . . . 153

5.5.1 Integral de caminos de Feynman . . . . . . . . . . . . . . . . . . . . . . . . . . . 154

5.5.2 Integral funcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155

5.5.3 Funcional generador de la teoría libre. Notación de DeWitt. . . . . . . . . . . . . . 157

5.6 Teorema de Wick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

5.7 Campo libre en presencia de una corriente . . . . . . . . . . . . . . . . . . . . . . . . . . 160

6 Teoría de perturbaciones 163

6.1 Fórmula de Gell-Mann–Low . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

6.2 Diagramas de Feynman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

6.2.1 Diagramas y reglas de Feynman para Z[J] . . . . . . . . . . . . . . . . . . . . . . 164

5

Page 6: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

6.2.2 Reglas de Feynman para G[J] . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167

6.2.3 Teorema del linked-cluster . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169

6.2.4 Reglas de Feynman para las funciones de Green . . . . . . . . . . . . . . . . . . . 170

6.2.5 Algunas relaciones estructurales diagramáticas . . . . . . . . . . . . . . . . . . . 170

6.3 Teoría φ 4 y otras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172

6.3.1 Reglas de Feynman en espacio de posiciones . . . . . . . . . . . . . . . . . . . . . 172

6.3.2 Reglas de Feynman en espacio de momentos . . . . . . . . . . . . . . . . . . . . . 174

6.3.3 Campos cargados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

6.3.4 Reglas de Feynman para QED . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

6.4 Tipos de diagramas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

6.4.1 Diagramas de vacío . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

6.4.2 Diagramas conexos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181

6.4.3 Diagramas de autoenergía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 182

6.4.4 Vértices irreducibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184

6.5 Ecuaciones de Schwinger-Dyson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 184

6.6 Acción efectiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

7 Matriz S 188

7.1 Fórmulas de reducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188

7.2 Amplitud invariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

7.3 Anchura de una partícula . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194

7.4 Interacción mediada por un potencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

6

Page 7: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

8 Teoría de campos en espaciotiempo euclídeo 200

8.1 Rotación de Wick . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200

8.2 Espacio euclídeo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

8.2.1 Tiempo imaginario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201

8.2.2 Acción euclídea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203

8.2.3 Funciones de correlación euclídeas . . . . . . . . . . . . . . . . . . . . . . . . . . 205

8.2.4 Formalismo euclídeo en espacio de momentos . . . . . . . . . . . . . . . . . . . . 206

8.3 Mecánica estadística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207

8.3.1 Relación con mecánica estadística clásica . . . . . . . . . . . . . . . . . . . . . . 207

8.3.2 Teoría de campos a temperatura finita . . . . . . . . . . . . . . . . . . . . . . . 208

9 Renormalización 209

9.1 Parámetros desnudos y renormalizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

9.2 Esquemas de regularización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211

9.3 Teoría regulada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214

9.4 Renormalización perturbativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217

9.5 Renormalizabilidad perturbativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223

9.6 Renormalización perturbativa a todos los órdenes . . . . . . . . . . . . . . . . . . . . . . 226

9.7 Renormalización no perturbativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229

9.7.1 Teoría regulada en el retículo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229

9.7.2 Límite del continuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231

9.8 Grupo de renormalización . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234

7

Page 8: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

9.8.1 Trivialidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234

9.8.2 Función beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235

9.8.3 Running de la constante de acoplamiento . . . . . . . . . . . . . . . . . . . . . . 237

8

Page 9: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

1 Teoría de campos clásicos

1.1 Invariancia Poincaré

1.1.1 Notación relativista

Usamos unidades c = 1. El espacio-tiempo (plano) es (isomorfo a) R4 en 3+1 dimensiones.

x = xµ = (t,x) = (t,x,y,z) ∈ R4. (1.1)

La cuatro componentes xµ , x0 = t, x1 = x, x2 = y, x3 = z, son la componentes contravariantes delcuadrivector x. Los índices griegos son espacio-temporales, µ = 0,1,2,3. Los índices latinos espaciales,i = 1,2,3.

La métrica de Minkowski es gµν = diag(+1,−1,−1,−1), es decir,

gµν =

+1, µ = ν = 0−1, µ = ν 6= 0

0, µ 6= ν

. (1.2)

También se usa la métrica con signo opuesto, que tiene varias ventajas, pero la usada aquí está másextendida en física de partículas.

Las componentes contravariantes de la métrica, gµν , están formadas por la matriz inversa de lascomponentes covariantes, gµν , es decir, gµαgαν = δµν . (Hay suma implícita sobre índices repetidos, eneste caso α.) En relatividad especial gµν y gµν tienen la misma matriz

gµν = gµν = diag(+1,−1,−1,−1), gµν = gµ

ν = δµν = diag(1,1,1,1) (1.3)

Usando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor yviceversa:

xµ = gµνxν = (t,−x) x0 = x0 = t, xi =−xi =−x . (1.4)

La norma al cuadrado y el producto escalar se definen usando la métrica de Minkowski:1

x · x = x2 = gµν xµxν = xµxµ = t2−x2 = t2− x2− y2− z2,

x · y = gµν xµyν = xµyµ = x0y0−x ·y.(1.5)

1No debe confundirse x2 = x · x con x2 = y. Ídem x cuadrivector con x = x1.

9

Page 10: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

(A menudo el punto del producto escalar es omite.) x2 representa el intervalo relativista entre el origen yel punto espacio-temporal x:

x2

> 0 separación tipo tiempo< 0 separación tipo espacio= 0 separación tipo luz

. (1.6)

Las transformaciones de Lorentz son las transformaciones lineales en el espacio-tiempo que dejan inva-riante el producto escalar (o equivalentemente la norma al cuadrado):

Λ : R4→ R4, x 7→ x′ = Λx, x′µ = Λµ

ν xν ,

xy = x′y′, gµνxµyν = gαβ x′αy′β = gαβ Λα

µ xµΛ

βν yν .

(1.7)

La invariancia requieregµν = gαβ Λ

αµ Λ

βν . (1.8)

En notación matricial G = ΛT GΛ. La ley de transformación de las componentes covariantes es

x′µ = (Λ−1)νµ xν = Λµ

ν xν , Λµν = gµαgβν

Λα

β = (Λ−1)νµ . (1.9)

Por su definición el conjunto de transformaciones forman el grupo matricial L =O(1,3), que es el grupode Lorentz completo. Es un grupo de Lie de dimensión 6 (en 3+1 dimensiones). La ley de composicióncorresponde al producto de matrices Λ12 = Λ1Λ2.

El grupo completo contiene rotaciones, boosts, reflexión espacial (paridad) e inversión temporal. Te-niendo en cuenta que det(AB) = detAdetB y detG = −1, se deduce que las transformaciones de Lorentzse dividen en dos tipos L = L+ ∪ L− de acuerdo con detΛ = ±1. Los elementos de L− se denominaninversiones. Por otro lado,

1 = g00 = gαβ Λα

0 Λβ

0 = (Λ00)

2− (Λ0i)

2, |Λ00| ≥ 1. (1.10)

Por tanto también hay dos tipos de transformaciones L = L↑∪L↓, ortocronas o antiortocronas, de acuerdocon Λ0

0 ≷ 0. El grupo de Lorentz completo contiene cuatro componentes conexas

L = L↑+∪L↑−∪L↓+∪L↓−. (1.11)

La componente L↑+ es un subgrupo, el grupo propio de Lorentz generado por rotaciones y boosts.Toda Λ ∈ L↑+ es de la forma Λ(θ,v) = B(v)R(θ). B(v) es el boost puro de velocidad v que actúa igual queΛ sobre (1,0):

Λ

(10

)= B

(10

)=

γv

), γ = (1−v2)−1/2. (1.12)

10

Page 11: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Por otro lado el grupo de las rotaciones está formado las transformaciones de Lorentz que dejan invarianteel vector (1,0). Es decir, R(θ) = B−1(v)Λ(θ,v) (que por construcción deja (1,0) invariante). θ = ωn,donde n es el eje de rotación (n2 = 1) y ω es el ángulo de rotación. Los boosts no forman un grupo en elcaso relativista. (Dos boosts puros sucesivos en la misma dirección producen un boost puro en la mismadirección, pero si no están la misma dirección se genera una rotación adicional.)

Las otras componentes de L se obtienen aplicando paridad e inversión temporal. Paridad o inversiónespacial es la transformación(

tx

)→ P

(tx

)=

(t−x

), P = diag(1,−1,−1,−1), PL↑↓± = L↑↓∓ . (1.13)

Obsérvese que en un espacio de dimensión arbitraria paridad se puede identificar con una reflexión quecambie el signo de un número impar de componentes de x. (Si se cambia un número par se obtiene unarotación.)

Inversión temporal es la transformación que cambia el sentido del tiempo:(tx

)→ T

(−tx

), T = diag(−1,1,1,1), T L↑↓± = L↓↑∓ . (1.14)

El conjunto de transformaciones que deja invariante el intervalo (x− y)2 entre dos sucesos x e y es elgrupo inhomogéneo de Lorentz o grupo de Poincaré, P = IO(1,3). Son transformaciones afines (Λ,a)

x→ Λx+a, Λ ∈ L, a ∈ R4. (1.15)

El grupo de Poincaré es el producto semidirecto del grupo de traslaciones espacio-temporales, x→ x+a, conel grupo de Lorentz. De su definición sobre R4 se deduce la ley de composición (Λ12,a12) = (Λ1,a1)(Λ2,a2),con Λ12 = Λ1Λ2 y a12 = a1 +Λ1a2.

Los objetos (sin índices) invariantes bajo transformaciones de Lorentz se denominan escalares (Lorentz).Por ejemplo, la norma al cuadrado, x2.

Los objetos que se transforman como x bajo transformaciones de Lorentz son cuadrivectores. Aµ →A′µ = Λµ

ν Aν , Aν = gµνAν , (A′)2 = A2. Por ejemplo, el cuadrimomento pµ = (E,p), donde E es la energíay p el momento. De modo que p2 = pµ pµ = E2−p2 = m2 es un escalar Lorentz.

Igualmente ∂µ =∂

∂xµes un cuadrivector:

∂′µ =

∂x′µ=

∂xν

∂x′µ∂ν = (Λ−1)ν

µ∂ν = Λµν∂ν . (1.16)

11

Page 12: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Correspondientemente el d’alambertiano 2= ∂µ∂ µ = ∂ 2t −∇2 es un escalar Lorentz.

Estas leyes de transformación son consistentes con las reglas de cuantización E→ i∂0, p=−i∇, que sepueden escribir en forma conjunta como pµ → i∂µ o (pµ → i∂ µ). Nótese que para x y p lo natural son lascomponentes contravariantes (xi son las componentes de x y pi son las de p), en cambio para la derivadalo natural son las componentes covariantes, ∂i son las componentes de ∇, mientras que ∂ i =−∇.

Por definición un tensor (respecto del grupo L↑+) con m índices contravariantes y n covariantesT µ1···µm

ν1···νn (los índices pueden estar ordenados de forma distinta) se transforma según2

T ′µ′1···µ ′m

ν ′1···ν ′n = Λµ ′1

µ1 · · ·Λµ ′mµmΛν ′1

ν1 · · ·Λν ′nνn T µ1···µm

ν1···νn , Λ ∈ L↑+ . (1.17)

La suma de tensores del mismo tipo produce otro tensor, Aµν +Bµν = Cµν , y lo mismo el producto,AµνBα

β =Cµνα

β . Los índices se pueden subir y bajar con la métrica. Contracción de un índice covariantecon uno contravariante produce un nuevo tensor: AµαBα

ν =Cµν . La derivada de un campo tensorial produceotro campo tensorial, ∂µAν(x) = Bµν(x).

La métrica es un tensor invariante (por definición de transformación de Lorentz):

gµν → g′µν = Λµα

Λνβ gαβ = gµν . (1.18)

Aparte de la métrica, sólo hay otro tensor básico invariante L↑+, el tensor de Levi-Civita εµναβ (cond+1 índices en d+1 dimensiones). Básico se refiere a que cualquier otro tensor invariante está construidocombinando gµν y εµναβ . El tensor de Levi-Civita se define por la propiedades: i) εµναβ es completamenteantisimétrico bajo permutación de índices. En particular, se anula si dos índices toman el mismo valor.Y ii) ε0123 = +1. Nótese que entonces ε0123 = −1. Esta elección de signo no es universal. εµναβ es unpseudo-tensor ya que es un tensor (invariante) bajo L↑+ pero cambia de signo bajo L−:

ε′µ ′ν ′α ′β ′ = Λµ ′

µΛν ′

νΛα ′

αΛβ ′

βεµναβ = det(Λ)εµ ′ν ′α ′β ′ =±εµ ′ν ′α ′β ′ . (1.19)

El producto de un número par de tensores de Levi-Civita es un tensor invariante y se puede escribir enfunción de la métrica:3

− εµ ′ν ′α ′β ′εµναβ = gµ ′µgν ′νgα ′αgβ ′β −·· · . (1.20)

La suma es sobre 4! permutaciones de (µναβ ), con signo menos si la permutación es par y con signomás si es impar. En general se usa tensor para un objeto con comportamiento tensorial bajo L y pseudo-tensor si en la transformación aparece detΛ. Así, si Fµν es un tensor, Fµν = 1

2 εµναβ Fαβ es un pseudo-tensor. El potencial vector A es un vector (o auténtico vector, o vector polar) y el campo magnético

2Nótese que Tµν = δµν no es un tensor, y sí lo es T µν = δµν .

3En efecto, el lado derecho es totalmente antisimétrico en µ,ν ,α,β y también en µ ′,ν ′,α ′,β ′, por tanto debe ser unmúltiplo del lado izquierdo.

12

Page 13: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

B = ∇×A (Bi = εi jk∂ jAk) es un pseudo-vector o vector axial. Bajo paridad A(x)→−A(−x), en cambioB(x)→+B(−x).

El cuadrivolumen subtendido por cuatro cuadrivectores A, B, C, D es εµναβ AµBνCαDβ . Por otro la-do A, B, C subtienden una hipersuperficie (subespacio tridimensional) Σ con cuadrivector normal σβ =εµναβ AµBνCα . Por construcción σµV µ = 0 para cualquier cuadrivector V en Σ. Interesa especialmente elcaso de cuadrivectores infinitesimales. Con paralelepípedos infinitesimales de dimensión n se puede cubriruna región Ω ⊂ R4 (n = 4) o una hipersuperficie (n = 3), etc. En particular, el elemento de cuadrivolu-men d4x corresponde a la celdilla con cuadrivectores (dx0,0,0,0), (0,dx1,0,0), (0,0,dx2,0), (0,0,0,dx3).Igualmente, la hipersuperficie t = cte tiene elemento de volumen dσµ = (d3x,0,0,0), así∫

R3d3xA0(x) =

∫Σ

dσµ Aµ(x). (1.21)

1.1.2 Álgebras de Lie de Lorentz y Poincaré

Para Λ ∈ L↑+ infinitesimal

Λµ

ν = gµν +δω

µν , Λ

T GΛ = G =⇒ δωµν =−δωνµ . (1.22)

La condición de antisimetría (válida análogamente para un grupo O(n,m)) indica que sólo hay 6 parámetrosindependientes, correspondientes a 3+3 de rotaciones y boosts.

Si D(Λ) es una representación de L↑+ en un espacio vectorial V , D(Λ1Λ2) = D(Λ1)D(Λ2), se tendrá

D(Λ) = e−i2 ωµν Jµν

, Jµν =−Jνµ . (1.23)

Los 6 operadores (en V ) Jµν son los generadores del grupo L↑+ en V . En el caso infinitesimal D(Λ) =1− i

2 δωµνJµν . El factor i es convencional de modo que si la representación es unitaria Jµν son operadoreshermíticos.4 El factor 1/2 es un factor de simetría, también convencional. Por ejemplo, en la representaciónD(Λ) = Λ en V = R4,

Λα

β = gαβ +δω

αβ = gα

β +12

δωµν(gµαgνβ −gναgµ

β ), (Jµν)αβ = i(gµαgν

β −gναgµβ ). (1.24)

En este caso cada uno de los 6 operadores Jµν son matrices 4×4. Esta representación no es unitaria.

Cualquiera que sea la representación, los generadores satisfacen las relaciones de conmutación delálgebra de Lie del grupo (y por tanto el álgebra se puede obtener de cualquier representación fiel):

[Jµν ,Jαβ ] = i(gναJµβ −gµαJνβ −gνβ Jµα +gµβ Jνα). (1.25)4El grupo de Lorentz propio es simple, conexo y no compacto, en consecuencia todas sus representaciones unitarias son de

dimensión infinita (excepto la representación trivial). De ahí que mecánica cuántica relativista requiere teoría de campos.

13

Page 14: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Extendamos el grupo de Lorentz al de Poincaré, x→Λx+a. Si D(Λ,a) es una representación del grupode Poincaré debe cumplir

D(Λ1,a1)D(Λ2,a2) = D(Λ1Λ2,a1 +Λ1a2). (1.26)

Actúa primero Λ y luego a, (Λ,a) = (1,a)(Λ,0). Entonces es costumbre expresar la representación entérminos de generadores como5

D(Λ,a) = eiaµ Pµ

e−i2 ωµν Jµν

. (1.27)

Pµ , el cuadrimomento, son los generadores infinitesimales del grupo de traslaciones.

El álgebra de Lie de Poincaré se puede obtener también a partir de una representación matricial usandouna representación en un espacio de 5 dimensiones:(

Λ a0 1

)(x1

)=

(Λx+a

1

). (1.28)

En todo caso, se obtiene para el álgebra de Lie

[Jµν ,Pα ] = i(gναPµ −gµαPν), [Pµ ,Pν ] = 0. (1.29)

En términos de una descripción espacio-temporal

H = P0, (P )i = Pi, (J)i =12

εi jkJ jk, (K)i = J0i . (1.30)

K genera los boosts y J , el momento angular, las rotaciones. Usamos simplemente Ji, Ki, εi jk para objetossin índices temporales. Nótese que con la signatura elegida para la métrica Pi no es (P )i = Pi sino −Pi.Las relaciones de conmutación se pueden reescribir

[Pi,P j] = [Pi,H] = [Ji,H] = 0,

[Ji,P j] = iεi jkPk, [Ji,K j] = iεi jkKk, [Ji,J j] = iεi jkJk,

[Ki,P j] =−iδi jH, [Ki,K j] =−iεi jkJk, [Ki,H] =−iPi.

(1.31)

El recubridor universal del grupo de Lorentz es SL(2,C). Es inmediato que los operadores

J± =12(J ± iK) := JL,R (1.32)

cumplen[J±,i,J±, j] = iεi jkJ±,k, [J±,i,J∓, j] = 0. (1.33)

5a y ω son coordenadas normales del grupo de traslaciones y de Lorentz respectivamente. Como para cualquier grupo deLie, es posible usar coordenadas normales globales para el grupo de Poincaré completo eia′µ Pµ− i

2 ωµν Jµν

, pero a′ no coincidirácon a.

14

Page 15: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Es decir, la complexificación del álgebra de Lie de Lorentz so(1,3) se descompone como la complexificaciónde su(2)⊕ su(2).6 Esto permite etiquetar las representaciones irreducibles del grupo propio de Lorentzmediante dos índices [ jL, jR] con jL,R entero o semientero (dimensión (2 jL + 1)(2 jR + 1)). Bajo paridadJ± → J∓ y por tanto [ jL, jR]→ [ jR, jL]. Hay dos representaciones irreducibles básicas (representacionesquirales) con las que se pueden construir las demás representaciones irreducibles de dimensión finita delgrupo de Lorentz:

[12,0] : J =

12σ, K =− i

2σ left,

[0,12] : J =

12σ, K =+

i2σ right.

(1.34)

Siendo σ las matrices de Pauli.

Ejemplo. Para una partícula de Dirac, con las gammas de Dirac, γµ = (γ0,γ), en la representaciónquiral

γ5 =

(1 00 −1

), γ

0 =

(0 11 0

), γ =

(0 −σσ 0

),

Jµν =i4[γµ ,γν ], J =

(12σ 00 1

), K =

( i2σ 00 − i

).

(1.35)

Por tanto el espacio de Dirac de dimensión 4 no es irreducible Lorentz, se reduce como [12 ,0]⊕ [0, 1

2 ]. Esteespacio es invariante bajo paridad. La representación vector, V µ , corresponde a [1

2 ,12 ]. ♦

Respecto de las representaciones irreducibles del grupo de Poincaré, hay dos operadores invariantesPoincaré que se pueden utilizar para clasificarlas, a saber, P2 y W 2. Estos dos operadores conmutan conlos generadores de Poincaré. P2 = PµPµ = M2 es la masa invariante al cuadrado. El otro invariante estárelacionado con el espín:

Wµ =12

εµναβ PνJαβ , (1.36)

es el vector de Pauli-Lubanski, W 2 =WµW µ .

Hay varios tipos de representaciones irreducibles unitarias de Poincaré propio, pero sólo las siguienteshan encontrado aplicación en física:

i) Pµ = Jµν = 0. Es la representación trivial del grupo y corresponde al estado vacío (estado fundamentalde la teoría de campos).

6Alternativamente, las soluciones irreducibles de dimensión finita del álgebra de JL,R se pueden elegir hermíticas (elección debase) y etiquetarlas con [ jL, jR]. J = JR +JL será hermítica (SU(2) compacto, representaciones de dimensión finita unitarias)y K = i(JR−JL) antihermítica (representaciones de Lorentz de dimensión finita no unitarias).

15

Page 16: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

ii) P2 = M2 > 0, P0 > 0, W 2 = −M2 j( j+ 1), con j = 0, 12 ,1, . . . Hay una representación irreducible de

este tipo por cada M (M > 0) y j. Se aplica a partículas masivas. En estas representaciones hay unsistema en el que P = 0, el sistema centro de masas. En este sistema W 0 = 0, W = MS, donde Ses el espín (J = L+S = S en este caso por P = 0). Los estados son de la forma |M, j;p,λ 〉 conλ =− j,− j+1, . . . , j. p es el momento lineal y λ la helicidad (momento angular en la dirección delmomento lineal). E =+

√M2 +p2.

iii) P2 = 0, P0 > 0, λ = 0,±12 ,±1, . . . Hay una representación irreducible de este tipo por cada λ . Re-

presenta partículas sin masa. En este caso W µ = λPµ y λ es un invariante Poincaré (pseudo-escalar)que presenta la helicidad. Por este motivo hay un único valor de la helicidad en cada representaciónirreducible y no 2 j+1 como ocurre para partículas masivas. La base es |M = 0,λ ;p〉. E = |p|.

También hay representaciones taquiónicas, con M2 < 0, que violan causalidad, y otras.

1.2 Derivada funcional

Una función es una aplicación f : A→ B. Suele usarse el nombre función cuando A es Rn o Cn, o másgeneralmente cuando A es una variedad de dimensión finita. Por ejemplo f (x) con x ∈Rn. Se suele usar elnombre funcional cuando A es un conjunto de funciones (en el sentido anterior). Por ejemplo

A = ϕ : Ω⊂ Rn→ Rx 7→ ϕ(x)

, F : A→ Bϕ 7→ F [ϕ]

. (1.37)

El dominio Ω es común a todas las funciones ϕ. Se usa a veces [ϕ] en vez de (ϕ) para denotar dependenciasfuncionales. Usualmente B es R o C.

Ejemplo. Si ρ(x) (x ∈R3) es la densidad de partículas, el número de partículas, N[ρ] =∫

d3xρ(x),es un funcional de ρ.

Ejemplo. Hrad =12∫

d3x(E2(x)+B2(x)), la energía del campo de radiación, es un funcional de E(x)y de A(x).

Ejemplo. δx[ϕ] = ϕ(x) es la distribución delta de Dirac. Es un funcional lineal de ϕ, con un parámetrox. También suele escribirse δx[ϕ] =

∫dnyδ (y− x)ϕ(y).

El concepto de derivada funcional es una generalización del concepto de derivada parcial para funciones

ordinarias. Para una función ordinaria f : Rn → R y una variación x→ x+ δx, δ f (x) =n

∑i=1

∂ f (x)∂xi δxi +

16

Page 17: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

O(δx2). Por definición el coeficiente lineal en δxi es la derivada parcial, ∂i f (x).7

Análogamente, para un funcional, F : ϕ 7→ F [ϕ] consideramos una variación ϕ→ ϕ +δϕ. La variaciónes local (se anula fuera de cierto soporte). Esto induce una variación en F : δF [ϕ] = F [ϕ +δϕ]−F [ϕ]. ParaF diferenciable (por definición) δF [ϕ] =

∫dnxK(x)δϕ(x)+O(δϕ(x)2). La función K(x) depende de x y ϕ

y es la derivada funcional de F respecto de ϕ en x. Suele denotarse δF [ϕ]

δϕ(x). Así, para δϕ infinitesimal

δF [ϕ] =∫

dnxδF [ϕ]

δϕ(x)δϕ(x). (1.38)

Por tanto la derivada funcional mide la dependencia de F con respecto a una variación de ϕ(x) en unentorno de x.

Nótese que: i) δF [ϕ]

δϕ(x)no depende de la variación δϕ(x). ii) δF [ϕ]

δϕ(x)tiene dimensiones de [δF ][δϕ]−1[dnx]−1

(a diferencia de ∂i f (x) que tiene dimensiones [δ f ][dx]−1). iii) δϕ(x) es local. Esto quiere decir que se anulafuera de alguna región acotada que no incluye los límites del dominio de las funciones ϕ, en particular elsoporte de δϕ es interior al dominio Ω de las funciones ϕ, δϕ

∣∣∣∂Ω

= 0. Esto permite integrar por partessin guardar términos de superficie.

Ejemplo. Sea F [ϕ] =∫

Ωdnx f (ϕ(x),∂iϕ(x),x) para cierta función f .

δF [ϕ] =∫

Ω

dnx(

∂ f∂ϕ(x)

δϕ(x)+∂ f

∂ (∂iϕ(x))δ (∂iϕ(x))

)=∫

Ω

dnx(

∂ f∂ϕ(x)

δϕ(x)−∂i

(∂ f

∂ (∂iϕ(x))

)δϕ(x)

)+∫

Ω

dnx∂i

(∂ f

∂ (∂iϕ(x))δϕ(x)

).

(1.39)

Se ha usado que δ (∂iϕ(x)) = ∂i(δϕ(x)). El último término puede reescribirse∫∂Ω

dn−1Si∂ f

∂ (∂iϕ(x))δϕ(x) = 0. (1.40)

Es un término de superficie y se anula por δϕ = 0 en ∂Ω. Por tanto

δF [ϕ]

δϕ(x)=

∂ f∂ϕ(x)

−∂i

(∂ f

∂ (∂iϕ(x))

). (1.41)

(Hay suma implícita sobre i.) La derivada parcial ∂i externa en el segundo término se refiere a toda ladependencia en x, no sólo a la x explícita en f .

7Siempre suponemos que las funciones u objetos matemáticos considerados son suficientemente bien comportados, en estecaso f es diferenciable.

17

Page 18: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Otra forma de introducir la derivada funcional es discretizando x. Supongamos ϕ : Ω⊂ Rn→ R. Divi-dimos la región Ω en celdillas δΩi, i = 1,2, . . . (un número finito si Ω es acotado) cada una con volumenδVi, de modo que δΩi es un partición de Ω. Al final se toma el límite δVi → 0 (uniformemente). Acada celdilla se le asocia un valor representativo ϕi definido como (δVi)

−1∫

δΩi

dnxϕ(x) (u otro promedio

adecuado). La idea es que se ha sustituido un conjunto continuo de coordenadas ϕ(x) para describir lafunción (o campo) por un conjunto discreto ϕi. El funcional F [ϕ] se sustituye por una función de las ϕi,F(ϕ). Se espera recuperar la descripción detallada en el límite del continuo, δVi→ 0.

F [ϕ]→ F(ϕi), ϕ(x)→ ϕi, δ F = ∑i

∂ F(ϕ)

∂ ϕiδ ϕi = ∑

iδVi

1δVi

∂ F∂ ϕi

δ ϕi. (1.42)

En el límite del continuo

∑i

δVi→∫

Ω

dnx, δ ϕi→ δϕ(x),1

δVi

∂ F(ϕ)

∂ ϕi→ δF [ϕ]

δϕ(x). (1.43)

Algunas propiedades:

δ

δϕ(x)(aF +bG) = a

δFδϕ(x)

+bδG

δϕ(x),

δ (FG)

δϕ(x)=

δFδϕ(x)

G+FδG

δϕ(x),

δ

δϕ(x)δ

δϕ(y)F =

δ

δϕ(y)δ

δϕ(x)F,

δϕ(x)δϕ(y)

= δ (x− y).

(1.44)

1.3 Formalismo lagrangiano

Supongamos un sistema físico en d + 1 dimensiones descrito por campos reales φA(x), A = 1, . . . ,N.Los campos están definidos en cierta región V ⊂ Rd . El conjunto de funciones φA(x) es la configuración(espacial) del campo. Más generalmente los campos pueden ser complejos o tomar valores en espacios dematrices, o directamente en álgebras, grupos de Lie, etc. En su evolución temporal el sistema describirá uncamino en el espacio de configuraciones espaciales, φA(x) = φA(x, t), x ∈ Rd+1. φA(x) es la configuraciónespacio-temporal del campo.

El campo, con infinitos grados de libertad (N grados de libertad en cada punto x) es una idealización,y en todo caso es conveniente tratarlo como un caso límite de un sistema con grados de libertad discretos,

18

Page 19: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

que conocemos mejor. Como se ha descrito antes (al final de la sección ), discretizamos V en celdillasde tamaño δVi y asociamos un promedio de los campos en cada celdilla, φA,i. Posteriormente tomaremosel límite del continuo δVi → 0. Al sistema mecánico descrito por los grados de libertad φA,i se le asocia

un lagrangiano L(t) = L(φ , ˙φ , t) (con posible dependencia explícita en t). Aquí ˙

φA,i =dφA,i

dt. La acción del

sistema en el intervalo temporal [t1, t2]

W2,1(φ) =∫ t2

t1L(t)dt, (1.45)

es un funcional del camino φA,i(t) en el espacio de configuración discretizado. Las ecuaciones de movimientose obtienen aplicando el principio de Hamilton o de mínima acción: la acción debe ser invariante bajo unavariación de primer orden δ φA,i(t) que se anule en los extremos temporales:

δW2,1(φ) = 0, δ φA,i(t1) = δ φA,i(t2) = 0. (1.46)

Es una condición sobre φA,i(t). Para obtener las ecuaciones de movimiento, notemos que debido a que lavariación es local (en t), se aplica la definición de derivada funcional

δW2,1(φ) =∫ t2

t1dt

δWδ φA,i(t)

δ φA,i(t), (1.47)

donde la derivada funcional se refiere a φA,i(t) como funciones de t y hay suma implícita sobre A, i. Másexplícitamente, notando que la forma del lagrangiano es L(φ , φ) se puede aplicar ec. (1.41) para n = 1 (yextendida a varias variables). Las ecuaciones de movimiento son

0 =δW

δ φA,i(t)=

∂ L∂ φA,i

− ddt

∂ L

∂˙φA,i

. (1.48)

Son las ecuaciones de Euler-Lagrange, o de movimiento, para el sistema discretizado.

En el límite del continuo

L(φ , ˙φ , t)→ L[φ , φ , t], W2,1(φ)→W2,1[φ ] =

∫ t2

t1dt L[φ , φ , t]. (1.49)

El lagrangiano es un funcional de φA(x) y φA(x), como funciones de x. La acción es un funcional de φA(x)como función de x = (x, t). Para obtener las ecuaciones del movimiento en el continuo, se multiplican lasecuaciones de movimiento discretas ec. (1.48) por 1/δVi y se aplica ec. (1.43):

0 =δL

δφA(x)− d

dtδL

δ φA(x). (1.50)

19

Page 20: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

En la aplicación de ec. (1.43) se ha supuesto que las variaciones δφA(x) y δ φA(x) son locales, enparticular, se anulan en ∂V . Esto puede ocurrir porque haya condiciones periódicas de contorno de modoque ∂V es vacío, o V = Rd (todo el espacio) y los campos van a cero en el infinito, o tienen condicionesde contorno tipo caja en ∂V .

Las ecuaciones se pueden derivar directamente del principio de Hamilton extendido a campos. Loscampos φA(x) están definidos en una región Ω ⊂ Rd+1, que hasta ahora era V × [t1, t2], pero ahora supo-nemos arbitraria. Entonces el principio extendido requiere que bajo una variación infinitesimal de φA(x)(configuración espacio-temporal) que se anule en la frontera de Ω la acción quede invariante

δWΩ[φ ] = 0, δφA(x)∣∣∣∂Ω

= 0. (1.51)

Este requerimiento da lugar a las ecuaciones de movimiento (de nuevo la variación es local y da lugar a laderivada funcional):

0 =δW

δφA(x). (1.52)

Nótese que esta ecuación no requiere que exista un lagrangiano. Otra observación es que las ecuaciones delcaso qi(t) (número finito de grados de libertad) se reobtienen considerándolo como una teoría de camposen 0+1 dimensiones, donde el espacio-tiempo es sólo t, y qi(t) son una colección de campos.

Veamos que este principio nos lleva a las mismas ecuaciones ec. (1.50). La condición δφA(x)∣∣∣∂Ω

= 0 se

satisfacía ya, dado que Ω =V × [t1, t2] con δφA(x, t1) = δφA(x, t2) = 0 y también δφA(x, t)∣∣∣∂V

= 0. Entonces

δWΩ[φ ] =∫ t2

t1dt δL[φ , φ , t] =

∫ t2

t1dt∫

Vddx

(δL

δφA(x)δφA(x)+

δLδ φA(x)

δ φA(x)

)=∫ t2

t1dt∫

Vddx

(δL

δφA(x)− d

dtδL

δ φA(x)

)δφA(x).

(1.53)

Efectivamente δWΩ[φ ] = 0 implica ec. (1.50).

En la práctica los lagrangianos de campos que se consideran son locales, es decir, de la forma

WΩ[φ ] =∫

Ω

dd+1xL (φ(x),∂φ(x),x). (1.54)

L (x) es la densidad lagrangiana. ∂φ(x) se refiere a ∂µφ(x), las derivadas parciales respecto de x. Laformulación hasta ahora es válida en general, pero en teoría relativistas ∇φ debe aparecer de forma simétricacon φ = ∂tφ . Incluso en teorías no relativistas, las derivadas espaciales aparecen de forma natural: laaparición de ∂tφ (a través de la energía cinética) indica que cuesta energía deformar φA(x) en sentidotemporal. Del mismo modo cuesta energía deformarlo en sentido espacial y eso introduce ∇φA. No se

20

Page 21: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

consideran densidades lagrangianas con derivadas de orden superior del mismo modo que no aparece qi enel lagrangiano en mecánica. Que la acción sea local indica que si Ω1∩Ω2 = /0, WΩ1∪Ω2 =WΩ1 +WΩ2 y nohay acción a distancia (evitar que la haya es precisamente el motivo de introducir teoría de campos).8

Para una teoría local, la derivada funcional en ec. (1.52) puede calcularse en forma más explícita poraplicación de ec. (1.41):9

0 =∂L (x)∂φA(x)

−∂µ

(∂L (x)

∂ (∂µφA(x))

). (1.55)

Son las ecuaciones de Euler-Lagrange, o de movimiento, de la teoría de campos.10 De nuevo la ∂µ externadel segundo término actúa sobre toda la dependencia en x no sólo la x explícita en L (en ese sentido laderivada es total y a veces se usa la notación Dµ).

Ejemplo. Consideremos la teoría de Klein-Gordon real, φ(x) ∈ R:

L (x) =12

∂µφ(x)∂ µφ(x)− 1

2m2

φ2(x). (1.56)

En este caso11

∂L (x)∂φ(x)

=−m2φ(x),

∂L (x)∂ (∂µφ(x))

= ∂µ

φ(x), (1.57)

y las ecuaciones de Euler-Lagrange quedan

(∂µ∂µ +m2)φ(x) = 0. (1.58)

Ésta es la denominada ecuación de Klein-Gordon. El parámetro m≥ 0 es la masa del campo. ♦

Debe notarse que las ecuaciones de movimiento no determinan W [φ ] o L (x) de forma unívoca, ya quedos densidades lagrangianas L (x) y L ′(x) relacionadas mediante:

L ′(x) = L (x)+∂µΛµ(φ(x),x) (1.59)

producen las mismas ecuaciones (de nuevo ∂µ deriva toda la dependencia en x). Λµ es una función arbitrariade φ y x (pero no contiene ∂φ). Esto se puede verificar directamente en ec. (1.55). Alternativamente, seve notando que la nueva contribución a la acción es un término de superficie:∫

Ω

dd+1x∂µΛµ(φ(x),x) =

∫∂Ω

ddσµ Λ

µ(φ(x),x). (1.60)

8La propia existencia de una lagrangiano, ec. (1.49) indica una localidad en sentido temporal: la acción en un intervalotemporal es la suma de la acciones en los subintervalos. Una ejemplo de un término no local sería

∫dtddx1ddx2V (x1 −

x2)φ(x1, t)φ(x2, t).9El mismo resultado se obtiene con ec. (1.50).

10Nótese que la métrica de Minkowski no aparece realmente en la fórmula. Las ecuaciones son válidas en cualquier teoríade campos locales, relativistas o no.

11 ∂ (∂α φ∂ α φ)/(∂µ φ) = gαβ ∂ (∂α φ∂β φ)/(∂µ φ) = 2gαβ gµα φ∂β φ = 2∂ µ φ .

21

Page 22: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Esta acción no tiene derivada funcional y no cambia las ecuaciones de movimiento.

Si se tiene un par de campos reales φ1(x), φ2(x), se pueden formar dos campos complejos equivalentesφ(x), φ ∗(x):

φ(x) =1√2(φ1(x)+ iφ2(x)), φ

∗(x) =1√2(φ1(x)− iφ2(x)), (1.61)

de modo que las ecuaciones de movimiento

0 =∂L (x)∂φA(x)

−∂µ

(∂L (x)

∂ (∂µφA(x))

), A = 1,2 (1.62)

se pueden cambiar por las dos ecuaciones

0 =∂L (x)∂φ(x)

−∂µ

(∂L (x)

∂ (∂µφ(x))

), 0 =

∂L (x)∂φ ∗(x)

−∂µ

(∂L (x)

∂ (∂µφ ∗(x))

). (1.63)

Aquí φ(x) y φ ∗(x) se tratan como campos independientes (a efectos de derivadas parciales o funcionales).El factor 1/

√2 es convencional. Dado que L (x) es real las dos ecuaciones son conjugadas una de otra.12

En la práctica esta construcción sólo tiene interés si los campos tienen la misma naturaleza, por ejemploel mismo espín y la misma masa.

Ejemplo. Campo de Klein-Gordon complejo. Se tienen dos campos de Klein-Gordon reales de igualmasa m y desacoplados

L (x) =12(∂µφ1)

2− 12

m2φ

21 +

12(∂µφ2)

2− 12

m2φ

22 , (1.64)

en términos del campo complejo

L (x) = ∂µφ∗(x)∂ µ

φ(x)−m2φ∗(x)φ(x). (1.65)

φ(x) y φ ∗(x) y satisfacen la ecuación de Klein-Gordon ec. (1.58).

1.4 Formalismo canónico

Volvemos temporalmente a la versión discretizada. El momento canónico conjugado de la coordenadaφA,i es

πA,i =∂ L

∂˙φA,i

, (1.66)

12Para cualquier teoría, la acción debe ser real para que la condición de estacionaridad tenga solución dentro del campo deφA(x) reales. Si L (x) fuera complejo la solución de las ecuaciones ec. (1.63) produciría un “φ∗(x)” que no sería el conjugadode φ(x). Por otra parte, si se cambia la ecuación de φ∗(x) para que sea la conjugada de la de φ(x) resulta que no hay unaacción común de la cual deriven el par de ecuaciones modificadas.

22

Page 23: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

y el hamiltoniano esH(φ , π, t) = ∑

A,iπA,i

˙φA,i− L. (1.67)

Para que tenga buen límite al continuo, hay que escalar πA,i con 1/δVi

πA,i

δVi→ πA(x) =

δLδ φA(x)

. (1.68)

Entonces H también tiene buen límite

∑A,i

πA,i˙φA,i− L→ H[φ ,π, t] = ∑

A

∫V

ddxπA(x) φA(x)−L, (1.69)

y lo mismo las ecuaciones de Hamilton

˙φA,i(t) =

∂ H∂ πA,i

→ φA(x) =δH

δπA(x),

˙πA,i(t) =−∂ H

∂ φA,i→ πA(x) =−

δHδφA(x)

.

(1.70)

Nótese que en el formalismo canónico hay que eliminar las velocidades en función de los momentos canónicos(invirtiendo ec. (1.68) en el caso de campos). Las derivadas de H o L son respecto de φA(x) y πA(x) comofunciones de x (no x).

En el caso de una teoría local

H =∫

VddxH (φ(x),∇φ(x),π(x),x), H (x) = ∑

AπA(x)φA(x)−L (x), π(x) =

∂L

∂ φ(x). (1.71)

H (x) es la densidad hamiltoniana. Obsérvese que H (x) no contiene derivadas de π(x), y por tanto lasecuaciones de Hamilton se pueden escribir en la forma

φA(x) =∂H (x)∂πA(x)

, πA(x) =−∂H (x)∂φA(x)

+∇

(∂H (x)

∂ (∇φA(x))

). (1.72)

De nuevo, todas estas fórmulas valen para un sistema de campos cualesquiera. En el caso de un sistemacon covariancia relativista, el formalismo lagrangiano mantiene esa simetría explícita (W es invarianteLorentz y L (x) es un escalar Lorentz). En cambio el formalismo canónico no es manifiestamente covariante.En realidad H no un invariante Lorentz sino la componente temporal de un cuadrivector.

Ejemplo. Para el campo de Klein-Gordon real ec. (1.56), el momento canónico y la densidad hamilto-niana son

π(x) =∂L

∂ φ(x)= φ(x), H (x) =

12(π

2(x)+(∇φ(x))2 +m2φ

2(x)). (1.73)

23

Page 24: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Las ecuaciones de Hamilton son

φ(x) = π(x), π(x) = ∇2φ(x)−m2

φ(x). (1.74)

Estas dos ecuaciones son equivalentes a la ecuación de Klein-Gordon (∂µ +m2)φ(x) = 0. ♦

Para campos complejos φ(x), φ ∗(x)13

π(x) =∂L (x)∂ φ ∗(x)

=1√2(π1(x)+ iπ2(x)), π

∗(x) =∂L (x)∂ φ(x)

=1√2(π1(x)− iπ2(x)),

H (x) = π1(x)φ1(x)+π2(x)φ2(x)−L (x) = π∗(x)φ(x)+π(x)φ ∗(x)−L (x).

(1.75)

Ejemplo. Para el campo complejo de Klein-Gordon, ec. (1.65),

π(x) = φ(x), π∗(x) = φ

∗(x),

H (x) = π∗(x)π(x)+∇φ

∗(x) ·∇φ(x)+m2φ∗(x)φ(x).

(1.76)

Para construir el paréntesis de Poisson empezamos en el sistema discretizado. Dados dos funcionalesF [φ ,π] y G[φ ,π] (que también pueden depender del tiempo) expresados en las variables canónicas, y susversiones discretizadas,

F , G= ∑A,i

(∂ F

∂ φA,i

∂ G∂ πA,i

− ∂ F∂ πA,i

∂ G∂ φA,i

). (1.77)

Añadiendo los factores δVi y tomando el límite del continuo, se obtiene la versión para campos:

F,G= ∑A

∫V

ddx(

δFδφA(x)

δGδπA(x)

− δFδπA(x)

δGδφA(x)

). (1.78)

Usando las identidades

δφA(x)

δφB(y)= δABδ (x−y),

δπA(x)

δπB(y)= δABδ (x−y),

δφA(x)

δπB(y)=

δπA(x)

δφB(y)= 0, (1.79)

Se comprueba que13En la literatura también se utiliza el convenio alternativo π = ∂L /∂ φ , π∗ = ∂L /∂ φ∗.

24

Page 25: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

i) La ecuaciones de Hamilton se pueden reescribir

φA(x) = φA(x),H, πA(x) = πA(x),H. (1.80)

Más generalmente, para un observable cualquiera

dFdt

= F,H+ ∂F∂ t

. (1.81)

ii) Se satisfacen las relaciones canónicas

φA(x),φB(y)= πA(x),πB(y)= 0, φA(x),πB(y)= δABδ (x−y). (1.82)

Para un campo complejo

F,G=∫

Vddx(

δFδφ(x)

δGδπ∗(x)

− δFδπ∗(x)

δGδφ(x)

+δF

δφ ∗(x)

δGδπ(x)

− δFδπ(x)

δGδφ ∗(x)

)φ(x),π∗(y)= φ ∗(x),π(y)= δ (x−y).

(1.83)

Los restantes paréntesis de Poisson canónicos se anulan.

Ejemplo. La función de onda de una partícula no relativista se puede ver como un campo complejocon ecuación de Schrödinger como ecuación de movimiento. La ecuación (usamos unidades h = 1)

i∂tψ(x) =− 12m

∇2ψ(x)+V (x)ψ(x) (1.84)

y su conjugada, con campos ψ(x) y ψ∗(x), derivan del lagrangiano

L (x) = ψ∗(x)

(i∂t +

12m

∇2−V (x)

)ψ(x). (1.85)

Integrando por partes se ve que la acción correspondiente es real si V (x) lo es. Por tanto esta densidadlagrangiana difiere de una real por un término de superficie, a saber, i

2∂t(ψ

∗(x)ψ(x))+1

2m∇(ψ∗(x)∇ψ(x)):

L ′(x) =i2(ψ∗(x)ψ(x)− ψ

∗(x)ψ(x))− 12m

∇ψ∗(x) ·∇ψ(x)−V (x)ψ∗(x)ψ(x). (1.86)

Ambas formas son equivalentes. Usamos la primera por simplicidad.

El formalismo lagrangiano, y en particular las ecuaciones de Euler-Lagrange, no presenta problemas.No es el caso para el formalismo hamiltoniano o canónico. Para los momentos canónicos se encuentra

π∗(x) =

∂L (x)∂ψ(x)

= iψ∗(x), π(x) =∂L (x)∂ψ∗(x)

= 0. (1.87)

25

Page 26: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Claramente no se puede proceder a eliminar las velocidades en función de los momentos canónicos. Elproblema proviene de que el lagrangiano es lineal en las velocidades y persiste usando la forma L ′(x). Enrealidad sólo hay dos campos complejos independientes que son ψ y π∗ (o ψ∗), en vez de cuatro ψ, ψ∗,π, π∗. Es decir, hay la mitad de grados de libertad de los aparentes. Teniendo en cuenta esto se puedeproceder a hacer el formalismo canónico:

H (x) = π∗(x)ψ(x)−L (x) =−iπ∗(x)

(− 1

2m∇

2 +V (x))

ψ(x),

ψ(x),ψ(y)= π∗(x),π∗(y)= 0, ψ(x),π∗(y)= δ (x−y).

(1.88)

Las ecuaciones de Hamilton salen ahora correctamente14 y reproducen la ecuación de Schrödinger y suconjugada.

También se puede trabajar con ψ(x) y ψ∗(x) (en vez de π∗(x)):

H (x) = π∗(x)ψ(x)−L (x) = ψ

∗(x)(− 1

2m∇

2 +V (x))

ψ(x),

ψ(x),ψ(y)= ψ∗(x),ψ∗(y)= 0, ψ(x),ψ∗(y)=−iδ (x−y).

(1.89)

Nótese que H = 〈H〉ψ (siendo H el hamiltoniano del campo clásico y H el operador hamiltoniano de lapartícula cuántica.) ♦

1.5 Simetrías

1.5.1 Transformaciones de simetría

Sea un sistema dinámico, cuyo estado está descrito por la configuración (espacio-temporal) de loscampos clásicos reales φA(x), A = 1, . . . ,N, y la dinámica viene dada por una acción W [φ ] que suponemoslocal, es decir,

WΩ[φ ] =∫

Ω

d4xL (x), (1.90)

donde la densidad lagrangiana L (x) es una función (no funcional) de φA(x), ∂µφA(x) y x. El caso deconfiguraciones definidas sobre otras variedades se puede reducir a éste.

Una transformación (activa) del campo es una aplicación invertible g, que supondremos suficientemen-te continua, tal que a cada configuración espacio-temporal φ le hace corresponder una nueva configuración,φ g. Las transformaciones forman un grupo.

14Teniendo en cuenta que H (x) contiene una dependencia inusual en ∇2ψ(x), o por partes, contiene ∇π∗(x).

26

Page 27: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

La transformación es de simetría (en sentido amplio) si deja invariante el subconjunto de configura-ciones espacio-temporales que son soluciones de las ecuaciones de movimiento, es decir, si

δW (ϕ)

δϕ(x)

∣∣∣ϕ=φ

= 0 implica δW (ϕ)

δϕ(x)

∣∣∣ϕ=φ g

= 0. (1.91)

Si denotamos por M el conjunto de configuraciones del sistema y por S ⊂M el subconjunto de soluciones,una simetría (en sentido amplio) es una transformación invertible g de M en M , que deja invariante S .También las transformaciones de simetría forman un grupo, el grupo de simetría del sistema.

Nota: Hay que advertir que la simetrías que acabamos de definir son más concretamente simetrías dela dinámica. En cierto sentido más laxo toda transformación realizable sobre el sistema es una simetría.Por ejemplo, supongamos un sistema de partículas cargadas que se mueven en un plano. El grupo derotaciones tridimensionales SO(3) no define un grupo de transformaciones. SO(3) no es realizable en estesistema (por lo menos no en ninguna forma natural interpretable como una auténtica rotación). En cambioel grupo de rotaciones planas SO(2) sí lo hace. Es una simetría del plano que induce una correspondientesimetría en la variedad formada por el espacio de configuración de las partículas. Si no hay campos externosaplicados, SO(2) debe ser también una simetría de la dinámica: si una trayectoria es solución, la trayectoriarotada también lo será (evolución y rotación conmutan). Si hay campos externos aplicados y consideramosdos conjuntos de condiciones iniciales rotadas unas respecto de otras, las trayectorias correspondientes noestarán relacionas por una rotación si los campos externos son fijos, pero sí lo estarán si al mismo tiemporotamos los campos externos. Esto es una consecuencia de la simetría SO(2) subyacente. Por tanto, amenudo se denomina de simetría (en sentido más amplio) a cualquier transformación realizable sobre elsistema.

Sólo vamos a considerar transformaciones locales y continuas, es decir, del tipo:

φgA(x

g) = FgA (x,φ(x)), xg = f g(x). (1.92)

Aquí F y f son funciones suficientemente diferenciables de x y φ(x) (no funcionales generales de φ , poreso la transformación es local). La transformación activa es

φA(x) 7−→g

φgA(x) = Fg

A (xg−1

,φ(xg−1)). (1.93)

Cuando xg = x se dice la transformación es interna.

Para transformaciones locales conviene usar una definición más restringida de simetría, que esencial-mente es que la densidad lagrangiana se transforme igual que el campo pero (casi) escalarmente. A saber,diremos que la transformación local g es de simetría cuando

∀φ ,∀x L [φ g](x) = Jg(x)L [φ ](xg−1) Jg(x) =

∣∣∣det(

∂ (xg−1)µ/∂xν

)∣∣∣ (1.94)

27

Page 28: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Jg(x) es el determinante jacobiano del cambio de variable xg−1(x), es decir, el cociente entre elementos

de cuadrivolumen d4xg−1 y d4x. Aquí estamos considerando un punto de vista activo. L (x) es conocidopara cualquier configuración φ(x) y denotamos esa dependencia con L [φ ](x). L [φ g](x) es la densidadlagrangiana en x cuando la configuración es φ g(x).

Esta condición equivale a

∀φ ,∀x L [φ g](xg) = Jg(xg)L [φ ](x) (1.95)

y tambiénWΩg [φ g] =WΩ[φ ] ∀Ω⊂ R4 ∀φ (1.96)

siendo Ωg es la región transformada de Ω por x→ xg. Es decir, que la acción sea invariante.

En el caso particular de una transformación interna la condición es simplemente que la densidad la-grangiana sea invariante,

∀φ ,∀x L [φ g](x) = L [φ ](x) (1.97)

Una situación más general que la indicada en (1.94) es

L [φ g](xg) = Jg(xg)L [φ ](x)+Dg(x) (1.98)

(Dg(x) es local, depende de x, φ(x) y ∂φ(x), igual que L (x).) En general la presencia del nuevo términohace que g no sea una simetría (transforme soluciones en soluciones). Una excepción es cuando Dg(x) esun término de superficie, ∂µΛgµ(x), ya que en este caso no influye en las ecuaciones de movimiento.

1.5.2 Teorema de Noether

Primero consideremos qué ocurre con la densidad lagrangiana al hacer una transformación infinitesimalφA(x)→ φA(x)+ δφA(x). Aquí tanto la configuración φA(x) como la variación δφA(x) son completamentearbitrarias. La variación de la densidad lagrangiana tiene la forma general

δL (x) = δw(x)+∂µδ jµ(x) (1.99)

donde δ jµ(x) y δw(x) no contienen derivadas de δφ(x). Esta forma se consigue de manera sistemáticamediante integración por partes.

Por ejemplo, para un campo complejo de Klein-Gordon

L (x) = ∂µφ∗∂

µφ −m2

φ∗φ , (1.100)

se varían φ y φ ∗:δL (x) = ∂µδφ

∗∂

µφ +∂µφ

∗∂

µδφ −m2

δφ∗φ −m2

φ∗δφ . (1.101)

28

Page 29: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

A continuación (siempre se hace igual) se integran por partes las derivadas sobre las variaciones δφ y δφ ∗

δL (x) = ∂µ(δφ∗∂

µφ)−δφ

∗∂µ∂

µφ +∂

µ(∂µφ∗δφ)−∂

µ∂µφ

∗δφ −m2

δφ∗φ −m2

φ∗δφ . (1.102)

Por tanto en este caso obtenemos

δw(x) =−δφ∗(∂µ∂

µφ +m2

φ)− (∂ µ∂µφ

∗+m2φ∗)δφ , (1.103)

δ jµ(x) = δφ∗

∂µ

φ +∂µ

φ∗

δφ . (1.104)

En la medida que L (x) es de la forma L (φ(x),∂φ(x),x) (sólo hay derivadas primeras de φ(x)) lacorriente δ jµ(x) está definida de manera unívoca por integración por partes. Nótese que ∂µδ jµ(x) esun término de superficie y no contribuye a las ecuaciones de movimiento. Éstas vienen dadas entoncestotalmente por δw(x). No es difícil probar que

δw(x) = ∑A

δW [φ ]

δφA(x)δφA(x) (1.105)

De hecho éste es el método más práctico para obtener las ecuaciones de movimiento de una teoría (es decir,calcular una variación infinitesimal general, más que usar (1.55)).15 Análogamente una expresión explícitapara δ jµ(x) es

δ jµ(x) = ∑A

∂L (x)∂ (∂µφA(x))

δφA(x) (1.106)

Supongamos ahora que φA(x) es completamente general pero δφA(x) es una transformación infinitesimalde simetría. Eso requiere que la transformación de simetría considerada forme parte de un grupo de Lie.En este caso se satisface (1.94). Sea

xg = x+δx, xg−1= x−δx, (1.107)

Usando la igualdad de Jacobi para matrices deteA = etr(A) se deduce det(1+δA) = 1+ tr(δA) y por tanto

Jg(x) = det(gµ

ν −∂µδxν)= 1−∂µ(δxµ) (1.108)

Por otro ladoL [φ ](xg−1

) = L (x−δx) = L (x)−δxµ∂µL (x) (1.109)

En conjunto (1.94) implica

δL (x) =−δxµ∂µL (x)−∂µ(δxµ)L (x) =−∂µ

(δxµL (x)

)(1.110)

15Como ilustración considérese calcular las ecuaciones de movimiento de L (x) = tr(∂µU†(x)∂ µU(x)

)donde el campo U(x)∈

U(n).

29

Page 30: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

En particular, para una simetría interna δL (x) = 0. En todo caso, para una simetría δL (x) es un términode superficie.

El teorema de Noether se obtiene al combinar este resultado con (1.99),

δL (x) = δw(x)+∂µδ jµ(x) =−∂µ

(δxµL (x)

)(1.111)

Implica que cuando δφA(x) es de simetría y φA(x) satisface las ecuaciones de movimiento (de modo queδw(x) = 0) la corriente infinitesimal

δJµ = δ jµ(x)+δxµL (x) (1.112)

es conservada∂µδJµ = 0 (1.113)

Este es el teorema de Noether, hay una corriente conservada por cada parámetro en el grupo de Lie detransformaciones de simetría. δJµ(x) es la corriente canónica o de Noether.

En el ejemplo del campo complejo de Klein-Gordon, el lagrangiano es invariante bajo φ → e−iαφ ,φ ∗→ eiαφ ∗, si α es real y constante. En este caso

δφ =−iδαφ , δφ∗ = iδαφ

∗, δJµ = iδα(φ ∗ ∂µ

φ −∂µ

φ∗

φ) = δα Jµ , (1.114)

y en efecto la corriente es conservada

∂µJµ(x) = φ∗∂µ∂

µφ −φ∂µ∂

µφ∗ = 0 (1.115)

usando las ecuaciones de movimiento (∂µ∂ µ +m2)φ = 0 y su conjugada.

En el caso más general de (1.98)

δL (x) =−∂µ

(δxµL (x)

)+δD(x) (1.116)

que implica (cuando el campo satisface las ecuaciones de movimiento)

∂µδJµ(x) = δD(x) (1.117)

Usando (1.106) se tiene una expresión explícita para la corriente (con suma implícita sobre A)

δJµ(x) =∂L (x)

∂ (∂µφA(x))δφA(x)+δxµL (x) (1.118)

La variación del campo φ g(x) tiene dos contribuciones, una porque Fg se aparta infinitesimalmente de laidentidad, y otra porque x varía a x−δx. Conviene separar ambas contribuciones:

δφ(x) = δ φ(x)−δxµ∂µφ(x), (1.119)

30

Page 31: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

y la corriente canónica toma la forma

δJµ(x) =∂L (x)

∂ (∂µφA(x))δ φA(x)+δxν

(gµ

ν L (x)− ∂L (x)∂ (∂µφA(x))

∂νφA(x))

(1.120)

La ecuación ec. (1.117) es una ecuación de continuidad para δJµ(x) con δD(x) actuando como fuenteo sumidero. La carga (infinitesimal) asociada a la región espacial fija V es

δQV (t) =∫

Vd3xδJ0(x) (1.121)

y cumple

ddt

δQV (t) =∫

Vd3x∂0δJ0(x) =

∫V

d3x(δD(x)−∂iδJi(x)) =∫

Vd3xδD(x)−

∫∂V

d2Si δJi(x). (1.122)

Por tanto la carga en todo el espacio es conservada si la transformación es una simetría (δD(x) = 0)y no hay flujo hacia el infinito (δJi(x) cae suficientemente deprisa en el infinito). Cuando no se especificaotra cosa, la carga δQ se refiere a la carga en todo el espacio:

ddt

δQ(t) =∫

d3xδD(x). (1.123)

Cuando la carga se conserva la integral es independiente de la superficie espacial (completa):

δQ =∫

Sd3

σµ δJµ(x). (1.124)

Supongamos que la transformación infinitesimal que hemos considerado hasta ahora forma parte deun grupo de Lie cuyos elementos están caracterizados por n parámetros εa, a = 1, . . . ,n, independientesde x. Estas se denominan transformaciones globales. Siempre se elige el sistema de coordenadas en elgrupo de modo que 0 corresponde al elemento neutro (transformación identidad). Para g infinitesimal losparámetros δεa son infinitesimales. Entonces

δxµ(x) = X µa (x)δε

a,

δφA(x) = ΦaA(x)δεa = ΦaA(x)δε

a−X µa (x)∂µφA(x)δε

a,

δD(x) = Da(x)δεa.

(1.125)

Se obtienen n corrientes de Noether (finitas) asociadas

Jµa (x) =

∂L (x)∂ (∂µφA(x))

ΦaA(x)+Xνa (x)

(gµ

ν L (x)− ∂L (x)∂ (∂µφA(x))

∂νφA(x)), (1.126)

31

Page 32: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

y n cargas (finitas) asociadasQa(t) =

∫d3xJ0

a (x), (1.127)

con las correspondientes ecuaciones de conservación

∂µJµa (x) = Da(x),

ddt

Qa =∫

d3xDa(x). (1.128)

Obsérvese que la ecuaciones anteriores no dependen de que el sistema sea relativista. La métrica noaparece en ningún momento (gµ

ν = δµν). Además todo lo anterior puede repetirse para D+1 dimensiones.

Hemos establecido el teorema de Noether: hay una carga conservada por cada generador de un grupode Lie de simetría.

Una observación importante es que, la corriente de Noether se puede redefinir (y deja de ser la corrientede Noether o canónica) sin que cambie ∂µδJµ(x) ni la carga asociada:

δJ′µ(x) = δJµ(x)+∂νδΛµν(x), δΛ

µν(x) =−δΛνµ(x). (1.129)

(La carga no cambia si δΛ0i(x) cae suficientemente deprisa en infinito.) Esta ambigüedad afecta a ladensidad de carga y de corriente y hay que fijarla usando otros criterios.

Obsérvese que las corrientes de la forma

δJµ(x) = ∂νδΛµν(x), δΛ

µν(x) =−δΛνµ(x) (1.130)

se conservan idénticamente, es decir, sin usar la ecuaciones de movimiento. Se denominan corrientestopológicas ya que llevan asociadas cargas topológicas bajo condiciones de contorno adecuadas.

Ejemplo. Sea el campo ω(x) que toma valores en U(1), ω(x)= eiθ(x), θ(x) real, en en 1+1 dimensionescompactificadas en la dirección espacial, x1 ∈ [0,L). Con lagrangiana

L (x) =12

∂µω−1(x)∂ µ

ω(x)+V (ω(x)) =12

∂µθ(x)∂ µθ(x)+V (eiθ(x)).

El campo complejo ω(x) es periódico, ω(x, t) = ω(x+ L, t) y derivable en todos los puntos para que laenergía cinética sea finita. El campo real θ(x) sólo es periódico módulo 2π, θ(x, t) = θ(x+ L, t)+ 2πn.Este n ∈ Z (el winding number de ω(x)) es un invariante topológico: no puede cambiarse sin pasar porconfiguraciones de energía infinita. La corriente topológica asociada es

Jµ(x) =− i2π

εµν

ω−1(x)∂νω(x) =

12π

εµν

∂νθ(x), ε01 =+1,

32

Page 33: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Q =∫ L

0

dx2π

∂xθ(x, t) =1

2π(θ(L)−θ(0)) = n.

Otra observación es que si δD(x) no se anula pero es un término de superficie, todavía hay una simetríay un corriente conservada,

δD(x) = ∂µΛµ(x), δJ′µ = δJµ −δΛ

µ , ∂µδJ′µ = 0 (1.131)

Ejemplo. Sea una partícula libre no relativista en D dimensiones espaciales. Este sistema se puede vercomo una teoría de campos en 0+ 1 dimensiones con D campos , que corresponden a la posición de lapartícula, xi(t), i = 1, . . . ,D. La acción es

W =∫

dt L (t), L (t) =12

mx2(t)

y ecuaciones de movimientoδW

δx(t)=− d

dt(mx(t)) =−mx(t) = 0

La transformación de Galileo (boost)

x(t)→ x(t)+vt, t→ t

es una simetría (interna pero dependiente de x) de las ecuaciones de movimiento. Estas transformacionesforman un grupo de Lie con D parámetros v (que son constantes respecto de t). La acción no es invariantepero cambia por un término de superficie:

L (t)→ 12

m(x(t)+v)2 = L (t)+ddt

(mvx(t)+

12

mv2t).

De la transformación infinitesimal

δx = δvt, δ t = 0, δΛ0 = mxδv

obtenemos para ΦaA, X µa , Λ

µa , Jµ

a

ΦaA = δAa t, X µ

a = 0, Λ0a = mxa, J0

a = Q = mxat−mxa.

La etiqueta transformación de gauge se reserva al caso en el que los parámetros εa se eligen arbi-trariamente en cada x, εa(x). No hay cargas específicas asociadas al grupo gauge. En efecto, supongamosuna transformación:

δxµ = 0, δφA(x) = δεa(x)FaA(x,φ(x)) (1.132)

33

Page 34: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

que deja invariante la densidad lagrangiana

0 = δL (x) =∂L (x)∂φA(x)

δφA(x)+∂L (x)

∂ (∂µφA(x))∂µδφA(x)

=

(∂L

∂φAFaA +

∂L

∂ (∂µφA)∂µFaA

)δε

a +

(∂L

∂ (∂µφA)FaA

)∂µδε

a.

(1.133)

Puesto que por hipótesis se cumple en todos los puntos x y para δεa(x) arbitrarios, se deben anular las dosexpresiones entre paréntesis independientemente. Por tanto

δJµ =∂L (x)

∂ (∂µφA(x))δφA(x) =

∂L

∂ (∂µφA)FaAδε

a = 0. (1.134)

1.6 Simetrías cinemáticas

Son las asociadas al grupo de Poincaré (o Galileo en el caso no relativista).

1.6.1 Traslaciones espacio-temporales

Son las transformacionesxg = x+a, φ

gA(x

g) = φA(x). (1.135)

Son simetría para lagrangianas que no dependen explícitamente de x,

L (x) = L (φ(x),∂φ(x)), WΩg(φ g) =WΩ[φ ]. (1.136)

Aplicando ec. (1.120) con δxµ(x) = δaµ , δ φA(x) = 0, se obtiene

δJµ(x) = δaν

(gµ

ν L (x)− ∂L (x)∂ (∂µφA(x))

∂νφA(x))

:=−T µν(x)δaν . (1.137)

T µν es el tensor de energía-momento canónico. Hay una corriente conservada y su carga asociada paracada ν :

∂µT µν(x) = 0, Pµ =∫

d3xT 0µ(x), ν = 0,1,2,3. (1.138)

Pµ = (H,P) es el cuadrimomento

Pi =−∫

d3xπA(x)∂iφA(x), H =∫

d3x(πA(x)φA(x)−L (x)

). (1.139)

Obsérvese que T 00(x) = H (x). Pµ es un cuadrivector cuando hay invariancia Lorentz.

34

Page 35: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Ejemplo. Para el campo de Klein-Gordon real

L (x) =12

∂µφ(x)∂ µφ(x)− 1

2m2

φ2(x)

T µν(x) = ∂µ

φ(x)∂ νφ(x)−gµνL (x).

(1.140)

La conservación de T µν indica que el sistema está aislado y no intercambia energía y momento confuerzas externas. Más generalmente, si L (x) tiene dependencia explícita en x, L (x) = L (φ(x),∂φ(x),x),

∂µT µν =−∂νL (x) (1.141)

donde ∂ν se refiere a derivada respecto de la dependencia explícita únicamente.

1.6.2 Rotaciones espacio-temporales

xµ → (xg)µ = Λµ

ν xν , φA(x)→ φg(xg) = DAB(Λ)φB(x). (1.142)

Aquí Λ es una transformación de Lorentz y D(Λ) la representación del grupo de Lorentz correspondienteal campo φA(x). La representación será proyectiva si el espín del campo es semientero:

D(Λ1)D(Λ2) =±D(Λ1Λ2). (1.143)

Infinitesimalmente

Λµ

ν = gµν +δω

µν , δωµν =−δωνµ

DAB(Λ) = δAB +12

Sµν

ABδωµν , Sµν

AB =−Sνµ

AB .(1.144)

Las matrices Sµν (matrices respecto de AB) satisfacen las relaciones de conmutación del álgebra de Lorentz,y están relacionadas con el espín del campo. Para el campo escalar D(Λ) = 1 y Sµν = 0.

Si la densidad lagrangiana es invariante bajo la transformación Lorentz ec. (1.142), se obtiene unacorriente conservada por cada uno de los seis parámetros en δωµν

δJµ(x) =∂L (x)

∂ (∂µφA(x))12

Sµν

ABδωµνφB(x)

+δωναxα

(gµν L (x)− ∂L (x)

∂ (∂µφA(x))∂

νφA(x)

):=

12

Jµναδωνα .

(1.145)

35

Page 36: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Jµνα =−Jµαν = T µαxν −T µνxα +12

SναAB

∂L

∂ (∂µφA)φB (1.146)

Aquí T µν es el tensor de energía-momento canónico. Jµνα(x) es la densidad de momento angular (cuadri-dimensional). Es conservado y la carga asociada es el momento angular cuadridimensional

0 = ∂µJµνα , Jµν =−Jνµ =∫

d3xJ0µν . (1.147)

Hay que notar que (si hay invariancia Lorentz) el tensor energía-momento debe ser simétrico [1] yeso no siempre ocurre para el tensor canónico, y tampoco es automáticamente invariante gauge. Ambosproblemas se pueden resolver usando el método de Belinfante-Rosenfeld que añade un término topológicoadecuado tanto a T µν(x) como a Jµνα(x), de modo que para los nuevos tensores

T µν = T νµ , Jµνα = T µαxν −T µνxα . (1.148)

Obsérvese que ahora la conservación de Jµνα se deriva automáticamente de la conservación de T µν . Porsupuesto Pµ y Jµν son los mismos del tratamiento canónico.

1.7 Simetrías internas

Se trata de simetrías globales no ligadas al grupo de Poincaré. Típicamente son transformacioneslineales:

xg = x, φgA(x

g) = DAB(g)φB(x), (1.149)

donde las matrices D(g) forman una representación de un grupo de Lie de dimensión n. Infinitesimalmente

δφA(x) = δεaT aAB φB(x) (1.150)

y las matrices T a forman una representación del álgebra de Lie del grupo. Si la acción es invariante bajo latransformación, W [φ g] =W [φ ], se tendrá una corriente conservada y su correspondiente carga

Jµa (x) =

∂L (x)∂ (∂µφA(x))

T aAB φB(x), Qa =

∫d3xπA(x)T a

AB φB(x). (1.151)

Ejemplo. Para el campo complejo de Klein-Gordon

L (x) = ∂µφ∗(x)∂ µ

φ(x)−m2φ∗(x)φ(x), (1.152)

Tenemos la simetría internaφ(x)→ e−iqλ

φ(x), φ∗(x)→ eiqλ

φ∗(x) (1.153)

36

Page 37: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

λ es el parámetro del grupo U(1) (g = eiλ ) y q real (para que respete la condición de que φ(x) y φ ∗(x)sean conjugados uno de otro). (De hecho para que la representación no sea proyectiva debe ser q entero.En todo caso es una representación del grupo recubridor (R,+).) q determina la irrep de U(1) en la quecae el campo. En el presente caso n = 1, δεa = δλ , y

T aφ ,φ =−T a

φ∗,φ∗ =−iq, T aφ ,φ∗ = T a

φ∗,φ = 0

Jµ(x) = iq(φ ∗∂ µφ −∂

µφ∗

φ).(1.154)

Esta corriente es conservada como se puede verificar usando las ecuaciones de movimiento (∂ 2 +m2)φ = 0(y su conjugada). En la teoría cuántica q representará la carga de la partícula asociada al campo φ(x). Loscampos reales en cambio corresponden a partículas neutras. ♦

Ejemplo. Para el campo de Schrödinger

L (x) = iψ∗(x)ψ(x)+1

2m∇ψ

∗(x)∇ψ(x)−V (x)ψ∗(x)ψ(x) (1.155)

con las mismas transformaciones de fase y q = 1 produce

J0(x) = ψ∗(x)ψ(x), J(x) =− i

2m(ψ∗(x)∇ψ(x)−∇ψ

∗(x)ψ(x)). (1.156)

Esta es la densidad y corriente de probabilidad usuales de mecánica cuántica. ♦

1.8 Corriente y acoplamiento gauge

La construcción de Noether proporciona la corriente canónica. Como se ha dicho la corriente físicapuede diferir de ésta por términos topológicos. La definición general de la corriente física se obtiene poracoplamiento a un campo gauge.

Para una simetría U(1) (abeliana) sea W [φ ,A] la acción del campo φ(x) acoplado al campo gaugeexterno Aµ(x). La corriente se define mediante

δAW =−∫

d4xδAµ(x)Jµ(x), Jµ(x) =− δWδAµ(x)

. (1.157)

Si W es invariante gauge, la corriente es automáticamente conservada. En efecto, bajo una transformaciónde gauge

Aµ(x)→ Aµ(x)+∂µΛ(x), (1.158)

entonces para una transformación infinitesimal

0 = δgW =∫

d4x(

δgAµ(x)δW

δAµ(x)+δgφA(x)

δWδφA(x)

). (1.159)

37

Page 38: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

El último término se anula por las ecuaciones de movimiento de φ ,

0 =∫

d4x(∂µδΛ(x))Jµ(x) =−∫

d4xδΛ(x)∂µJµ(x), ∂µJµ(x) = 0. (1.160)

Por ejemplo para el campo de Klein-Gordon complejo, ec. (1.152), se puede introducir el campo gaugemediante la prescripción de acoplamiento mínimo:16

∂µφ → Dµφ = (∂µ + iqAµ)φ , ∂µφ∗→ Dµφ

∗ = (∂µ − iqAµ)φ∗ = (Dµφ)∗. (1.161)

La acciónW =

∫d4x(Dµ

φ∗Dµφ −m2

φ∗φ)

(1.162)

es invariante teniendo en cuenta que

φ(x)→ e−iqΛ(x)φ(x), φ

∗(x)→ eiqΛ(x)φ∗(x),

Dµφ(x)→ e−iqΛ(x)Dµφ(x), Dµφ∗(x)→ eiqΛ(x)Dµφ

∗(x).(1.163)

En este caso la corriente es

δAW =∫

d4x(−iqδAµφ

∗Dµφ +Dµ

φ∗(iqδAµφ)

)Jµ(x) = iq(φ ∗Dµ

φ −Dµφ∗φ) .

(1.164)

Coincide con la corriente Noether poniendo Aµ = 0.

Nótese que en general Aµ puede acoplarse de modo invariante gauge de forma no mínima, a través deFµν = ∂µAν −∂νAµ .17 En todo caso ec. (1.157) proporciona la corriente. Los términos no mínimos indicanque el campo (partícula) tiene estructura, por ejemplo momento magnético, que da nuevas contribucionesa la corriente.

Nótese también que la acción W es la acción del campo φ acoplado al campo gauge externo. Si Aµ esun campo dinámico, hay que añadir su acción:

Wtot[φ ,A] =W [φ ,A]+WA[A], (1.165)

y la ecuación de movimiento de Aµ(x) queda

0 =−Jµ(x)+δWA

δAµ(x). (1.166)

16Obsérvese que la derivada covariante, como operador diferencial, depende de la carga del campo. La derivada covarianteactúa de acuerdo con la representación del grupo bajo la que se transforma cada campo.

17Por ejemplo, un momento magnético µ, con término −µFµν Dµ φ∗Dν φ , o −µ12 Fµν ψσ µν ψ para una partícula de Dirac.

38

Page 39: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Así, para el campo de Maxwell,

F0i = Ei, F i j = εi jkBk, Aµ = (φ ,A), LA =12(E2−B2) =−1

4FµνFµν ,

δWA

δAµ(x)=−∂νFµν =

−∂iF0i =−∂iEi

−∂0F i0−∂ jF i j = ∂tEi− (∇×B)i

(1.167)

La misma construcción vale para simetrías internas no abelianas con

δAW =−∫

d4xδAaµ(x)J

µa (x). (1.168)

Una construcción análoga proporciona el tensor energía-impulso T µν físico, simétrico y conservado.Igual que la corriente es lo que se acopla al campo gauge, el tensor energía-impulso es lo que se acopla ala métrica gµν(x):

δW =−12

∫d4x√−g(x)δgµν(x)T µν(x) (1.169)

Aquí g(x) = det(gµν(x)). De nuevo aquí W sólo incluye la acción de los campos de materia acoplados a lamétrica.18

T µν(x) es automáticamente simétrico. En este caso el grupo de transformaciones es el de difeomorfismos(transformaciones generales de coordenadas). Si W es invariante T µν(x) es también automáticamenteconservado. En efecto,

g′µν(x) =∂xα

∂x′µ∂xβ

∂x′νgαβ . (1.170)

En el caso infinitesimal δgµν = ∇µδ f αgαν +∇νδ f β gµβ .

0 = δW =−∫

d4x√−g(x)∇µδ f αgανT µν(x) =

∫d4x√−g(x)δ f αgαν∇µT µν(x) (1.171)

implica∇µT µν(x) = 0. (1.172)

Ejemplo. Para el campo real de Klein-Gordon en espacio-tiempo curvo

W [φ ] =∫

d4x√−g(x)L (x), L (x) =

12

gµν(x)∇µφ(x)∇νφ(x)− 12

m2φ

2(x). (1.173)

18Sumando la acción de Hilbert-Einstein Wgrav =− 116πG

∫d4x√−gR, se obtienen las ecuaciones de Einstein de la gravitación

0 =1√−g

δ (Wgrav +W )

δgµν (x)=

116πG

(Rµν − 12

gµν R)− 12

T µν .

39

Page 40: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Dado que φ(x) es un escalar ∇µφ(x) = ∂µφ(x) y en este caso la derivada no depende de la métrica. gµν esla matriz inversa de gµν , por tanto19

δgµν =−gµαδgαβ gβν , δ logg = gµν

δgµν (1.174)

se deduceT µν(x) = ∇

µφ(x)∇ν

φ(x)−gµν(x)L (x). (1.175)

En el caso plano, coincide con el tensor canónico obtenido anteriormente. ♦

1.9 Generadores

Como se ha visto a cada simetría continua le corresponde una carga δG(t) =∫

d3xδJ0(x) (antesdenominada δQ(t)) que es conservada si se trata de una simetría de la dinámica. Igual que en mecánicaclásica de sistemas finitos, δG(t) es a su vez un generador de la simetría ya que se cumple

δφA(x) = φA(x),δG(t), δπA(x) = πA(x),δG(t), (1.176)

donde , denota el paréntesis de Poisson

φA(x, t),φB(y, t)= πA(x, t),πB(y, t)= 0, φA(x, t),πB(y, t)= δABδ (x−y). (1.177)

Por ejemplo para una simetría interna,

δG(t) =∫

d3yπB(y)δφB(y),

φA(x, t),δG(t)=∫

d3x (φA(x),πB(y)δφB(y)+πB(y)φA(x),δφB(y)) = δφA(x).(1.178)

La segunda relación en ec. (1.176) es tal que la transformación en el espacio de las fases sea canónica,es decir, respete las relaciones canónicas ec. (1.177).

En general para cualquier funcional F [φ ,π],

δF = F,δG. (1.179)

Si δG no depende explícitamente del tiempo, genera una simetría de la dinámica si deja el hamiltonianoH[φ ,π] invariante

δH = H,δG= 0. (1.180)

19 Usando, δA−1 =−A−1δAA−1, logdetA = tr logA y δ tr logA = tr(A−1δA), para una matriz regular cualquiera.

40

Page 41: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

La misma relación se puede leer (considerando ahora a δ tH como el generador de una transformación, asaber, la evolución temporal)

∂tδG = δG,H= 0. (1.181)

Es decir, si δG genera una transformación de simetría de la dinámica, entonces se conserva. Éste es elcontenido del teorema de Noether.

Para las transformaciones espacio-temporales,

φA(x),P0= φA(x),H= φA(x),

φA(x),Pi= φA(x),−∫

d3yπB(y)∂iφB(y)=−∂iφA(x),(1.182)

consistente conδφA(x) = φA(x),δaµPµ= δaµ

∂µφA(x) = φA(x+a)−φ(x). (1.183)

Igualmente se verifica para transformaciones de Lorentz.

Además, si los Ga(t) generan un grupo de simetría, satisfacen la correspondiente álgebra de Lie usandoel paréntesis de Poisson como paréntesis de Lie,

Ga(t),Gb(t)= fabcGc(t) . (1.184)

Debe notarse que si δG depende explícitamente del tiempo pero genera una simetría de la dinámicaaún es una constante de movimiento teniendo en cuenta que

ddt

δG =∂

∂ tδG+δG,H. (1.185)

Éste es caso del generador infinitesimal de los boosts

J0i =−tPi +∫

d3xxi T 00(x). (1.186)

Es una constante de movimiento aunque de acuerdo con las relaciones de conmutación del álgebra deLorentz no conmuta con H.

41

Page 42: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

2 Campo de radiación

2.1 Partículas idénticas

2.1.1 Espacio de Fock

Sea H1 el espacio de estados monoparticulares, subtendido por una base ortonormal

|x〉 ≡ |x,σ〉, (2.1)

donde x es la posición de la partícula y σ son otros números cuánticos,

〈x,σ |x′,σ ′〉= δ (x−x′)δσσ ′ ≡ δ (x− x′) (2.2)

Podemos también usar otra base ortonormal cualquiera (típicamente la asociada a estados propios delhamiltoniano en el espacio de una partícula),

|α〉=∫

d3x∑σ

ϕα(x)|x〉, 〈α|β 〉= δαβ . (2.3)

Los estados monoparticulares también se llaman orbitales. En nuestras aplicaciones dimH1 = ∞ pero elformalismo que sigue vale igual si el número de orbitales es finito.

El espacio de N partículas se obtiene con

HN = H1⊗N· · ·⊗H1, HN 3 |ψ〉= ∑

α1,...,αN

ψα1,...,αN |α1, . . . ,αN〉 (2.4)

Las partículas son idénticas, por definición, si ningún observable las distingue. Un ejemplo de observablede partículas idénticas es

H =N

∑i=1

Ti +12

N

∑i, j=1i6= j

Vi j, Vi j = Vji (2.5)

donde todos los operadores T (por ejemplo energía cinética) son iguales salvo que actúan en el espacio dela partícula i-ésima, y análogamente los V (por ejemplo potencial de interacción entre pares de partículas).Los observables conmutan con los operadores P que realizan la permutación P de las etiquetas de laspartículas

P ∈ SN P|α1, . . . ,αN〉= |α1〉P1⊗·· ·⊗ |αN〉PN = |αP−11, . . . ,αP−1N〉 (2.6)

Esto presenta el problema de la degeneración de intercambio. Si ningún observable distingue los estadospermutados se tiene que hay N! estados físicamente equivalentes. Esto es un subespacio de dimensión N!

42

Page 43: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

por cada estado físico en contra del primer postulado de la mecánica cuántica: cada estado corresponde a unsubespacio de dimensión uno. El grupo simétrico tiene dos irreps unidimensionales que son la representaciónsimétrica (tablero de Young [N]) y la antisimétrica ([1N ]). Para eliminar la degeneración de intercambio sepostula que una especie de partículas idénticas sólo tiene estados simétricos (bosones) o sólo antisimétricos(fermiones), pero no de simetría mixta. El carácter bosónico o fermiónico es intrínseco a la partícula: puestoque H conmuta con las permutaciones la evolución no puede cambiar el tipo de simetría y tampoco puedehacerlo una medida ya que están mediadas por observables.20 El teorema de conexión espín-estadísticaestablece que en una teoría relativista (por tanto en la naturaleza) las partículas con espín entero sonbosones y con espín semientero son fermiones.

Denotemos HN al subespacio de estados completamente simétricos o completamente antisimétricos deHN , usaremos la variable ζ para distinguir los dos casos, ζ =+1 para bosones y ζ =−1 para fermiones.Así

|(α1, . . . ,αN)〉 (2.7)

denota el estado que se obtiene al simetrizar o antisimetrizar el estado |α1, . . . ,αN〉 y normalizarlo (si no escero). Por construcción

|(α1, . . . ,αN)〉= ζP|(αP−11, . . . ,αP−1N)〉, P ∈ SN (2.8)

donde 1P = 1 (caso bosónico) y (−1)P es la paridad de la permutación P (caso fermiónico).

En el caso bosónico, por ejemplo

|(αβ )〉=

|αα〉 α = β

1√2(|αβ 〉+ |βα〉) α 6= β

(2.9)

En el caso fermiónico se tiene el principio de exclusión o de Pauli: la proyección se anula si hay orbitalesrepetidos, todos los fermiones tienen que estar en estados distintos,

|(αβ )〉=

0 α = β

1√2(|αβ 〉− |βα〉) α 6= β

(2.10)

Siendo partículas idénticas, el estado físico queda determinado especificando cuántas partículas hay encada orbital (no cuáles). Por tanto una base ortonormal de HN es |(nα)〉 siendo nα el número de ocupaciónes decir, el número de partículas en cada orbital α. Para bosones nα = 0,1,2, . . ., para fermiones nα = 0,1,y en todo caso ∑α nα = N.

20Al mismo tiempo que no todo vector de HN corresponde a un estado físico, no todos los operadores son observables, sóloaquéllos que conmutan con los P.

43

Page 44: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Por ejemplo para bosones

|(nα = 2,nβ = 1,notros = 0)〉= |(ααβ )〉 (2.11)

Para fermiones |(αβ )〉=−|(βα)〉, por tanto para determinar totalmente el vector estado (concretamenteel signo) no basta con especificar los números de ocupación. Para fijar el signo se elige una ordenaciónentre los orbitales y al reconstruir el estado a partir de los números de ocupación usamos el convenio deponer los orbitales de menor a mayor en |(α1, . . . ,αN)〉.21 Así

|nα = nβ = 1,notros = 0)〉=|(αβ )〉 α < β

|(βα)〉 β < α(2.12)

Los estados |(nα)〉, con ∑α nα = N, forman una base ortonormal de HN .

El espacio de Fock HF se define como22

HF =∞⊕

n=0

HN (2.13)

Es un espacio con número indeterminado de partículas. Una base ortonormal de este espacio es

|(n1,n2, . . . ,nα , . . .)〉, ∑α

nα < ∞ (2.14)

N = ∑α nα es el número de partículas en el estado |(nα)〉. Cuando el número de orbitales es infinito Nno está acotado. La condición de que N sea finito (aunque no necesariamente acotado) garantiza quela base es numerable y HF es separable. Así un estado |(1,1, . . . ,1, . . .)〉 (con infinitos orbitales) estáexcluido. Físicamente esto ocurrirá en general porque tal estado tendría energía infinita. Estados con Ninfinito pueden surgir en transiciones de fase, por ejemplo, en presencia de condensados. Esta situaciónindica que el espacio de Fock basado en H1 es inadecuado y hace falta partir de otro sistema de estadosmonoparticulares (ver Sec. 3.9.4).

El espacio de Fock contiene el subespacio H0 que tiene dimensión 1. El único vector de la base es elestado vacío de Fock y representa el estado sin partículas, |0〉 = |(nα ≡ 0)〉. No debe confundirse con elvector 0, |0〉 está normalizado a 1,

〈0|0〉= 1 (2.15)

Un estado cualquiera del espacio de Fock es de la forma

|ψ〉= ∑nα

ψnα|(nα)〉 ∑nα|ψnα|

2 < ∞ (2.16)

21Esta elección no es universal, también se usa el convenio de mayor a menor.22Debe quedar claro que un H1 dado tiene asociados un espacio de Fock bosónico y otro fermiónico. El espacio físico es

sólo uno de los dos, según que la partícula sea un bosón o un fermión.

44

Page 45: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

de modo que tiene cierta amplitud de probabilidad en cada subespacio HN

|ψ〉= ψ0|0〉+∑α

ψα |α〉+ ∑α≤β

ψαβ |(αβ )〉+ · · · (2.17)

En el espacio de Fock, se define el operador destrucción de una partícula en el orbital α, aα , comoun operador de HN →HN−1 tal que

aα |(n1,n2, . . . ,nα , . . .)〉=√

nαζ ∑γ<α nγ |(n1,n2, . . . ,nα −1, . . .)〉 (2.18)

Es decir, quita una partícula del orbital α y da cero si nα = 0. Para bosones el factor es simplemente √nα ,para fermiones hay un signo menos adicional si el número de partículas con orbitales menores que α esimpar.

El operador de creación de una partícula en el orbital α, a†α es el operador adjunto del operador de

destrucción a†α = (aα)

†. Este operador va de HN a HN+1, y como se puede comprobar su acción sobre labase es

a†α |(n1,n2, . . . ,nα , . . .)〉=

√nα +1ζ ∑γ<α nγ |(n1,n2, . . . ,nα +1, . . .)〉 (2.19)

(con el convenio de que |(n)〉 ≡ 0 si algún número de ocupación es mayor que 1 en el caso fermiónico).Para fermiones la aplicación del operador de creación es cero si el orbital estaba ocupado.

Es fácil comprobar por ejemplo

|α〉= a†α |0〉, |(αβ )〉= a†

αa†β|0〉, |(αα)〉= 1√

2(a†

α)2|0〉, (2.20)

(se supone α 6= β en la segunda igualdad y que son bosones en la tercera). En general, aplicando operadoresde creación sobre el vacío se construyen todos los estados,

|(n1,n2, . . . ,nα , . . .)〉=(a†

1)n1

√n1!

(a†2)

n2

√n2!· · · (a

†α)

√nα !· · · |0〉 (2.21)

Como se puede comprobar el operador número de partículas en el orbital α es

Nα ≡ a†αaα Nα |(n)〉= nα |(n)〉 (2.22)

El operador N = ∑α Nα cuenta el número total de partículas en un estado. Los operadores Nα forman unconjunto completo de operadores para el espacio de Fock. En cambio los operadores aα y a†

α forman unconjunto irreducible de operadores: cualquier operador que conmute con todos ellos es un múltiplo de laidentidad (lema de Schur). Con estos operadores se puede construir cualquier otro operador del espacio deFock.

45

Page 46: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Teniendo en cuenta su definición, los operadores de creación y destrucción cumplen las siguientesrelaciones de conmutación canónicas

[aα ,a†β]∓ = δαβ , [aα ,aβ ]∓ = [a†

α ,a†β]∓ = 0 (ζ =±1) (2.23)

(Nótese que [a†α ,a

†β]∓ = 0 se deduce de [aα ,aβ ]∓ = 0 tomando adjuntos.) Aquí [ , ]∓ representa el conmu-

tador o anticonmutador

[A,B]∓ = AB∓BA, [A,B]− = [A,B], [A,B]+ = A,B, (2.24)

Es deciraαa†

β= ζ a†

βaα +δαβ , aαaβ = ζ aβ aα a†

αa†β= ζ a†

βa†

α (2.25)

conζ =

+1 bosones−1 fermiones (2.26)

Por otro lado, se tiene la propiedad

|0〉 único estado (salvo fase) tal que 〈0|0〉= 1, ∀α aα |0〉= 0 (2.27)

Las propiedades (2.23) y (2.27) son suficientes para reconstruir completamente el espacio de Fock y sepuede prescindir de la construcción basada en H1. En efecto, una base de estados se construye con (2.21)

|(nα)〉= ∏α

(a†α)

√nα !|0〉 (2.28)

(el producto es ordenado en el caso fermiónico, las partículas con orbitales más altos son creadas antes).Se puede demostrar usando sólo (2.23) y (2.27) que estos estados forman un conjunto ortonormal

〈(nα)|(n′α)〉= ∏α

δnα n′α (2.29)

Así por ejemplo, con a†α |0〉 reconstruimos H1 y la ortonormalidad de la base

|α〉= a†α |0〉, 〈α|= 〈0|aα , 〈α|β 〉= 〈0|aαa†

β|0〉= 〈0|ζ a†

βaα +δαβ |0〉= δαβ 〈0|0〉= δαβ (2.30)

El principio de exclusión se recupera igualmente ya que para fermiones

a†αa†

α =−a†αa†

α = 0 (2.31)

Hasta ahora hemos considerado un sólo tipo de partícula. Si hay varios tipos de fermiones, por ejemplo,protones y neutrones, se puede hacer un espacio de Fock de protones y otro de neutrones y el espacio

46

Page 47: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

conjunto sería el producto tensorial de ambos, operadores puramente protónicos y puramente neutrónicosconmutarían (aparte podría haber operadores que transforman un tipo de partícula en otro). Este trata-miento no es incorrecto pero hay una alternativa más práctica, a saber, considerar que protón y neutrón sondos estados (de isospín) de un único fermión, el nucleón. Aparte de otros números cuánticos (momento,espín) el nucleón puede estar en estado protón o en estado neutrón, la etiqueta que los distingue se englobaen α (o σ en la base |x,σ〉). Hay un único espacio de Fock. Este procedimiento es el mejor y más utilizado:todos los fermiones son el mismo en distintos estados (electrón, quark, etc) e igualmente todos los bosonesson el mismo en distintos estados (fotón, gluon, etc). Falta considerar el espacio de Fock de bosones yfermiones juntos. La construcción sigue las líneas de (2.23) y (2.27). Si para cada estado i (i contiene todoslos números cuánticos, incluido el tipo de partícula) bi es el operador de destrucción de partículas bosónicasen estado i y fα el operador de destrucción de partículas fermiónicas en estado α (que de nuevo contienetodas las etiquetas), se postula

|0〉 único estado (salvo fase) tal que 〈0|0〉= 1, ∀i,α bi|0〉= fα |0〉= 0 (2.32)

y también

[bi,b†j ] = δi j, fα , f †

β= δαβ ,

0 = [bi,b j] = [bi, fα ] = [bi, f †α ] = fα , fβ

(2.33)

(las tres que faltan se obtienen tomando adjunto de éstas). La regla es que son relaciones de anticonmu-tación si ambos operadores son fermiónicos y de conmutación en otro caso. Y una base ortonormal delespacio de Fock es

|(n,m)〉= ∏i

(b†i )

ni

√ni!

∏α

( f †α)

mα |0〉, ∑i

ni < ∞, ∑α

mα < ∞, (2.34)

siendo ni y mα los números de ocupación de orbitales bosónicos y fermiónicos. mα ! = 1 por mα = 0,1. Elproducto fermiónico está ordenado (los fermiones con orbitales más altos se crean antes).

Se dice que un producto de operadores de creación y destrucción es bosónico cuando contiene unnúmero par de operadores de creación o destrucción de fermiones y fermiónico cuando contiene un númeroimpar. Y una definición se aplica para los estados. Los observables, por ejemplo el hamiltoniano, son siempreoperadores bosónicos, lo cual equivale a decir que bajo evolución o medidas el número de fermiones sólopuede cambiar por pares. Esto se puede deducir del teorema de conexión espín-estadística (si el momentoangular es exactamente conservado no puede cambiar de entero a semientero) y también porque tener unamezcla coherente de estados bosónicos y fermiónicos sería incompatible con que las permutaciones entrepartículas idénticas no deben cambiar el estado físico. La restricción sobre qué operadores hermíticos son

47

Page 48: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

admisibles es un ejemplo de regla de superselección.

2.1.2 Operadores campo

Si |α〉 es otra base ortonormal, la relación de cambio de base es

|α〉= ∑α

〈α|α〉|α〉 (2.35)

La matriz 〈α|α〉 es unitaria y el cambio de base induce una transformación unitaria a nivel de operadoresde creación y destrucción

a†α= ∑

α

〈α|α〉a†α , aα = ∑

α

〈α|α〉aα . (2.36)

Por construcción la transformación conserva las relaciones de conmutación o anticonmutación, como puedecomprobarse.

Más generalmente, se puede definir de forma natural el operador de creación y destrucción asociado auna estado monoparticular ψ cualquiera

|ψ〉= ∑α

ψα |α〉, a†ψ = ∑

α

ψαa†α , aψ = ∑

α

ψ∗αaα , (2.37)

que cumple[aψ ,a

†ψ ′ ]−ζ = 〈ψ|ψ ′〉 (2.38)

Un base ortonormal especialmente importante es la base |x〉 = |x,σ〉. Los operadores de creación ydestrucción asociados a esta base son los operadores campo y se denotan Ψ(x) y Ψ†(x)

Ψ(x) = Ψσ (x) = ∑α

ϕα(x)aα , Ψ†σ (x) = ∑

α

ϕ∗α(x)a

†α , ϕα(x) = 〈x|α〉 (2.39)

ϕα(x) es la función de onda del orbital α. Como cualquier otra base, los operadores campo satisfacen lasrelaciones de conmutación canónicas

[Ψσ (x),Ψ†σ ′(y)]−ζ = δ (x−y)δσσ ′ , [Ψσ (x),Ψσ ′(y)]−ζ = 0. (2.40)

2.1.3 Operadores de un cuerpo y dos cuerpos

Supongamos que se tiene un operador H como el de (2.5) para cualquier valor de N (número departículas). Estos operadores actúan en HN y por tanto en HF . Tal operador se puede escribir en HF

usando operadores de creación y destrucción y se obtiene

H = ∑αβ

Tαβ a†αaβ +

12 ∑

αβγδ

Vαβγδ a†αa†

βaδ aγ (2.41)

48

Page 49: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

La expresión vale tanto en el caso bosónico como fermiónico. Los coeficientes se calculan en H1 y H2(estados no simetrizados) respectivamente,

Tαβ = 〈α|T |β 〉, Vαβγδ = 〈αβ |V |γδ 〉, (2.42)

T es un operador de un cuerpo, V de dos cuerpos

x

TV

α

β

α

γ δ

β

(2.43)

Así para partículas idénticas no relativistas (sin espín, por simplicidad) y con masa m, en presencia deun potencial externo U(x) e interacción entre pares mediada por un potencial V (x1−x2), se tiene entoncesel hamiltoniano

H =∫

d3x(

12m

∇Ψ†(x)∇Ψ(x)+U(x)Ψ†(x)Ψ(x)

)+∫

d3x1d3x212

V (x1−x2)Ψ†(x1)Ψ

†(x2)Ψ(x2)Ψ(x1)

(2.44)

2.1.4 Orden normal

Se dice que un producto de operadores de creación y destrucción está ordenado normalmente cuandolos operadores de destrucción actúan antes (están más a la derecha en el producto) y los de creacióndespués (más a la izquierda). Así los operadores en (2.41) o (2.44) están ordenados normalmente.

También se define el orden normal de un producto de operadores de creación y destrucción. Ésta esuna notación que se indica con : (producto) : de modo que, no importa como estén escritos los operadoresen “producto”, hay que ponerlos ordenados normalmente. En general esto implica reordenarlos respecto decomo estén escritos y en el caso de fermiones además de reordenar hay que añadir un factor −1 cada vezque se trasponen dos operadores fermiónicos. Así por ejemplo (bi son bosónicos, fα fermiónicos)

: b1 f2b†4b3 f †

5 : = − f †5 b†

4 f2b1b3, : f1 f2 f †3 : = f †

3 f1 f2 (2.45)

En el primer caso el signo menos se ha generado al cruzar f2 y f †5 . En el segundo se generan dos signos

menos. La definición de orden normal se extiende linealmente a combinaciones lineales de productos,

: λA+µB : = λ : A : + µ : B : λ ,µ ∈ C (2.46)

Es importante notar que el orden normal es una notación y no una operación que se aplica a un operadordado. Así por ejemplo

b1b†1 = b†

1b1 +1 (2.47)

49

Page 50: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

sin embargob†

1b1 = : b1b†1 : 6= : (b†

1b1 +1) : = b†1b1 +1 (2.48)

Una propiedad importante del orden normal es que dentro del orden normal los operadores bosóni-cos conmutan con otros operadores bosónicos o fermiónicos y los fermiónicos anticonmutan con otrosoperadores fermiónicos.23 Así por ejemplo

: f †1 b3 f2 : = − : b3 f2 f †

1 : , : e∑i(ψibi+ϕib†i ) : = : e∑i ψibie∑i ϕib

†i : = e∑i ϕib

†i e∑i ψibi . (2.49)

Otra propiedad es que si A es un producto con algún operador de creación o destrucción, se tiene

〈0| : A : |0〉= 0 (2.50)

por a|0〉= 〈0|a† = 0.

2.1.5 Segunda cuantización

El formalismo de operadores de creación y destrucción a veces se denomina formalismo de segundacuantización. Veamos por qué.

El valor esperado de la energía de una partícula no relativista en un potencial U(x) (que puede dependertambién del espacio interno σ) es, en una base cualquiera,

|ψ〉= ∑α

ψα |α〉 〈H〉ψ = ∑hαβ ψ∗αψβ . (2.51)

Comparando con su versión multipartícula (esto es en el espacio de Fock)

H = ∑hαβ a†αaβ (2.52)

se ve que este resultado se corresponde con la sustitución de las amplitudes por operadores ψα → aα . Paraoperadores campo (con suma implícita sobre índices repetidos)

〈H〉ψ =∫

d3x(

12m

∇ψ∗σ (x)∇ψσ (x)+ψ

∗σ (x)Uσσ ′(x)ψσ ′(x)

),

H =∫

d3x(

12m

∇Ψ†σ (x)∇Ψσ (x)+Ψ

†σ (x)Uσσ ′(x)Ψσ ′(x)

).

(2.53)

El operador H en el espacio de Fock se obtiene aplicando las reglas

ψσ (x)→Ψσ (x), ψ∗σ (x)→Ψ

†σ (x) (2.54)

23Conmutan/anticonmutan como operadores del espacio de Fock. Si por ejemplo el espacio completo es H = HF ⊗L2(R),los operadores x y p técnicamente son bosónicos pero [x, p] = i como siempre y el orden normal no dice cómo ordenarlos.

50

Page 51: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

A esta sustitución a veces se le llama segunda cuantización. La idea subyacente es que la “primeracuantización” es cambiar los observables clásicos x y p (posición y momento) por sus versiones cuánticas,los operadores x y p, de modo que

xi, p jP = δij→

1ih[xi, p j] = δ

ij (2.55)

es decir , P → 1ih [ , ]. Al hacer la “primera cuantización” en lugar de una posición definida se tiene

una amplitud de probabilidad ψ(x) (ídem en momentos). Esta función de onda es un campo clásico. La“segunda cuantización” sería reemplazar este campo clásico por un operador campo, y en efecto, para lafunción de onda como campo clásico se tienen las relaciones de conmutación (paréntesis de Poisson)

ψ(x),π(y)P = δ (x−y), ψ(x),ψ(y)P = 0, π(x) = ihψ∗(x) (2.56)

y para los operadores campo

[Ψ(x),Ψ†(y)]∓ = δ (x−y), [Ψ(x),Ψ(y)]∓ = 0 (2.57)

que obedece a la regla de cuantización , P→

1ih[ , ]∓ (2.58)

El nombre “segunda cuantización” es sólo una forma de hablar. Físicamente no hay una nueva cuantización,lo que hace la sustitución (2.54) es pasar de la teoría de una partícula (espacio H1) a una de multipartículaen el espacio de Fock.

Hasta ahora hemos usado la imagen de evolución Schrödinger (evolucionan los vectores estado, no losobservables). En imagen de Heisenberg evolucionan los observables y no los vectores estado. La evoluciónde los observables (tomando como tiempo de referencia t = 0 y usando unidades h = 1) es

A(t) = eitHASe−itH , (2.59)

que implicaidAdt

= [A,H] (2.60)

A nivel clásico se tendría dA/dt = A,HP. Nótese que en la versión cuántica siempre es conmutador,no anticonmutador aunque el sistema sea fermiónico. No es una excepción a la regla (2.58), es que elanticonmutador aparece exclusivamente cuando ambos operadores son fermiónicos (es decir, con un númeroimpar de operadores de creación o destrucción fermiónicos). El hamiltoniano como cualquier observable,es un operador de tipo bosónico, y aparece con conmutadores.

La evolución de la función de onda obedece la ecuación de Schrödinger (obviamos σ por claridad)

i∂tψ(x, t) =(− 1

2m∇2 +U(x)

)ψ(x, t) (2.61)

51

Page 52: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Debería esperarse que el campo cumpla una ecuación similar en imagen de Heisenberg

i∂tΨ(x, t) =(− 1

2m∇2 +U(x)

)Ψ(x, t) (2.62)

tanto en el caso bosónico como en el fermiónico. En efecto es así. Basta comprobarlo en la base de orbitalesα con hamiltoniano H. Para la ecuación de Schrödinger en H1 se tiene

|ψ(t) = ∑α

ψα(t)|α〉, i∂tψα(t) = ∑β

hαβ ψβ (t) (2.63)

Para el operador de destrucción en imagen de Heisenberg debería tenerse

i∂taα(t) = ∑β

hαβ aβ (t) (2.64)

lo cual es cierto. Primero notemos que siendo

aα(t) = eitHaαe−itH (2.65)

los aα(t) y a†α(t) cumplen las mismas relaciones de conmutación canónicas que a t = 0 y también se cumple

H = ∑αβ

hαβ a†α(t)aβ (t) ∀t (2.66)

entoncesi∂taα(t) = [aα(t),H] = ∑

γβ

hγβ [aα(t),a†γ(t)aβ (t)] (2.67)

Ahora podemos usar las identidades

[A,BC] = [A,B]C+B[A,C] = A,BC−BA,C (2.68)

empleando el desarrollo en conmutadores en el caso bosónico y en anticonmutadores en el fermiónico

i∂taα(t) = ∑γβ

hγβ

([aα(t),a†

γ(t)]∓aβ (t)±a†γ(t)[aα(t),aβ (t)]∓

)= ∑

β

hαβ aβ (t). (2.69)

En lo que sigue vamos a estudiar la cuantización de campos clásicos (por ejemplo el campo electro-magnético) y un método es cambiar el campo clásico por un operador, como en (2.54). Como un ejercicio,uno puede considerar la función de onda del lagrangiano de Schrödinger como un campo clásico (se hahecho en Sec. 1.4). Lo que hemos visto aquí es que la cuantización del campo de Schrödinger simplementeproduce la versión multipartícula de la teoría cuántica. Como veremos las teorías cuánticas de campos sonteorías con número variable de partículas en un espacio de Fock. En algunos casos, como el campo deSchrödinger, cada subespacio HN es invariante (el número de partículas es una constante de movimiento),pero en general no es así en teorías relativistas. Además en el caso no relativista tanto la versión multipar-tícula bosónica como la fermiónica son consistentes. En el caso relativista no es así, el teorema de conexiónespín-estadística es mucho más restrictivo y para cada espín a lo sumo sólo una de las dos versiones esconsistente.

52

Page 53: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

2.2 Ecuaciones de Maxwell e invariancia gauge

En los cursos de mecánica cuántica se estudia la cuantización de la energía de partículas. Por ejemploen un oscilador armónico los niveles son discretos de tipo hω(n+ 1/2). En cambio la teoría de Maxwellde la radiación electromagnética es clásica: su espectro es continuo y no aparece la ecuación de EinsteinE = hω por ningún lado. A continuación vamos a cuantizar esta teoría. Eso permitirá explicar por ejemploel origen de las transiciones espontáneas en el átomo de hidrógeno, que no tienen cabida en la teoría deSchrödinger. El campo de radiación es más complicado que por ejemplo un campo de Klein-Gordon por lainvariancia gauge y el espín, pero empezamos por él porque la necesidad de cuantizarlo es más evidente.

Empezamos con la teoría clásica y luego introduciremos la cuantización.

Las ecuaciones de Maxwell en presencia de cargas son (en el vacío)

∇E = ρ(x), ∇×B− 1c

∂tE =1cj(x) ,

∇B = 0, ∇×E+1c

∂tB = 0 .(2.70)

Esta ecuaciones están escritas en unidades gaussianas racionalizadas.24 Esto quiere decir que la constantede estructura fina α ≈ 1/137.0 y la ley de Coulomb son

α =e2

4π hcFCoul. =

Q1Q2

4πr2 (2.71)

Las unidades afectan al valor de e no al de α, que no depende de las unidades. El motivo de usar unidadesracionalizadas es que producen la normalización estándar en teoría de campos para el campo electromag-nético.

Aparte, a partir de ahora usamos unidades naturales que son estándar en teoría de partículas. En estasunidades h = c = 1. De este modo sólo queda una unidad “dimensional” independiente que se puede elegircomo la longitud L o el tiempo T o la masa M o la energía E, etc, de modo que en unidades naturalesL = T = M−1 = E−1. Las relaciones

hc≈ 197.3MeVfm, c≈ 3×108 ms−1 (2.72)

permiten pasar de unas unidades a otras. En unidades naturales [∇] = M, [ρ] = [j] = M3, [E] = [B] = M2.

Las dos primeras ecuaciones de Maxwell implican la continuidad de la corriente jµ = (ρ,j)

0 = ∂µ jµ = ∂tρ +∇j (2.73)

24En unidades gaussianas o cgs, no racionalizadas la ecuación sería ∇E = 4πρ(x).

53

Page 54: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

y de hecho el término de “corriente de desplazamiento” 1c

∂tE (que da lugar a las ondas hertzianas) fueintroducido por Maxwell con este fin.

Las dos ecuaciones homogéneas en (2.70) equivalen a la existencia de los potenciales escalar y vector,Aµ = (Φ,A) tales que

B =∇×A, E =−∇Φ−∂tA (2.74)

En función de los potenciales las ecuaciones de Maxwell se pueden escribir

2Φ−∂t(∂tΦ+∇A) = ρ 2A+∇(∂tΦ+∇A) = j (2.75)

siendo 2= ∂ 2t −∇2 el d’lambertiano. Estas ecuaciones son de segundo orden y derivan de un lagrangiano,

que sin embargo es singular, no se puede hacer la transformada de Legendre para obtener el hamiltoniano.Esto está relacionado con la conservación de corriente. Las ecuaciones no tienen solución si la corriente nose conserva. Como contrapartida, cuando tienen solución ésta no es única. En efecto, si Aµ es una solucióntambién lo es

A′µ(x) = Aµ +∂µ

Λ(x), Φ′(x) = Φ(x)+∂tΛ(x), A′(x) =A(x)−∇Λ(x), (2.76)

donde Λ(x) es una función cualquiera. Se dice que A′µ(x) y Aµ(x) difieren por una transformación degauge.25 Como es fácil comprobar los campos eléctrico y magnético son invariantes gauge, es decir

E′(x) =E(x) B′(x) =B(x) (2.77)

La invariancia gauge de las ecuaciones de Maxwell (2.75) implica que no va a ser posible determinarunívocamente una solución especificando unas condiciones iniciales Aµ(x, t0) y ∂tAµ(x, t0) y por tanto nose puede hacer un formalismo canónico. (Exactamente el mismo problema ocurre con las ecuaciones deEinstein respecto de la covariancia general.)

La solución para construir un formalismo canónico es fijar el gauge de modo que la solución sea unívoca.Dado un Aµ(x) todos sus transformados gauge forman una órbita gauge, todas las configuraciones de laórbita son físicamente equivalentes (producen los mismos E y B). Fijar el gauge es elegir un representantecanónico en cada órbita.

Las ecuaciones de Maxwell son invariantes Lorentz (de hecho las transformaciones de Lorentz se obtu-vieron imponiendo invariancia de las ecuaciones de Maxwell). Lo natural sería elegir un gauge covarianteLorentz tal y como el gauge de Lorenz ∂µAµ = 0, sin embargo esto tiene otros problemas, de modo queelegimos el gauge de Coulomb o transversal, definido por la condición

∇A(x) = 0 (2.78)

25Ya se vio en la Sec. 1.8 que la invariancia gauge implicaba conservación de corriente.

54

Page 55: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

El tratamiento no es manifiestamente covariante Lorentz aunque la teoría sí lo sea.26 En el gauge deCoulomb las ecuaciones de Maxwell quedan

−∇2Φ = ρ 2A+∇∂tΦ = j (2.79)

Se ve por qué se llama gauge de Coulomb: Φ(x) se puede resolver en función de ρ(x), y da el potencialcoulombiano (instantáneo). Podemos ahora comprobar que la condición de gauge es aceptable: por cadaórbita gauge solución de las ecuaciones hay exactamente un representante gauge Aµ(x) en el gauge deCoulomb. En efecto, si A′µ(x) es una solución, el Aµ(x) equivalente gauge y en el gauge de Coulomb debecumplir

0 =∇A=∇(A′+∇Λ), −∇2Λ =∇A′ (2.80)

Esta ecuación tiene solución (Λ(x) es el potencial coulombiano creado por ∇A′) y fija unívocamente A(x)y Φ(x). Para que la soluciones de Φ(x) o Λ(x) sean únicas se suponen condiciones de contorno adecuadas,por ejemplo jµ(x) y los Aµ(x) van a cero suficientemente deprisa cuando |x| → ∞.

De momento consideramos sólo la teoría en ausencia de cargas, jµ(x) = 0. Tradicionalmente se consi-deraba que los campos eléctrico y magnético son creados por las cargas, pero este es un punto de vista muyrestrictivo y no es sostenible para las ecuaciones de Maxwell. En realidad hay unos grados de libertad de lascargas (que tienen su propia dinámica, la inercia de las partículas cargadas, etc) y otros grados de libertadque son los del campo de radiación. Estos dos tipos de grados de libertad están acoplados por la interacciónelectromagnética de modo que las cargas influyen en la evolución dinámica del campo electromagnético(descrito por las ecuaciones de Maxwell) y también el campo electromagnético influye sobre las cargas através de la fuerza de Lorentz

F = q(E+v×B) (2.81)

Las ecuaciones de Maxwell (dinámica del campo electromagnético) y la ley de Newton con la fuerza deLorentz (dinámica de las cargas) no son independientes ya que deben derivar de un mismo lagrangiano.Pero el punto que se quiere enfatizar aquí es que el campo electromagnético tiene una existencia propia,independiente de la existencia de cargas. Esta es la dinámica que se quiere estudiar ahora.

En ausencia de cargas las ecuaciones del campo electromagnético son

2A= 0, ∇A= 0, (2.82)

junto conΦ = 0, B =∇×A, E =−∂tA. (2.83)

26Manifiestamente covariante sería que dado un campo Aµ (x) en el gauge de Coulomb, en otro sistema de referencia se vieracomo Λµ

ν Aν (Λ−1x) y en el gauge de Coulomb del nuevo sistema de referencia. Más bien se tendrá T (Λ)µν Aν (Λ−1x) donde

T (Λ) sigue siendo una representación de Lorentz pero no con un matriz constante sino un operador seudodiferencial.

55

Page 56: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Es posible y de hecho conveniente expresar A(x) en “espacio de momentos” (modos de Fourier)

A(x, t) =∫ d3k

(2π)3 eikxA(k, t), A(k, t) =∫

d3xe−ikxA(x, t). (2.84)

La condición de gauge se traduce enkA(k, t) = 0 (2.85)

es decir, el vector A(k, t) no tiene componente longitudinal (paralela a k), sólo componentes transversales.Se dice que A es un campo transversal. Igualmente E y B son campos transversales.

Se podría ahora proceder con el formalismo canónico. Se tiene27

L (x) =12(E2−B2), π(x) =−E(x), H (x) =

12(E2 +B2). (2.86)

En lugar de seguir este camino cuantizaremos la teoría mostrando que el campo electromagnético es unsistema de osciladores armónicos desacoplados, sistema que es fácil de cuantizar.

Aunque no es imprescindible (siendo un sistema lineal), es bastante conveniente regularizar el sistemapara que el número de grados de libertad sea al menos numerable. Lo hacemos en espacio de modos deFourier a base de poner el sistema en una caja. Por simplicidad tomamos una caja cúbica de lado L, volumenV = L3. El sistema físico original se recupera tomando el límite V → ∞. Usamos también V para denotarlos puntos en la caja V = [0,L]3. Como condiciones de contorno se podrían tomar “tipo caja”, es decir,A|∂V = 0, pero es más conveniente usar las llamadas condiciones periódicas de contorno. Se puedenexpresar diciendo que A(x) está definida en todo el espacio pero es una función periódica con periodo Len cada dirección

A(x) =A(x+Lm) ∀m ∈ Z3, (2.87)

por tanto los únicos grados de libertad distintos son los asociados a la caja. Además de ser más prácticas, seespera que estas condiciones de contorno tengan un límite más suave V →∞ dado que de manera efectivala caja no tiene una frontera (si se atraviesa una pared de la caja se entra por la pared opuesta).

Los modos de Fourier eikx permitidos por las condiciones periódicas de contorno son aquéllos quecumplen

k =2π

Ln, n ∈ Z3 (2.88)

El conjunto eikx/√

V forma una base ortonormal de funciones periódicas f (x)

f (x) = ∑k

eikx√

Vf (k), f (k) =

∫V

d3xe−ikx√

Vf (x),

∫V

d3xe−ikx√

Veiqx√

V= δk,q (2.89)

27Con unidades no racionalizadas se tendría L (x) = 18π

(E2−B2). El factor 1/2 es el estándar para campos reales.

56

Page 57: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Para el potencial vector se tiene

A(x, t) = ∑k

eikx√

VA(k, t), (2.90)

Las coordenadas que describen ahora la configuración del sistema son las amplitudes complejas A(k, t).Por ser A(x) un campo real se tiene la ligadura

A(x, t)∗ =A(x, t), (A(k, t))∗ = A(−k, t) (2.91)

Para los modos de Fourier la ecuación 2A(x) = 0 se traduce en

−∂2t A(k, t) = k2A(k, t) (2.92)

con solución (imponiendo ya la condición (2.91))

A(k, t) = A(k)e−iωkt + A∗(−k)eiωkt , ωk = |k| . (2.93)

Esta fórmula es para k 6= 0. Para k = 0 la solución acotada es constante en t y x y no contribuye a E oB por lo que se puede elegir A(0, t) = 0. Los A(k) son amplitudes complejas arbitrarias, excepto por lacondición de transversalidad, que implica

k · A(k) = 0 (2.94)

por tanto el vector A(k) sólo tiene dos amplitudes independientes. Para aislarlas podemos elegir, para cadak, una base ortonormal orientada positivamente εr(k), r = 1,2,3, tal que el eje 3 es longitudinal

ε3(k) = k, εr(k) ·εs(k) = δrs, εr(k)×εs(k) = εrstεt(k) (2.95)

Esta base no es única, hay una ambigüedad correspondiente a un ángulo de rotación alrededor del eje 3.Opcionalmente se puede elegir para −k que se cumpla ε1(−k) = ε1(k), ε2(−k) =−ε2(k). En esta base

A(k) =1√2ωk

∑r=1,2

εr(k)ak,r (2.96)

El factor 1/√

2ωk se introduce por conveniencia. Para cada k hay dos amplitudes complejas ak,1 y ak,2.Estas amplitudes corresponden a las dos polarizaciones lineales de la luz. εr(k) es la llamada basecartesiana. Una base más conveniente es la base esférica, ελ (k) con λ = 0,±1,

ε0(k) = ε3(k) = k, ε±1(k) =∓1√2(ε1(k)± iε2(k)) (2.97)

Estos son vectores complejos que cumplen

ε∗λ(k) = (−1)λε−λ (k), ε∗

λ(k) ·ελ ′(k) = δλλ ′ , k×ελ (k) =−iλελ (k). (2.98)

57

Page 58: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

De nuevo aquí hay una ambigüedad en la base esférica correspondiente a una redefinición por una fase talque ελ (k)→ eiαλελ (k) con α ∈ R. La elección opcional para −k mencionada antes se corresponde conελ (−k) =−ε−λ (k). En la base esférica

A(k) =1√2ωk

∑λ=±1

ελ (k)ak,λ (2.99)

las amplitudes ak,±1 corresponden a las polarizaciones circulares de la luz.

Utilizando los resultados (2.93) y (2.99) en (2.90) se tiene

A(x, t) = ∑k

∑λ=±1

1√2ωkV

(ελ (k)ak,λ e−iωkteikx+ε∗

λ(−k)a∗−k,λ eiωkteikx

)(2.100)

En este punto siempre se hace un reetiquetado que es estándar y se aplica a todos los campos relativistas(de cualquier masa y espín), a saber, se cambia la etiqueta k→−k en la componente con eiωkt :

A(x, t) = ∑k

∑λ=±1

1√2ωkV

(ελ (k)e

−iωkt+ikxak,λ +ε∗λ(k)eiωkt−ikxa∗k,λ

)(2.101)

Como se ve en la solución hay una componente que va con e−iωkt y se denomina componente de frecuenciaspositivas y otra componente de frecuencias negativas que va con e+iωkt :

A(x, t) =A(+)(x, t)+A(−)(x, t), A(−)(x, t) = (A(+)(x, t))∗ (2.102)

Para los campos eléctrico y magnético se obtiene análogamente

E(x, t) =E(+)(x, t)+E(−)(x, t), B(x, t) =B(+)(x, t)+B(−)(x, t) (2.103)

con

E(+)(x, t) = ∑k

∑λ=±1

√ωk

2Viελ (k)e

−iωkt+ikxak,λ

B(+)(x, t) = ∑k

∑λ=±1

√ωk

2Vλελ (k)e

−iωkt+ikxak,λ

(2.104)

Si se calcula la energía del campo usando (2.86) se tiene

H = ∑k

∑λ=±1

ωka∗k,λ ak,λ (2.105)

La dependencia en t se cancela. De la expresión de H se ve que es el hamiltoniano de un sistema deosciladores clásicos desacoplados, uno por cada modo (k,λ ), con frecuencias ωk. Para verlo mejor notemosque ak,λ evoluciona con

ak,λ (t) = e−iωktak,λ , ak,λ (t) =−ω2k ak,λ (t). (2.106)

58

Page 59: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

En función de las coordenadas reales

qk,λ (t) =1√2ωk

(ak,λ (t)+a∗k,λ (t)

)pk,λ (t) =−i

√ωk

2(ak,λ (t)−a∗k,λ (t)

)(2.107)

las ecuaciones quedanqk,λ = pk,λ pk,λ =−ω

2k qk,λ (2.108)

y la energía se expresa comoH = ∑

k∑

λ=±1

12(

p2k,λ +ω

2kq2

k,λ

). (2.109)

Éste es el hamiltoniano de una suma de osciladores y la evolución temporal se obtiene correctamente delas ecuaciones de Hamilton

qk,λ =∂H

∂ pk,λ, pk,λ =− ∂H

∂qk,λ. (2.110)

2.3 Cuantización del campo de radiación. Fotones. Espín del fotón

2.3.1 Oscilador armónico cuántico

Hacemos primero un repaso del oscilador armónico cuántico en una dimensión. El espacio de Hilbertes L2(R), p =−i∂x. El hamiltoniano es (usamos unidades m = 1)

H =12

p2 +12

ω2x2, [x, p] = i (2.111)

Se definen los operadores diferenciales

a =

√ω

2x+

i√2ω

p, a† =

√ω

2x− i√

2ωp (2.112)

que cumplen las relaciones de conmutación canónicas de operadores de creación y destrucción bosónicos

[a,a†] = 1 (2.113)

Si se denota el estado fundamental como |0〉, con función de onda 〈x|0〉=(

ω

π

)1/4e−ωx2/2, se tiene

a|0〉= 0 (2.114)

Además |0〉 es la única solución normalizable (salvo múltiplos) de la ecuación diferencial a|ψ〉= 0. L2(R)equivale a un espacio de Fock bosónico con un solo orbital, siendo |0〉 el vacío de Fock. Los bosones creadospor a† se denominan fonones, son los cuantos del oscilador. El hamiltoniano puede escribirse como

H = ω(N + 12), N = a†a (2.115)

59

Page 60: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

N es el operador número de fonones. Se deduce que los estados |(n)〉 son los vectores propios del hamilto-niano

|(n)〉= 1√n!(a†)n|0〉, H|(n)〉= En|(n)〉 En = ω(n+ 1

2) (2.116)

Cada fonón aumenta la energía en ω sobre la energía del vacío E0 = ω/2. También es útil notar que enimagen de Heisenberg, el operador de destrucción evoluciona como e−iωta.

Para un oscilador en d dimensiones se tiene

H =d

∑i=1

12

p2i +

12

d

∑i, j=1

Ωi jxix j, [xi, p j] = iδ ij, [xi,x j] = [pi, p j] = 0 (2.117)

donde Ωi j es una matriz simétrica y real con autovalores positivos. Las ecuaciones de movimiento sonlineales

x i =−Ωi jx j (2.118)

El sistema se puede diagonalizar mediante una rotación, de modo que quede

H =d

∑i=1

(12

p2i +

12

ω2i xi2

)(2.119)

Es una suma de osciladores desacoplados y da lugar a un espacio de Fock bosónico con d orbitales, d tiposde fonones y d operadores de destrucción y creación. El estado fundamental es un producto de gaussianasen la representación xi y el vacío de Fock, ai|0〉= 0 ∀i.

2.3.2 Cuantización del campo de radiación

Podemos ahora proceder a cuantizar el campo de radiación. Este sistema era un conjunto de osciladoresarmónicos clásicos. Eso era evidente desde el principio porque cualquier sistema de ecuaciones linealesrepresentan un sistema de osciladores, y las ecuaciones de Maxwell son lineales. Las xi aquí son los A(x).Lo que pasa es que en espacio de posiciones los osciladores está acoplados: ∇ en (2.86) conecta puntospróximos. Al pasar a modos de Fourier los osciladores quedan desacoplados, como se ve en (2.109). Cadavalor de (k,λ ) representa una dirección distinta en el espacio del oscilador, para el oscilador que es elcampo d = ∞.

Para cuantizar la teoría simplemente reemplazamos los osciladores clásicos por cuánticos. Ahora qk,λes un operador multiplicativo y pk,λ =−i∂/∂qk,λ

[qk,λ ,qk′,λ ′ ] = [pk,λ , pk′,λ ′ ] = 0, [qk,λ , pk′,λ ′ ] = iδk,k′δλ ,λ ′ . (2.120)

Equivalentemente, en función de los operador de creación y destrucción28

[ak,λ ,ak′,λ ′ ] = [a†k,λ ,a

†k′,λ ′ ] = 0, [ak,λ ,a

†k′,λ ′ ] = δk,k′δλ ,λ ′ . (2.121)

28Nótese que las ecuaciones (2.107) coinciden con (2.112).

60

Page 61: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Además〈0|0〉= 1, ∀k,λ ak,λ |0〉= 0. (2.122)

Los cuantos del campo electromagnéticos son los fotones. El estado fundamental o vacío es el vacío deFock, el estado sin fotones. El operador número de fotones en estado (k,λ ) es

Nkλ = a†k,λ ak,λ (2.123)

y el operador numero total de fotones esN = ∑

k,λ

Nk,λ (2.124)

El hamiltoniano puede entonces escribirse como

H = ∑k,λ

ωkNk,λ +E0, E0 = ∑k,λ

12 ωk (2.125)

y la base de estados propios es

|(nk,λ 〉= ∏k,λ

(a†k,λ )

nk,λ√nk,λ !

|0〉 (2.126)

En particular el estado de un fotón con números cuánticos (k,λ ) es

|k,λ 〉= a†k,λ |0〉. (2.127)

El primer resultado y el más notable que se obtiene al cuantizar es la aparición de partículas, los fotones,a partir de una campo continuo clásico. Respecto de las propiedades de los fotones, se ve que son bosones,además son partículas sin interacción mutua. Esto se deduce de que la energía del campo, en (2.125),es simplemente aditiva en el número de fotones, cada nuevo fotón aumenta la energía en ω(k). En unsistema con subsistemas en interacción la energía difiere de la suma de las energías de los subsistemas,esa diferencia es el término de interacción. También se puede deducir que el fotón es una partícula sinmasa. En efecto, la energía de un fotón con números cuánticos (k,λ ) es ω(k) = |k| y el mínimo valor, quees la masa para una partícula relativista, es cero, correspondiente a k = 0. Para una partícula relativista larelación de dispersión es E =+

√m2 +p2 donde p es el momento y m la masa. Aunque nuestro tratamiento

no ha sido manifiestamente covariante relativista la teoría sí es invariante y eso se debe reflejar en la relaciónde dispersión del fotón. Vemos que en efecto es así si m = 0 y k es el momento del fotón. También se vela invariancia relativista en que el exponente que aparece en el campo puede escribirse como

ωkt−kx= kx kµ = (ωk,k), xµ = (t,x) (2.128)

siendo k y x cuadrivectores Lorentz, y k2 = 0.

La mejor forma de ver que k es el momento del estado |k,λ 〉 sería construir el operador momento Pµ

a partir del operador tensor energía-impulso T µν . Pero nos podemos convencer por otro argumento.

61

Page 62: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Dado que ak,λ es un operador, el campo A(x) también pasa ahora a ser un operador en el espacio deFock,29

A(x) =A(+)(x)+A(−)(x), A(−)(x) = (A(+)(x))†

A(+)(x) = ∑k,λ

1√2ωkV

ελ (k)e−ikxak,λ .

(2.129)

La dependencia en t se debe a que éste es el campo en imagen de Heisenberg. El campo en imagen deSchrödinger se obtiene tomando t = 0.

Si se compara A(+)(x) con el operador campo en (2.39), Ψ(x,σ) = ∑α ϕα(x,σ)aα , se identificaελ (k)eikx como la función de onda del fotón en el estado |k,λ 〉 (aquí α = (k,λ ) y σ = i = 1,2,3, lastres direcciones cartesianas del espacio R3 donde vive el vector ε, dicho de otra forma ϕα es un vector).

El factor eikx en la función de onda indica que en efecto k es el momento de la partícula. El momentoes el generador de las traslaciones y por definición un estado tiene momento k cuando bajo una traslacióna, ψ(x)→ψ(x−a), el estado cambia por una fase e−ika (es decir, cae en la irrep k). Una argumentaciónsimilar nos permite deducir que λ = ±1 es la helicidad del fotón. En efecto, si se aplica una rotación deángulo ϕ alrededor del eje k, se obtiene ελ (k)→ e−iλϕελ (k). Como es sabido, una rotación de ángulo ϕ

respecto del eje de cuantización de un estado | j,m〉 produce e−imϕ | j,m〉 y se deduce m = λ para el fotón.Si el fotón fuera una partícula masiva de espín j = 1, habría tres estados de espín m = 0,±1, sin embargoal no tener masa, y de acuerdo con la discusión general, cada estado de helicidad produce una irrep delgrupo de Poincaré. El fotón tiene dos estados, relacionados por una transformación de paridad, que es unasimetría de las ecuaciones de Maxwell.

Que el fotón es una partícula con espín 1 es se debe a que su campo es un vector, que sólo tenga dosestados de polarización se ha obtenido como consecuencia de la invariancia gauge. Un término de masa enel fotón rompería esta invariancia. De manera análoga, un campo escalar dará lugar a partículas con espíncero, y el campo gravitatorio, con campo gµν(x), da lugar a partículas con espín 2, los gravitones.30

Antes de proseguir, podemos estudiar el límite V → ∞, al quitar el regulador que es la caja cúbica. Enuna caja unidimensional, los momentos permitidos son k =

Ln, por tanto el salto entre dos k sucesivos

es ∆k2π

L, de aquí se deduce (para una función integrable Riemann f (k))

∫ dk2π

f (k) = limL→∞

∑n∈Z

∆k2π

f (kn) = limL→∞

1L ∑

n∈Zf (kn) (2.130)

29Es importante notar que x no es aquí un operador, sino meramente una etiqueta que distingue unos operadores de otros.30De nuevo los gravitones no tienen masa y sólo tienen dos estados de espín, covariancia general desempeña un papel análogo

a invariancia gauge.

62

Page 63: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

y en tres dimensiones1V ∑

k

f (k)→∫ d3k

(2π)3 f (k) (2.131)

y para las deltas correspondientes se tiene

V δkk′ → (2π)3δ (k−k′). (2.132)

Estas reglas para pasar del caso con y sin caja (en ambos sentidos) funciona bien y se puede aplicar encualquier momento sin mayores problemas.31

Podemos ahora definir los operadores de destrucción “normalizados” en R3 que denotamos aλ (k)

aλ (k) =√

V ak,λ (2.133)

de modo que

A(x, t) =∫ d3k

(2π)31√2ωk

∑λ

(ελ (k)e

−ikxaλ (k)+ε∗λ(k)eikxa†

λ(k)). (2.134)

Los operadores en R3 cumplen las relaciones de conmutación

[aλ (k),a†λ ′(k)

′] = (2π)3δ (k−k′)δλ ,λ ′ , [aλ (k),aλ ′(k

′)] = 0 (2.135)

Los estados a†k,λ |0〉 tienen función de onda ελ (k)e

ikx/√

V , y están normalizados a 1 en la caja. Los estadosaλ (k)

†|0〉 tienen función de onda ελ (k)eikx, de modo que su normalización es

〈k,λ |k′,λ ′〉= 〈0|aλ (k)a†λ ′(k

′)|0〉= 〈0|[aλ (k),a†λ ′(k

′)]|0〉= (2π)3δ (k−k′)δλ ,λ ′ , (2.136)

en acuerdo con ∫d3xe−ikxe−ik′x = (2π)3

δ (k−k′). (2.137)

2.3.3 Relaciones de conmutación

Por supuesto los campos eléctrico y magnético también pasan a ser operadores

E(x, t) =E(+)(x, t)+E(−)(x, t), B(x, t) =B(+)(x, t)+B(−)(x, t) (2.138)

31De hecho el error que se introduce por aproximar∫ dk

2πf (k) por 1

L ∑n∈Z

f (kn) es menor que cualquier O(1/Ln), si la función

(supuesta L1(R)) es C∞(R).

63

Page 64: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

con

E(+)(x) =∫ d3k

(2π)31√2ωk

∑λ

iελ (k)e−ikxaλ (k), E(−)(x) = (E(+)(x))†

B(+)(x) =∫ d3k

(2π)31√2ωk

∑λ

λελ (k)e−ikxaλ (k), B(−)(x) = (B(+)(x))†

(2.139)

Estos operadores A(x), E(x), B(x) (imagen de Schrödinger) satisfacen ciertas relaciones de conmu-tación que se obtienen fácilmente a partir de las relaciones de conmutación canónicas de los operadores decreación y destrucción. Por un lado

[Ai(x),A j(x′)] = [Ei(x),E j(x

′)] = 0 (2.140)

A(x) se corresponde con los operadores posición xi en el sistema de osciladores en (2.117). Teniendo encuenta que E(x) = −∂tA(x), se ve que −E(x) se corresponde con los momentos canónicos conjugadospi. El resultado obtenido refleja por tanto [xi,x j] = [pi, p j] = 0. Por otro lado, la relación [xi, p j] = iδ i

j sugiere

[Ai(x),E j(x′)] =−iδi jδ (x−x′) (2.141)

Esta relación es cualitativamente correcta pero no exactamente porque los campos A(x) y E(x) sontransversales por la condición de gauge de Coulomb. Entonces en vez de la parte derecha, que es (−iveces) la identidad en el espacio |x, i〉, se obtiene el proyector sobre el subespacio transversal

[Ai(x),E j(x′)] =−iPTi j(x−x′)≡−i

∫ d3k(2π)3 eik(x−x′)

(δi j−

kik j

k2

). (2.142)

Para el campo magnético se obtiene

[Ai(x),B j(x′)] = [Bi(x),B j(x

′)] = 0, [Bi(x),E j(x′)] = iεi jk∂kδ (x−x′). (2.143)

Estas relaciones de conmutación se derivan de las anteriores sin nuevo cálculo teniendo en cuenta la relación∇×A(x) =B(x).

Se confirma entonces que (A,−E) con canónicos conjugados (en el espacio transversal).32 Los opera-dores A(x) forman un conjunto completo de observables y lo mismo vale para los E(x). Por otro lado Ay E no conmutan y eso implica que en la teoría cuántica ambos observables están sujetos a una relación

32Si se hubiera postulado una versión fermiónica de estas relaciones de conmutación, se obtendría resultados inconsistentes,como se discutirá más adelante para el campo de Klein-Gordon.

64

Page 65: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

de incertidumbre y no pueden medirse simultáneamente con precisión arbitraria, y la misma limitación valepara E y B.

2.3.4 Divergencias infrarroja y ultravioleta

El espacio de Fock presenta una solución engañosamente simple. A y E tienen fluctuaciones cuánticasincluso en el vacío. Esto es así porque |0〉 no es un estado propio de A o E con valor propio cero como losería en la teoría clásica. Los operadores A(x) forman un conjunto completo de operadores y tienen unabase de estados propios de A(x), pero éstos no son los estados |(n)〉 propios de H. En realidad el vacío deFock |0〉 posee una estructura no trivial desde el punto de vista de A y E ya que es el estado fundamentalde un oscilador en muchas dimensiones, una gaussiana de hecho. Si | ~A (x)〉 representa un estado propiode los operadores A(x), la amplitud de probabilidad de encontrar este estado en el vacío es

〈 ~A (x)|0〉= Ne− 1

2∫ d3k

(2π)3∑λ ωk|Ak,λ |2 , ~A (x) =

∫ d3k(2π)3 ∑

λ

~ελ (k)eikxAk,λ . (2.144)

Las fluctuaciones de E(x) (o B(x)) en el estado vacío se pueden revelar calculando 〈0|E2(x)|0〉. Es fácilver que 〈0|E(x)|0〉 = 0, no hay un valor medio del campo eléctrico en el vacío. En cambio 〈0|E2(x)|0〉no sólo no se anula sino que de hecho diverge. Esto se puede ver incluso sin un cálculo detallado. Siconsideramos la energía del vacío, E0, teniendo en cuenta que

H =∫

d3x12(E2 +B2) (2.145)

y por el teorema del virial 〈E2〉= 〈B2〉 en un estado estacionario H,

E0 =∫

d3x〈0|E2(x)|0〉=V 〈0|E2(0)|0〉 (2.146)

usando invariancia traslacional del vacío (su momento es cero). E0 diverge cuando V → ∞. Esta unadivergencia infrarroja (IR). No es especialmente grave, sólo indica que el concepto más relevante es ladensidad de energía del vacío. Por otro lado

E0 = ∑k,λ

12

ωk =V∫ d3k

(2π)3 ωk (2.147)

que implica

〈0|E2(x)|0〉=∫ d3k

(2π)3 |k|, (2.148)

La integral es divergente para k grande. La densidad de energía presenta una divergencia ultravioleta(UV). Cada oscilador, cada grado de libertad contribuye a la energía del estado fundamental con una

65

Page 66: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

energía de punto cero 12 ωk. La divergencia IR se debe a que en cada unidad de volumen del espacio hay

grados de libertad y hay infinitos volúmenes unidad en todo el espacio. La divergencia UV se debe a quehay infinitos grados de libertad en cualquier unidad de volumen (por pequeña que se elija). Una región detamaño a contiene modos con k > 2π/a hasta infinito. Además de a la energía del vacío las fluctuaciones depunto cero de los osciladores contribuyen a la dispersión de E(x) en el vacío. Si se corta la integral |k|< Λ

el resultado crece como Λ4, es una divergencia cuártica. Una forma de regular el valor de 〈0|E2(x)|0〉 esusar un campo promediado. En vez de tomar el valor en x se hace un promedio sobre el campo en lospuntos de los alrededores en un entorno de tamaño a

E(x) =∫

d3r1a3 ρ(r/a)E(x−r) (2.149)

donde ρ(r) es una función suave normalizada, por ejemplo una gaussiana. Esto es una convolución por loque se suprimen los modos altos, por debajo de Λ ∼ 1/a. Cuando a→ 0 se recupera el campo original.Para el campo promediado se obtiene

〈0|E2(x)|0〉=Cρ

a4 (2.150)

donde Cρ depende de la elección concreta del perfil ρ(x). La dependencia en a estaba totalmente fijadapor dimensiones ya que [E] = M2 (estamos en el caso V → ∞ de modo que no hay otra escala que a).También se podría elegir calcular

〈0|E(x)E(x+a)|0〉 (2.151)

con un efecto similar: el resultado es finito y diverge como 1/a4 cuando a→ 0. Las divergencia IR y/o UVaparecen en teorías de campos por tener infinitos grados de libertad. Las que requieren más atención, almenos en 3+1 dimensiones, son las UV (estas divergencias empeoran cuando aumenta la dimensión, lasinfrarrojas al revés). El proceso de regular y eliminar las divergencias se denomina renormalización. Seestudiará en la Sec. 9. Las divergencias UV no son muy problemáticas en teorías libres, como es el campode radiación en ausencia de cargas.

Para la divergencia de la energía del vacío podemos simplemente notar que la dinámica no se modificasi se añade una constante al hamiltoniano. Por tanto podemos usar como hamiltoniano H ′ = H−E0. Eneste caso el vacío pasa a tener energía cero, el estado de fotón |k,λ 〉 tiene energía ωk, etc.

Una forma práctica de eliminar E0 y otros infinitos es usar orden normal,

H ′ = :12

∫d3x(E2(x)+B2(x)) : (2.152)

En efecto,: E2(x) : = (E(+)(x))2 +(E(−)(x))2 +2E(−)(x)E(+)(x) (2.153)

La diferencia entre E2(x) y : E2(x) : es un conmutador y es un c-número33 Además

0 =E(+)(x)|0〉= 〈0|E(−)(x) (2.154)33Un c-número es un operador que es un múltiplo de la identidad, conmuta con todo.

66

Page 67: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

implica 〈0| : E2(x) : |0〉= 0, y análogamente para B(x).

Como hemos visto aparecen divergencias UV cuando se multiplican campos en el mismo punto. Esto sedebe a que los campos no son estrictamente hablando operadores en el espacio de Fock, son operadoresimpropios, en el mismo sentido que los estados con función de onda δ (x−x0) o eikx son estados impropios.Los elementos de matriz 〈(n)|A(x)|(n′)〉 (y lo mismo para E o B) son finitos pero no así ‖A(x)|(n)〉‖2.En realidad los campos son distribuciones que toman valores en operadores. Esto quiere decir que siξ(x) es una función bien comportada (suave, caída rápida) el objeto

Aξ =∫

d3xA(x) ·ξ(x) (2.155)

sí es un operador del espacio de Fock (el campo eléctrico promediado E(x) es un ejemplo). Por otro ladoun producto de campos en el mismo punto, tal como E2(x)B2(x) no es ni siquiera un operador impropio.En cambio el objeto : E2(x)B2(x) : sí lo es.

2.4 Energía del vacío. Efecto Casimir

Como hemos visto, el campo de radiación tiene una energía de vacío

E0 = ∑k,λ

12

ωk, ωk = |k|. (2.156)

Éste es un término aditivo en el hamiltoniano y no tiene ningún efecto físico, mientras se mantengaconstante. Sin embargo, como observó Casimir, si se considera el campo de radiación en una cavidad, elespectro de ω(k) depende de la cavidad por las condiciones de contorno que modifican los momentos kpermitidos. Esto implica que la energía del vacío puede dar lugar a fuerzas observables sobre las paredesde la cavidad que trabajarán para minimizar la energía.

l

Un caso típico es el de dos láminas metálicas grandes paralelas separadas poruna distancia l. Sobre las superficies conductoras E‖ =B⊥ = 0. Estas condicionesdependen de l y dan lugar a una fuerza de atracción entre las láminas. La fuerzapor unidad de área es

F =− π2

240hcl4 (2.157)

Para ver el mecanismo basta considerar un caso más simple: un campo escalar φ(x) en una dimensiónespacial, con condición de contorno φ(x) = 0 en las paredes y ωk = |k|. Los modos normales son

67

Page 68: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

0 L

x

φn(x) = sen(knx), kn =πnL

= ωn, n = 1,2,3, . . . (2.158)

La energía del vacío es

E0(L) =∞

∑n=1

12

ωn (2.159)

Por supuesto es divergente UV (cuadráticamente divergente, en 1+ 1 dimensiones). Para regular la di-vergencia se puede introducir una frecuencia de corte, Λ, de modo que en la suma sólo estén incluidoslos modos ωn < Λ, y al tomar el límite Λ→ ∞ se recupere el problema original. En realidad para kn sufi-cientemente grande (longitudes de onda suficientemente pequeñas) importará las estructura atómica de lasláminas y modificará la descripción basada sólo en las condiciones de contorno. Sin necesidad de entrar endetalles sobre Λ, la idea es obtener una fuerza dependiente de Λ tal que tenga limite al quitar el regulador,aunque la energía misma diverja. Pero sí es importante que el corte se introduzca sobre el valor de kn, quees lo que tiene sentido físico, y no sobre n.

En lugar de introducir un corte brusco, del tipo θ(Λ−ωn), es más conveniente considerar uno másgeneral

EΛ0 (L) =

∑n=1

12

ωn f (ωn/Λ) (2.160)

El perfil f (x) debe ser una función tal que cuando Λ→∞ un modo ωn fijo sea contado con peso 1, y paraΛ finito, los modos ωn & Λ tengan peso cero. Eso requiere

limx→0

f (x)→ 1, limx→∞

f (x)→ 0, (2.161)

y además f (x)→ 0 suficientemente deprisa para contrarrestar el crecimiento de la suma de modos. Comoveremos la forma concreta de f (x) no es crucial. Lo más simple es elegir f (x) = e−x. Con esta elección lasuma se puede hacer de forma exacta y se obtiene

EΛ0 (L) =

π

8Lcsch2(

π

2LΛ) =

LΛ2

2π− π

24L+O(

1Λ2 ) (2.162)

Se comprueba que la divergencia es cuadrática. La fuerza entre las láminas viene dada por la variación dela energía al cambiar la separación y vemos que esa derivada también es cuadráticamente divergente. Sinembargo considerar sólo la variación de EΛ

0 (L) no es correcto, ya que al otro lado de una lámina tambiénhay radiación y su energía cambia en sentido contrario al mover la lámina. Para tener esto en cuentaconsideramos un sistema con dos láminas fijas separadas por una distancia L grande y otra entre las dos auna distancia l L de una de ellas

68

Page 69: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Ll0

La energía total del sistema es aditiva en las dos regiones más lasregiones externas que como son fijas sólo dan una constante aditiva

EΛ0,tot(l) = EΛ

0 (l)+EΛ0 (L− l)+C(L) (2.163)

Desarrollando la expresión para Λ→ ∞ y L→ ∞ se tiene

EΛ0,tot(l) =

LΛ2

2π− π

24l+O(

1L)+O(

1Λ2 )+C(L) (2.164)

Ahora si se obtiene una fuerza finita entre las láminas en el límite Λ,L→ ∞

F(l) =−dEΛ

0,tot(l)

dl=− π

24l2 (2.165)

Es una fuerza atractiva (la energía disminuye para l decrecientes). El mismo resultado se obtiene si seponen dos láminas fijas bien separadas y entre ellas dos láminas móviles lejos de las fijas.

El resultado obtenido no depende de la forma elegida para regular la divergencia UV. Esto se compruebausando la fórmula de Euler-McLaurin∫

0F(x)dx =

∑n=0

hF(hn)− 12

F(0)h+1

12F ′(0)h2 +O(h4) (2.166)

para h→ 0, donde F(x) es una función de C3(R) y L1(R).

En nuestro caso, (2.160) puede reescribirse como

EΛ0 (L) =

Λ

2

∑n=1

hn f (hn) =Λ

2

∑n=0

F(hn), F(x) = x f (x), h =π

LΛ(2.167)

Por las propiedades de f (x) en (2.161),

F(0) = 0, F ′(0) = f (0) = 1 (2.168)

aplicando ahora Euler-McLaurin para expresar la suma como una integral se obtiene

EΛ0 (L) =

Λ

2(Ch− h

12+O(h3)) =

LΛ2

2πC− π

24L+O(Λ−2), C =

∫∞

0F(x)dx (2.169)

La parte divergente depende del regulador mientras que la parte finita no depende y en consecuenciareproduce el resultado obtenido previamente para f (x) = e−x.

69

Page 70: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Teniendo en cuenta que el resultado es robusto, con frecuencia para sistemas más complicados seutiliza el siguiente método, basado en la función ζ de Riemann, para extraer directamente la parte finita.La función ζ (z) se define en el semiplano Re(z)> 1 como

ζ (z) =∞

∑n=1

1nz , Re(z)> 1 (2.170)

Es una función univaluada que se extiende al plano complejo como una función meromorfa cuya únicasingularidad es un polo simple en z = 1 con residuo 1. Usando continuación analítica se puede definir unaenergía E0 regulada como

E0(L) =∞

∑n=1

πn2L

−→ E0(L,s) =12

π

L

∑n=1

1ns =

π

2Lζ (s) (2.171)

El problema original corresponde a s =−1 y teniendo en cuenta que ζ (−1) =− 112

, se obtiene

E0(L) = E0(L,−1) =− π

24L(2.172)

que es directamente la parte finita de EΛ0 (L). Nótese que a s =−1 se llega por continuación analítica y no

está en el semiplano Re(s)> 1 donde la serie es convergente, de hecho el resultado obtenido es negativoaunque todos los sumandos en E0 son positivos.

2.5 Interacción radiación-materia

2.5.1 Tratamiento clásico

Consideremos ahora la interacción de cargas con el campo electromagnético. Las cargas son tratadasde forma no relativista y se suponen sin espín (momento magnético). Partimos de la teoría clásica y delhamiltoniano

H =N

∑i=1

p2i

2mi(2.173)

e introducimos el efecto de un campo electromagnético externo mediante la prescripción de acoplamientomínimo

pi→ pi−qiA(xi, t), H→ H−N

∑i=1

qiΦ(xi, t). (2.174)

qi es la carga de la partícula i-ésima. Esta prescripción se justifica porque el hamiltoniano correspondiente

H =N

∑i=1

((pi−qiA(xi, t))2

2mi+qiΦ(xi, t)

)(2.175)

70

Page 71: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

reproduce correctamente las ecuaciones de movimiento con la fuerza de Lorentz

mid2xi

dt2 = qi(E(xi, t)+vi×B(xi, t)), i = 1, . . . ,N (2.176)

donde vi(t) =dxi

dtes la velocidad de la partícula i-ésima.

Hasta aquí Aµ = (Φ(x),A(x)) es un campo externo (él actúa sobre las cargas pero las cargas no actúansobre él). En realidad la energía se conserva y la energía que ganan o pierden las cargas es a costa delcampo electromagnético, la interacción es mutua. La dinámica de Aµ(x) está descrito por las ecuacionesde Maxwell, que en el gauge de Coulomb toman la forma

−∇2Φ(x) = ρ(x) =

N

∑i=1

qiδ (x−xi(t)),

2A(x)+∇∂tΦ(x) = j(x) =N

∑i=1

qivi(t)δ (x−xi(t)).

(2.177)

La ecuación de Poisson no contiene ∂tΦ(x), y en consecuencia se puede resolver inmediatamente para darel potencial coulombiano

Φ(x) =N

∑i=1

qi

4π|x−xi(t)|(2.178)

Esto significa que Φ(x) no es un campo dinámico, no es un genuino grado de libertad del campo de radiación;ya vimos que había dos grados de libertad en cada punto, correspondientes a las dos polarizaciones de la luz.Φ(x) es una variable auxiliar, un funcional de ρ(x). (Φ es creado por las cargas.) El potencial coulombianoobtenido es instantáneo aunque la teoría de Maxwell es relativista. Esto es sólo un espejismo debido a laelección de gauge. Los grados de libertad físicos del campo de radiación se propagan a la velocidad de laluz y no hay interacción instantánea.

El hamiltoniano completo del sistema de cargas más radiación es34

H =N

∑i=1

((pi−qiA(xi))

2

2mi+

12

qiΦ(xi)

)+

12

∫d3x(E2

T (x)+B2(x)) (2.179)

donde ET (x) es la parte transversal de E(x). El campo eléctrico completo (en presencia de cargas) es

E(x) =EL(x)+ET (x), EL(x) =−∇Φ(x) ET (x) =−∂tA(x) (2.180)

34H es conservativo. xi,pi,A(x),ET (x) son variables dinámicas, no tienen dependencia intrínseca en t, sólo dinámica. Comoes usual esta dependencia se omite al escribir el hamiltoniano.

71

Page 72: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Nótese el factor 12 en qiΦ(xi, t). Dado que Φ(x) es creado por las cargas y no externo, el factor 1

2 evitacontar dos veces cada par i j cuando (2.178) se introduce en la expresión de H.35 El término coulombianose puede escribir como

N

∑i=1

12

qiΦ(xi) =∫

d3x12

ρ(x)Φ(x) =∫

d3x12E2

L(x) (2.181)

(usando la ecuación de Poisson) por lo que hamiltoniano también se puede escribir como

H =N

∑i=1

(pi−qiA(xi))2

2mi+

12

∫d3x(E2(x)+B2(x)) (2.182)

teniendo en cuenta que EL(x) y ET (x) son ortogonales dentro de la integral.

2.5.2 Tratamiento cuántico. Emisión espontánea

Podemos ahora proceder a la cuantización del sistema de cargas y radiación. xi y pi son operadoresen Hmat = L2(R3N) que obedecen las reglas de cuantización canónicas [x, p] = i. Análogamente A(x) y−ET (x) son los operadores canónicos conjugados en el espacio de Fock del campo de radiación, HF . Susrelaciones de conmutación son las que se obtuvieron en ausencia de cargas. Por su parte EL(x) o Φ(x) sonfunciones de los operadores xi. El espacio de Hilbert del sistema cuántico conjunto es H = Hmat⊗HF .El hamiltoniano del sistema es la versión cuántica de (2.179)

H = :N

∑i=1

((pi−qiA(xi))

2

2mi+

12

qiΦ(xi)

)+

12

∫d3x(E2

T (x)+B2(x)) : (2.183)

Aquí A(x) es un operador en HF y xi un operador en Hmat. Esto no es ningún problema para definirA(xi), que corresponde a

A(xi) =∫

d3xδ (x−xi)A(x) (2.184)

Por otro lado el orden normal sólo añade una constante aditiva independiente de todos los grados delibertad.

De cara a usar teoría de perturbaciones separamos el hamiltoniano en su parte libre y de interacción

H = H0 +HI, H0 = Hmat +Hrad (2.185)

Para la parte libre

Hmat =N

∑i=1

(p2

i

2mi+

12

qiΦ(xi)

), Hrad = :

12

∫d3x(E2

T (x)+B2(x)) : (2.186)

35Y sólo así la fuerza de Lorentz se sigue reproduciendo correctamente.

72

Page 73: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Hmat actúa sólo en Hmat y es la identidad en HF , y al revés para Hrad.

Hmat describe por ejemplo un átomo (siendo una de las cargas el núcleo y las otras electrones) tal ycomo se estudia en la teoría atómica no relativista. Tiene un espectro de estados propios |A〉. Estos estadosson estacionarios. Según Hmat no hay transiciones atómicas. Análogamente Hrad describe un sistema defotones sin interacción mutua ni con los átomos, con estados propios |(nk)〉. Los estados propios de H0 sonpor tanto del tipo |A〉⊗ |(nk)〉.

El término de interacción es

HI =N

∑i=1

(− qi

miA(xi)pi +

q2i

2mi: A2(xi) :

)(2.187)

Nótese que aunque xi y pi no conmutan A(xi)pi = piA(xi) por la condición de transversalidad de A(x).

El término de interacción sí acopla los dos espacios Hmat y HF y el estado |A〉⊗ |(nk)〉 ya no es unestado propio de H. Una consecuencia de esto son las transiciones radiativas en átomos. Consideremos porejemplo el proceso de emisión espontánea

|A〉⊗ |0〉 → |B〉⊗ |k,λ 〉 (2.188)

El estado inicial es el átomo en estado |A〉, con energía EA, que sufre una transición, mediada por HI aun estado atómico de menor energía |B〉, con energía EB, con emisión de un fotón (k,λ ), que se llevala energía restante, EA = EB +ωk. En presencia de HI el estado |A〉 es inestable con cierta vida media, τ

correspondiente a una anchura Γ = 1/τ en su energía.

Dado que la interacción electromagnética es débil (la constante de estructura fina α es pequeña)podemos quedarnos a primer orden en HI y aplicar la regla de oro de Fermi para una transición

|i〉 →HI| f 〉 w f i = 2πδ (E f −Ei)|〈 f |HI|i〉|2 (2.189)

donde w f i representa la probabilidad por unidad de tiempo para la transición |i〉 → | f 〉. La delta de Diracde conservación es el factor de espacio fásico (no hay transición A→ B+γ si EA ≤ EB). El segundo factores el elemento de matriz de transición. Podemos calcula este factor en nuestro caso,

〈 f |HI|i〉= 〈B|⊗ 〈k,λ |HI|A〉⊗ |0〉 (2.190)

El término : A2(x) : de HI no contribuye ya que contiene términos del tipo a†2 +a2 +a†a que no conectan|0〉 → |γ〉. Queda entonces (trabajamos en la caja de volumen V )

〈 f |HI|i〉=∫

Vd3x〈B|

N

∑i=1

(− qi

mi

)δ (x−xi)pi|A〉〈0|ak,λA(x)|0〉

=− 1√2ωkV

ε∗λ(k)〈B|

N

∑i=1

qi

mie−ikxipi|A〉

(2.191)

73

Page 74: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

El cálculo ha quedado reducido a un elemento de matriz atómico. Vamos a suponer que se trata de unatransición radiativa de baja energía de modo que λ R siendo λ la longitud de onda del fotón emitidoy R el tamaño del átomo, por ejemplo λ ≈ 4000− 7500 Å frente a R ≈ 1Å. Puesto que kR 1 se puededespreciar la exponencial para obtener

〈 f |HI|i〉=−1√

2ωkVε∗

λ(k)〈B|

N

∑i=1

qi

mipi|A〉 (2.192)

Esta es la aproximación dipolar eléctrica (E1). En efecto,

〈B|N

∑i=1

qi

mipi|A〉=−i〈B|

N

∑i=1

qi[xi,Hmat]|A〉=−i(EA−EB)〈B|N

∑i=1

qixi|A〉 (2.193)

El operador D=N

∑i=1

qixi es el operador momento dipolar eléctrico (se supone que ∑i qi = 0). La transición

dipolar es la dominante a menos que esté prohibida para |A〉→ |B〉 por alguna regla de selección.36 Se tieneentonces (usando ya que EA−EB = ωk)

〈 f |HI|i〉= i√

ωk

2Vε∗

λ(k)〈B|D|A〉. (2.194)

Para la anchura, sumando sobre estados finales del fotón,

ΓA→B+γ = ∑k,λ

w f i =V∫ d3k

(2π)3 ∑λ

2πδ (EB +ωk−EA)ωk

2V|ε∗

λ(k)DBA|2 . (2.195)

La dependencia en V se cancela como debe ser. La delta fija totalmente el valor de ωk = |k| y sólo queda laintegral sobre el ángulo sólido y la suma sobre helicidades. La anchura diferencial y separando por estadosfinales de helicidad es por tanto

dΓA→B+γ(k,λ )

dΩk=

ω3k

8π2 |ε∗λ(k)DBA|2 . (2.196)

(El resultado no depende de la elección concreta de ελ (k).) Si sólo se quiere la anchura total de A→ B+γ

hay que integral sobre ángulo sólido y sumar sobre helicidades

ΓA→B+γ =∫

dΩk∑λ

dΓA→B+γ(k,λ )

dΩk=

ω3k

8π2

∫dΩk ∑

λ=±1|ε∗

λ(k)DBA|2 . (2.197)

Se puede usar ∫dΩk ∑

λ=±1ε

iλ(k)ε∗ j

λ(k) =

∫dΩk(δi j− kik j) =

23

4πδi j (2.198)

36Dado que D es un operador vectorial, por el teorema de Wigner-Eckart |JA−JB| ≤ 1 y JA+JB > 0, y por paridad πA =−πB.

74

Page 75: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

para obtener finalmente

ΓA→B+γ =ω3

3π|DBA|2, ω = EA−EB . (2.199)

La anchura es de orden α, a través de |DBA|2.

75

Page 76: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

3 Campo de Klein-Gordon

La ecuación de Klein-Gordon aparece al buscar una ecuación que generalice la de Schrödinger pero seacompatible con invariancia relativista. Repitiendo el argumento de Schrödinger

p→−i∇ E→ i∂t , Pµ → i∂ µ (3.1)

para la ecuación relativista E2 = m2 +p2, se obtiene la ecuación de Klein-Gordon

(2+m2)φ(x) = 0 (3.2)

siendo 2= ∂µ∂ µ el d’lambertiano. Aquí φ(x) es un campo complejo que debería representar la función deonda de la partícula relativista. Tal partícula no tiene espín ya que como se vio φ(x) es un escalar Lorentz.Sin embargo surgen dos problemas con esta interpretación:1) La única corriente conservada y local asociada a la ecuación de Klein-Gordon (salvo un factor) es

jµ(x) = i(φ ∗(x)∂ µφ(x)−∂

µφ∗(x)φ(x)). (3.3)

Desgraciadamente la densidad j0(x) no tiene signo definido, y por tanto no puede representar una densidadde probabilidad. No hay una corriente de probabilidad conservada.2) La ecuación tiene soluciones con energía positiva y negativa. No hay un estado fundamental. En efecto,las soluciones tipo onda plana e−iEt+ikx producen soluciones

E =±√k2 +m2 (3.4)

En la teoría libre (de interacción) estos estados son estacionario pero se mezclarán en cuanto la teoría tengainteracción (o equivalentemente al hacer medidas). Por ejemplo, al acoplar un campo electromagnético laenergía podría disminuir indefinidamente emitiendo fotones.

Estos problemas aparecen en realidad en cualquier teoría cuántica relativista de una partícula. En unateoría relativista la energía se conserva pero no la masa en reposo y como consecuencia el número departículas tampoco se conserva.37 Los problemas sólo se resuelven en la versión multipartícula o segundo-cuantizada, es decir en una teoría cuántica de campos.

Si hubiera empezado con E =+√

m2 +p2 se tendría una ecuación tipo Schrödinger

i∂tψ(x) = hψ(x), h =+√

m2−∇2 (3.5)

37Si son partículas cargadas, que la carga se conserve tampoco garantiza que lo haga el número de partículas ya que secrearán pares partícula-antipartícula.

76

Page 77: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

El hamiltoniano h es un operador bien definido (es +√

m2 +p2 en representación de momentos), la ecuaciónes invariante relativista, el espectro es positivo empezando en E = m y la densidad ρ(x) = ψ∗(x)ψ(x) espositiva y produce una probabilidad conservada

ddt

∫d3xρ(x) = 0 (3.6)

Sin embargo tiene el defecto fundamental de no ser un operador local (y tampoco lo es la corriente deprobabilidad asociada). Esto quiere decir que bajo una deformación local de ψ(x) el valor de (hψ)(x) puedecambiar en un punto x0 aunque δψ(x) se anule en un entorno de ese punto. Un ejemplo bien conocido deoperador no local es e−a∇ψ(x) = ψ(x−a). Si se desarrolla en potencias de ∇ se obtiene el desarrollo enserie de Taylor. La situación para h es similar

h = m− 12m

∇2− 18m3∇

4 + · · · (3.7)

la no-localidad proviene de que el desarrollo en derivadas no se trunca, en cambio un operador diferencialsí es local. El alcance de la no-localidad es del orden de 1/m, es decir, de la longitud de onda Compton dela partícula. Una teoría no local no se considera consistente ya que justamente las teorías de campos seintrodujeron para evitar recurrir a una acción a distancia.

3.1 Campo de Klein-Gordon real

El lagrangiano del campo real de Klein-Gordon es

L (x) =12(∂µφ∂

µφ −m2

φ2) (3.8)

con φ(x) = φ ∗(x) y π(x) = ∂tφ(x).

3.1.1 Cuantización del campo

Para cuantizar la teoría sustituimos φ(x) y π(x) reales por operadores hermíticos,38

φ(x) = φ†(x), π(x) = π

†(x), (3.9)

con reglas de conmutación bosónicas

[φ(x),π(x′)] = iδ (x−x′), [φ(x),φ(x′)] = [π(x),π(x′)] = 0 (3.10)

que derivan de aplicar la regla de cuantización , P→−i[ , ]. φ(x) es el campo en imagen de Schrödinger,φ(x) = φ(x, t) es el campo en imagen de Heisenberg. Dado que la imagen de Heisenberg se obtiene de la

38Se podría reducir la teoría a un sistema de osciladores y cuantizarlos, aquí usamos segunda cuantización que da el mismoresultado.

77

Page 78: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

de Schrödinger mediante una transformación de semejanza, las mismas relaciones de conmutación valenpara cualquier tiempo siempre que sea el mismo en ambos campos, es decir,

δ (x0− x′0)[φ(x),π(x′)] = iδ (x− x′), δ (x0− x′0)[φ(x),φ(x′)] = δ (x0− x′0)[π(x),π(x′)] = 0 (3.11)

Como hamiltoniano tomamos

H =∫

d3x12(π2 +(∇φ)2 +m2

φ2) (3.12)

ya que, en imagen de Heisenberg proporciona la ecuación de Klein-Gordon para el campo,

∂tφ(x) =−i[φ(x),H] = π(x), ∂tπ(x) =−i[π(x),H] =∇2φ(x)−m2

φ(x),

(∂µ∂µ +m2)φ(x) = 0

(3.13)

Este resultado se obtiene usando sólo las relaciones de conmutación.39 (De hecho este cálculo es un casoparticular del desarrollado en (2.64).) Nótese que igualmente se hubiera obtenido la ecuación de Klein-Gordon eligiendo relaciones de conmutación fermiónicas. Sin embargo la cuantización como fermiones llevaa inconsistencias como veremos.

La ecuación de Klein-Gordon es muy parecida a la ecuación 2A= 0 del campo de radiación excepto porla presencia del término de masa y el hecho de que φ(x) es escalar y no vector como A(x).40 La soluciónde la ecuación es similar: Si se desarrolla el campo en ondas planas e−iEt+ikx la ecuación de Klein-Gordonimplica E =±ωk con

ωk =√

k2 +m2 (3.14)

por tanto la forma más general de φ(x) es

φ(x) =∫ d3k

(2π)3 (A(k)e−iωkt +B(k)e+iωkt)eikx =

∫ d3k(2π)3 (A(k)e

−ikx +B(−k)e+ikx) (3.15)

Aquí kµ = (ωk,k) y xµ = (t,x) y A(k) y B(k) son operadores. La condición φ(x) = φ †(x) implica B(−k) =A†(k). Finalmente la solución más general es

φ(x) =∫ d3k

(2π)31√2ωk

(a(k)e−ikx +a†(k)eikx) (k0 = ωk) (3.16)

El factor (2ωk)−1/2 se introduce por conveniencia.

39Hay que elegir el t de los campos en H (que no depende de t) igual al de los campos a derivar, como se hace en (2.67).40La partícula Klein-Gordon es por tanto una especie de fotón escalar y masivo.

78

Page 79: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Al igual que para fotones, en el campo φ(x) se puede definir un componente de energía positiva y otrade energía negativa,

φ(x) = φ(+)(x)+φ

(−)(x), φ(−)(x) = (φ (+)(x))†

φ(+)(x) =

∫ d3k(2π)3

1√2ωk

a(k)e−ikx (k0 = ωk)(3.17)

Derivando el campo respecto de t se obtiene el momento canónico,

π(x) =−i∫ d3k

(2π)3

√ωk

2(a(k)e−ikx−a†(k)eikx) (3.18)

Las ecuaciones de φ(x) y π(x) se pueden invertir para expresar a(k) y a†(k) en función de los campos

a(k) =1√2ωk

∫d3xeikx(ωkφ(x)+ iπ(x)) =

1√2ωk

∫d3xeikxi

↔∂tφ(x)

a†(k) =1√2ωk

∫d3xe−ikx(ωkφ(x)− iπ(x)) =

1√2ωk

∫d3xe−ikx(−i)

↔∂tφ(x)

(3.19)

con↔∂t =

→∂t −

←∂t . El resultado no depende de t. Es fácil entonces obtener las relaciones de conmutación de

los operadores a(k) y a†(k) a partir de las de φ(x) y π(x),

[a(k),a†(k′)] = (2π)3δ (k−k′) [a(k),a(k′)] = [a†(k),a†(k′)] = 0. (3.20)

Éstas son las relaciones de conmutación canónicas de un conjunto de operadores de creación y destrucciónde bosones. También es posible proceder al revés, postular estas relaciones y de ahí recuperar las relacionescanónicas para φ(x) y π(x), (3.10).

Es también interesante notar qué ocurre si se adopta una segunda cuantización fermiónica del campo deKlein-Gordon. El resultado es inconsistente. Si se postulan relaciones de conmutación estándar fermiónicaspara a(k) esto produce φ(x),π(x′)= 0 y φ(x),φ(x′) 6= 0. Por otro lado si se postulan relaciones deconmutación estándar fermiónicas para φ(x),π(x), el resultado es a(k),a†(k′)= 0 y a(k),a(k′) 6= 0.

De momento no se ha especificado cuál es el espacio de Hilbert en el que actúan estos operadorescampo. Si se hubiera partido del campo de Klein-Gordon como un conjunto de osciladores (lo cual esperfectamente aceptable) se hubieran obtenido los mismos resultados para las relaciones de conmutación yhamiltoniano, y además el espacio sería el espacio de Fock con vacío |0〉, dado por una gaussiana similar ala de (2.144) pero más simple. En vez de seguir este método hemos postulado las relaciones de conmutaciónde (φ ,π) y también el hamiltoniano. La ventaja de hacerlo así es que se podrían haber elegido relacionesfermiónicas que no aparecen a partir de osciladores armónicos. De hecho la versión fermiónica no funciona

79

Page 80: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

para el campo de Klein-Gordon, pero por ejemplo para el campo de Schrödinger (que también es unsistema lineal) sí lo hace, e igualmente para el campo de Dirac que veremos más adelante (y para el cualuna cuantización bosónica sería inconsistente).

A la vista de las relaciones de conmutación de los operadores a(k) y a†(k), que permiten su interpreta-ción como operadores de destrucción y creación bosónicos, postulamos que el espacio de Hilbert de nuestrosistema es el espacio de Fock asociado y tal que

a(k)|0〉= 0 ∀k (3.21)

Usando la expresión del campo en función de operadores de creación y destrucción, el hamiltoniano sepuede escribir como

H =∫ d3k

(2π)312

ωk

(a†(k)a(k)+a(k)a†(k)

)(3.22)

Aquí no se ha usado ninguna relación de conmutación. De nuevo se ve aquí que unas relaciones fermiónicasproducirían un H absurdo, a saber, completamente constante (múltiplo de la identidad), independiente delestado. Para bosones en cambio

H =∫ d3k

(2π)3 ωkN(k)+E0, E0 =V∫ d3k

(2π)312

ωk N(k) = a†(k)a(k) (3.23)

siendo V = (2π)3δ (0) el volumen del espacio. De manera análoga a lo que pasaba para los fotones, laspartículas descritas por el campo de Klein-Gordon real cuántico son bosones sin interacción, pero conmasa m y sin espín. Cada partícula con momento k aumenta la energía en ωk. Los estados propios delhamiltoniano son los estados con números de ocupación definidos41

|(nk)〉= ∏k

(a†k)

nk√

nk!|0〉, ∑

k

nk < ∞ (3.24)

Es importante notar que los dos problemas que tenía la teoría de una partícula, en la que la ecuaciónde Klein-Gordon era una versión relativista de la ecuación de Schrödinger y φ(x) la función de onda, sehan solucionado en la teoría de segunda cuantización. Por un lado |0〉 es el estado fundamental y todoslos demás estados propios tienen energía mayor. Por otro lado no hay ningún problema de probabilidadesnegativas. El espacio de Fock tiene un producto escalar definido positivo de modo que la probabilidadde detectar un estado |ψ1〉 en un estado |ψ2〉 (ambos normalizados) es |〈ψ1|ψ2〉|2 ≥ 0 como siempre. Lacondición de normalización 〈ψ|ψ〉= 1 se conserva en el tiempo.

En lugar de identificar la etiqueta k como el momento en un estado |k〉= a†(k)|0〉 a partir de la funciónde onda en el campo, (3.16), se puede hacer construyendo el operador momento. Para ello partimos de las

41Aquí usamos estados normalizados en una caja de tamaño V .

80

Page 81: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

expresiones clásicas

T µν(x) = ∂µ

φ∂νφ −gµνL , Mαµν(x) = xµT αν − xνT αµ (3.25)

cambiando campos clásicos por cuánticos. De esta forma se obtiene para el operador momento

P =−∫

d3xπ(x)∇φ(x) =∫ d3k

(2π)3kN(k)+P0, P0 =V∫ d3k

(2π)312k (3.26)

Se obtiene que cada nueva partícula, obtenida al aplicar a†(k), aumenta en k el momento. P0 representael momento del vacío que debería anularse. En efecto se puede argumentar que la integral se anula porinvariancia rotacional o paridad, sin embargo el argumento no es concluyente ya que la integral no esconvergente UV. Supondremos que se aplica una regularización UV adecuada tal que P0 = 0.

3.1.2 Invariancia relativista y unicidad del vacío

Hasta ahora hemos procedido de manera no del todo sistemática proponiendo tentativamente relacionesde conmutación, la forma del hamiltoniano y el espacio de Hilbert. El propósito último es construir unateoría cuántica basada en campos que sea internamente (matemáticamente) consistente y compatible coninvariancia relativista y otras propiedades fenomenológicas básicas. Todas las teorías que cumplan estosrequisitos serán lógicamente posibles y el experimento debe decidir entre ellas.

La teoría cuántica requiere un espacio de Hilbert de estados y unos operadores hermíticos que co-rrespondan a observables.42 Para el campo de Klein-Gordon se postula el espacio de Fock bosónico HF

como espacio de Hilbert, a través de las ecuaciones de movimiento esto fija las relaciones de conmutaciónbosónicas de φ(x) y π(x). Los observables intensivos son operadores locales (productos de campos yderivadas de campos en un mismo punto) con orden normal para que sean operadores al menos impropios(esto basta para renormalizar los infinitos de una teoría libre). Los observables extensivos son integralesespaciales de los intensivos.

La invariancia relativista requiere que el espacio de Hilbert lleve una representación unitaria del grupode Poincaré,43 U(Λ,a),

U(Λ,a) = eiaµ Pµ

e−i2 ωµν Jµν

(3.27)

donde los generadores Pµ y Jµν son operadores hermíticos en HF satisfaciendo el álgebra de Poincaré

[Jµν ,Jαβ ] = i(gναJµβ −gµαJνβ −gνβ Jµα +gµβ Jνα)

[Jµν ,Pα ] = i(gναPµ −gµαPν), [Pµ ,Pν ] = 0.(3.28)

42En teorías con fermiones los observables deben ser de paridad bosónica. Y hay otras reglas de superselección, por ejemploneutralidad eléctrica, invariancia gauge (abeliana y no abeliana), etc.

43En realidad una representación proyectiva en presencia de fermiones.

81

Page 82: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Para el campo de Klein-Gordon este requisito se satisface con

Pµ =∫

d3xT 0µ(x), Jµν =∫

d3xM0µν(x)

T µν(x) = : ∂µ

φ(x)∂ νφ(x)−gµνL (x) : Mαµν(x) = xµT αν(x)− xνT αµ(x)

(3.29)

Siendo Pµ y Jµν operadores cuadráticos en los campos, el orden normal da una constante aditiva (aunquedivergente UV) y por tanto se puede obviar en el cálculo de los conmutadores. Este cálculo es prácticamenteidéntico al de la teoría clásica con paréntesis de Poisson y se comprueba que en efecto el álgebra de Lie(3.28) se satisface. No sería así sin orden normal. (En la parte derecha faltarían las constantes aditivasmencionadas, también se vería la inconsistencia tomando valor esperado en el vacío en ambos lados de lasrelaciones de conmutación).

En consecuencia para los operadores hamiltoniano y momento se tiene

H = :∫

d3x12(π2 +(∇φ)2 +m2

φ2) :, P = :

∫d3xπ(x)(−∇)φ(x) :,

Pµ =∫ d3k

(2π)3 kµ N(k) (k0 = ωk).

(3.30)

Otra propiedad que debe cumplirse (y en efecto lo hace) es que el campo de Klein-Gordon se transformeescalarmente bajo el grupo de Poincaré, es decir,44

U(Λ,a)φ(x)U†(Λ,a) = φ(Λx+a) (3.31)

Nótese la consistencia de esta expresión con

U(Λ1,a1)U(Λ2,a2) =U(Λ1Λ2,a1 +Λ1a2). (3.32)

(Para un campo clásico o una función de onda la transformación consistente es φ(x)→ φ(Λ−1(x− a)).)Dado que una transformación U(Λ,a) finita es producto de transformaciones infinitesimales (por ser ungrupo de Lie), basta comprobar la transformación escalar en el caso infinitesimal.

eiδaµ Pµ− i2 δωµν Jµν

φ(x)e−iδaµ Pµ+ i2 δωµν Jµν

= φ(x)+ [φ(x),−iδaµPµ +i2

δωµνJµν ]

φ(x+δx) = φ(x)+δxµ∂µφ(x) = φ(x)+(δaµ∂

µ +δωµνxν∂

µ)φ(x)(3.33)

La igualdad de ambas expresiones requiere

− i[φ(x),Pµ ] = ∂µ

φ(x) − i[φ(x),Jµν ] = (xµ∂

ν − xν∂

µ)φ(x). (3.34)

44Fórmulas análogas se cumplen para φ (±)(x).

82

Page 83: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Lo hacemos explícitamente para traslaciones. El caso µ = 0 no es más que una de las ecuaciones demovimiento en (3.13). El caso µ = i se verifica igualmente (el orden normal puede obviarse en el conmutadory también es útil que Pµ es una constante de movimiento)

− i[φ(x, t),Pi] = i[φ(x, t),∫

d3yπ(y, t)∂iφ(y, t)] =−i∫

d3y [φ(x, t),π(y, t)]∂ iφ(y, t) = ∂

iφ(x, t). (3.35)

Automáticamente la propiedad de transformación Poincaré en (3.31) se va a cumplir para otros opera-dores locales O(x), si son escalares (por ejemplo : ∂µφ(x)∂ µφ(x) :) o más generalmente, de acuerdo con larepresentación del grupo de Lorentz que corresponda, así por ejemplo el operador Aµ(x) ≡: φ(x)∂ µφ(x) :se transformará según45

U(Λ,a)Aµ(x)U†(Λ,a) = (Λ−1)µνAν(Λx+a). (3.36)

Un postulado relacionado con éste de transformación de operadores locales, es el postulado de micro-causalidad, que requiere que dos operadores locales conmuten si su separación es tipo espacio

[O1(x1),O2(x2)] = 0 para (x1− x2)2 < 0 (3.37)

Esta propiedad garantiza que una acción física no se propague a velocidad supralumínica. (Si no fuera así,en otro sistema de referencia el efecto precedería a la causa.) Esta propiedad de hecho se verifica para elcampo de Klein-Gordon, como se verá más adelante (Sec. 3.6.3).

En una teoría cuántica de campos relativista el estado fundamental se denomina vacío. Otro requisitoque suele imponerse en estas teorías es que el vacío sea no degenerado.46 En particular eso implica quedebe ser invariante bajo transformaciones de simetría, y para invariancia relativista, que el vacío ocupe larepresentación trivial del grupo de Poincaré. Es decir,

U(Λ,a)|0〉= |0〉, Pµ |0〉= 0, Jµν |0〉= 0 . (3.38)

El vacío es idéntico para cualquier observador inercial y no tiene momento lineal, energía o momentoangular. (Si tuviera momento lineal o angular sería degenerado, aplicando una rotación). Aunque no es elcaso del campo de Klein-Gordon real, en general puede haber cargas conservadas. El vacío tiene que serneutro, de otro modo por CPT habría otro estado con la misma energía y carga opuesta, como se discutemás adelante.

Estas propiedades deseables se satisfacen en la teoría libre (e igualmente para campos con otros espines,o cargados). Este es el caso ideal. En teorías con interacción estas propiedades se postulan y el juego es

45De nuevo, para un campo clásico sería Aµ (x)→ Λµν Aν (Λ−1(x−a)).

46Si fuera degenerado, bien habría efecto túnel que bajaría la energía o una barrera infinita y los espacios construidos sobredistintos vacíos jamás se verían.

83

Page 84: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

renormalizar (dar sentido) esas teorías de modo que se cumplan.

3.2 Campo de Klein-Gordon complejo

El lagrangiano y momentos canónicos son

L (x) = ∂µφ∗∂

µφ −m2

φ∗φ , π(x) = ∂tφ(x), π

∗(x) = ∂tφ∗(x). (3.39)

En la teoría cuántica φ(x) es un operador y φ †(x) (que ya no coincide con φ(x)) otro. Una opción esexpresar estos campos en términos de campos reales φ(x) = (φ1(x)+ iφ2(x))/

√2. El lagrangiano es suma

de lagrangianos de campos reales y se aplica todo lo que se ha hecho previamente para el campo realde Klein-Gordon, con un espacio de Fock de dos tipos de partículas, a1(k) y a2(k). Equivalentemente, sepuede trabajar con φ(x) y φ †(x) con pasos similares a los del campo real. Las relaciones de conmutaciónson

[φ(x),π†(x′)] = [φ †(x),π(x′)] = iδ (x−x′)

[φ(x),φ(x′)] = [φ(x),φ †(x′)] = [φ(x),π(x′)] = [π(x),π(x′)] = [π(x),π†(x′)] = 0(3.40)

(las dos que faltan se obtienen tomando adjunto de éstas). Las ecuaciones de movimiento (en imagen deHeisenberg) son

(∂µ∂µ +m2)φ(x) = 0, (∂µ∂

µ +m2)φ †(x) = 0 (3.41)

con solución

φ(x) =∫ d3k

(2π)31√2ωk

(a(k)e−ikx +b†(k)eikx)

φ†(x) =

∫ d3k(2π)3

1√2ωk

(b(k)e−ikx +a†(k)eikx)

(k0 = ωk =+√k2 +m2) (3.42)

Puesto que φ(x) no es hermítico a(k) y b(k) no están relacionados como en el caso real. Estos operadoresestán relacionados con los a1,2(k) mediante

a(k) =1√2(a1(k)+ ia2(k)), b(k) =

1√2(a1(k)− ia2(k)) (3.43)

implica que a†(k)|0〉 y b†(k)|0〉 son estados ortogonales (al igual que a†1(k)|0〉 y a†

2(k)|0〉). Las relacionesde conmutación independientes son

[a(k),a†(k′)] = [b(k),b†(k′)] = (2π)3δ (k−k′)

[a(k),a(k′)] = [a(k),b(k′)] = [a(k),b†(k′)] = [b(k),b(k′)] = 0.(3.44)

Y las ecuaciones de movimiento derivan del hamiltoniano

H = :∫

d3x(π†π +∇φ

†∇φ +m2φ

†φ) : =

∫ d3k(2π)3 ω(k)(a†(k)a(k)+b†(k)b(k)) (3.45)

84

Page 85: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Para el operador momento se obtiene un resultado similar

P =∫ d3k

(2π)3k(a†(k)a(k)+b†(k)b(k)) (3.46)

Tenemos dos tipos de partículas y el cuadrimomento es la suma de cada sector. Los estados estacionariosson

|(n,n′)〉= ∏k

(a†k)

nk√

nk!(b†

k)n′k√

n′k!|0〉 (3.47)

(Por supuesto los espacios de Fock generados por a† y b† o a†1,2 son el mismo.)

En esta teoría hay dos tipos de partículas, que podemos llamar de tipo a y tipo b, con idéntica masa m.φ(x) destruye partículas de tipo a y crea de tipo b mientras que φ †(x) destruye de tipo b y crea de tipo a.Como vamos a ver enseguida a estas partículas se les puede asignar cargas opuestas ±q (del tipo que sea,por ejemplo eléctrica, u otra) de modo que el efecto neto de φ(x) cambiar la carga en −q unidades y φ †(x)en +q unidades. Se dice que b es la antipartícula de a (y viceversa). De hecho que cada partícula cargadatenga una antipartícula con igual masa (y vida media en su caso) y espín y todas las cargas opuestas esun resultado general en teoría cuántica de campos relativista. En efecto, en una teoría cuántica (relativistao no) hay partículas virtuales, es decir, fuera de la capa de masas, E 6= ω(k) durante tiempos talesque ∆t∆E ≈ h. Esto permite conectar puntos con separación tipo espacio (esto se discute más adelante).Consideremos el intercambio de un pion entre un protón y un neutrón visto por observadores en dos sistemasde referencia inerciales distintos

t1

t2

t2t

1

t’2

t’1

t’1

t’2

t’t π

p

p

n

n

<

n

boost

π

p

pn

>

−+

Para un observador t1 < t2: en t1 el protón emite un pion positivo que luego es absorbido por el neutrón en t2,se intercambia una partícula cargada positivamente. Para el otro observador t ′1 > t ′2 (posible si la separaciónes tipo espacio), de modo que es el neutrón el que emite un pion negativo en t ′2 y éste es posteriormenteabsorbido por el protón en t ′1. De hecho, por consistencia entre cuántica y relatividad toda partícula cargadadebe tener una antipartícula. Así la antipartícula del π+ es el π−, del electrón es el positrón, del K0 elK0 (aunque son eléctricamente neutros tiene cargas de extrañeza opuestas), etc. Las partículas neutrasson sus propias antipartículas. Por ejemplo el fotón, o el pion neutro, π0. Así π± se describe mediante uncampo de Klein-Gordon complejo o cargado y π0 mediante un campo de Klein-Gordon real o neutro.Intercambiar partículas con antipartículas no modifica la energía, esta es la simetría de conjugación de

85

Page 86: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

carga.47

3.3 Cargas conservadas

A diferencia del caso real, para el campo complejo de KG hay una simetría continua interna, a saber

φ(x)→ eiqλφ(x), φ

†(x)→ e−iqλφ

†(x), (3.48)

siendo λ ∈ R el parámetro del elemento del grupo U(1) 3 ω = eiλ y q también real es la carga del campoφ(x). Esta simetría va a tener una carga asociada conservada (de tipo abeliano).

Hay varias observaciones relevantes:

La carga podría absorberse en λ lo cual equivale a q = 1 pero es preferible dejarla como un parámetroexplícito ya que en general habrá varios campos φA(x) cada uno con su carga respondiendo a una mismatransformación

φA(x)→ eiqAλφA(x). (3.49)

Por ejemplo, si se tienen N campos libres

L0(x) =N

∑A=1

(∂µφ†A(x)∂

µφA(x)−m2

Aφ†A(x)φA(x)) (3.50)

el grupo de simetría es en realidad⊗

A U(1)A (NA factores) ya que cada campo puede transformarseindependientemente, habría N cargas abelianas conservadas.48 Si ahora se añade un término de interacción,es decir, no cuadrático en los campos, por ejemplo N = 2 y 49

L (x) = L0(x)−λ

†2 φ

21 −

λ ∗

†1

2φ2 (N = 2) λ 6= 0 (3.51)

el grupo es U(1) y además necesariamente q2 = 2q1. Tal y como está, q1 es arbitrario y su valor sólo podríarestringirse por interacción con nuevos campos, mientras la simetría se mantenga. Esto es general, la cargade un campo hay que asignarla por interacción con otros campos de modo que L (x) sea invariante, si elloes posible.

47Es una simetría en la teoría libre, puede violarse por términos de interacción. Sin embargo la existencia de antipartículascon masas y vidas medias idénticas se mantiene, ya que estas propiedades derivan de una simetría más sofisticada, CPT , quees exacta en cualquier teoría.

48Si además algunas de las masas son iguales la simetría aumenta. Por ejemplo si son todas las masas son iguales el gruposería U(N), un grupo no abeliano para N > 1.

49No me preocupo ahora por el hecho de que esta teoría produce un hamiltoniano no acotado inferiormente y por tanto noes viable.

86

Page 87: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Si se tuviera en cambio

L (x) = L0(x)−λ

†2 φ

21 −

λ ∗

†1

2φ2− εφ

†2 φ1− εφ

†1 φ2 (N = 2) (3.52)

(λ 6= 0 y ε 6= 0) la simetría se pierde porque no hay modo de asignar las cargas q1,2 de modo que L (x)sea invariante. Aún así, si ε es pequeño la carga (asignada a partir del lagrangiano con ε = 0) puede serútil para clasificar los estados, al ser aproximadamente conservada.

Otra observación es que el grupo U(1) sólo tiene representaciones enteras, q ∈ Z, de modo que lairrep e−iqλ = ω−q sea univaluada como función de ω. Sin embargo en mecánica cuántica deben admitirserepresentaciones proyectivas (representaciones salvo una fase50). Esto equivale a usar representacionesdel grupo recubridor universal51 que es (R,+) para U(1) y ahí q puede tomar cualquier valor real.52 qpuede restringirse cuando U(1) aparece como subgrupo de por ejemplo SU(2), que coincide con su propiorecubridor (SU(2) es simplemente conexo) lo cual cuantiza las cargas permitidas.

Finalmente, otra observación es que para el campo real de KG también hay “cargas” conservadas, esdecir, operadores hermíticos que conmutan con el hamiltoniano y no están relacionados con el grupo dePoincaré. Un ejemplo es el operador número de partículas, (usando aquí la versión del sistema en una cajaV )

N = ∑k

a†kak . (3.53)

De hecho cualquier operador del tipoN = ∑

k

f (k)a†k′ak (3.54)

donde f (k) depende sólo de ‖k‖, y k′ depende de cualquier forma de k con la única condición ‖k′‖= ‖k‖,es conservado. Es fácil añadir condiciones sobre f y k′ para que N se además hermítico. En efecto la teoríalibre admite infinitas “leyes de conservación”. Sin embargo todos estos operadores tienen un problemafundamental, y es que no derivan de una corriente local conservada y generarían transformaciones desimetría no locales. Además tales simetrías no sobreviven a introducir interacción.53 Volveremos sobre estepunto.

Volviendo al caso de un campo KG complejo con carga q, la corriente conservada es la versión cuánticade la corriente clásica Noether

jµ(x) = iq : (φ †(x)∂ µφ(x)−∂

µφ

†(x)φ(x)) : (3.55)50Un ejemplo es el grupo de rotaciones, una auténtica representación requiere que a una rotación de 2π le corresponda el

operador identidad, sin embargo se obtiene −1 para estados fermiónicos.51El recubridor de un grupo conexo es el único (salvo isomorfismos) grupo conexo y simplemente conexo con la misma

álgebra de Lie.52q complejo también corresponde a una representación pero no unitaria si q no es real.53Aunque también en las teorías con interacción hay infinidad de “cargas conservadas” pero no locales. Como ya se comentó

hay infinitas formas de deformar la configuración espacio-temporal de un campo de modo que la acción no cambie.

87

Page 88: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

que en efecto satisface ∂µ jµ(x) = 0. La carga conservada es

Q = iq∫

d3x : (φ †(x)π(x)−π†(x)φ(x)) : (3.56)

que puede reescribirse como

Q = q∫ d3k

(2π)3 (a†(k)a(k)−b†(k)b(k)) = qNa−qNb . (3.57)

La dependencia en t se cancela. La expresión obtenida implica que las partículas de tipo a y b tienen cargasq y −q respectivamente.54

Teniendo en cuenta la expresión del hamiltoniano

H =∫ d3k

(2π)3 ω(k)(a†(k)a(k)+b†(k)b(k)), (3.58)

es inmediato que[H,Q] = 0 (3.59)

de modo que Q se conserva, y al mismo tiempo H es invariante bajo las transformaciones generadas porQ. La representación de U(1) en el espacio de Fock viene dada por la familia de operadores unitarios55

U(λ ) = e−iλQ (3.60)

Como es de esperar se satisface

U(λ )φ(x)U†(λ ) = eiqλφ(x), U(λ )φ †(x)U†(λ ) = e−iqλ

φ†(x), (3.61)

En efecto considerando el caso infinitesimal δλ , esta relaciones equivalen a

[Q,φ(x)] =−qφ(x) [Q,φ †(x)] = qφ†(x) (3.62)

que son inmediatas usando la expresión de Q en ec. (3.56).56 También pueden reescribirse como

[Q,a(k)] =−qa(k), [Q,a†(k)] = qa†(k), [Q,b(k)] = qb(k), [Q,b†(k)] =−qb†(k). (3.63)

En general, si un operador Op se transforma según la representación p de U(1)

U(λ )OpU†(λ ) = eipλ Op, [Q,Op] =−pOp, (3.64)

54Nótese que aunque Na y Nb son objetos no locales por separado, la combinación Na− Nb sí es local, a la vista de lacorriente.

55Por supuesto esta fórmula es análoga a U(a) = e−ia·P para traslaciones, o U(θ) = e−iθ ·J para rotaciones.56Como siempre el orden normal no molesta al diferir sólo en un c-número de la expresión sin orden normal

88

Page 89: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

esto nos indica que Op destruye p unidades de carga (y O†p crea p unidades). En efecto, si |ψ〉 tiene carga

p′

Q|ψ〉= p′|ψ〉 (3.65)

se tendrá que Op|ψ〉 tiene carga p′− p ya que

QOp|ψ〉= (OpQ− pOp)|ψ〉= (p′− p)Op|ψ〉. (3.66)

El vacío tiene carga ceroQ|0〉= 0 (3.67)

(por a|0〉 = b|0〉 = 0) y en consecuencia Op|0〉 tiene carga −p y O†p|0〉 carga p. En particular, el campo

φ(x) hace disminuir la carga en q unidades ya que es de la forma a+b†, o bien destruye una partícula ao crea una de tipo b en ambos casos la carga disminuye en q unidades, y similarmente para φ † ∼ b+ a†

hacer cambiar la carga en +q.

También se deduce que 〈0|Op|0〉= 0 si p 6= 0, ya que las cargas de Op|0〉 y |0〉 difieren. Alternativamente,(usando U(λ )|0〉= |0〉)

〈0|Op|0〉= 〈0|U†(λ )U(λ )OpU†(λ )U(λ )|0〉= e−ipλ 〈0|Op|0〉 (3.68)

igualdad que requiere p = 0 o 〈0|Op|0〉= 0.

Hasta ahora hemos considerado que tenemos un solo campo de KG complejo (y su adjunto) con lo sepuede hablar de “carga” sin especificar su naturaleza. En efecto, para un campo dado la corriente jµ(x) esúnica salvo el valor de q y entonces todas los operadores carga que tenga la partícula correspondiente sonproporcionales: la carga de tipo i (por ejemplo, eléctrica, extrañeza, bariónica, etc) es qi veces el númerode partículas menos antipartículas presente en el estado cuántico. Esto deja de ser así cuando hay más deuna especie. Si hay campos φA(x) con A = 1, . . . ,N, con cargas qA,i (A especie, i tipo de carga), se tendrápara el operador carga de tipo i

Qi =N

∑A=1

qA,iQA, QA = NA− NA, (3.69)

y habrá un grupo U(1)i por cada tipo de carga:

Ui(λi) = e−iλiQi , Ui(λi)φA(x)U†i (λi) = eiqA,i φA(x) . (3.70)

Aún así puede haber relaciones entre las cargas Qi si hay pocas especies. Por ejemplo, si sólo haypiones y nucleones (π− es la antipartícula de π+, π0 es neutro, protón-antiprotón y neutrón-antineutrón)un término del lagrangiano del tipo

LI = ψ†pψnφπ+ (3.71)

89

Page 90: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

(ψp,n denota los campos de protón y neutrón,57 LI destruye un π+ y un neutrón y crea un protón)58

requiereQp,i = Qn,i +Qπ+,i (3.72)

para cualquier tipo de carga i. Esto implica que las cargas de p y n fijan las de π± para cualquier i y sólopuede haber dos cargas independientes: así en nuestro caso I3 (tercera componente de isospín), Q (cargaeléctrica) y B (número bariónico) están relacionados por Q = 1

2 B+ I3. Esta relación puede modificarse si seañaden nuevas especies de campos, con extrañeza, etc.

3.4 Simetrías internas

Como ya se ha comentado un lagrangiano como

L (x) =N

∑A=1

(∂µφ†A∂

µφA−m2

φ†AφA) (3.73)

(todas las masas iguales) es invariante bajo transformaciones del tipo

φA→UAB φB (3.74)

donde, como siempre, hay suma implícita sobre B y U es una matriz unitaria N×N,59 de modo que

φ†A →U ∗

AB φB = φBU †BA (3.75)

o en notación matricial, introduciendo un vector columna Φ(x) tal que (Φ)A = φA,

L (x) = ∂µΦ†∂

µΦ−m2

Φ†Φ (3.76)

Φ→U Φ, Φ†→Φ

†U †, U ∈ U(N) (3.77)

La condición de que (Φ′)† = (Φ†)′ ( ′ se refiere a transformado) introduce U † y la condición de que L (x)sea invariante requiere que U † = U −1, es decir, que U sea unitaria.

También se puede considerar el caso de N campos reales degenerados en masa: φ†A = φA

L (x) =12

∂µΦT

∂µ

Φ− 12

m2Φ

TΦ (3.78)

57El convenio es que un campo φA destruye la partícula A y crea la antipartícula A, φ†A = φA.

58Este término y su adjunto describe procesos (reales o virtuales) A+B→ C como el descrito y también sus cruzados,B→C+ A, etc, cambiando una partícula en un lado de la reacción por su antipartícula en el otro. Nótese que los campos delos nucleones, al tener espín 1/2, no son de KG.

59Los elementos de matriz de U son números complejos, no operadores.

90

Page 91: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

(ΦT se refiere a matriz traspuesta, es decir, (φA) dispuesto como un vector fila). Este lagrangiano esinvariante bajo transformaciones ortogonales (reales)

Φ→A Φ, Φ†→Φ

†A T , A ∈ SO(N) (3.79)

Nos quedamos con la parte conexa del grupo, las componentes disconexas se obtienen mediante transfor-maciones discretas que no estamos estudiando aquí. Las matrices ortogonales, A −1 =A T , son las unitariasreales, y SO(N) son las rotaciones en N dimensiones. Este grupo tiene N(N−1)/2 generadores.

Para concretar consideremos el caso N = 3 que describe el caso de piones. Tenemos tres campos de KGreales ~φ = (φ1,φ2,φ3) (uso notación vectorial) y

L (x) =12

∂µ~φ ·∂ µ~φ − 1

2m2~φ ·~φ . (3.80)

Este lagrangiano es invariante bajo rotaciones SO(3)

~φ(x)→ ~φ ′(x) = R−1~φ(x), R ∈ SO(3). (3.81)

Estas rotaciones son en el denominado espacio de isospin que es el espacio interno del índice i = 1,2,3de los campos. Estas rotaciones no están relacionadas con las rotaciones espaciales (aunque los grupos sonisomorfos), se puede indicar el grupo como SO(3)I para distinguirlas.

Nótese que se ha usado el convenio de denotar R−1 = RT a la matriz que actúa sobre ~φ (en vez deR). Esto es así para que la aplicación R 7→U(R) sea una representación (homomorfismo), siendo U(R) eloperador unitario en H que realiza la transformación:

~φ(x) 7→U(R)~φ(x)U†(R) = R−1~φ(x). (3.82)

En efecto, si se hacen dos transformaciones sucesivas

U(R1)U(R2)~φ(x)U†(R2)U†(R1) = R−12 U(R1)~φ(x)U†(R1) = R−1

2 R−11

~φ(x)

=U(R1R2)~φ(x)U†(R1R2)(3.83)

(Ri j son simples números y conmutan con los operadores U) y se verifica U(R1R2) =U(R1)U(R2).

La representación unitaria se realiza a través de generadores ~I

U(R) = e−i~θ ·~I (3.84)

siendo ~θ = θ n los parámetros de la rotación R. La forma de ~I se obtiene a partir de la corriente de Noether:Dado que para una rotación infinitesimal Ri j = δi j− εi jkδθk, δ~φ = −δ~θ ×~φ , tenemos para las corrientes

Noether δJ µ =∂L

∂∂µ~φ·δ~φ , y aplicando orden normal

~J µ(x) =: ~φ(x)×∂µ~φ(x) : (3.85)

91

Page 92: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

y finalmente~I =

∫d3x : ~φ(x)×~π(x) : (3.86)

Puede ahora comprobarse que

[~I,H] = 0, [Ii, I j] = iεi jk Ik, [Ii,φ j(x)] = iεi jk φk(x). (3.87)

Los campos (φ1,φ2,φ3) son reales y corresponden a lo que sería la base cartesiana. Los campos físicos(con cargas eléctricas bien definidas) corresponden a (casi) la base esférica

φπ0(x) = φ3(x), φπ±(x) =1√2(φ1(x)∓ iφ2(x)) (3.88)

Para piones la relación Q = 12 B+ I3 se reduce a Q = I3, y π0,± son los estados con I3 bien definido:

[I3,φπλ (x)] =−λφπλ (x) λ = 0,±1. (3.89)

Por supuesto φ†πλ(x) = φ

π−λ (x), es decir, la antipartícula de πλ es π−λ . Es de notar que φπλ (x) no

exactamente la base esférica estándar (en el sentido de SU(2)), ya que la relación entre bases es ε±1 =∓ 1√

2(ε1± iε2). El campo que completa una base estándar junto φπ0(x) y φπ−(x) es −φπ+(x). El problema

es que hay un conflicto inevitable entre los convenios de los grupos de simetría interna y el convenio deque φ

†A sea el campo de la antipartícula de A, φA, y en teoría cuántica de campos se prefiere mantener este

último.60

3.5 Simetrías discretas

Las simetrías discretas se refieren a grupos discretos y pueden ser de tipo interno o estar relacionadascon el grupo de Poincaré. Como todas las transformaciones, se realizan mediante operadores unitarios. Elteorema de Noether no se aplica en el caso discreto y no necesariamente tienen observables conservadosasociados. En todo caso un requerimiento crucial, aparte de ser simetrías, es que sean de tipo local ypuedan seguir existiendo cuando se introduce términos de interacción.

3.5.1 Paridad en φ

Para el campo de KG real no existe la simetría asociada a cambios de fase pero sí su versión discreta,φ(x)→−φ(x), que deja invariante L (x). El grupo de simetría es Z2.

φ(x)→Uφ(x)U† =−φ(x). (3.90)

60Nótese que φ†A crea una partícula de tipo A (y destruye A), de ahí que la relación φi → φ

†πλ

es la que va, salvo el signomencionado, como εi→ ελ , mientras que φi→ φ

πλ va como εi→ ε∗λ

.

92

Page 93: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Si se añaden términos de interacción del tipo LI(x) = λφ n(x) la simetría se mantiene si n es par. Estasimetría de hecho da una ley de conservación, a saber, requiere que aunque el número de partículas nose conserve en una reacción, sí se conserve la paridad del número de partículas entre el estado inicial yfinal, es decir, las partículas se deben crear o destruir por pares. El operador conservado es (−1)N que tieneespectro ±1.

El operador U que hace esta transformación se puede escribir de modo explícito (basta tomar λ = π

en U(λ ) del campo complejo):

U = exp(−iπ ∑k

a†kak) = eiπN = (−1)N . (3.91)

En efecto, si |(n)〉 tiene N = ∑k nk partículas, (−1)N |(n)〉= (−1)N |(n)〉, como φ(x)∼ a+a† crea o destruyeuna partícula cambia de signo el valor de (−1)N

(−1)Nφ(x)|(n)〉=−φ(x)(−1)N |(n)〉 ∀|(n)〉 (3.92)

como los |(n)〉 forman una base se deduce que (−1)Nφ(x) =−φ(x)(−1)N y U = (−1)N es una asignacióncorrecta. De hecho ésta es la única solución si se añade la condición U |0〉= |0〉. Para esta simetría el propioU =U† es un observable conservado.

3.5.2 Paridad o inversión espacial

La inversión espacial o paridad, P, es la transformación

xµ = (t,x)→ xµ ≡ xµ = (t,−x). (3.93)

Forma parte del grupo de Lorentz L pero no de L↑+ (grupo conexo o propio). El requerimiento de invarianciarelativista sólo se refiere a éste último y de hecho paridad no es una simetría exacta de la naturaleza. Debeobservarse que la definición dada depende del sistema de referencia inercial, sin embargo si la inversiónespacial para un observador es simetría también lo serán las demás ya que difieren en una transformaciónLorentz (propia) que siempre es simetría.

Tanto la acción de KG (real o complejo) como las relaciones de conmutación son invariantes bajo

φ(x)→ ηPφ(x), ηP =±1 (3.94)

La fase ηP está restringida a η2P = 1 por el requerimiento de que dos transformaciones de paridad sucesivas

deben equivalentes a no hacer nada, por P2 = 1.

ηP es la denominada paridad intrínseca del campo. El valor concreto de la paridad intrínseca no estáfijado en la teoría libre (hay dos transformaciones de paridad y ambas serían simetría) pero sí pueden

93

Page 94: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

aparecer restricciones cuando hay varios tipos de partículas en interacción. Por ejemplo en una teoría conun término de interacción

L1(x) = g1 ψ†(x)ψ(x)φ(x) (3.95)

la acción sólo es invariante si la paridad intrínseca de φ es +1 (se dice que φ es un escalar bajo paridad).La paridad de ψ no queda fijada por esta interacción. Análogamente

L2(x) = g2 εµναβ

∂µψ†1 ∂νψ1∂αψ

†2 ∂β ψ2 φ (3.96)

requiere ηP =−1 para φ , que será un campo pseudoescalar. (Hay tres índices espaciales y uno temporal y∇ cambia de signo bajo paridad, esto debe compensarse con un cambio de signo en φ .)

En general la paridad intrínseca de una partícula puede determinarse en reacciones donde haya produc-ción o destrucción neta de esa partícula. Así el pion y el kaón son partículas pseudoescalares bajo paridad.La paridad de los quarks no puede determinarse pero sí que todos tienen la misma paridad, ésta se eligeconvencionalmente como +1 (teoría cuántica de campos predice entonces que los antiquarks tienen paridad−1, por ser partículas de Dirac).

Si los dos términos anteriores L1(x) y L2(x) estuviera presentes en la interacción, simplemente paridadcesaría de ser una simetría en tal teoría. Esta situación ocurre en interacción débil en la naturaleza.

La transformación de paridad la realiza un operador unitario UP tal que

UP φ(x)U†P = ηP φ(x) (3.97)

y en el caso complejo también UP φ †(x)U†P = ηP φ †(x), que se deduce de la otra. Esto implica que para

partículas de KG (espín cero) partícula y antipartícula tienen la misma paridad intrínseca, lo cual se confirmaexperimentalmente.

La expresión anterior involucra la imagen de Heisenberg y presupone que UP conmuta con H. Paradeterminar UP (de la teoría libre) en el espacio de Fock vamos a imagen de Schrödinger y postulamos lasrelaciones (caso real para simplificar)

UP φ(x)U†P = ηP φ(−x), UP π(x)U†

P = ηP π(−x), UP |0〉= |0〉. (3.98)

La segunda relación se obtiene derivando en ec. (3.97) respecto de t. En la última relación se requiere queel vacío sea invariante, esto permitiría una fase UP |0〉= ω|0〉, ω ∈U(1), que puede eliminarse redefiniendola fase de UP.

Estas relaciones fijan totalmente UP dado que φ(x),π(x) forman lo que se denomina un conjuntoirreducible de operadores.61 Si se descomponen las relaciones anteriores en modos de Fourier se obtienen

61Así, en H = L2(R) x,p forman un conjunto irreducible, cualquier operador que conmute con ellos es múltiplo de laidentidad, y todo operador se construye con ellos. Si se añade espín 1/2, H = L2(R)⊗C2 el conjunto anterior deja de serirreducible ya que S = 1

2σ conmuta con x y p, hay que añadir S para que sea irreducible. x,Sz sería un conjunto completode observables compatibles.

94

Page 95: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

las relaciones equivalentesUP a(k)U†

P = ηP a(−k), UP |0〉= |0〉, (3.99)

y en el caso complejo tambiénUP b(k)U†

P = ηP b(−k). (3.100)

Y obviamente también las relaciones análogas para a† y b† que se obtienen tomando adjuntos. ak,a†k es

un conjunto irreducible para el caso real y añadiendo bk,b†k, lo es para el caso complejo.

Estas relaciones determinan UP totalmente ya que dicen cómo actúa el operador sobre un estadocualquiera. Por ejemplo, para el estado de una partícula con momento k,

UP|k〉=Up a†(k)|0〉=Up a†(k)U†PUP|0〉= ηP|−k〉 (3.101)

y la misma construcción se aplica a cualquier otro estado de la base.

El cambio k→−k da lugar a la paridad extrínseca, para un estado con momento angular orbital `daría una fase (−1)`. La paridad intrínseca se manifiesta en que incluso en reposo

UP |k = 0〉= ηP|k = 0〉 (3.102)

esta fase no puede eliminarse redefiniendo la fase del estado |k = 0〉 (ya que es el mismo en ambos lados)ni redefiniendo la fase de UP que ya se fijó con UP|0〉= |0〉.

En lo anterior se ha dado por supuesto que UP es unitario. El operador queda totalmente determinadopostulando UP akU−1

P = ηP a−k, UP a†kU−1

P = ηP a†−k, y UP |0〉 = |0〉 y resulta ser unitario. Esto estaba

garantizado porque las transformaciones

ak→ ηP a−k a†k→ ηP a†

−k (3.103)

son canónicas es decir dejan invariantes las relaciones de conmutación canónicas.

Puede comprobarse que

UP PµU†P = Pµ , UP JµνU†

P = Jµν , UP jµ(x)U†P = jµ(x), (3.104)

es decir, Pµ , Jµν , y la corriente son tensores (y no pseudotensores) bajo paridad.

En particular se deduce [H,UP] = 0. Aplicando ahora evolución temporal (e−itH) a ambos lados deUP φ(x)U†

P = ηP φ(−x) para pasar a imagen de Heisenberg se recupera la relación (3.97).

3.5.3 Conjugación de carga

La teoría de KG complejo es invariante bajo

φ(x)→ φ†(x), (3.105)

95

Page 96: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

denominada conjugación de carga que intercambia una partícula con su antipartícula. Técnicamente esuna simetría interna ya que no implica cambio en x.

En su formulación canónica, postulamos un operador unitario C tal que

C φ(x)C† = φ†(x), C π(x)C† = π

†(x), C|0〉= |0〉, (3.106)

o equivalentemente (descomponiendo los campos en modos de Fourier)

C akC† = bk, C bkC† = ak, C|0〉= |0〉. (3.107)

C queda totalmente fijado y dado que la transformación es canónica C es unitario.

En la definición no se ha incluido una fase, C φ(x)C† = ηcφ †(x) ya que ésta se podría eliminar redefinien-do la fase del campo φ(x) y no tendría efecto físico. Sin embargo, el mismo operador C debe actuar sobretodos los campos de una teoría para realizar la operación de conjugación de carga física (si es simetría).Entonces sobre un campo de KG neutro sí puede tenerse

C φ(x)C† = ηcφ(x), ηc =±1 (campo neutro) (3.108)

ya que ahora la fase (que tiene que ser real por ser φ(x) un campo real) no se puede eliminar. η2c = 1

se sigue del requerimiento de que C2 no tenga ningún efecto, lo cual implica que C2 es un múltiplo de laidentidad y de hecho C2 = 1 por la elección C|0〉= |0〉.

Al igual que pasaba con paridad, el número cuántico ηc (paridad de carga) sólo puede fijarse enreacciones con producción o destrucción de la partícula neutra.

Volviendo al caso de campo general, se tiene

C PµC† = Pµ , C JµνC† = Jµν . (3.109)

Esto es general, las simetrías internas conmutan con el grupo de Poincaré. La corriente no es invariante,sino que cambia de signo

C jµ(x)C† =− jµ(x), C QC† =−Q, (3.110)

correspondiendo al intercambio entre partículas y antipartículas. Que C y Q anticonmuten (en vez deconmutar) hace que de entre los estados con carga definida sólo estados neutros puedan ser propios de C.

Por otro lado UP y C conmutan ya que UPC y CUP actúan igual sobre campos y vacío.62

3.5.4 Inversión temporal

La transformación x = (t,x)→−x = (−t,x) es inversión temporal. El efecto de esta transformación62Esta propiedad ya no se mantiene en presencia de campos fermiónicos. En general (CUP)

2 = (−1)2J , el operador deunivalencia. Véase más abajo.

96

Page 97: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

sobre un sistema de partículas es cambiar el signo de sus velocidades (y de los espines si lo tienen) sincambiar las posiciones, de modo que por ejemplo la energía cinética se mantiene.

Cuando inversión temporal es simetría, a nivel de campos implica

UT φ(x)U†T = φ(−x), UT φ

†(x)U†T = φ

†(−x). (3.111)

Lo primero que hay que notar es que tal transformación no puede ser implementada por un operador lineal.La ecuación de evolución

φ(x, t) = eiHtφ(x)e−iHt , (3.112)

produceUT eiHt

φ(x)e−iHtU†T = φ(−x) = e−iHt

φ(x)e+iHt (3.113)

Dado que [UT ,H] = 0, se sigue que UT es antilineal (cambia i por −i). O equivalentemente de ∂tφ(x) =−i[φ(x),H], al aplicar UT ,U

†T , t →−t cambia el signo en ∂t y antilinealidad cambia el signo en la parte

derecha.

En la formulación canónica, (φ ,π†) en imagen de Schrödinger, la acción de UT requiere postular (ídem(φ †,π))

UT φ(x)U†T = φ(x), UT π

†(x)U†T =−π

†(x), UT |0〉= |0〉. (3.114)

El signo menos procede de derivar φ †(x,−t) respecto de t para obtener π†(x). También aquí habría unproblema si UT fuera lineal. En efecto

[φ(x),π†(y)] = iδ (x−y) (3.115)

implica

UT iδ (x−y)U†T =UT [φ(x),π

†(y)]U†T = [UT φ(x)U†

T ,UT π†(y)U†

T ] = [φ(x),−π†(y)]

=−iδ (x−y),(3.116)

que no puede satisfacerse por un operador UT lineal. Esto es general en mecánica cuántica, las transfor-maciones que involucren inversión temporal (un número impar de veces) se implementan con operadoresunitarios pero antilineales en vez de lineales.

Un operador antilineal A es tal que

A(λ |ψ〉+µ|φ〉) = λ∗|ψ〉+µ

∗|φ〉. (3.117)

Se deduce que el producto de un número par/impar de operadores antilineales es lineal/antilineal. Si L y Ason operadores lineal y antilineal respectivamente, sus adjuntos se definen mediante

〈ψ|L†|φ〉= 〈Lψ|φ〉= 〈φ |L|ψ〉∗, 〈ψ|A†|φ〉= 〈Aψ|φ〉∗ = 〈φ |A|ψ〉, (3.118)

97

Page 98: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

de modo que 〈λψ|A†|φ〉 = λ ∗〈ψ|A†|φ〉 es compatible con 〈φ |A|λψ〉 = λ ∗〈φ |A|ψ〉. La propiedad (AB)† =B†A† se mantiene cuando hay operadores antilineales en el producto. Con esta definición un operadorantilineal unitario (también llamado antiunitario) es un operador antilineal tal que A† = A−1.

UT es por tanto un operador antiunitario y no hay conflicto con las relaciones de conmutación.63

Teniendo en cuenta la antilinealidad, se deduce fácilmente

UT a(k)U†T = a(−k), UT b(k)U†

T = b(−k), UT |0〉= |0〉. (3.119)

Aunque la acción de UT sobre los operadores de creación y destrucción es idéntica a la de UP los dosoperares difieren al ser UT antilineal.

Para la transformación de los generadores de Poincaré se obtiene

UT PµU†T = Pµ , UT JµνU†

T =−Jµν , (3.120)

es decir, evolución temporal y boosts se invierten, mientras que traslaciones y rotaciones no cambian bajoinversión temporal. Por ejemplo,

UT PUT =−P , UT e−ia·PUT = e−ia·P , (3.121)

UT JUT =−J , UT e−iθ·JUT = e−iθ·J . (3.122)

Aquí es crucial la antilinealidad: en e−ia·P el momento cambia de signo pero también lo hace i y el operadortraslación permanece invariante. Respecto de la corriente

UT jµ(x)U†T = jµ(−x), (3.123)

por tanto la carga Q es invariante bajo inversión temporal.

Se puede permitir una fase ηT en la transformación, φ(x)→ ηT φ(−x), pero no hay un número cuánticoasociado a inversión temporal. Para operadores antilineales no hay un espectro ya que en la ecuación deautovalores la fase del valor propio se puede cambiar cambiando la fase del vector propio:

A|ψ〉= λ |ψ〉, A(ω|ψ〉) = ω∗λ |ψ〉= ω

∗2λ (ω|ψ〉) (3.124)

por tanto en la ecuación UT |k〉= ηT |k〉, ηT ∈ U(1) se puede eliminar cambiando la fase del estado |k〉.

El operador U2T es lineal y no hace nada sobre campos o vacío, por tanto coincide con la identidad,

U2T = 1. Esta es una propiedad general para campos bosónicos. Para campos fermiónicos U2

T vale −1 sobre63El argumento basado en la ecuación de evolución para concluir que UT se realiza antilinealmente es general y definitivo.

El de la preservación de las relaciones de conmutación no es concluyente en otros casos, por ejemplo para el campo de Diraco el de Weyl.

98

Page 99: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

estados de un fermión y (−1)N para estados con N fermiones. Esta fase ±1 no se puede cambiar por unaelección de fase de UT ,64 en efecto, para otra elección

(ωUT )2 = ωUT ωUT = ωω

∗UTUT =U2T . (3.125)

En general para campos arbitrarios mezclados U2T = (−1)2J donde J es aquí un operador derivado de

J2 cuyo espectro es J(J +1). El observable (−1)2J se denomina univalencia; sobre un estado cualquieraproduce +1 si hay un número par de fermiones y −1 si el número es impar (esto es así porque la parteorbital de J siempre da una contribución entera en J. Por tanto (−1)2J = (−1)N f , siendo N f el operadorque cuenta el número de fermiones. El mismo operador univalencia aparece en rotaciones ya que no es másque el operador que se obtiene al hacer una rotación de 2π: ±1 según que J sea entero o semientero.

Incluso si T no es exactamente conservado, U2T = (−1)2J sí lo es (ya que J lo es). Dado que univalencia

equivale a (−1)N f su conservación implica que los fermiones siempre se producen o aniquilan por pares.Hay que notar que la acción de U2

T no tiene efecto físico por lo que debería esperarse que fuera un múltiplode la identidad, sin embargo (−1)2J no lo es. Lo que ocurre es que se aplica una regla de superselección: elespacio de estados se descompone en dos sectores H = H+∪H−, según que el número de fermiones seapar o impar. La regla de superselección postula que los estados físicos están en un sector o en otro perono hay estados combinación lineal de ambos. De otro modo una rotación de 2π sobre un estado |+〉+ |−〉lo transformaría en |+〉− |−〉, y la rotación cambiaría el estado. Se postula además que de entre todos losoperadores hermíticos sólo aquellos que no conecten los dos sectores son observables, de otro modo, dadoque todo observable puede formar parte de una hamiltoniano, un estado de un sector acabaría evolucionandoa una suma coherente de los dos sectores. Univalencia es un múltiplo de la identidad en cualquiera de lossectores que nunca se mezclan. Otros ejemplo de regla de selección es la descomposición en sectores concarga eléctrica definida: no se admiten estados que sean suma coherente de sectores distintos ya que enotro caso una transformación de gauge tendría un efecto no trivial sobre los estados físicos.

Los operadores con un número par de campos fermiónicos tienen univalencia +1 (operadores bosónicos),y con un número impar tiene univalencia −1 (operadores fermiónicos). Los observables físicos siempre sonbosónicos porque univalencia se conserva absolutamente; los fermiones siempre se crean o destruyen porpares.

3.5.5 Transformación CPT

La transformación CPT actúa según

UCPT φ(x)U†CPT = φ

†(−x) (3.126)

64Este cambio de fase en UT debe ir acompañado de un cambio en la fase de |0〉 para que se mantenga la relaciónUT |0〉=+|0〉. Tal cambio de fase en el vacío no afecta a las otras relaciones, e.g. C|0〉=+|0〉, ya que los otros operadores sonlineales.

99

Page 100: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

es antilineal y equivale a la aplicación sucesiva de las transformaciones de conjugación de carga, paridad einversión temporal. Para UCPT no hay ninguna fase en la parte derecha de la ecuación: dadas UP y C, laforma de UT queda fijada (con las fases ηT necesarias en las distintas especies de campos) de modo que

UCPT =CUPUT . (3.127)

La particularidad de esta transformación es que, a diferencia de P, C o T , es siempre una simetría exactade cualquier teoría cuántica de campos relativista local. Es decir, no es posible escribir un lagrangiano queviole esta simetría, y esto vale para campos de cualquier espín (los campos de espín entero son bosónicosy los de espín semientero fermiones).

El motivo es que para un lagrangiano local con invariancia relativista la transformación CPT transformaL (x) en L †(−x). El requerimiento de tener una teoría unitaria, L (x) = L †(x), implica entonces que lateoría tiene invariancia CPT .

Una predicción de CPT es que una partícula y su antipartícula tienen exactamente la misma masay la misma anchura (inverso de la vida media), incluso aunque C se viole. Esta predicción se confirmaexperimentalmente con enorme precisión.

Se encuentra, para campos cualesquiera, que UT conmuta con CUP y U2CPT = 1.

3.6 Relaciones de conmutación covariantes

La teoría cuántica de campos está formulada mediante reglas de conmutación a igual tiempo, perotiene invariancia relativista. Por ello se espera que el objeto definido por

[φ(x),φ †(y)] = i∆(x,y) (3.128)

también sea invariante Poincaré. Hemos considerado aquí el campo de KG complejo (libre). La discusiónpara el campo real es similar. El factor i se mete por conveniencia.

3.6.1 Propiedades generales

∆(x,y) se puede calcular en forma explícita (ya que estamos en el caso libre), pero muchas propiedadesse pueden establecer inmediatamente.

a) En primer lugar ∆(x,y) es un c-número, es decir, una función compleja ordinaria por el operadoridentidad. Esto se deduce de que φ(x)∼ a+b† y φ †(x)∼ b+a†, y todos los conmutadores entre operadoresde creación y destrucción son c-números.

b) ∆(x,y) depende sólo de x− y por invariancia bajo traslaciones:i∆(x,y) =U(a)[φ(x),φ †(y)]U†(a) = [φ(x+a),φ †(y+a)] (3.129)

100

Page 101: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Eligiendo a =−y se ve que depende de x− y. A partir de ahora pondremos ∆(x− y).

c) ∆(x) es una función real e impar. En efecto, tomando adjuntos en

[φ(x),φ †(y)] = i∆(x− y) (3.130)

se deduce[φ(y),φ †(x)] =−i∆∗(x− y) (3.131)

es decir, ∆∗(x) =−∆(−x).

Por otro lado aplicando C (conjugación de carga) se deduce

i∆(x− y) =C[φ(x),φ †(y)]C† = [φ †(x),φ(y)] =−i∆(y− x) (3.132)

es decir, ∆(x) =−∆(−x). En conjunto

∆(x) = ∆∗(x) =−∆(−x). (3.133)

d) Aplicando ahora una transformación de Lorentz Λ ∈ L↑ (por tanto lineal, no antilineal)

i∆(x) =U(Λ)[φ(x),φ †(0)]U†(Λ) = [φ(Λx),φ †(0)] = i∆(Λx) (Λ ∈ L↑) (3.134)

Es decir, ∆(x) es un escalar Lorentz (incluido paridad). Si Λ ∈ L↓, U(Λ) es antilineal, lo cual nos lleva a

− i∆∗(x) = i∆(Λx) (Λ ∈ L↓) (3.135)

∆(x) cambia de signo bajo inversión temporal.

e) ∆(x− y) se anula cuando el vector x− y es tipo espacio,

∆(x− y) = 0 si (x− y)2 < 0 . (3.136)

Esto se deduce de que cuando la separación es tipo espacio existe un Λ ∈ L↑+ tal que x′−y′ = Λ(x−y) conx′0 = y′0 (x′ e y′ simultáneos)

i∆(x− y) = i∆(x′− y′) = [φ(x′),φ(y′)] = 0 (3.137)

donde el conmutador se anula por ser campos a igual tiempo. Dicho de otro modo, el conmutador[φ(x),φ(y)] se anula no sólo cuando x e y son simultáneos (una de las relaciones de conmutación ca-nónica) sino siempre que x no esté en el cono causal (pasado o futuro) de y.65 Volveremos sobre estepunto.

65El cono de luz lo forman los vectores x2 = 0 o t =±‖x‖. El cono causal futuro es t ≥ ‖x‖ y el pasado t ≤−‖x‖.

101

Page 102: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

f ) El conmutador satisface(−∂

2−m2)∆(x) = 0 (3.138)

es decir es una solución de la ecuación de KG. Esto es evidente ya que φ(x) cumple la ecuación. Y también

−δ (x0)∂0∆(x) = δ (x) (3.139)

Aquí δ (x0) fija x0 = 0 y δ (x) = δ (x0)δ (x) fija xµ = 0. En efecto, la relación canónica [φ(x),π†(y)] =iδ (x−y) implica

iδ (x− y) = δ (x0− y0)[φ(x), φ †(y)] = δ (x0− y0)∂y0 i∆(x− y) =−iδ (x0− y0)∂x0∆(x− y). (3.140)

También es inmediato que para el campo complejo

[φ(x),φ(y)] = [φ †(x),φ †(y)] = 0 (campo complejo) (3.141)

El motivo es que estos conmutadores son c-números y a la vez operadores cargados luego deben anularse.También se ve porque los varios operadores a y b† conmutan entre sí.

Para el campo real de KG este argumento no sirve y de hecho

[φ(x),φ(y)] = i∆(x− y) (campo real) (3.142)

donde ∆(x) es la misma función que para el campo complejo.

3.6.2 Cálculo de ∆(x− y)

Procedemos a descomponer el campo en su parte de frecuencias positiva y frecuencias negativas

φ(x) = φ(+)(x)+φ

(−)(x) φ†(y) = φ

†(+)(y)+φ†(−)(y). (3.143)

Cumplen (φ (±)(x))† = φ †(∓)(x). Estos operadores también son escalares Lorentz

U(Λ,a)φ (±)(x)U†(Λ,a) = φ(±)(Λx+a). (3.144)

Explícitamente

φ(+)(x) =

∫ d3k(2π)3

e−ikx√2ω(k)

a(k), φ(−)(x) =

∫ d3k(2π)3

eikx√2ω(k)

b†(k)

φ†(+)(y) =

∫ d3k(2π)3

e−iky√2ω(k)

b(k), φ†(−)(y) =

∫ d3k(2π)3

eiky√2ω(k)

a†(k)

(3.145)

102

Page 103: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Como siempre kµ = (ω(k),k) en estas fórmulas (k está sobre la capa de masas positiva).

Es estándar definir las funciones ∆(±)(x)

[φ (+)(x),φ †(−)(y)] = i∆(+)(x− y), [φ (−)(x),φ †(+)(y)] = i∆(−)(x− y). (3.146)

Estas funciones también son escalares Lorentz y soluciones de la ecuación de KG. Por conjugación de carga(a,a† se comportan igual que b,b†) se deduce que

∆(−)(x) =−∆

(+)(−x) (3.147)

Además, dado que a y b conmutan

[φ(x),φ †(y)] = [φ (+)(x),φ †(−)(y)]+ [φ (−)(x),φ †(+)(y)] (3.148)

que implica∆(x) = ∆

(+)(x)+∆(−)(x) (3.149)

o también∆(x) = ∆

(+)(x)−∆(+)(−x). (3.150)

∆(x) es (dos veces) la parte impar de ∆(+)(x). Que ∆(x) se anule fuera del cono causal equivale a decir que∆(+)(x) es una función par de x fuera del cono causal.

Usando las relaciones de conmutación entre a y a† se tiene

i∆(+)(x− y) =∫ d3k

(2π)3e−ikx√2ω(k)

∫ d3k′

(2π)3eik′y√2ω(k′)

[a(k),a†(k′)]

=∫ d3k

(2π)31

2ω(k)e−ik(x−y)

(3.151)

Es deciri∆(±)(x) =±

∫ d3k(2π)3

12ω(k)

e∓ikx, ∆(x) =−∫ d3k

(2π)3sen(kx)ω(k)

. (3.152)

A partir de la última expresión es inmediato reproducir ec. (3.139).

Para escribir estas funciones en forma manifiestamente invariante podemos usar la identidad66

δ (k2−m2) =1

2ω(k)

(δ (k0−ω(k))+δ (k0 +ω(k))

)=

12ω(k)

δ (|k0|−ω(k)) (3.153)

66En general si una función real f (x) tiene ceros simples x0, δ ( f (x)) = ∑x0

δ (x− x0)

| f ′(x0)|.

103

Page 104: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

que implica ∫d4k δ (k2−m2)θ(±k0) f (k) =

∫ d3k2ω(k)

f (k)∣∣k0=±ω(k)

(3.154)

donde θ(x) es la función escalón,

θ(x) =

1 x > 00 x < 0

(3.155)

Esa relación nos permite escribir

∆(±)(x) =∓i

∫ d4k(2π)4 2πδ (k2−m2)θ(k0)e±ikx =∓i

∫ d4k(2π)4 2πδ (k2−m2)θ(±k0)e−ikx,

∆(x) =−i∫ d4k

(2π)4 2πδ (k2−m2)ε(k0)e−ikx.

(3.156)

Aquí ε(x) denota la función signo,

ε(x) =x|x|

= θ(x)−θ(−x) =+1 x > 0−1 x < 0

(3.157)

Es muy importante notar que en estas fórmulas se integra sobre un cuadrivector kµ arbitrario, no sobre lacapa de masas, de modo que k0 es una variable independiente. La condición física de que k esté en la capamásica la impone el factor δ (k2−m2) del integrando.

Las expresiones de ∆(±)(x) y ∆(x) ahora son manifiestamente escalares Lorentz teniendo en cuenta qued4k y δ (k2−m2) lo son. El signo de k0 también es un invariante para vectores k tipo tiempo o luz (lo cualestá asegurado por la condición k2 = m2 ≥ 0) siempre que Λ ∈ L↑. Bajo inversión temporal x0→−x0, ∆(x)cambia de signo.

Las integrales involucradas pueden hacerse explícitamente y se obtienen las funciones ∆(±)(x) y ∆(x)en términos de funciones de Bessel. El caso sin masa es particularmente simple

∆(±)(x) =± i

(2π)2 P1x2 −

14π

ε(x0)δ (x2), ∆(x) =− 12π

ε(x0)δ (x2) (m2 = 0). (3.158)

Son distribuciones y el símbolo P indica tomar la prescripción de valor principal de Cauchy en integrales alencontrar un polo en x2 = 0.67

3.6.3 Microcausalidad

Como se ha visto, una consecuencia de las invariancia Lorentz de ∆(x−y) y las relaciones de conmutacióncanónicas es que los campos φ(x) y φ †(y) conmutan cuando la separación es tipo espacio.68 Y también

67La siguiente identidad es útil: 1x±i0+ = P 1

x ∓ iπδ (x), x es una variable real.68Hay que señalar que ∆(x) se anula fuera del cono causal, pero eso ya no es cierto para ∆(±)(x) por separado.

104

Page 105: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

hay conmutación entre φ ’s y entre φ †’s. La conmutación puede entonces extenderse a cualquier par deoperadores locales, O1(x) e O2(y)

[O1(x),O2(y)] = 0 (x− y)2 < 0 (3.159)

En efecto, un operador local es uno construido con número finito de campos en un mismo punto involucran-do un número finito de derivadas. Por ejemplo ∂µφ †(x)∂ µφ(x), o la corriente jµ(x). (Nótese que φ (±)(x)no son operadores locales y no conmutan para separaciones espaciales.) Como los campos separados es-pacialmente conmutan también lo hacen sus derivadas y productos y sumas de ellos, es decir, operadoreslocales cualesquiera.

La ecuación (3.159) expresa el principio de microcausalidad que es la forma más exigente de causali-dad. Una acción física O1(x) no puede influir sobre otro observable O2(y) si la separación entre ellos es tipoespacio y por tanto no está en su cono causal (futuro), y viceversa, no puede ser influido por él. Hay quetener en cuenta que en relatividad el futuro absoluto es el cono causal futuro y el pasado absoluto el conocausal pasado (los conos incluyen las separaciones tipo luz), y lo que hay fuera es el presente relativista.En el límite no relativista el presente se reduce a los eventos simultáneos.

Lo más notable es microcausalidad no se ha impuesto sino que ha surgido espontáneamente del for-malismo, lo cual es un éxito de teoría cuántica de campos. En teorías más complicadas (con interacción)microcausalidad se postula. Esta propiedad se hubiera violado si el campo de KG se hubiera cuantizadocon estadística fermiónica.

Para campos fermiónicos las relaciones de conmutación canónicas (a igual tiempo) llevan anticonmu-tadores y dan lugar a relaciones (caso de campos cargados)

[ψα(x),ψ†β(y)]+ = i∆αβ (x− y) , [ψα(x),ψβ (y)]+ = 0 . (3.160)

La función ∆αβ (x− y) está relacionada con ∆(x− y) de KG, y satisface

∆αβ (x) = 0 x2 < 0. (3.161)

Como ya se comentó, por conservación de univalencia, los observables deben tener un número par decampos fermiónicos (los fermiones se crean o destruyen por pares), por ejemplo

O(x) = ψ†α(x)Γαβ ψβ (x) (3.162)

(Γ es una matriz compleja cualquiera.) Por tanto los observables son operadores bosónicos (tienen uni-valencia +1). El principio de microcausalidad se aplica igualmente cuando hay operadores fermiónicosinvolucrados. (Siempre con conmutador entre observables, no anticonmutador. Los campos fermiónicos nocualifican como observables.)

105

Page 106: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

En efecto, empleando la identidad69

[A,BC] = [A,B]∓C±B[A,C]∓ (3.163)

se tiene (simplificando la notación)

[ψ†x ψx,ψ

†y ψy] = [ψ†

x ψx,ψ†y ]ψy +ψ

†y [ψ

†x ψx,ψy]

= ψ†x [ψx,ψ

†y ]+ψy− [ψ†

x ,ψ†y ]+ψxψy +ψ

†y ψ

†x [ψx,ψy]+−ψ

†y [ψ

†x ,ψy]+ψx

= ψ†x [ψx,ψ

†y ]+ψy−ψ

†y [ψ

†x ,ψy]+ψx

= 0 si (x− y)2 < 0

(3.164)

3.6.4 Ordenación cronológica

Se define el producto ordenado temporalmente de dos operadores locales como

T (O1(x)O2(y)) =

O1(x)O2(y) x0 > y0

±O2(y)O1(x) x0 < y0

= θ(x0− y0)O1(x)O2(y)±θ(y0− x0)O2(y)O1(x)(3.165)

donde el signo es + si cualquiera de los operadores es bosónico y − si ambos son fermiónicos. Es decir,dentro del operador de ordenación cronológica T los operadores se ordenan de modo que los que estánantes en el tiempo también actúan antes como operadores. La definición se puede extender para cualquiernúmero de operadores

T (O1(t1) · · ·On(tn)) =±OP1(tP1) · · ·OPn(tPn) tP1 > tP2 > · · ·> tPn (3.166)

P es la permutación que ordena temporalmente (t1, . . . , tn). El signo es la paridad de la permutación requeridaentre operadores fermiónicos, es decir, se genera un signo − cada vez que hay que cruzar dos operadoresfermiónicos para ordenarlos temporalmente.

El operador de ordenación cronológica es similar al orden normal (que sigue reglas análogas) en el sentidode que no es una operación que se aplique a un producto de operadores sino una notación. Igual que en elcaso del orden normal, dentro de T todos los operadores conmutan (o anticonmutan) independientementede las relaciones de conmutación que obedezcan.

La definición es ambigua para operadores a igual tiempo (x0 = y0). A menudo eso no es problema yaque O1(x) y O2(y) conmutan (o anticonmutan) si la separación es tipo espacio, y por tanto O1(x)O2(y) =±O2(y)O1(x). Sí hay una ambigüedad cuando x = y. La definición de T debe completarse en esos casos (a

69Más generalmente [A,BC]σ = [A,B]ηC−ηB[A,C]−ησ , σ ,η =±. σ =+ es útil cuando A y BC son fermiónicos.

106

Page 107: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

menudo se toma como el orden normal ahí); esto forma parte de la teoría de renormalización de divergenciasultravioleta que se tratará más adelante.

3.6.5 Propagador de Feynman

El propagador de Feynman (o simplemente propagador) ∆F(x− y) se define para el campo cargadocomo

i∆F(x− y) = 〈0|T φ(x)φ†(y)|0〉 (3.167)

Para el campo neutro es la misma definición con φ †(y) = φ(y), y se obtiene la misma función. Por supuesto〈0|T φ(x)φ(y)|0〉= 0 para el campo cargado.

En principio la ordenación temporal rompe invariancia Lorentz, ya que el orden temporal puede dependerdel sistema inercial, pero eso sólo ocurre cuando la separación es tipo espacio y en ese caso los camposconmutan. De hecho el propagador es invariante Lorentz, incluyendo inversión temporal70 En efecto estose puede ver reduciendo ∆F(x− y) a funciones conocidas

i∆F(x− y) = θ(x0− y0)〈0|φ(x)φ†(y)|0〉+θ(y0− x0)〈0|φ †(y)φ(x)|0〉

= θ(x0− y0)〈0|φ (+)(x)φ†(−)(y)|0〉+θ(y0− x0)〈0|φ †(+)(y)φ (−)(x)|0〉

= θ(x0− y0)〈0|[φ (+)(x),φ †(−)(y)]|0〉+θ(y0− x0)〈0|[φ †(+)(y),φ (−)(x)]|0〉= θ(x0− y0)i∆(+)(x− y)−θ(y0− x0)i∆(−)(x− y)

=

i∆(+)(x− y) x0 > y0

i∆(+)(y− x) y0 > x0

(3.168)

Como vimos, fuera del cono causal ∆(+)(x) es una función par por lo cual ∆F(x− y) no depende delobservador. También se deduce que ∆F(x− y) = ∆F(y− x) en todos los casos.

Que ∆F(x−y) sea invariante bajo todo el grupo de Lorentz L implica que es una función del invariante(x− y)2. En cambio ∆(x− y) y ∆(±)(x− y) dependen además de ε(x0− y0) (orden temporal de x− y).

La propiedad más importante del propagador de Feynman es que es un propagador o función de Greende la ecuación de Klein-Gordon,

(−∂2−m2)∆F(x) = δ (x). (3.169)

Esto puede probarse fácilmente a partir de su expresión explícita (en espacio de momentos) que veremosenseguida, pero también puede probarse a partir de su definición, las ecuaciones de movimiento y las

70No referimos siempre a la teoría libre. En teorías con interacción seguimos suponiendo invariancia bajo el grupo propioortocrono, pero paridad o inversión pueden violarse.

107

Page 108: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

relaciones de conmutación canónicas:

(−∂2−m2)〈0|T φ(x)φ

†(0)|0〉= [−∂

2−m2,θ(t)]〈0|φ(x)φ†(0)|0〉+[−∂

2−m2,θ(−t)]〈0|φ †(0)φ(x)|0〉=−

(δ (t)∂t +∂tδ (t)

)〈0|[φ(x),φ †(0)]|0〉

=−δ (t)〈0|[π(x),φ †(0)]|0〉= iδ (x)

(3.170)

Esta demostración se puede adaptar al caso con interacción.

La ecuación que define una función de Green tiene distintas soluciones, dependiendo de las condicionesde contorno aplicadas. ∆F(x−y) es un propagador consistente con la ordenación cronológica de operadoresy como se verá aparece en forma natural en teoría de campos. Como todo propagador, permite resolveruna ecuación de movimiento con una fuente J(x) aplicada

(∂ 2−m2)ϕ(x) = J(x), ϕ(x) = ϕ0(x)+∫

d4y∆F(x− y)J(y) (3.171)

donde ϕ0(x) es una solución de la ecuación homogénea.

3.6.6 Cálculo del propagador

El propagador se puede expresar en términos de funciones de Bessel pero se obtiene una expresiónsimple en espacio de momentos. Ec. (3.168) se puede reescribir como

i∆F(x) = θ(x0)∫ d3k

(2π)3e−ikx

2ω(k)+θ(−x0)

∫ d3k(2π)3

eikx

2ω(k)

=−∫ d3k

(2π)3

∫CF

dk0

2πie−ikx

(k0−ω(k))(k0 +ω(k))

(3.172)

La segunda igualdad se basa en integrar la variable k0 en su plano complejo a lo largo de un contornoCF que sigue el eje real pero rodeando el polo k0 = ω(k) por encima y k0 =−ω(k) por debajo. Aplicando elteorema de residuos (cerrando por abajo/arriba según x0 ≷ 0 ) se comprueba inmediatamente la igualdad.

En vez de deformar el camino de integración respecto del eje real, puede desplazarse el parámetro demasa m2→m2− iη , siendo η > 0 y luego tomar η→ 0. En efecto, eso equivale a desplazar ω(k)→ω(k)− iεcon ε → 0+, y se obtiene

∆F(x) =∫

CF

d4k(2π)4

e−ikx

k2−m2 = limη→0+

∫R4

d4k(2π)4

e−ikx

k2−m2 + iη(3.173)

A menudo se omite “limη→0+” o se reemplaza η por 0+.

108

Page 109: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

−m

m

k0

CF

Figura 1: Contorno en el plano complejo k0 para el propagador de Feynman. Se muestran los cortes de ramaobtenidos por acumulación de polos en k0 =±ω(k) al variar k.

Esta expresión permite obtener fácilmente (3.169):

(−∂2−m2)

∫ d4k(2π)4

e−ikx

k2−m2 + iη=∫ d4k

(2π)4(k2−m2)e−ikx

k2−m2 + iη=∫ d4k

(2π)4 e−ikx = δ (x) (3.174)

k0

−m m

CC(−) (+)

Figura 2: Contorno en el plano complejo k0 para ∆(±)(x).

∆F(x), ∆(x) y ∆(±)(x) son ejemplos de funciones invariantes que pueden obtenerse haciendo integralessobre distintos contornos en el plano complejo k0. Por ejemplo

∆(±)(x) =−

∫C(±)

d4k(2π)4

e−ikx

k2−m2 (3.175)

donde C(±) rodean los cortes de rama positivo y negativo respectivamente, en sentido positivo. (Ver Fig.2.) Igualmente, ∆(x) sigue un contorno que es la suma de C(±) y equivale a (R− i0+) menos (R+ i0+).

En general cada contorno C define una función invariante ∆C(x) tal que

(−∂2−m2)∆C(x) =

0 C contráctil

δ (x) C deformable a R (3.176)

109

Page 110: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

La demostración es la misma que en (3.174). En el caso de C contráctil la integral se anula ya que elintegrando no tiene singularidades.

Los propagadores retardado y avanzado se obtienen similarmente con C = R± i0+ y cumplen

∆R(x) = +∆(x)θ(x), ∆A(x) =−∆(x)θ(−x). (3.177)

La relación ∂tθ(t) = δ (t) da lugar a δ (x) al aplicar −∂ 2−m2 sobre ∆R,A(x). También se deduce ∆(x) =∆R(x)−∆A(x).

Que un propagador sea una función de Green indica que es el “inverso” de las ecuaciones de movimien-to.71 Las ecuaciones de movimiento en espacio de momentos

(k2−m2)ϕ(k) = 0, ϕ(k) =∫

d4xeikxϕ(x). (3.178)

dan lugar a

∆F(k) =1

k2−m2 + iη, ∆F(x) =

∫ d4k(2π)4 e−ikx

∆(k). (3.179)

El (k0)2 + iη proporciona las condiciones de contorno de Feynman, mientras que (k0∓ iη) dan lugar a lospropagadores retardado y avanzado respectivamente.

3.7 Localizabilidad de partículas

3.7.1 Interpretación del propagador de Feynman

Como se ha visto

i∆F(x− y) = θ(x0− y0)〈0|φ (+)(x)φ†(−)(y)|0〉+θ(y0− x0)〈0|φ †(+)(y)φ (−)(x)|0〉. (3.180)

Teniendo en cuenta el contenido en operadores de creación y aniquilación, φ (+)(x)∼ a(k), etc, se ve quecualitativamente ∆F(x−y) representa la amplitud de probabilidad de propagar una partícula de y a x cuandox posterior a y (esto es, detectarla en x si fue creada en y), y una antipartícula de x a y cuando y es posteriora x. El propagador es invariante Lorentz, sin embargo la segregación de casos x0 ≷ y0 no lo es cuando laseparación es tipo espacio. Cuando (x−y)2 ≥ 0, todo observador asignará la propagación (con intercambiode carga eléctrica por ejemplo) entre x e y al intercambio de una partícula de y a x si x0 > y0, o a una

71El operador diferencial −∂ 2−m2 no tiene propiamente inverso, hasta que se eligen unas condiciones de contorno, en elcaso de Feynman, m2→ m2− iη.

110

Page 111: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

y

a b

x

yx

t

x >yx <y0

00 0

Figura 3: Representación del propagador de Feynman.

antipartícula de x a y si y0 > x0. En cambio si (x− y)2 < 0 algunos observadores verán x0 > y0 y otrosy0 > x0 y harán distintas asignaciones para el mismo proceso.

3.7.2 Localizabilidad de partículas

Hay que notar que, a diferencia del conmutador ∆(x− y), el propagador ∆F(x− y) no se anula paraseparaciones tipo espacio. Esta propagación supralumínica da lugar a una aparente violación de causalidad.De hecho no es así si se tiene en cuenta que φ (−)(x)|0〉 (o φ †(+)(x)|0〉) no corresponden exactamente aestados de una partícula (antipartícula) con posición definida en x. En realidad hay una dispersión en laposición del orden de 1/m (la longitud de onda Compton de la partícula). Al mismo tiempo ∆F(x) tieneuna caída exponencial cuando x2 < 0 para separaciones del orden de 1/m (potencial de Yukawa). Esto haceque no se pueda asegurar que realmente (x′− y′)2 < 0, siendo x′ e y′ las auténticas puntos de emisión yabsorción.

La localizabilidad de partículas es distinta en una teoría no relativista y una relativista. Esto se deduceya de un sencillo argumento que involucra el principio de incertidumbre y la relación masa-energía. Enefecto, si se intenta localizar una partícula en una región de tamaño ∆x habrá una incertidumbre en elmomento del orden de ∆p ∼ 1/∆x y a su vez en la energía ∆E ∼ ∆p. Cuando esta energía sea del ordende la masa será suficiente para producir nuevas partículas. (Hay que tener en cuenta que al confinar laposición ya no estamos en el caso de hamiltoniano libre, de un modo u otro se está introduciendo unainteracción, que puede crear partículas.) Si hay una ley de conservación de carga las partículas se produciránpor pares. En todo caso la conclusión es que si un estado está muy localizado (más allá de la longitud deonda Compton) no podrá asegurarse simultáneamente que el número de partículas es exactamente una. Ellímite no relativista no es más que un límite de masa grande (c = 1 todo el tiempo) y consecuentemente nohay creación de partículas y la longitud de onda Compton es cero. Ahí no hay problema de localizabilidad.La no conservación del número de partículas es el motivo último por el que las teorías cuánticas relativistasde una partícula son inconsistentes (recordemos que la ecuación de KG no se podía interpretar como unaecuación de una función de onda relativista).

111

Page 112: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Podemos comparar la localizabilidad en los casos relativista y no relativista usando estados de momentodefinido, que tienen el mismo significado en ambos casos. El operador campo no relativista que crea unapartícula en un punto x es

Ψ†(x) =

∫ d3k(2π)3 e−ik·xa†(k) (3.181)

y el análogo relativista (normalizado para que coincida en el límite m→ ∞) es√

2mφ(−)(x) =

∫ d3k(2π)3

√m

ω(k)e−ik·xa†(k) (3.182)

Así como la transformada de Fourier de la onda plana da δ (x) en el caso no relativista, el factor extra(m/ω(k))1/2 (requerido por invariancia relativista) da lugar a una función de Bessel con una anchura delorden de 1/m.

3.7.3 Operador posición para Klein-Gordon

Para ver esto mejor hagamos una pequeña digresión al problema de KG de una partícula y cómo definirel operador posición ahí. Queremos construir un espacio de Hilbert en el que poner los estados de unapartícula y un operador posición.

Usamos ϕ(x) para denotar la función de onda (compleja) que satisface la ecuación de KG. Si conside-ramos todas las funciones definidas en R4, aquellas que son solución de KG definen un espacio vectorialcomplejo V . Este espacio contiene soluciones con energía positiva y soluciones de energía positiva

V =V+⊕V− . (3.183)

En V hay una corriente conservada con densidad (normalizada para que tenga buen límite no relativista)

ρ(x) =i

2m(ϕ∗∂tϕ−∂tϕ

∗ϕ) (3.184)

que permite definir una forma sesquilineal en V

〈ϕ1|ϕ2〉=∫

d3xi

2m(ϕ∗1 ∂tϕ2−∂tϕ

∗1 ϕ2). (3.185)

Porque jµ(x) es conservada la forma sesquilineal también lo es y también es invariante Poincaré. Esimportante notar que un producto escalar naive tal como

〈ϕ1(t)|ϕ2(t)〉0 =∫

d3xϕ∗1 (x)ϕ2(x) (3.186)

no tiene sentido ya que no es conservado por la evolución temporal ni es invariante Lorentz (es la dinámica,y más concretamente la parte de energía cinética que fija las corrientes, la que dicta el producto escalar deuna teoría cuántica).

112

Page 113: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Expresado en espacio de momentos

〈ϕ1|ϕ2〉=∫ d3k

(2π)3ω(k)

m

(ϕ(+)∗1 (k) ϕ

(+)2 (k)− ϕ

(−)∗1 (k) ϕ

(−)2 (k)

). (3.187)

Aquí ϕ(+)+ϕ(−) es la descomposición de ϕ en sus componentes con energía positiva y negativa. Se veclaramente que la forma sesquilineal no define un producto escalar en V porque no es definido positivo.

Sin embargo se puede definir un producto escalar en V+ (igualmente en V− cambiando el signo global).Para concretar elegimos nuestro espacio de Hilbert como H = V+, el espacio de soluciones de energíapositiva de KG. Esto es lo mismo que se hubiera obtenido partiendo de

i∂tϕ(x) = ωϕ(x), ω =+√

p2 +m2 (3.188)

donde p es el operador momento. En H el valor de ϕ(x) en t = 0 determina completamente la evoluciónpara todo t y eso establece un isomorfismo entre H y un espacio de funciones en R3 (ϕ(x) = ϕ(x, t = 0)).El producto escalar en H queda

〈ϕ1|ϕ2〉=∫

d3xϕ∗1 (x)

ω

mϕ2(x). (3.189)

Además de positivo es invariante Lorentz, invariante bajo traslaciones y conservado. Pero no es local, encambio la forma definida en V era local, pero no positiva. No es posible tener todas las buenas propiedadesen el espacio de una partícula relativista.

Puesto que el producto escalar no es el naive, x definido como operador multiplicativo sobre ϕ(x) nopuede ser el operador posición. El motivo es que x no es hermítico. El operador posición es más bien

q = ω−1/2x ω

1/2 (3.190)

que sí es hermítico〈ϕ1|q|ϕ2〉= 〈ϕ2|q|ϕ1〉∗ (3.191)

y además tiene las demás propiedades correctas

[qi,q j] = 0, [qi, p j] = iδi j . (3.192)

La primera relación implica que las componentes de q son compatibles. La segunda que q se transformacorrectamente bajo las traslaciones generadas por p:

δaq = [−ia ·p,q] = δa. (3.193)

Se pueden ahora buscar los estados propios de q, y trabajando en espacio de momentos se ve que elestado con valor propio x0 es

ϕ(x) =∫ d3k

(2π)3

√m

ω(k)eik·(x−x0) =

√mω

δ (x−x0). (3.194)

113

Page 114: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Este es el resultado obtenido anteriormente, una delta ensanchada con anchura del orden de la longitud deonda Compton. En el límite no relativista m→ ∞ se recupera la delta localizada.

3.7.4 Operadores densidad de partículas y densidad de carga

Para el campo neutro se puede definir una corriente conservada

J µ(x) = i(

φ(−)(x)∂

µφ(+)(x)−∂

µφ(−)(x)φ

(+)(x))

(3.195)

que es hermítica, invariante Lorentz y además reproduce el operador número

N =∫

d3xJ 0(x). (3.196)

(Hay una versión para el campo cargado.) J 0(x) podría considerarse como una densidad de partículas peroesta interpretación es deficiente. Si se define lo que sería el número de partículas en una región espacial V

NV =∫

Vd3xJ 0(x) (3.197)

se encuentra que para regiones distintas (disjuntas o no)

[NV , NV ′ ] 6= 0 (3.198)

y no hay estados localizados con número de partículas definido. Igualmente

[NV ,φ(−)(x)] 6= φ

(−)(x)θ(x ∈V ). (3.199)

J 0(x) no es un operador local.

En cambio para el campo cargado, se puede definir el operador densidad de carga en una región V

QV =∫

Vd3x j0(x). (3.200)

Sí cumple[QV ,QV ′ ] = 0 (3.201)

para V,V ′ cualesquiera (consecuencia de [ j0(x), j0(y)] = 0). También

[QV ,φ†(x)] = qφ

†(x)θ(x ∈V ) (3.202)

(q es la carga del campo) que implica que φ †(x) aumenta en q la carga en V sii x ∈V . (Nótese sin embargoque |0〉 no es uno de los estados propios de QV , a menos que V sea todo el espacio.)

3.8 Conexión espín-estadística

Como ya se ha visto (Sec. 2.1.5) la teoría del campo de Schrödinger es igualmente consistente eligiendouna segunda cuantización (es decir, su versión con partículas idénticas) bosónica o fermiónica. No es así para

114

Page 115: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

campos relativistas. El campo escalar (espín cero) requiere una cuantización como campo bosónico. Si seeligiera una cuantización fermiónica la ecuación de movimiento se derivaría correctamente pero resultaríauna relación incorrecta entre relaciones de conmutación entre campos y de operadores de creación ydestrucción. Otra propiedad que se violaría es microcausalidad, ya que [φ(x),φ †(y)]+ no se anula fuera delcono causal.

Igualmente es inviable una cuantización bosónica del campo de Dirac que corresponde a espín 1/2ya que se encontrarían problemas similares. El teorema de conexión espín-estadística se demuestra enel contexto de teoría axiomática de campos relativistas72 y afirma que los campos de espín entero sonbosónicos y los de espín semientero son fermiónicos. La correspondiente relación a nivel de partículaselementales se verifica empíricamente sin excepción.

Es notable que la estadística bosónica o fermiónica puede deducirse directamente a partir de la ecuaciónde movimiento. En efecto, consideremos por ejemplo el campo de KG neutro. El propagador ∆F(x−y) estádeterminado por la ecuación de movimiento (es su inverso)

∆F(k) =1

k2−m2 + iη(3.203)

y automáticamente implica que ∆F(x− y) es una función continua en x0 = y0 y par

∆F(x− y) = ∆F(y− x) (3.204)

lo cual requiere una estadística bosónica:

〈0|φ(x)φ(y)|0〉= 〈0|T φ(x,0+)φ(y)|0〉= ∆F(x− y) = ∆F(y− x) = 〈0|φ(y)φ(x)|0〉. (3.205)

Para fermiones se requeriría un signo menos. El caso de campos cargados se trata igualmente reduciéndolosa pares de campos reales. Para el campo de Dirac, usando sólo la ecuación de Dirac, se puede hacer unaconstrucción similar (requiere reducirlo a pares de campos reales, de Majorana) y se obtiene un propagadorantisimétrico que sólo es compatible con una estadística fermiónica (véase Sec. 4.7).

3.9 Representación de Schrödinger

3.9.1 Mecánica cuántica con número finito de grados de libertad

Como es bien sabido, en mecánica cuántica de una partícula en n dimensiones espaciales (espacio deHilbert H = L2(Rn)) la representación de posiciones está definida por la base |x〉 de vectores propiosdel operador posición x

x|x〉= x|x〉 (3.206)72Se postula tener una representación unitaria del grupo de Poincaré, unicidad del vacío, axiomas de localidad y otros

axiomas técnicos. El mismo sistema axiomático produce el teorema de invariancia CPT [2].

115

Page 116: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

x define un conjunto completo de operadores y los |x〉 forman una base ortonormal

〈x|y〉= δ (x−y) =n

∏i=1

δ (xi− yi),∫

dnx |x〉〈x|= 1 (3.207)

(por supuesto los |x〉 son vectores impropios de H , no son normalizables). En la representación de posi-ciones los estados se representan por una función de onda73

|ψ〉 ∈H |ψ〉=∫

dnxψ(x)|x〉, ψ(x) = 〈x|ψ〉. (3.208)

Supuesto |ψ〉 normalizado, ψ(x) es la amplitud de probabilidad de encontrar la partícula en el punto x. Elproducto escalar entre estados se obtiene mediante

〈ψ1|ψ2〉=∫

dnxψ∗1 (x)ψ2(x). (3.209)

En esta representación x actúa multiplicativamente y p es una derivación

〈x|x|ψ〉= xψ(x), 〈x|p|ψ〉=−i∇ψ(x) (3.210)

o simplemente xψ(x) = xψ(x), pψ(x) =−i∇ψ(x), consistente con

[xi, p j] = iδi j . (3.211)

Todo esto es bien sabido. Queremos extenderlo a campos.

3.9.2 Representación de Schrödinger

Una teoría de campos es un sistema dinámico con infinitos grados de libertad, de modo que hay ungrado de libertad (o más para campos no escalares) por cada punto del espacio. Considerando el caso delcampo neutro, por concretar, φ(x) ∈ R es la coordenada del campo en el punto x, análogo a xi para lapartícula: Para la partícula, x (la posición de la partícula) es una aplicación

x : 1, . . . ,n → Ri 7→ xi

(3.212)

Para el campo, una configuración ϕ del campo φ(x) es una aplicación

ϕ : Rn → Rx 7→ ϕ(x)

(3.213)

73Puede adoptarse el punto de vista de que el espacio H está formado por funciones de cuadrado integrable y |x0〉 es lafunción δ (x−x0), o bien que H es un espacio abstracto de vectores isomorfo a L2(Rn) y ψ(x) son las componentes de |ψ〉en la base |x〉. Ambos puntos de vista son equivalentes. A menudo el segundo es preferible.

116

Page 117: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Así la teoría del campo equivale a la teoría de una partícula en infinitas dimensiones (hay una etiqueta ipor cada x). En el caso cuántico (trabajamos aquí en imagen de Schrödinger), el conjunto de operadorescampo φ(x), que conmutan entre sí, es el conjunto completo de operadores similar a x, y define una basede estados propios (pero impropios)

φ(x)|ϕ〉= ϕ(x)|ϕ〉 ∀x. (3.214)

|ϕ〉 es un estado con configuración totalmente definida ϕ (igual que |x〉 representa un estado con posicióndefinida).74 Los estados |ϕ〉 forman una base ortonormal

〈ϕ1|ϕ2〉= δ (ϕ1−ϕ2)≡∏x

δ (ϕ1(x)−ϕ2(x)) (3.215)

(Todo esto es formal y dista mucho de ser riguroso. Debido a las infinitas dimensiones los estados |ϕ〉 sonimpropios en un sentido mucho más esencial que |x〉. Todo esto se puede formalizar para el caso libre, elcaso con interacción está en construcción.)

Los estados |Ψ〉 se pueden expresar en esta base, lo que proporciona la representación de Schrödinger

Ψ[ϕ] = 〈ϕ|Ψ〉 (3.216)

El funcional Ψ[ϕ] representa la amplitud de probabilidad de encontrar el campo en la configuración ϕ.75

También|Ψ〉=

∫Dϕ(x)Ψ[ϕ] |ϕ〉, Dϕ(x)≡∏

x

dϕ(x) (3.217)

en Dϕ(x) tenemos una integral (real en este caso) sobre cada una de las variable ϕ(x). Representa unaintegral funcional, ya que se está sumando sobre todas las posibles configuraciones espaciales ϕ del campo.Para el producto escalar en representación de Schrödinger

〈Ψ1|Ψ2〉=∫

Dϕ(x)Ψ∗1[ϕ]Ψ2[ϕ]. (3.218)

Los operadores campo φ y momento canónico π actúan multiplicativa y derivativamente

〈ϕ|φ(x)|Ψ〉= ϕ(x)Ψ[ϕ], 〈ϕ|π(x)|Ψ〉=−iδΨ[ϕ]

δϕ(x), (3.219)

o simplementeφ(x)Ψ[ϕ] = ϕ(x)Ψ[ϕ], π(x)Ψ[ϕ] =−i

δΨ[ϕ]

δϕ(x), (3.220)

74Nótese |ϕ〉 no depende de x, aunque a veces por conveniencia se pueda escribir en la forma |ϕ(x)〉.75Aquí una elucubración: en la primera cuantización en vez de x definido se tiene una amplitud ψ(x). En la segunda

cuantización se tiene una amplitud Ψ[ϕ(x)]. Una “tercera cuantización” correspondería entonces a una amplitud Ψ[Φ[ϕ(x)]].

117

Page 118: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

consistente con[φ(x),π(y)] = iδ (x−y) . (3.221)

La ecuación de evolución temporal,

i∂t |Ψ(t)〉= H|Ψ(t)〉, (3.222)

puede escribirse explícitamente en la representación de Schrödinger, transcribiendo el hamiltoniano, como

i∂tΨ[ϕ, t] =∫

d3x(−1

2δ 2

δϕ(x)2 +12|∇ϕ(x)|2 + 1

2m2

ϕ2(x)

)Ψ[ϕ, t] (3.223)

También se podría añadir un término de “energía potencial”, por ejemplo V (ϕ(x)).

Nótese que aquí no hay otros operadores que los diferenciales y los multiplicativos usuales de L2(Rn),pero con n infinito. Este espacio en el que viven los estados |Ψ〉 se denomina espacio de Schrödinger. Enprincipio sería el espacio de Fock, pero veremos que en realidad es un espacio mucho mayor. Volveremossobre esto más adelante.

Como se ve la ecuación de Schrödinger es la ecuación de una “partícula” en infinitas dimensiones y enausencia de interacción tiene la estructura

i∂tψ(x, t) =−12

n

∑i=1

∂ 2

∂x2i

ψ(x, t)+12

n

∑i, j=1

Ωi jxix jψ(x, t) (3.224)

que es un sistema de osciladores armónicos acoplados. Ωi j no es directamente diagonal porque el término∇ϕ(x) acopla una coordenada ϕ(x) con las de su entorno infinitesimal. Pasando a modos de Fourierqueda diagonal y permite obtener el espectro y funciones propias.

Para hacer esto el campo complejo es ligeramente más simple ya que su transformada de Fourier notiene la ligadura ϕ∗(k) = ϕ(−k). Para el campo complejo la ecuación es

i∂tΨ[ϕ, t] =∫

d3x(− δ

δϕ∗(x)

δ

δϕ(x)+∇ϕ

∗(x)∇ϕ(x)+m2ϕ∗(x)ϕ(x)

)Ψ[ϕ, t] (3.225)

Usando las relaciones

ϕ(x) = ∑k

eikx√

Vϕk, ϕk =

∫V

d3xe−ikx√

Vϕ(x),

δ

δϕ(x)= ∑

k

δ ϕk

δϕ(x)

∂ ϕk= ∑

k

e−ikx√

V∂

∂ ϕk, ∇ϕ(x) = ∑

k

eikx√

Vikϕk,

(3.226)

118

Page 119: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

y sus conjugadas, se tiene

i∂tΨ[ϕ, t] = ∑k

(− ∂

∂ ϕ∗k

∂ ϕk+(k2 +m2)ϕ∗kϕk

)Ψ[ϕ, t] (3.227)

En las nuevas variables Ωi j es diagonal, con diagonal k2+m2 = ω2k. La ecuación es separable. El estado

fundamental es un funcional gaussiano

Ψ0[ϕ] = N ∏k

e−ωk ϕ∗kϕk (3.228)

con energía E0 = ∑k ωk. El funcional del vacío expresado en variable ϕ(x) es

Ψ0[ϕ] = Ne−∫

d3xϕ∗(x)ωϕ(x), ω =+√−∇2 +m2. (3.229)

Se ve que la configuración más probable es ϕ(x) = 0. Las fluctuaciones cuánticas introducen cierta amplitudde probabilidad para otras configuraciones. Las amplitudes grandes están suprimidas y también los modoscon momento grande.

Los estados excitados se pueden obtener aplicando operadores de creación y aniquilación sobre el vacío.Usando las relaciones conocidas entre estos operadores y φ(x) y π(x) se obtiene

ak =1√2ωk

(∂

∂ ϕ∗k+ωkϕk

), a†

k =1√2ωk

(− ∂

∂ ϕk+ωkϕ

∗k

),

bk =1√2ωk

(∂

∂ ϕ−k+ωkϕ

∗−k

), b†

k =1√2ωk

(− ∂

∂ ϕ∗−k+ωkϕ−k

).

(3.230)

(Para el campo neutro bk = ak por ϕ∗−k = ϕk.) La gaussiana del vacío se obtiene fácilmente resolviendolas ecuaciones

akΨ0 = bkΨ0 = 0 ∀k. (3.231)

Los estados con distintos números de ocupación dan lugar a polinomios de Hermite multiplicando lagaussiana. Por ejemplo, el estado de una partícula a con momento k es

a†kΨ0 =

√2ωkϕkΨ0 . (3.232)

3.9.3 Expresiones en una base ortonormal arbitraria

Para resolver el espectro lo que se ha hecho es expresar ϕ en una base ortonormal de ondas planas.Se puede trabajar en una base ortonormal cualquiera (aunque el problema no quedará diagonalizado).

119

Page 120: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Si se tienen campos complejos φA(x), A = 1, . . . ,N, las configuraciones espaciales ϕA(x) están en V =L2(R3)⊗CN y se pueden ver como

ϕA(x) = 〈x,A|ϕ〉, 〈x,A|y,B〉= δABδ (x−y) (3.233)

Si |n〉 es una base ortonormal cualquiera de V , denotamos las correspondientes funciones de onda

φn,A(x) = 〈x,A|n〉. (3.234)

Las componentes de una configuración ϕ del campo son

ϕn = 〈n|ϕ〉=N

∑A=1

∫d3xφ

∗n,A(x)ϕA(x), ϕA(x) = ∑

nϕn φn,A(x) . (3.235)

La integral funcional se puede hacer usando las coordenadas complejas ϕn

〈Ψ1|Ψ2〉=∫

∏n

d2ϕn Ψ

∗1[ϕ]Ψ2[ϕ] (3.236)

(d2z = dxdy, z = x+ iy en el plano complejo.) Respecto de la derivadas funcionales

δ

δϕA(x)= ∑

nφ∗n,A(x)

∂ϕn,

δ

δϕ∗A(x)= ∑

nφn,A(x)

∂ϕ∗n. (3.237)

La ecuación de Schrödinger en representación |n〉 adoptará la forma

i∂tΨ = ∑n,m

(−δnm

∂ϕ∗n

∂ϕm+Mnmϕ

∗n ϕm

)Ψ (3.238)

La conservación de la forma cuadrática δnm en la energía cinética es consecuencia de que la base |n〉 esortonormal. La matriz Mnm es hermítica y semidefinida positiva.

Se puede usar una notación matricial disponiendo ϕ como un vector columna cuyas componentes sonϕn, (ϕ)n = ϕn, igualmente ϕ† es un vector fila con (ϕ†)n = ϕ∗n , ϕT es fila con (ϕT )n = ϕn y ϕ∗ columnacon (ϕ∗)n = ϕ∗n . Por otro lado ∂ y ∂ ∗ denotan vectores fila con (∂ )n = ∂/∂ϕn y (∂ ∗)n = ∂/∂ϕ∗n . Finalmente∂ T y ∂ † son vectores columna con (∂ T )n =−∂/∂ϕn y (∂ †)n =−∂/∂ϕ∗n .76

En notación matriciali∂tΨ = (∂ †

∂ +ϕ†Mϕ)Ψ (3.239)

76Se podría haber definido ∂ T y ∂ † con signo +, pero con signo menos ∂ † coincide con el adjunto como operador en elespacio de Schrödinger, y lo mismo el traspuesto.

120

Page 121: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Dado que M = M† ≥ 0 se puede definir W =+M1/2 (yendo a la base diagonal de M y tomando las raícescuadradas no negativas). W también es hermítica y no negativa. Es fácil comprobar entonces que

Ψ0 = Ne−ϕ†Wϕ , E0 = tr(W ). (3.240)

Los operadores de creación y destrucción a†n, b†

n, an, bn, pueden igualmente calcularse. Introduciendolas matrices

Ω =+(2W )−1/2 (3.241)

se tiene

an = Ωnm(∂∗+Wϕ)m , a†

n = (∂ T +ϕ†W )mΩmn ,

bn = (−∂T +ϕ

†W )mΩmn, b†n = Ωnm(−∂

∗+Wϕ)m .(3.242)

Como puede comprobarse

[an,a†m] = [bn,b†

m] = δnm, (las demás cero) (3.243)

y también (a es un vector columna y b un vector fila)

H = a†Wa+bWb†, : H : = a†Wa+b∗W T bT . (3.244)

ϕA(x) = φA,n(x)Ωnm(am +b†m). (3.245)

Si se usa la base ortonormal eikx/√

V , hay que tener en cuenta que bk va con e−ikx/√

V por convenio,de modo que bn corresponde a b−k. Más generalmente, si la base |n〉 es tal que Φ∗A,n(x) es otro elementode la base, que podemos denotar |−n〉, es más natural denotar b−n a lo que más arriba se ha llamado bn.

3.9.4 Espacio de Schrödinger

Para un campo φ(x) (supondremos el caso complejo por concretar) el espacio de Schrödinger, HS, esel espacio vectorial formado por los funcionales Ψ[ϕ]. Ciertamente este espacio contiene todos los estadosde las teorías libres de KG con cualquier masa.

Nos encontramos con una situación curiosa: el vacío de la teoría con masa m1, |Ψ0;m1〉 no coincidecon el vacío con una masa m2 distinta. En principio, |Ψ0;m1〉 podrá expresarse en la base de m2 peroinvolucrando estados |(n);m2〉 con partículas de masa m2. Es decir el estado vacío de la teoría m1 no estávacío para la teoría m2.

En realidad la situación es peor. Para dos masas m1 y m2 podemos preguntarnos cuál es el solapamientoentre los correspondientes vacíos 〈Ψ0;m1|Ψ0;m2〉, cuyos funcionales gaussianos conocemos. Para calcular

121

Page 122: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

esto los más práctico es usar espacio de momentos regulando IR el sistema mediante una caja cúbica devolumen V

S≡ 〈Ψ0;m1|Ψ0;m2〉= N1N2

∫(∏

k

d2ϕk)e−∑k ω1kϕ∗kϕke−∑k ω2kϕ∗kϕk (3.246)

Dado que cada modo de Fourier es independiente (factoriza), el resultado correctamente normalizado sepuede expresar como

S = ∏k

( ∫d2ϕe−(ω1k+ω2k)ϕ

∗ϕ

(∫

d2ϕe−2ω1kϕ∗ϕ)1/2(∫

d2ϕe−2ω2kϕ∗ϕ)1/2

)≡∏

k

sk (3.247)

Las integrales se hacen fácilmente con∫

d2ze−π|z|2 = 1,

sk =

π

ω1k+ω2k√π

2ω1k

√π

2ω2k

=

√ω1kω2k

12(ω1k+ω2k)

. (3.248)

Finalmente se puede explicitar la dependencia en V

S = e∑k log(sk) = exp(

V∫ d3k

(2π)3 log(sk))

(3.249)

El resultado se puede escribir

S = e−V σ , σ ≡∫ d3k

(2π)3 log(s−1k ) (3.250)

Dado que sk ≤ 1, σ ≥ 0 y S≤ 1, como debe ser. Desarrollando sk para k grande se ve que

sk = 1− (m21−m2

2)2

32k4 +O(k−6) (3.251)

lo cual indica que σ es convergente UV en 3+ 1 dimensiones. Para dimensiones espaciales mayores laintegral sobre k sería +∞ y el solapamiento se anularía, a menos que se introduzca un regulador UV,|k|< Λ.

La magnitud σ representa el “solapamiento por unidad de volumen” entre los dos vacíos. Los vacíosdifieren algo en cualquier región espacial de volumen finito, al juntar todas las regiones para formar R3,V → ∞ y S→ 0. No hay solapamiento entre los dos vacíos si se quita la caja.

Aún más, para V → ∞, tampoco hay solapamiento entre dos estados cualesquiera uno del espacio deFock de la teoría con masa m1, Hm1 y otro de la teoría con masa m2, Hm2 .

Hm1,2 ⊂HS, Hm1 ⊥Hm2 (3.252)

122

Page 123: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

En efecto, los estados de un espacio de Fock son combinación de estados con un número finito de partículas,es decir, de la forma gaussiana por polinomio. Al calcular el solapamiento el factor e−V σ va a seguir estandopresente y se anula para un volumen infinito. Los espacios de Fock de distintas masas no se ven unos aotros. Más generalmente, los elementos de matriz entre espacios distintos

〈Ψ1;m1|O(x)|Ψ2;m2〉= 0, Ψ1,2 ∈Hm1,2 (3.253)

para cualquier operador local O(x), ya que estos operadores contienen un número finito de operadores decreación y destrucción. Una acción local no puede producir el cambio global requerido para pasar de unespacio a otro.

El espacio de Schrödinger HS es un espacio de Hilbert no separable enorme que contiene a los espaciosde Fock de las teorías libres con distintas masas como subespacios, así como los espacios de las teoríascon interacción, generalmente sin solapamiento entre ellos. Esto es un problema serio ya que querríamostratar interacciones que, por ejemplo, cambien la masa y hacerlo todo en un mismo espacio. Por ejemplo,en el espacio de Fock el único estado que es a la vez normalizable e invariante bajo traslaciones es el vacíode Fock |0〉. Si enchufamos una interacción, el vacío (estado fundamental) se modificará a otro estado |0

∼〉

que también deberá ser normalizado e invariante traslacional, pero que no puede coincidir con el vacío deFock ya que éste no será vector propio del nuevo hamiltoniano. Se llega así a una obstrucción (teoremade Haag). Sin embargo el problema se sortea trabajando con teorías reguladas y los resultados físicos serecuperan al quitar los reguladores mediante el proceso de renormalización.

123

Page 124: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

4 Campo de Dirac

El tema del campo de Dirac es bastante extenso, aquí veremos sólo algunos aspectos relevantes.

4.1 Ecuación de Weyl

Queremos plantear una ecuación que represente una partícula relativista de espín 12 . El ejemplo más

simple es la ecuación de Weyl (hay dos versiones)

i∂t χ(x) =−iλσ ·∇χ(x), λ =±1 (4.1)

donde σ son la matrices de Pauli y χ(x) es un biespinor

χ(x) =(

χ1(x)χ2(x)

), (4.2)

Dado que la ecuación es compleja los operadores campo χα(x), α = 1,2 no coinciden con sus adjuntos.(De momento también se podría tomar χ(x) como un campo clásico complejo que sería la función de ondade la teoría de una partícula en primera cuantización.)

La ecuación se puede escribir como i∂t χ = Hχ, siendo el hamiltoniano H = λσ ·p. La relación dedispersión relativista es E2 = p2 +m2. Usando la identidad σiσ j = δi j + iεi jkσk se tiene H2 = λ 2p2, einvariancia relativista requiere entonces λ =±1 y m = 0. La ecuación de Weyl describe partículas sin masa.

Falta comprobar que la ecuación satisface invariancia relativista y describe partículas de espín 12 . Ve-

rifiquemos que para λ = +1 χ cae en la representación [0, 12 ] (quiralidad positiva) del grupo de Lorentz.

Recordemos que para la representación [0, 12 ] los generadores son

J =σ

2, K =+i

σ

2, (4.3)

La transformación Lorentz del campo es77

χ(x)→ χ′(x) = D(Λ)χ(Λ−1x) (4.4)

donde D(Λ) es la matriz 2×2 de la representación [0, 12 ]. (Nótese que esta representación no es unitaria,

K no es hermítico.) Explícitamente,

D(Λ) = e−iθJ−iξK = e−iθσ/2, θ = θ+ iξ ∈ C3 (4.5)

77 En realidad una transformación activa para operadores campo es χ ′(x) =U(Λ)χ(x)U†(Λ) = D(Λ−1)χ(Λx). Aquí ponemosla acción correspondiente a Λ−1 para que algunas fórmulas queden un poco más simples. La transformación dada es paratransformaciones activas Λ de funciones de onda o campos clásicos.

124

Page 125: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

donde ξ es la rapidez, el parámetro normal (aditivo) que coincide con la velocidad para velocidades peque-ñas, v = tanh(ξ ). En el caso infinitesimal δξ = δv y

D(Λ) = 1− i(δθ+ iδv)σ/2. (4.6)

Si definimos el cuadrivector (formado por matrices 2×2)

σµ = (1,σ) = σ

µ † (4.7)

la ecuación de Weyl para λ =+1 se puede escribir como

0 = σµ i∂µ χ(x). (4.8)

Invariancia Lorentz requiere que 0 = σ µ i∂µ χ(x) implique 0 = σ µ i∂µ χ ′(x):

0 = σµ i∂µ

(D(Λ)χ(Λ−1x)

)= (Λ−1)ν

µσµD(Λ)(i∂ν χ)(Λ−1x). (4.9)

La implicación está garantizada si (Λ−1)νµσ µD(Λ) es de la forma L(Λ)σν siendo L(Λ) una matriz cual-

quiera. La única solución consistente con la hermiticidad de σ µ es

D†(Λ)σ µD(Λ) = Λµ

νσν . (4.10)

Y esta relación sí se verifica para D(Λ) en la representación [0, 12 ]. En efecto, para la parte derecha de la

ecuación:

Λµ

ν = gµν +δω

µν , δω

0i = δω

i0 = δvi, δω

ij =−εi jkδθk

Λ0

νσν = σ

0 +δvσ, Λiνσ

ν = (σ+δv+δθ ×σ)i(4.11)

Para la parte izquierda:

D†(Λ)σ0D(Λ) = 1+δvσ

D†(Λ)σD(Λ) = σ+ i[δθσ

2,σ]+ [δv

σ

2,σ]+ = σ+δθ ×σ+δv.

(4.12)

Queda entonces comprobado que χ(x) para λ = +1 es un campo relativista de partículas sin masa yespín 1

2 , porque J = σ/2 genera las rotaciones del biespinor. Debe notarse que el J completo contieneademás la parte orbital L que genera las rotaciones de x.

Para λ =−1 el campo, que se suele denotar ζ (x), cae en la representación [12 ,0] (quiralidad negativa),

con J = iK = σ/2. La ecuación es

0 = σµ i∂µζ (x), σ

µ = σµ = (1,−σ) (4.13)

125

Page 126: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

y hay invariancia Lorentz usando la matriz de representación en [12 ,0] que denotamos D(Λ) y cumple

D†(Λ)σ µD(Λ) = Λµ

ν σν . (4.14)

Hay que notar que las dos irreps [0, 12 ] y [1

2 ,0] son inequivalentes, es decir, no hay un cambio de baseen el espacio de biespinores que lleve λ a −λ . El producto σxσyσz = i implica que no existe una matriz Sde cambio de base tal que SσS−1 =−σ. Sí hay equivalencia entre −σ y σ∗ = σT , a saber,

σyσ∗σy =−σ . (4.15)

La irreps [12 ,0] y [0, 1

2 ] son conjugadas, concretamente

D(Λ) = σyD∗(Λ)σy = D†−1(Λ) . (4.16)

El hecho de que las irreps quirales no sean equivalentes a sus conjugadas indica que son necesariamentecomplejas en cualquier base.

Para campos de Weyl, la quiralidad λ =±1 coincide con (dos veces) la helicidad, h, definida por

h =pJ

|p|(4.17)

En efecto, teniendo en cuenta que el momento angular orbital L es ortogonal a p y |p|= H = λσp

h =pσ/2

H=

λ

2. (4.18)

Que la helicidad coincida con la quiralidad tiene una consecuencia importante: la ecuación de Weyl notiene simetría de paridad. La helicidad es un pseudoescalar y cambia de signo bajo paridad, el transformadopor paridad de un campo una quiralidad tendría quiralidad opuesta y no sería solución de la misma ecuaciónde Weyl. Otra forma de verlo, si se cambia χ(t,x) por χ(t,−x), esto produce ∇→−∇ en la ecuación, locual equivale a λ →−λ .

Igualmente no hay simetría de conjugación de carga. Si se toma el adjunto y traspuesto de la ecuaciónpara quiralidad λ se tiene

i∂t χ∗(x) =−iλσ∗∇χ

∗(x), χ∗ ≡ χ

T † (4.19)

Como se ha visto antes, mediante un cambio de base σ∗→−σ y la ecuación no queda invariante, sinoque λ →−λ .

Sin embargo CP (y por tanto T ) sí se conserva ya que involucra dos cambios λ →−λ y la ecuaciónqueda invariante. Concretamente multiplicando la última ecuación por iσy y cambiando x de signo se ve

126

Page 127: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

que la ecuación es invariante bajo la transformación78

χ(x)→UCP χ(x)U†CP = iσyχ

∗(x). (4.20)

4.2 Formulación lagrangiana del campo de Weyl

La ecuación de Weyl (consideramos el caso λ =+1) deriva del lagrangiano79

L (x) = χ†(x)σ µ i∂µ χ(x). (4.21)

El operador L (x) es hermítico.80 La ecuación se obtiene con 0 = ∂L (x)/∂ χ†(x).

Dado que χ(x) cae en la representación [0, 12 ], χ†(x) cae en la representación conjugada que es [1

2 ,0].Por otro lado ∂µ es un cuadrivector Lorentz y consecuentemente cae en la irrep [1

2 ,12 ]. Al construir L (x)

lo que se ha hecho es acoplar las irreps [0, 12 ] de χ con [1

2 ,12 ] de ∂µ para dar [1

2 ,0] (y [12 ,

32 ]) que se acopla

con [12 ,0] de χ† para dar [0,0] de L (x), un escalar Lorentz. Los coeficientes σ

µ

αβson simplemente los

coeficientes de Clebsch-Gordan necesarios.81

La ecuación de Klein-Gordon (para masa nula)

∂µ∂µ

χ(x) = 0 (4.22)

también se cumple, como debe ser ya que expresa E2 = p2, pero no es la ecuación básica. Esa ecuaciónes reducible y describiría igualmente dos campos de KG escalares. El lagrangiano de la que derivaría,L (x) = ∂µ χ†(x)∂ µ χ(x) de hecho no es invariante Lorentz a menos que χ(x) esté en una irrep del tipo[ j, j], ya que ∂µ∂ µ está en [0,0], y las irreps [ j, j] siempre van a ser bosónicas (espín entero) ya queJ = JL +JR.

Respecto del contenido en partículas del campo de Weyl, por un lado es un campo biespinor complejo(esto es inevitable al estar en una irrep compleja) y tendría el contenido de dos campos complejos de KG,pero por otro la ecuación de movimiento es de primer orden en ∂t , con lo cual tiene la mitad de grados delibertad. Igual que pasaba con el campo de Schrödinger, algunos momentos canónicos son redundantes,π(x) coincide con iχ†(x). En un símil mecánico, no hace falta dar “posición y velocidad” sólo “posición”.En consecuencia el contenido en partículas es el mismo que para un campo de KG complejo: en total dospartículas.

78La fase i es convencional (iσy es real) y se puede cambiar con un cambio de fase de los campos. UCP es lineal y unitario.79Más correctamente densidad lagrangiana.80Módulo integración por partes, es decir, se puede añadir un término de superficie − i

2 ∂µ (χ†(x)σ µ χ(x)) para que sea

estrictamente hermítico.81Hay que recordar que la reducción de [ jL, jR]⊗ [ j′L, j′R] se obtiene haciendo la suma de momentos angular para JL y para

JR, por separado.

127

Page 128: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

El campo se puede escribir explícitamente usando operadores de creación y destrucción resolviendo laecuación de Weyl con ondas planas:

χ(x) =∫ d3k

(2π)3 w(k)(e−ikxa(k)+ eikxb†(k)

)∣∣k0=|k|,

χ†(x) =

∫ d3k(2π)3 w†(k)

(e−ikxb(k)+ eikxa†(k)

)∣∣k0=|k|.

(4.23)

Aquí kµ = (|k|,k) y w(k) es el biespinor normalizado solución de

σµkµw(k) = 0, w†(k)w(k) = 1. (4.24)

w(k) es el análogo del vector de polarización para el campo del fotón. La ecuación definitoria es unaecuación de autovalores82

(σk)w(k) = +|k|w(k). (4.25)

El biespinor con valor propio −|k| (energía negativa) se puede elegir como w(−k). En el campo χ(x) salela combinación (a(k)w(k)+b†(−k)w(−k))eikx, con dos biespinores ortogonales para un k dado. Nóteseque los operadores a(k) y b(k) son necesariamente distintos ya que χ(x) es un campo complejo.

Teniendo en cuenta que el momento canónico conjugado de χα(x) es iχ†α(x), las relaciones de conmu-

tación canónicas son[χα(x),χ

†β(y)]+ = δαβ δ (x−y), (las demás cero) (4.26)

Como sabemos sólo la estadística fermiónica es consistente al tratarse de campos con espín semientero.Correspondientemente a(k), b(k) y sus adjuntos satisfacen las relaciones canónicas de operadores decreación y destrucción fermiónicos.

Para la ecuación de Weyl lo más natural es interpretar este contenido como una partícula con helicidadλ =+1 y su antipartícula con helicidad λ =−1. χ(x) que se transforma con λ =+1 destruye la partícula(y crea la antipartícula) y χ†(x) que se transforma con λ = −1 (irrep [1

2 ,0]) destruye la antipartícula (ycrea la partícula). Este sería el caso de los neutrinos.83 Alternativamente se puede ver como una partículaneutra con dos estados de helicidad; este otro punto de vista será preferible como límite del caso masivo.

La carga que distingue la partícula de la antipartícula es la quiralidad λ y dado que no hay masacoincide con la helicidad. Cuando se introduzca masa la quiralidad deja de ser conservada. La helicidad deuna partícula sigue siendo una constante de movimiento en la teoría libre.

La carga de quiralidad es la carga Noether de la simetría χ(x)→ eiϕ χ(x), con corriente conservada

jµ(x) = : χ†(x)σ µ

χ(x) : (4.27)

82Nótese que no hay partículas sin masa con k= 0, este modo se excluye de la suma de Fourier como pasaba para fotones.83Unos neutrinos teóricos, sin masa. Los neutrinos físicos sí tienen masa aunque extremadamente pequeña.

128

Page 129: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

4.3 Campo de Majorana

Un término de masa (al menos en una teoría libre) es uno que penaliza en la acción (o la energía)la amplitud del campo y no su variación, por tanto no involucra derivadas. Para formar un tal operadorcuadrático invariante Lorentz se puede usar un acoplamiento χχ pero no χ†χ. El motivo es que [0, 1

2 ]⊗ [0,12 ]

puede producir un escalar [0,0] pero [12 ,0]⊗ [0, 1

2 ] sólo da [12 ,

12 ].

Esto tendría dos problemas en primera cuantización que se eluden en segunda cuantización. Escriba-mos primero el lagrangiano del término de masa. El acoplamiento de dos espines 1

2 para dar singlete esantisimétrico, eso produce

Lm(x) =12

mεαβ

χα χβ +12

m∗εαβχ

†β

χ†α (4.28)

donde m es un parámetro que puede ser complejo y εαβ es el tensor antisimétrico en dos dimensiones,ε12 =+1.

Notablemente, Lm(x) se anularía idénticamente si los χα(x) fueran c-números, pero siendo operadorescampo fermiónicos χα y χβ anticonmutan a igual tiempo y Lm(x) no se anula.84 También se puede escribircon notación matricial (εαβ = (iσy)αβ )

Lm(x) =12

mχT iσyχ− 1

2m∗χ†iσyχ

∗. (4.29)

Podemos verificar la invariancia Lorentz usando la relación

σyDT (Λ)σy = σye−iασT /2σy = D−1(Λ), (4.30)

entoncesχ

Tσyχ → χ

T DTσyDχ = χ

TσyσyDT

σyDχ = χT

σyχ. (4.31)

Claramente el término de masa viola la simetría de cambio de fase del campo y la quiralidad deja deser una constante de movimiento. Se puede usar la libertad de cambiar la fase de χ(x) para elegir m ≥ 0si se quiere (la física sólo puede depender de |m|).

Con el término de masa, la ecuación de movimiento de χ(x) queda

i∂t χ(x) =−iσ∇χ(x)+m∗iσyχ∗(x). (4.32)

Aquí se ve otro problema en primera cuantización (es decir, interpretando χ(x) como una función de ondao amplitud de probabilidad), y es que la ecuación no es lineal en χ(x). En cambio no hay ninguna dificultad

84Se puede hacer una primera cuantización pero usando variables de Grassmann para χα (x) de modo que anticonmuten.

129

Page 130: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

si χ(x) es un operador campo y la ecuación de movimiento es la ecuación de evolución en imagen deHeinsenberg. La teoría es lineal en su acción sobre los estados |ψ〉 del sistema.

Comprobemos que la masa de la partícula es |m|. Para ello podemos escribir la ecuación junto con suconjugada

i∂t χ∗(x) =−iσ∗∇χ

∗(x)−miσyχ(x) (4.33)

en la formai∂t

χ∗

)= H

χ∗

), H =

(−iσ∇ m∗iσy

−miσy −iσ∗∇

). (4.34)

Es fácil comprobar ahora que H2 = p2 + |m|2 (por la identidad 4×4).85

Para el campo de Weyl el grupo de Lorentz (propio, rotaciones y boosts) no permite cambiar la helicidad(son partículas sin masa) y al ser un campo cargado la interpretación más natural es de una partícula y suantipartícula con helicidades opuestas fijas. Al introducir masa la helicidad ya no es un invariante Poincaréy quiralidad deja de conservarse, la interpretación es de una partícula neutra masiva con sus dos estadosde espín. Las partículas neutras de espín 1

2 son partículas de Majorana.

4.4 Ecuación de Dirac

El campo χ∗(x) tiene quiralidad λ = −1 y se transforma con D∗(Λ). Es usual introducir el campoequivalente ζ (x)

ζ (x) = iσyχ∗(x), ζ

∗(x) = iσyχ(x), ζT (x) =−χ

†(x)iσy, ζ†(x) =−χ

T (x)iσy. (4.35)

ζ (x) se transforma con D(Λ) = D†−1(Λ).

Las ecuaciones de movimiento quedan

i∂t χ(x) =−iσ∇χ(x)+m∗ζ (x), i∂tζ (x) = +iσ∇ζ (x)+mχ(x). (4.36)

Los términos cinético y masivo del lagrangiano se pueden escribir:

LK(x) = χ†σ

µ i∂µ χ = ζ†σ

µ i∂µζ , Lm(x) =−12

mζ†χ− 1

2m∗χ†

ζ . (4.37)

(Nótese que cuando los elementos de matriz de A y B anticonmutan (AB)T =−BT AT .) Las transformacionesde χ y ζ implican que ζ †χ es invariante Lorentz.

85Si sólo se quiere ver cuál es la masa, basta considerar una solución de energía E con momento cero, Eχ = m∗iσyχ∗ y suconjugada implican E2 = |m|2.

130

Page 131: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Con los campos χ(x) y ζ (x) se puede construir un cuadriespinor

ψ(x) =(

χ(x)ζ (x)

)=

ψ1(x)ψ2(x)ψ3(x)ψ4(x)

, (4.38)

y las ecuaciones de movimiento toman la forma

i∂tψ = Hψ, H =

(−iσ∇ m∗

m iσ∇

). (4.39)

Es estándar elegir la fase de modo que m = |m| (la masa de la partícula) y lo hacemos en lo que sigue.En este caso H se puede expresar como

H =−iα ·∇+βm (4.40)

donde α, β son matrices 4×4

α=

(σ 00 −σ

), β =

(0 11 0

). (4.41)

Estas matrices satisfacen las relaciones

α=α†, β = β†, [αi,α j]+ = 2δi j, β

2 = 1, [β ,αi]+ = 0, (4.42)

que garantizan H = H† y H2 = p2 +m2.

La ecuación de ψ se puede llevar a una forma más manifiestamente covariante partiendo de

σµ i∂µ χ = mζ , σ

µ i∂µζ = mχ, (4.43)

e introduciendo las matrices de Dirac

γµ =

(0 σ µ

σ µ 0

), γ

0 = β , γ = βα, (4.44)

con lo que la ecuación queda86

(iγµ∂µ −m)ψ(x) = 0 (4.45)

que es conocida como ecuación de Dirac. Las matrices de Dirac satisfacen las propiedades

γµ † = γµ = γ

µγ

0, [γµ ,γν ]+ = 2gµν . (4.46)

86m va multiplicada por la matriz identidad 4×4.

131

Page 132: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Las relaciones de anticonmutación garantizan que ψ(x) satisface la ecuación de Klein-Gordon. También seintroduce la matriz γ5 que cumple

γ5 =

(1 00 −1

), γ5 = γ

†5 = iγ0

γ1γ

3, [γ5,γµ ]+ = 0. (4.47)

La matriz γ5 mide la quiralidad, +1 para χ, −1 para ζ .

Dado que χ y ζ están relacionados por conjugación, los campos ψ y ψ∗ no son independientes, sinoque cumplen la relación

ψ∗(x) =

(0 −iσy

iσy 0

)ψ(x) (condición de Majorana). (4.48)

La condición de Majorana expresa que el cuadriespinor ψ(x) sólo contiene dos grados de libertad inde-pendientes y no cuatro y describe una partícula masiva de espín 1

2 neutra. Es el análogo de la condiciónφ †(x) = φ(x) para el campo real de Klein-Gordon.

4.5 Campo de Dirac

De modo análogo a lo que ocurría para el campo de complejo de KG, si tomamos dos campos deMajorana (es decir, neutros) ψ1 y ψ2 con igual masa, se tiene una simetría SO(2) de rotación en el plano(ψ1,ψ2) que es una simetría de la acción. Este grupo es isomorfo a U(1). Si formamos el campo

ψ(x) =1√2(ψ1(x)+ iψ2(x)) (4.49)

y su conjugado, la simetría toma la forma (podemos elegir carga q = 1)

ψ(x)→ eiλψ(x), ψ

∗(x)→ e−iλψ∗(x). (4.50)

El campo complejo ψ(x) ya no está sujeto a la condición de Majorana ya que sus biespinores χ(x) y ζ (x) yano están relacionados por conjugación. Tenemos un campo de Dirac, es un campo cargado que contienecuatro grados de libertad (para cada k), dos partículas neutras con dos estados de espín que se interpretanmejor como una partícula de espín 1

2 y su antipartícula.87 Bajo el grupo de Lorentz χ y ζ se transformanindependientemente88

ψ(x)→U(Λ−1)ψ(x)U†(Λ−1) = S(Λ)ψ(Λ−1x), S(Λ) =(

D(Λ) 00 D(Λ)

)(4.51)

87Esta carga no es la quiralidad. Quiralidad no se conserva ya que γ5 no conmuta con H por el término de masa.88Recuérdese que ésta es en realidad la transformación activa para Λ−1 no Λ, o bien Λ pero para campos clásicos o funciones

de onda.

132

Page 133: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

y teniendo en cuenta las transformaciones de σ µ y σ µ , se tiene

S−1(Λ)γµS(Λ) = Λµ

νγν (4.52)

que permite verificar independientemente la invariancia Lorentz de la ecuación de Dirac. Se observa queψ(x) cae en la representación reducible [0, 1

2 ]⊕ [12 ,0].

También es importante enfatizar que U(Λ) es un operador unitario en el espacio de Fock aunqueS(Λ) no sea una matriz unitaria en el caso de boosts. En primera cuantización el producto escalar sería∫

d3xψ†1 (x)ψ2(x), y se conserva bajo boosts: el cambio en ψ

†1 ψ2 (por S(Λ) no unitaria) se compensa con

la contracción espacial del elemento de volumen. Para el campo de Klein-Gordon la compensación la hacíael factor ω en

∫d3xϕ∗1 (x)ωϕ2(x).

En realidad las relaciones[γµ ,γν ]+ = 2gµν , γ

µ † = γµ (4.53)

es todo lo necesario para obtener todas las propiedades del campo de Dirac. No es difícil demostrar queestas relaciones (álgebra de Clifford) sólo admiten una representación irreducible módulo equivalencia, quees la que se muestra en ec. (4.44) y es de dimensión 4. Ésa es la denominada representación quiral.Se pueden obtener nuevas representaciones (equivalentes) mediante un cambio de base ortonormal en elespacio de Dirac (el espacio de dimensión 4 donde vive el cuadriespinor ψ)

γ′µ =Uγ

µU† U ∈ U(4). (4.54)

Si hubiera habido más representaciones inequivalentes habría distintos tipos de partículas de Dirac, perono es el caso. En cambio, cuando no hay masa γ0 = β se puede eliminar de las ecuaciones y las únicasrelaciones necesarias son

[αi,α j]+ = 2δi j, α† =α. (4.55)

Estas relaciones tiene sólo dos soluciones irreducibles inequivalentes, a saber, α = ±σ (dimensión 2). Enefecto hay dos tipos de partículas sin masa, las partículas de Weyl con quiralidades λ =±1.

La ecuación de Dirac deriva del lagrangiano

L (x) = ψ(x)(iγµ∂µ −m)ψ(x) = ψ

†(x)(i∂t −H)ψ(x) (4.56)

donde se ha introducido el denominado campo adjunto

ψ(x)≡ ψ†(x)γ0. (4.57)

Usando la propiedad γµ † = γ0γµγ0 es inmediato comprobar que L (x) = L †(x) (módulo integración porpartes). También es manifiesta la invariancia U(1), con corriente Noether

jµ(x) = : ψ(x)γµψ(x) : (4.58)

133

Page 134: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

La conservación de jµ(x) se comprueba usando la ecuación de Dirac y su ecuación adjunta89

ψ(x)(iγµ←∂ µ +m) = 0 (4.59)

de modo que0 = ψ(iγµ

∂µ −m)ψ + ψ(iγµ←∂ µ +m)ψ = ∂µ(ψγ

µψ). (4.60)

En primera cuantización la densidad de carga ψ†(x)ψ(x) sería definida positiva, pero en segunda cuantiza-ción, con orden normal, no tiene signo definido, cambia de signo al intercambiar partículas con antipartículas.

Teniendo en cuenta las transformaciones Lorentz de ψ, y ψ

ψ(x)→ ψ(Λ−1x)S−1(Λ) (4.61)

se deduce que jµ(x) es un cuadrivector Lorentz

jµ(x)→ Λµ

ν jν(Λ−1x). (4.62)

Análogamente ψψ es un escalar, ψγ5ψ es un pseudoescalar,90 ψγ5γµψ un pseudocuadrivector, ψγµγνψ

un tensor, etc.

4.6 Soluciones tipo onda plana

Podemos desarrollar los campos ψ(x) en soluciones de momento definido y los correspondientes ope-radores de creación y destrucción,

ψ(x) =∫ d3k

(2π)3 ∑λ=±1

2

√m

E(k)

(e−ikxuλ (k)aλ (k)+ e+ikxvλ (k)b

†λ(k)),

ψ(x) =∫ d3k

(2π)3 ∑λ=±1

2

√m

E(k)

(e−ikxvλ (k)bλ (k)+ e+ikxuλ (k)a

†λ(k)).

(4.63)

Aquí E(k)=+√

p2 +m2 y kµ =(E(k),k). λ no es la quiralidad sino una etiqueta (asociada a una constantede movimiento) que distinga los dos estados de espín, por ejemplo la helicidad.

uλ (k) y vλ (k) son cuadriespinores (las polarizaciones en el espacio de Dirac) y u = u†γ0, v = v†γ0.uλ (k) y vλ (k) son tales que ψ(x) cumpla la ecuación de Dirac. Eso requiere

(kµγµ −m)uλ (k) = 0, (kµ

γµ +m)vλ (k) = 0. (4.64)

89A←∂ B≡ (∂A)B, es decir, la ecuación es (∂µ ψ)iγµ +mψ = 0.

90γ5 =14! iεµναβ γµ γν γα γβ , con ε0123 =+1.

134

Page 135: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

u±1

2(k) y v

±12(−k) son los cuatro vectores propios de la matriz αk+ βm (el hamiltoniano de primera

cuantización) y por tanto son ortogonales entre sí.

Teniendo en cuenta las relaciones de conmutación canónicas

[ψα(x),ψ†β(y)]+ = δαβ δ (x−y), [ψα(x),ψβ (y)]+ = 0 (4.65)

los operadores de creación y destrucción están correctamente normalizados cuando u y v se normalizansegún

u†λ(k)uλ ′(k) = v†

λ(k)vλ ′(k) =

E(k)m

δλλ ′ . (4.66)

Con esta normalizaciónuλ (k)uλ ′(k) =−vλ (k)vλ ′(k) = δλλ ′ . (4.67)

En este caso[aλ (k),a

†λ ′(k

′)]+ = [bλ (k),b†λ ′(k

′)]+ = δλλ ′(2π)3δ (k−k′) (4.68)

y los demás anticonmutadores se anulan.

Respecto del hamiltoniano (de segunda cuantización)

H = :∫

d3xψ†(x)(−iα∇+βm)ψ(x) : =

∫ d3k(2π)3 ∑

λ=±12

E(k)(a†(k)a(k)+b†(k)b(k)

). (4.69)

Y para el operador carga

Q =∫

d3x j0(x) =∫ d3k

(2π)3 ∑λ=±1

2

(a†(k)a(k)−b†(k)b(k)

). (4.70)

4.7 Relaciones de conmutación covariantes

Las relaciones conmutación covariantes y el propagador de Feynman son

[ψα(x), ψβ (y)]+ = iSαβ (x− y), S(x) = (iγµ∂µ +m)∆(x),

〈0|T ψα(x)ψβ (y)|0〉= iSF αβ (x− y), SF(x) = (iγµ∂µ +m)∆F(x).

(4.71)

Puesto que ∆(x− y) se anula fuera del cono causal S(x− y) también lo hace y el campo de Dirac satisfacemicrocausalidad. El propagador puede escribirse como

SF(x) =∫ d4k

(2π)4 e−ikxSF(k), SF(k) =γµkµ +m

k2−m2 + iη=

1γµkµ −m+ iη

(4.72)

135

Page 136: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

y es inmediato que es una función de Green de la ecuación de Dirac

(iγµ∂µ −m)SF(x) = δ (x). (4.73)

El propagador deriva directamente de la ecuación de movimiento y es suficiente para ver que la segundacuantización ha de ser en la versión fermiónica. Para ver esto hay que usar campos neutros (de ahí vale paracargados) de Majorana. Lo más cómodo es usar la llamada representación de Majorana de las matricesde Dirac. En esta representación las matrices de Dirac son imaginarias puras

γµ∗ =−γ

µ , γµ T =−γµ (representación de Majorana) (4.74)

de modo que la ecuación de Dirac (iγµ∂µ −m)ψ = 0 es puramente real y la condición de Majorana essimplemente

ψ∗(x) = ψ(x) (condición de Majorana en la representación de Majorana) (4.75)

es decir, ψα(x) es un operador hermítico.

Al igual que para el campo de KG real, aquí se trata de ver que

〈0|T ψα(x)ψβ (y)|0〉= (iSF(x− y)γ0)αβ , (4.76)

es una función antisimétrica (para KG era simétrica) al intercambiar (x,α) con (y,β ), es decir,(SF(−x)γ0)T

=−SF(x)γ0. (4.77)

Esto es fácil de comprobar en espacio de momentos

(SF(−k)γ0)T

=

(1

γµ(−kµ)−m+ iηγ

0)T

= γ0T 1−γµ T kµ −m+ iη

=−γ0 1

γµkµ −m+ iη=− 1

γµkµ −m+ iηγ

0 =−SF(k)γ0.

(4.78)

En realidad 〈0|T ψα(x)ψβ (y)|0〉, como propagador que es, coincide con el inverso de la ecuación de mo-vimiento, es decir con 〈x,α|(i∂t −H)−1|y,β 〉. Pero i∂t es un operador antisimétrico: el caso bosónico portanto ya está excluido por ser la ecuación de Dirac de primer orden. Lo que se ha hecho es comprobar queel propagador completo es antisimétrico. El argumento de simetría o antisimetría para ver la estadística bo-sónica o fermiónica se basa en la continuidad del propagador respecto de x0−y0 en x0 = y0 y esa propiedadse sigue de microcausalidad y la invariancia relativista del propagador (no puede pasar nada especial enx0 = y0). Para el campo de Schrödinger el argumento no funciona y puede cuantizarse en las dos versionesbosónica o fermiónica.

136

Page 137: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

4.8 Paridad y conjugación de carga

Como ya se comentó, bajo paridad y bajo conjugación de carga las representaciones [0, 12 ] y [1

2 ,0] seintercambian. Como el campo de Dirac se transforma en [0, 1

2 ]⊕ [12 ,0] ya no hay obstrucción para tener

invariancia bajo P o C.

Como se puede comprobar, si ψ(x) es una solución de la ecuación de Dirac γ0ψ(x) es otra solución.En efecto, x→ x produce ∂µ → ∂ µ en la ecuación, pero esto se compensa con γ0γµγ0 = γµ . Así pues bajoparidad

UPψ(x)U†P = ηPγ

0ψ(x), ηP =±1 (4.79)

El γ0 es el análogo de S(Λ) para una transformación de L↑+. UP es unitario y verifica U2P = 1.

La transformación bajo C debe cambiar ψ por ψ∗ sin modificar x. La forma más general es91

ψ(x)→ ψc(x) = C ψ

T (x) = C γ0T

ψ∗(x) (4.80)

permitiendo una matriz unitaria C del espacio de Dirac, tal que si ψ(x) es solución de la ecuación de Dirac,ψc(x) también. Partiendo de la ecuación adjunta,

ψ(x)(iγµ←∂ µ +m) = 0 (4.81)

si se aplica trasposición se tiene(iγµ T

∂µ +m)γ0Tψ∗(x) = 0. (4.82)

Multiplicando ahora por una matriz unitaria C se obtendrá la relación deseada92

(iγµ∂µ −m)C γ

0Tψ∗(x) = 0 (4.83)

si la matriz C satisface las relacionesC γ

µ T C † =−γµ . (4.84)

Pero es inmediato que tal matriz existe ya que −γµ T satisface las relaciones de conmutación y hermiticidadrequeridas para ser matrices de Dirac y como la solución es única salvo equivalencia, debe haber una matrizunitaria de cambio de base C que conecte −γµ T con γµ . Además las γµ forman un conjunto irreducible yeso implica que en cada representación de las γµ la matriz C es única salvo fase.

En la representación quiral de las γµ la matriz es

C =

(−iσy 0

0 iσy

)(representación quiral) (4.85)

91Se podría haber definido C de modo que ψc(x) = C ψ∗(x), pero el convenio dado es el más usual.92Hay que notar que en segunda cuantización el requerimiento es dejar la acción o el hamiltoniano invariante. Para trans-

formaciones lineales esto equivale a dejar la ecuación de movimiento invariante, pero eso ya no vale para UT o UCPT.

137

Page 138: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Esta matriz es antisimétrica y esa propiedad se mantiene en cualquier representación de la γµ ,

C T =−C . (4.86)

La condición de Majorana para expresar que el campo es neutro puede entonces expresarse93

ψc(x) = ψ(x) (condición de Majorana) (4.87)

La transformación CCψ(x)C† = C ψ

T (x) =−γ0C ψ

∗(x) (4.88)

satisface C2 = 1.

Inversión temporal esUT ψ(x)U†

T =−C †γ5ψ(−x) (4.89)

de modo que CPT quedaUCPT ψ(x)U†

CPT = γT5 ψ∗(−x). (4.90)

Es fácil comprobar que esta transformación deja invariante la acción (teniendo en cuenta que UCPT esantilineal y los campos son fermiónicos):

UCPTL (x)U†CPT = ψ

T (−x)γT5 γ

0∗(γµ∗(−i)(−∂µ)−m)γT5 ψ∗(−x)

=−ψ†(−x)γ5(γ

µ †(−i)(+∂µ)−m)γ0γ5ψ(−x)

= ψ(−x)γ5(−γµ i∂µ −m)γ5ψ(−x)

= L (−x).

(4.91)

Otra observación es que, de acuerdo con univalencia, se cumple

U2T ψ(x)U†

T2 =−ψ(x). (4.92)

93Salvo quizá una fase que depende de la elección de fase de C . Esta relación vale en cualquier representación de las γµ .

138

Page 139: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

5 Campos con interacción

5.1 Diferencias con el caso libre

Los términos del lagrangiano no cuadráticos en los campos dan lugar a ecuaciones no lineales y corres-ponden a términos de interacción ya que la energía de un sistema formado por dos subsistemas ya no seráaditiva.

Por ejemploL (x) =

12

∂µφ∂µ

φ − 12

m2φ

2− 14!

gφ4 (5.1)

produce las ecuaciones de movimiento

(−∂2−m2)φ(x) =

13!

gφ3(x) (5.2)

que no se pueden resolver en forma cerrada. Si se comparan con las ecuaciones del campo en presencia deuna fuente J(x)

(−∂2−m2)φ(x) = J(x), φ(x) = φ0(x)+

∫d4y∆F(x− y)J(y) (5.3)

donde φ0(x) es el campo libre, se ve que el término de interacción se puede ver como una fuente que creao destruye partículas (compárese con las ecuaciones de Maxwell donde la corriente eléctrica jµ(x) crea odestruye fotones). La ecuación

φ(x) = φ0(x)+∫

d4y∆F(x− y)13!

gφ3(y) (5.4)

permite una solución iterativa en potencias de la constante de acoplamiento g, que proporciona la serieperturbativa.

Para concretar supondremos un campo escalar neutro y una interacción con acoplamientos no deriva-tivos (el término de interacción no contiene ∂µφ). El lagrangiano es

L (x) =12

∂µφ(x)∂ µφ(x)− 1

2m2

φ2(x)−V (φ(x))≡L0(x)+LI(x) (5.5)

donde V (ϕ) es una función real ordinaria (no funcional) y típicamente es un polinomio. En principio lafunción V (ϕ) debe estar acotada inferiormente para que haya estado fundamental.94 En realidad la dinámicadepende sólo de la combinación 1

2 m2φ 2+V (φ), el parámetro m2 es arbitrario y se podría absorber en V (ϕ).94A nivel perturbativo se puede tratar el caso no acotado (e.g. φ 3) que es de interés académico pero a veces produce ejemplos

más simples.

139

Page 140: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Se puede elegir para optimizar un desarrollo perturbativo en V (ϕ) y generalmente la elección más adecuadaes que m sea la masa de la partícula.95

En presencia de interacción el momento canónico sigue siendo π(x) = ∂tφ(x) y la densidad hamiltonianaes

H (x) =12

π2 +

12(∇φ)2 +

12

m2φ

2 +V (φ)≡H0(x)+HI(x) (5.6)

Las relaciones de conmutación canónicas se mantienen

[φ(x),π(y)] = iδ (x−y), [φ(x),φ(y)] = 0 . (5.7)

Y también se sigue manteniendo que hay una representación unitaria del grupo de Poincaré y el estadofundamental o vacío |0

∼〉 es no degenerado y cae en la representación trivial del grupo.

Pµ |0∼〉= 0, Jµν |0

∼〉= 0, (5.8)

Consecuentemente se mantiene microcausalidad (aunque [φ(x),φ(y)] ya no es un c-número).

Notablemente, en imagen de Heinsenberg todavía es posible escribir

φ(x) =∫ d3k

(2π)

1√2ω(k)

(eikxa(k, t)+ e−ikxa†(k, t))

π(x) =−i∫ d3k

(2π)

√ω(k)

2(eikxa(k, t)− e−ikxa†(k, t))

(5.9)

siendo ω(k) cualquier función positiva y par en k, por ejemplo +√k2 +m2, y a(k, t), a†(k, t) operadores

tales que[a(k, t),a†(k′, t)] = (2π)3

δ (k−k′), [a(k, t),a(k′, t)] = 0, (5.10)

cona(k, t) = eitHa(k,0)e−itH . (5.11)

Sin embargo, a diferencia del caso libre, para t 6= 0

a(k, t) 6= e−iω(k)ta(k,0) (5.12)

y si |0〉 es el estado vacío de Fock aniquilado por los a(k,0)

a(k, t)|0〉 6= 0 (5.13)

95Desgraciadamente esta masa no se conoce hasta que se resuelve la teoría. En un cálculo perturbativo m2 se va calculandoy reajustando en cada orden perturbativo.

140

Page 141: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

De hecho |0〉 no es un estado estacionario y no coincide con el vacío físico |0∼〉, el estado fundamental

de H. En efecto, cuando V (φ) = φ 4, por ejemplo, se escriba en función de los operadores de creación ydestrucción en t = 0 habrá términos del tipo (a+a†)4 y los términos a†4|0〉 modificarán el vacío de Fockcreando partículas.

5.2 Funciones de Green o de correlación

La función de Green o función de correlación de n puntos de una teoría de campos escalares neutrosse define como

iG(x1, . . . ,xn) = 〈0∼|T φ(x1) · · ·φ(xn)|0∼〉 (5.14)

T indica ordenación cronológica, φ(x) es el campo en imagen de Heisenberg, |0∼〉 es el vacío normalizado

exacto de la teoría, es decir, el estado fundamental de H, y se supone que el sistema es conservativo (Hindependiente del tiempo) de modo que |0

∼〉 esté bien definido (de hecho suponemos invariancia Poincaré).

La imagen de Heisenberg está referida a un tiempo t0 (en el cual coincide con la imagen de Schrödinger)pero dado que |0

∼〉 es propio de H el valor esperado no depende del valor de t0. Y tampoco depende de

cómo se elija el origen de energías en H. Si no se dice otra cosa suponemos que el origen de energías estal que E0 = 0.

Para una teoría de campos escalares cargados las funciones de Green son

iG(x1, . . . ,xn,y1, . . . ,ym) = 〈0∼|T φ(x1) · · ·φ(xn)φ†(y1) · · ·φ †(ym)|0∼〉 (5.15)

Obviamente si la carga es exactamente conservada las funciones con n 6= m se anulan.

Estas funciones generalizan el propagador de Feynman de la teoría libre que hemos visto antes. Y lainterpretación es análoga, en los puntos xi se crean partículas o se detectan antipartículas y en los y j se creanantipartículas o se detectan partículas (dentro de lo que permite la localizabilidad de partículas relativistas),según el orden temporal entre estos puntos. Las funciones de correlación nos dan la información sobre comose propagan las partículas en presencia de interacción entre ellas. Generalizan la función de onda ψ(x, t)de la teoría de una partícula.

Más generalmente se requiere 〈0∼|T O1(x1) · · ·On(xn)|0∼〉 donde los Oi(x) son operadores locales cuales-

quiera construidos con los campos básicos. Éstas se pueden obtener a partir de las funciones de Green delos campos básicos de la teoría (φA(x),ψA(x), ψA(x), etc.)

Una teoría cuántica de campos se considera completamente resuelta cuando se conocen sus funcionesde correlación de los campos en el vacío, ya que a partir de estas funciones se pueden obtener los valoresesperados de observables, el espectro de energías, la matriz de colisión, relaciones de conmutación, etc.

141

Page 142: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

La idea es que un estado cualquiera se puede formar aplicando operadores (construidos con los campos)sobre el vacío,

|Ψ〉= O†Ψ|0∼〉, (5.16)

y eso permite obtener un valor esperado o elementos de matriz

〈Ψ1|A|Ψ2〉= 〈0∼|TOΨ1A(0)O†Ψ2|0∼〉. (5.17)

Aquí A(t) es el operador en imagen de Heisenberg, y asignamos etiquetas temporales t = 0+ a OΨ1 y t = 0−

a O†Ψ2

.

Igualmente un conmutador entre dos operadores se puede obtener a partir del orden cronológico.Definiendo

GAB(t)≡ 〈0∼|TOΨ1A(t)B(0)O†Ψ2|0∼〉, (5.18)

el salto de discontinuidad de GAB(t) en t = 0 proporciona el conmutador de los operadores A, B.

〈Ψ1|[A,B]|Ψ2〉= GAB(0+)− iGAB(0−)≡ ∆GAB(0). (5.19)

También se definen las funciones de correlación en espacio de momentos como la transformadade Fourier de la funciones de correlación en posiciones

iG(k1, . . . ,kn) =∫

d4x1 · · ·d4xn eik1x1 · · ·eiknxn iG(x1, . . . ,xn) (5.20)

Cualitativamente los ki son los cuadrimomentos de las partículas que se propagan. El convenio tal y comoestá escrito corresponde a momentos salientes (−ki corresponde al momento entrante). Un k0

i positivo indicaque la partícula se lleva energía del sistema, un valor negativo que aporta energía. Invariancia traslacional deG(x1, . . . ,xn) implica que el cuadrimomento total se conserva y eso da lugar a una delta de conservaciónen las G(k1, . . . ,kn)

G(k1, . . . ,kn) ∝ (2π)4δ (k1 + · · ·+ kn) (5.21)

Así para la función de dos puntos

G(x1,x2) = G(x1− x2),

G(k1,k2) =∫

d4x1d4x2 eik1x1eik2x2 G(x1− x2) =∫

d4x1d4x2 eik1(x1−x2)ei(k1+k2)x2 G(x1− x2)

= (2π)4δ (k1 + k2)G(k1).

(5.22)

Hay que notar que estos cuadrimomentos no tienen que estar sobre la capa de masas, es decir k2 notiene que coincidir con m2 (siendo m la masa de la partícula) y k2 y k0 pueden ser positivos o negativos.

142

Page 143: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Que los momentos estén fuera de la capa de masas (off-shell) indica que son estados virtuales (frentea estacionarios). Este fenómeno no es específico de teorías relativistas, ocurre en teoría de colisiones enmecánica cuántica de partículas no relativistas con una interacción mediada por un potencial. Una partículase puede propagar con una energía que no se corresponde con su momento (partícula virtual) durante ciertotiempo de acuerdo con ∆E∆t ∼ h. (Esta relación sale directamente de la transformada de Fourier e indicaque no se puede tener un paquete de ondas a la vez muy localizado en tiempo y en frecuencias.) Cuandouna partícula se propaga en el tiempo con una energía E (por ejemplo ω(k) su función de onda evolucionacon una fase e−iEt . Si la propagación es desde t =−∞ a t = ∞ la transformada de Fourier de la amplitudproduce ∫

dt eik0te−iEte−η |t| = 2πδ (k0−E) (5.23)

k0 = E es la única frecuencia que aparece. En cambio, si la partícula se crea en t = 0 y luego se propagahasta t =+∞ (o se propaga desde t =−∞ y se destruye en t = 0) lo que se tiene es∫

dt eik0te−iEte−η |t|θ(±t) =± i

k0−E± iη(5.24)

Aparecen otras frecuencias, con supresión (pero muy suave) a medida que k0 se aleja de E. El valor dela energía en la capa de masas se manifiesta como un polo. Esto es general, los polos en las funcionesde correlación en espacio de momentos corresponden a modos propios del sistema (estados estacionarios).Esto se puede ver en el propagador de Feynman del campo de KG (y también en el de Dirac)

∆F(k) =1

k2−m2 + iη=

1k02−ω(k)2 + iη

(5.25)

Usando la identidad (P indica valor principal de Cauchy)

1x± iη

= P1x∓ iπδ (x), (5.26)

se tieneIm ∆F(k) =−πδ (k2−m2) (5.27)

Esto es general, las partes imaginarias de las funciones de Green en espacio de momento localizan lospuntos del espectro de la teoría.

5.3 Representación de Lehmann

Consideramos un campo escalar complejo φ(x), y sea

iG(+)2 = 〈0

∼|φ(x)φ †(y)|0

∼〉 (5.28)

143

Page 144: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Usando invariancia traslacional U(a) = eiaµ Pµ

φ(x) = eiPxφ(0)e−iPx (5.29)

y Pµ |0∼〉= 0,

iG(+)2 = 〈0

∼|φ(0)e−iP(x−y)

φ†(0)|0

∼〉 (5.30)

que puede reescribirse como

iG(+)2 =

∫ d4k(2π)4 e−ik(x−y)〈0

∼|φ(0)(2π)4

δ (P− k)φ †(0)|0∼〉. (5.31)

Vamos a suponer que 〈0∼|φ(x)|0

∼〉= 0 (no hay condensados).96 En este caso φ †(0)|0

∼〉 sólo puede contener

estados con energía positiva, es decirP0 > 0 P2 ≥ 0 (5.32)

que permite escribir

iG(+)2 =

∫ d4k(2π)4 θ(k2)θ(k0)e−ik(x−y)〈0

∼|φ(0)(2π)4

δ (P− k)φ †(0)|0∼〉. (5.33)

Dado que |0∼〉 y φ(0) son escalares Lorentz, y Pµ un cuadrivector

U(Λ)|0∼〉= |0

∼〉, U(Λ)φ(0)U†(Λ) = φ(0), U(Λ)PµU†(Λ) = (Λ−1)µ

νPν (5.34)

se deduce que la función2πρ(k2)≡ 〈0

∼|φ(0)(2π)4

δ (P− k)φ †(0)|0∼〉 (5.35)

es escalar y depende sólo de k2. Esto permite escribir

iG(+)2 =

∫ d4k(2π)4 θ(k2)θ(k0)e−ik(x−y)2πρ(k2)

=∫

0d(m2)ρ(m2)

∫ d4k(2π)4 θ(k2)θ(k0)e−ik(x−y)2πδ (k2−m2)

=∫

0d(m2)ρ(m2) i∆(+)(x− y;m2).

(5.36)

m2 es un parámetro de integración y ∆(+)(x−y;m2) es la función invariante ∆(+) de la teoría libre con masam. Otra forma de expresar el resultado es

〈0∼|φ(x)φ †(y)|0

∼〉=

∫∞

0d(m2)ρ(m2)〈0|φ(x)φ †(y)|0〉libre,m2 . (5.37)

96Esto es trivial en la teoría libre o si la carga es conservada, pero no con interacción para campos neutros o para cargadossi la carga no es exactamente conservada.

144

Page 145: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Análogamente〈0∼|φ †(y)φ(x)|0

∼〉=

∫∞

0d(m2)ρ(m2)〈0|φ †(y)φ(x)|0〉libre,m2 . (5.38)

Para la función de correlación de dos puntos y el conmutador se tiene entonces la llamada represen-tación de Lehmann

iG(x1,x2) = 〈0∼|T φ(x)φ †(y)|0∼〉=

∫∞

0d(m2)ρ(m2) i∆F(x− y;m2)

〈0∼|[φ(x),φ †(y)]|0

∼〉=

∫∞

0d(m2)ρ(m2) i∆(x− y;m2).

(5.39)

Resultados análogos valen para el caso neutro. Es muy notable que toda la información sobre la teoríacon interacción está contenida en la densidad espectral ρ(m2).

El campo φ †(0) de la teoría con interacción actúa sobre el vacío |0∼〉 produciendo estados excitados

|n∼,k〉 con masa invariante mn (estados normalizados, propios de H y P )

Pµ |n∼,k〉= (ωn(k),k)|n∼,k〉, 〈n

∼,k|n∼′,k′〉= δnn′(2π)3

δ (k−k′) (5.40)

con cierta amplitud de probabilidad f ∗n ,

φ†(0)|0

∼〉= ∑

n

∫ d3k(2π)3

1√2ωn(k)

f ∗n |n∼,k〉. (5.41)

(Usamos una etiqueta n discreta por simplicidad, pero en general habrá una parte continua en el espectro.)Los estados producidos se pueden clasificar por su cuadrimomento. Por cada estado con momento cerohay una torre de estados con cualquier momento obtenidos aplicando un boost. Todos estos tienen lamisma amplitud y masa invariante. El operador δ (P− k) es esencialmente un proyector sobre estados concuadrimomento kµ . Podemos escribir la resolución de la identidad (Parseval) como

1 = ∑n

∫ d3k(2π)3 |n∼,k〉〈n∼,k| (5.42)

e insertarla en la expresión que define ρ(m2) (5.35); eligiendo kµ = (mn,0)

2πρ(m2) = ∑n

2πδ (mn−m)|〈n∼,0|φ †(0)|0

∼〉|2 = ∑

n2πδ (m2

n−m2)| fn|2. (5.43)

En particular en el caso de una teoría libre de masa m0, φ †(0)|0∼〉 sólo produce estados de una partícula y

sólo hay un sumando, con amplitud f = 1, que da lugar a ρ(m2) = δ (m2−m20).

145

Page 146: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

La representación de Lehmann es un resultado no perturbativo muy notable que sólo utiliza invarianciaLorentz, localidad y unitaridad. El propagador (función de Green de dos puntos) de una teoría es unacombinación de propagadores libres pesados con la densidad espectral. Esta densidad es definida positiva,y además está normalizada

ρ(m2)≥ 0,∫

0d(m2)ρ(m2) = 1. (5.44)

La regla de suma se deduce de

〈0∼|[φ(x),φ †(y)]|0

∼〉=

∫∞

0d(m2)ρ(m2)〈0|[φ(x),φ †(y)]|0〉libre,m2 (5.45)

derivando respecto de y0 y tomando x0 = y0 = 0

〈0∼|[φ(x),π†(y)]|0

∼〉=

∫∞

0d(m2)ρ(m2)〈0|[φ(x),π†(y)]|0〉libre,m2 . (5.46)

Dado que ambos conmutadores son iguales (a iδ (x−y)) sin dependencia en m2, se obtiene la normalizaciónindicada para la densidad espectral. Estas relaciones permiten interpretar la densidad espectral como ladensidad de probabilidad de producir estados de masa m al aplicar el campo sobre el vacío.

Tomando transformada de Fourier, se obtiene para el propagador exacto en espacio de momentos97

G(k) =∫

0d(m2)ρ(m2)

1k2−m2 + iη

. (5.47)

El espectro se puede obtener a partir propagador tomando parte imaginaria,

Im G(k) =−πρ(k2). (5.48)

La regla de suma de ρ(m2) implica que para k→ ∞, G(k)∼ 1/k2. Este ritmo de caída para k0 grandeimplica que G(x) es continua pero con derivada discontinua como función de x0 (y x fijo genérico), lo cualestá de acuerdo con las relaciones de conmutación canónicas.

Como se ha dicho, la densidad espectral ρ(m2) tiene soporte en las masas de los estados presentes enφ †(x)|0

∼〉. Una situación típica (ni mucho menos la más general) es que el espectro de la teoría contenga

estados de una partícula y estados de multipartícula, con masas invariantes mb > 0 y M ≥ nmb n = 2,3 . . .(la masa invariante en estados de más de una partícula forma un continuo ya que puede haber una energíacinética de movimiento relativo en el centro de masas). Se supone además que el campo crea esa partícula,junto otros estados de multipartícula. En este caso

ρ(m2) = Zδ (m2−m2b)+ρc(m2) (5.49)

97Se suele escribir el propagador como G(x− y) aprovechando invariancia traslacional.

146

Page 147: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

donde el espectro continuo empieza en m2 = (2mb)2. La condición de normalización implica

0≤ Z ≤ 1 (5.50)

Z se puede interpretar como la probabilidad de crear un estado de una partícula (y no multipartícula) alaplicar el campo. En el propagador

G(k) =Z

k2−m2b + iη

+∫

(2mb)2d(m2)ρc(m2)

1k2−m2 + iη

. (5.51)

El propagador presenta un polo en k2 = m2b con residuo Z, correspondiendo a

〈0∼|φ(x)|b

∼,k〉= Z1/2 e−ikx√

2ωn(k). (5.52)

La parte del continuo presenta una acumulación de “polos” (uno en cada punto del espectro) lo cual dalugar a un corte de rama en G(k) en el plano complejo k2.

La representación de Lehmann se puede generalizar para otros operadores locales. Para operadoresescalares

〈0∼|TOi(xi)O

†j(x j)|0∼〉=

∫∞

0d(m2)ρi j(m2)i∆F(xi− x j;m2) (5.53)

con〈0∼|Oi(x)|n∼,k〉= f i

ne−ikx√2ωn(k)

. (5.54)

yρi j(m2) = ∑

nδ (m2

n−m2) f in f j

n∗. (5.55)

La matriz ρi j es semidefinida positiva. La condición de normalización ya no tiene que cumplirse.

Utilizando operadores con distintos números cuánticos, se pueden explorar distintos sectores del espectroy las constantes de acoplamiento f i

n. Si O(x) es un operador con carga q, O†(x) sólo producirá estadoscon carga q, por ejemplo. Dado que el propagador libre tiene una caída exponencial para separacionesespaciales, controlada por la masa (potencial de Yukawa) se tendrá

〈0∼|TO(x)O†(y)|0

∼〉 ∼ | f0|2e−rmO (5.56)

para separaciones r = |x−y| grandes, donde mO es la masa del estado más ligero excitado por O(x).Equivalentemente, las masas y acoplamiento se obtiene buscando polos de la función de correlación en

147

Page 148: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

espacio de momentos. El cálculo en espacio de posiciones se aplica en cálculos no perturbativos en elretículo por ejemplo para determinar el espectro de masas de QCD.

5.4 Funcional generador de las funciones de Green

5.4.1 Funcional generador

Se puede escribir un funcional generador de las funciones de correlación. Para el campo real

G[J] = 〈0∼|Te−i

∫d4xJ(x)φ(x)|0

∼〉 (5.57)

donde J(x) es la corriente o fuente, un campo clásico real (una función ordinaria, c-número). Si sedesarrolla en potencias de J(x)

G[J] =∞

∑n=0

(−i)n

n!

∫d4x1 . . .d4xn J(x1) · · ·J(xn)〈0∼|T φ(x1) · · ·φ(xn)|0∼〉 (5.58)

lo cual permite recuperar las funciones de Green por desarrollo en serie de Taylor (funcional)

iG(x1, . . . ,xn) = iδ

δJ(x1)· · · i δ

δJ(xn)G[J]

∣∣∣J=0

(5.59)

La ecuación es consistente porque las G(x1, . . . ,xn) son funciones completamente simétricas bajo permuta-ción de los x j debido a la presencia del operador cronológico T .

Para un campo cargado habría una corriente J(x) compleja,

G[J] = 〈0∼|Te−i

∫d4x(J∗(x)φ(x)+φ †(x)J(x))|0

∼〉. (5.60)

Para fermiones las funciones de Green

〈0∼|T ψα1(x1) · · ·ψαn(xn)ψ

†β1(y1) · · ·ψ†

βn(yn)|0∼〉 (5.61)

son completamente antisimétricas al permutar las etiquetas (x j,α j) entre sí (ídem (y j,β j)). El funcionalgenerador aún se puede construir usando corrientes que sean números de Grassmann (anticonmutan, envez de conmutar [3]).

Como vamos a ver G[J] coincide con la amplitud de persistencia del vacío

G[J] = 〈0∼|0∼〉J. (5.62)

148

Page 149: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Esta es la amplitud probabilidad de que empezando en el estado vacío (en t = −∞) el sistema acabe (ent =+∞) otra vez en el mismo estado en presencia de la corriente.

5.4.2 Operador de evolución

Sea U(t1, t2) el operador de evolución temporal que evoluciona el estado |ψ(t)〉 en imagen de Schrö-dinger,

|ψ(t)〉=U(t, t ′)|ψ(t ′)〉. (5.63)

Este operador es unitario y por su propia definición satisface

U(t1, t2)U(t2, t3) =U(t1, t3), U(t1, t2) =U†(t2, t1), U(t, t) = 1. (5.64)

Para un hamiltoniano H conservativoU(t1, t2) = e−i(t1−t2)H (5.65)

En un caso más general, con H(t) dependiente del tiempo, se tiene

U(t f , ti) = Te−i∫ t f

tiH(t)dt (t f ≥ ti), (5.66)

donde T es el operador cronológico. Esta fórmula se sigue de la ecuación de Schrödinger

i∂t |ψ(t)〉= H(t)|ψ(t)〉 (5.67)

que implica (para dt infinitesimal)

U(t +dt, t) = 1− iH(t)dt = e−iH(t)dt (5.68)

El producto ordenado cronológicamente de estos factores infinitesimales produce (5.66). Recordemos quetodos los operadores bosónicos conmutan dentro de T por lo que

TeAeB = TeA+B. (5.69)

H siempre es bosónico, es decir, tiene un número par de campos fermiónicos. Para t f < ti basta usar

U(t f , ti) =U†(ti, t f ) (5.70)

5.4.3 Función de partición

El funcional generador se puede expresar de una forma más conveniente. Para ello notemos que laimagen de Heisenberg de un operador corresponde a

O(x, t) =U(t0, t)OS(x, t)U(t, t0) (5.71)

149

Page 150: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

siendo t0 es tiempo de referencia en el que las imágenes de Heisenberg y Schrödinger coinciden y OS es eloperador en imagen de Schrödinger. Si suponemos que el observable O no depende del tiempo

O(x) =U(t0, t)O(x)U(t, t0) (5.72)

y más generalmente

O(x1) · · ·O(xn) =U(t0, t1)O(x1)U(t1, t2) · · ·U(tn−1, tn)O(xn)U(tn, t0). (5.73)

Entonces una función de Green de dos puntos, por ejemplo, puede escribirse en imagen de Schrödingercomo

〈0∼|TO1(x1)O2(x2)|0∼〉= 〈0∼|O1(x1)U(t1, t2)O2(x2)|0∼〉 (t1 > t2) (5.74)

y una fórmula análoga para t1 < t2. Aquí se ha usado

U(t, t ′)|0∼〉= |0

∼〉 (5.75)

por E0 = 0. El resultado no depende de t0. Nótese que (5.74) no presupone t2 > t0, esto es irrelevante.También se puede escribir

〈0∼|TO1(x1)O2(x2)|0∼〉= 〈0∼|U(T1, t1)O1(x1)U(t1, t2)O2(x2)U(t2,T2)|0∼〉 (t1 > t2) (5.76)

Aquí T1 es un tiempo positivo grande (remoto futuro) y T2 negativo grande (remoto pasado) de modo quetodos los t j estén en el intervalo [T2,T1], aunque en realidad la igualdad no depende de esto.

La expresión se puede llevar a una notación más conveniente

〈0∼|TO1(x1) · · ·On(xn)|0∼〉= 〈0∼|TU(T1,T2)O1(x1) · · ·On(xn)|0∼〉S (5.77)

El operador T se encarga de ordenar los operadores de acuerdo con sus etiquetas temporales, y en parti-cular trocea U(T1,T2) para insertar cada tramo de evolución ordenadamente. Es importante notar que losoperadores O(x, t) en la derecha están en imagen de Schrödinger pero tienen una etiqueta temporal sólopara indicar cómo debe ordenarlos T . Que los operadores están en imagen de Schrödinger lo indicamos conel subíndice S. En esta expresión sí es necesario que el intervalo [T2,T1] contenga todos los tiempo t j.

Podemos tomar los límites T1,2 → ±∞ y usar la expresión del operador de evolución en (5.66), queimplica

U(+∞,−∞) = Te−i∫

d4xH (x) (5.78)

Junto con (5.77) produce

〈0∼|Te−i

∫d4xJ(x)φ(x)|0

∼〉= 〈0

∼|Te−i

∫d4xH (x)e−i

∫d4xJ(x)φ(x)|0

∼〉S

= 〈0∼|Te−i

∫d4xH J(x)|0

∼〉S

(5.79)

150

Page 151: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

con el hamiltoniano modificado HJ(t)

H J(x) = H (x)+ J(x)φ(x). (5.80)

Esta expresión muestra que el efecto de la fuente J(x) equivale a un término de interacción con unacorriente, correspondiendo a un lagrangiano

L J(x) = L (x)− J(x)φ(x) (5.81)

En efecto, la corriente eléctrica se acopla con − jµ(x)Aµ(x) en el lagrangiano del campo electromagnético.De ahí que J(x) sea simultáneamente un fuente (o sumidero) de partículas y una corriente.

De acuerdo con la ec. (5.79), denotando UJ el operador de evolución en presencia de la corriente, setiene

G[J] = 〈0∼|UJ(+∞,−∞)|0

∼〉= 〈0

∼|0∼〉J (5.82)

Es decir, el generador de las funciones de Green G[J] coincide con la amplitud de persistencia del vacío enpresencia de J. Dado que UJ es unitario, cuando la corriente no pueda crear partículas netas sobre el vacíoesta amplitud será una fase, en otro caso la probabilidad de acabar otra vez en el vacío, |〈0

∼|0∼〉J|2, será

menor que 1.

En todas estas fórmulas se supone que J(x)→ 0 para x0→±∞ (o más generalmente |xµ | → 0) de modoque HJ(t)→H y la acción de J(x) no cambie las condiciones de contorno. Los tiempos x0

j de las funcionesde Green son “finitos” con respecto a T1,2, es decir, en todo caso el límite de T1,2 se toma antes de posibleslímites x j→ ∞.

Podemos ir más lejos notando que U(t1, t2) depende analíticamente de t1 y t2, por lo que está biendefinido considerar evoluciones temporales con t1,2 complejos o más generalmente a lo largo de caminos enel plano complejo t. En particular nos interesa un camino que recorra un tramo suficientemente grandedel eje real (para contener los tiempos de todos los observables) pero que luego puede apartarse del ejereal si es conveniente, con T1,2 complejos. (Para caminos en el plano complejo T se refiere a ordenación alo largo del camino.)

Consideremos un camino como el indicado en la Fig. 4, T2→ T ′2 → T ′1 → T1 y el elemento de matriz

〈Ψ1|UJ(T1,T2)|Ψ2〉= 〈Ψ1|U(T1,T ′1)UJ(T ′1,T

′2)U(T ′2,T2)|Ψ2〉 (5.83)

Aquí |Ψ1,2〉 son dos estados cualesquiera pero que tengan cierto cierto solapamiento con el vacío, 〈0∼|Ψ1,2〉 6=

0. Insertando un conjunto de estados propios de H, se tiene

〈Ψ1|U(T1,T ′1) = 〈Ψ1|∑n|n∼〉〈n∼|U(T1,T ′1) = 〈Ψ1|0∼〉〈0∼|+ ∑

n>0e−i(T1−T ′1)En〈Ψ1|n∼〉〈n∼| (5.84)

151

Page 152: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Si ahora tomamos el límite en T1 en el plano complejo de modo que

T1→+∞− i∞ (5.85)

y dado que En > 0, se deduce que todos los estados excitados están exponencialmente suprimidos y sólosobrevive el vacío

〈Ψ1|U(T1,T ′1)→ 〈Ψ1|0∼〉〈0∼|. (5.86)

AnálogamenteT2→−∞+ i∞ U(T ′2,T2)|Ψ2〉 → |0∼〉〈0∼|Ψ2〉. (5.87)

En este caso se tiene

plano t

txx

T2

T1

2 1T

2

T1’

Figura 4: Camino seguido en el plano complejo de la variable t para 〈Ψ1|UJ(T1,T2)|Ψ2〉 en (5.83).

〈Ψ1|UJ(T1,T2)|Ψ2〉 → 〈Ψ1|0∼〉〈0∼|UJ(+∞,−∞)|0

∼〉〈0∼|Ψ2〉 (5.88)

Equivalentemente puede aplicarse la prescripción

T1,2→±∞(1∓ iη), η → 0+ (5.89)

donde el límite en η hay que tomarlo en último lugar.

El hecho de que la dependencia en Ψ1,2 factorice en (5.88), nos permite reescribir (5.82) como

G[J] = limT1,2→±∞∓i∞

〈Ψ1|UJ(T1,T2)|Ψ2〉〈Ψ1|U(T1,T2)|Ψ2〉

(5.90)

o simplemente

G[J] =〈Ψ1|UJ(+∞,−∞)|Ψ2〉〈Ψ1|U(+∞,−∞)|Ψ2〉

(5.91)

152

Page 153: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

En lo que sigue siempre supondremos que el límite t→±∞ del operador de evolución se toma acompañadode ∓i∞.

Dado que el resultado no depende de los estados Ψ1,2 se puede tomar un promedio sobre ellos y lo másfrecuente es utilizar la suma sobre una base ortonormal de estados con |Ψ1〉= |Ψ2〉= |n〉, es decir la traza,

G[J] =Tr(UJ(+∞,−∞))

Tr(U(+∞,−∞))≡ Z[J]

Z[0](5.92)

El funcionalZ[J] = Tr(UJ(+∞,−∞)) = Tr(Te−i

∫d4xH J(x))S (5.93)

es la función de partición. Cualquier elección de estados Ψ1,2 produce el mismo resultado salvo normali-zación, que se cancela con el denominador, de modo que genéricamente cualquiera de estos resultados seconsidera una función de partición, que siempre hay que normalizar tomando cocientes.

Obsérvese que en la expresión de Z[J] no aparece |0∼〉 explícitamente sino que las condiciones de contorno

se seleccionan por la forma de H J(x). La condición J(x)→ 0 para x→ ∞ asegura que HJ → H y loselementos de matriz se evalúan con el estado fundamental de H.

Derivando respecto de J(x) se puede obtener los productos ordenados de campos

〈0∼|T φ(x1) · · ·φ(xn)|0∼〉=

Tr(Te−i∫

d4xH (x)φ(x1) · · ·φ(xn))S

Tr(Te−i∫

d4xH (x))S(5.94)

y de ahí cualquier funcional A[φ ] construido con los φ(x) y con soporte en x finitos (respecto de T1,2)

〈0∼|TA[φ ]|0

∼〉= Tr(Te−i

∫d4xH (x)A[φ ])S

Tr(Te−i∫

d4xH (x))S(5.95)

También se debe notar que las fórmulas a partir de (5.90) son válidas incluso aunque el origen deenergías no se elija de modo que E0 = 0. Un cambio de origen sólo cambia la normalización de Z[J].

5.5 Formulación basada en integración funcional

El formalismo canónico (basado en el hamiltoniano) que se ha usado hasta ahora es especialmente útilen el caso libre pero no tanto en presencia de interacción. Una alternativa al formalismo canónico, y que

153

Page 154: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

en cierto sentido es más fundamental, es la formulación de Feynman de la integral de caminos, o integralfuncional en el caso de campos, basado en el lagrangiano.

5.5.1 Integral de caminos de Feynman

Como es sabido [4] para una partícula en n dimensiones con hamiltoniano p2/(2m)+V (x, t) la amplitudde probabilidad de propagarse del punto xi en tiempo ti al punto x f en tiempo t f

〈x f , t f |xi, ti〉 ≡ 〈x f |U(t f , ti)|xi〉 (5.96)

se puede expresar como una suma sobre los caminos x(t) que unan (xi, ti) con (x f , t f ) pesados con unafase eiS[x(t)], siendo S[x(t)] la acción del camino:98

〈x f , t f |xi, ti〉=∫ x(t f )=x f

x(ti)=xi

Dx(t)eiS[x(t)], S[x(t)] =∫ t f

tidt(

12

mx2(t)−V (x(t), t)). (5.97)

La suma sobre caminos es de hecho una integral funcional

Dx(t) = ∏t

dnx(t), (5.98)

hay una integral sobre Rn por cada t en el intervalo (ti, t f ). Obviamente tal integral no está bien definidamatemáticamente y lo que se hace es discretizar t y luego tomar el límite del continuo, ∆t→ 0, y hay quepermitir un factor de normalización de modo que se recupere la condición 〈x f , t|xi, t〉= δ (x f −xi).99

Aunque en principio se suma sobre todos los caminos el camino clásico es dominante en el límite clásico.Si reintroducimos h, por dimensiones la fase es eiS/h. Cuando h→ 0 sólo el camino que deja estacionariala acción δS = 0 evita las interferencias destructivas con caminos próximos, se recupera el principio deHamilton.100

En este formalismo no hay operadores. Por ejemplo

〈ψ f |U(t f , ti)|ψi〉=∫

dnx f dnxi ψ∗f (x f )ψi(xi)

∫ x(t f )=x f

x(ti)=xi

Dx(t)eiS[x(t)] (5.99)

98Usamos aquí S en lugar de W para denotar la acción.99De hecho x(t) es una teoría de n campos en 0+1 dimensiones y requiere renormalización por divergencias UV, ∆t → 0.

El formalismo canónico elimina esas divergencias automáticamente, pero no es suficiente en teorías en d+1 dimensiones parad ≥ 1.

100En general caminos muy poco estacionarios están suprimidos, el camino típico es browniano: continuo -una discontinuidadproduciría demasiada energía cinética- pero no derivable en ningún punto. El término peor comportado en el UV, la energíacinética, selecciona qué caminos tienen contribución no nula en la suma y los caminos brownianos dominan porque son muchomás abundantes que los diferenciables.

154

Page 155: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Igualmente, si A j(x, t) son operadores funciones del operador x (están en imagen de Schrödinger peropueden tener dependencia explícita en t), se tiene

〈x f |TU(t f , ti)A1(t1) · · · An(tn)|xi〉S =∫ x(t f )=x f

x(ti)=xi

Dx(t)eiS[x(t)]A1(x(t1), t1) · · ·An(x(tn), tn) (5.100)

A la izquierda A j(t j) es un operador (en imagen de Schrödinger), a la derecha A j(x, t) es una funciónordinaria (evaluada en x= x(t j) del camino x(t) y t = t j). Esta ecuación conecta los formalismo canónicoy de integral de caminos. Nótese la consistencia de la expresión: A la izquierda el orden en que se escribanlos operadores no importa debido a T , a la derecha el orden no importa porque los factores conmutan (sonc-números). La integral de caminos automáticamente produce operadores ordenados temporalmente, quees el orden natural de acción de los operadores.

Todo el formalismo canónico de operadores se puede reconstruir a partir de la formulación basada enintegral de caminos. Por ejemplo la no conmutación de los operadores x y p se origina en que los caminostípicos no son derivables y como consecuencia la función de correlación 〈T x(t)p(0)〉 (con p = mx) no escontinua en t = 0.

5.5.2 Integral funcional

Como se vio para la representación de Schrödinger, la configuración (espacial) ϕ(x) de un campo sepuede ver como el vector posición x de una partícula en n-dimensiones, con n infinito (una dimensión porcada x). Si añadimos dependencia temporal a la posición de la partícula para que describa un caminox(t), eso corresponde en campos a que la configuración espacial vaya variando en el tiempo y se obtieneuna configuración espaciotemporal ϕ(x, t) = ϕ(x). La transcripción de la integral de caminos a campos esinmediata

〈ϕ f , t f |ϕi, ti〉=∫

φ(x,t f )=ϕ f (x)

φ(x,ti)=ϕi(x)Dφ(x)eiS[φ ], S[φ ] =

∫ t f

tid4xL [φ ](x). (5.101)

Aquí φ(x) son funciones ordinarias (c-números). La integral funcional es una suma sobre todas las configu-raciones espaciotemporales que conecten ϕi en ti con ϕ f en t f . Dφ(x) es parecido a Dφ(x) que aparecíaen el producto escalar en la representación de Schrödinger (3.218), pero

Dφ(x) = ∏x

dφ(x), (5.102)

ahora hay una integral (en R, o C si el campo es complejo) por cada x = (x, t).

La ec. (5.100), que conecta el formalismo hamiltoniano con el lagrangiano, para campos es

〈ϕ f |TU(T1,T2)O(x1) · · ·O(xn)|ϕi〉S =∫

φ(x,T1)=ϕ f (x)

φ(x,T2)=ϕi(x)Dφ(x)ei

∫d4xL (x)O(x1) · · ·O(xn). (5.103)

155

Page 156: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Para obtener la función de partición Z[J] hay que seguir pasos análogos a los dados en el formalismocanónico. x0 va de T2→−∞+ i∞ a T1→ +∞− i∞ siguiendo un camino en el plano complejo x0 como elde la Fig. 4 o la prescripción (5.89). La traza corresponde a tomar ϕ f = ϕi (denominadas condiciones decontorno periódicas) e integrar funcionalmente sobre ϕi(x), es decir,

Z[J] = limT1,2

∫φ(x,T1)=φ(x,T2)

Dφ(x)ei∫

d4x(L (x)−J(x)φ(x)) (5.104)

A menudo se escribe simplemente

Z[J] =∫

Dφ(x)ei∫

d4x(L (x)−J(x)φ(x)) (5.105)

Como ya se comentó las condiciones de contorno (elección de Ψ1,2) no es esencial ya que sólo difieren enla normalización de Z[J], y ésta se cancela al calcular valores esperados de productos de observables en elvacío (siempre que los observables tengan soporte en x finitos).

La integral funcional sería sólo condicionalmente convergente si x0 estuviera en el eje real ya que SJ[φ ]es real y el integrando eiSJ [φ ] es una fase. La prescripción (5.89) fija la convergencia al añadir un factor1− iη , η → 0+. El mismo efecto se consigue con la prescripción de Feynman m2→ m2− iη que añade unfactor e−η

∫d4xφ 2(x) al integrando.

La formulación funcional se extiende al caso fermiónico, aunque en este caso las fuentes y los camposen vez de c-números son números de Grassmann, que anticonmutan.

Formalmente al menos, el problema de resolver una teoría cuántica de campos se ha reducido en (5.105)a cuadraturas (calcular integrales). La formulación funcional es la más frecuentemente utilizada en teoríacuántica de campos.

Los valores esperados de A[φ ] (un funcional formado con campos localizados en x finitos) se obtienencon

〈0∼|TA[φ ]|0

∼〉=

∫Dφ(x)e i

∫d4xL (x)A[φ ]∫

Dφ(x)e i∫

d4xL (x)(5.106)

Esto se parece mucho a un promedio estadístico de una variable aleatoria A[φ ] con un peso eiS[φ ], denominadofactor o peso de Boltzmann, excepto que el peso es complejo.

La fórmula (5.105) se puede ver como una transformada de Fourier funcional, Z[J] es la transformada deFourier de eiS[φ ]. Del mismo modo que x multiplicando una función equivale aplicar i∇k en su transformada,aquí un factor φ(x) multiplicando a eiS[φ ] equivale a aplicar iδ/δJ(x) sobre Z[J]. Así

〈0∼|TA[φ(x)]|0

∼〉= 1

Z[0]A[

δJ(x)

]Z[J]

∣∣∣J=0

. (5.107)

156

Page 157: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Si separamos L = L0 +LI

Z[J] =∫

Dφ(x)ei∫

d4x(L0(x)+LI(x)−J(x)φ(x)) (5.108)

El factor eiSI [φ ] se puede generar igualmente con φ → iδ/δJ,

Z[J] = ei∫

d4xLI [iδ/δJ](x)Z0[J] (5.109)

siendo Z0[J] el funcional de la teoría libre. Así, por ejemplo, si LI(x) =−λφ 4(x)/4!

Z[J] = e−i λ

4!∫

d4x(

i δ

δJ(x)

)4

Z0[J] (5.110)

permite calcular las funciones de Green (por ejemplo en potencias de λ ) a partir del funcional generadorde la teoría libre.

5.5.3 Funcional generador de la teoría libre. Notación de DeWitt.

Para la teoría libre la acción es cuadrática y las integrales son gaussianas, evaluables de forma cerrada,

Z0[J] =∫

Dφ(x)ei∫

d4x( 12 ∂µ φ∂ µ φ− 1

2 m2φ 2−Jφ). (5.111)

Para simplificar el cálculo usamos la denominada notación de DeWitt. En esta notación el campoes un vector φ i, la etiqueta i contiene x (espacio y tiempo) y todos los demás índices que pueda tener elcampo, y a efectos de notación se trata como un índice discreto de modo que

∫d4x = ∑i, etc. En esta

notación,Z[J] =

∫Dφ e−S[φ ]+Jiφ

i, Dφ = ∏

idφ

i (5.112)

Los índices repetidos está sumados. Además se tienen las identificaciones

φi→ φ(x), Ji→−iJ(x), −S[φ ]→ iS[φ ], ∑

i→∫

d4x. (5.113)

(Por conveniencia, S[J] se normaliza de forma distinta en notación de DeWitt, en cambio Z[J] es la funciónde partición usual.) En esta notación las ecuaciones de movimiento son

∂iS[φ ] = 0, ∂i =∂

∂φ i (5.114)

o más generalmente, en presencia de J

SJ[φ ] = S[φ ]− Jiφi, ∂iS[φ ] = Ji. (5.115)

157

Page 158: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

En nuestro caso la acción es cuadrática

S0[φ ] =12

mi jφiφ

j, Z0[J] =∫

Dφ e−12 mi jφ

iφ j+Jiφi=∫

Dφ e−12 φ T mφ+JT φ . (5.116)

con la identificación siguiente:

mi j→−i(∂x,µ∂

µy δ (x− y)−m2

δ (x− y)). (5.117)

La matriz compleja m (con elementos de matriz mi j) es simétrica y Re(m) definida positiva para quela integral sobre φ sea convergente. Definiendo la matriz inversa s

s≡ m−1, mi js jk = δkj (5.118)

podemos completar cuadrados en el exponente

12

φT mφ − JT

φ =12(φ T − JT s)m(φ − sJ)− JT sJ, (5.119)

e integrando en la nueva variable φ − sJ se obtiene

Z0[J] = Z0[0]e12 JT sJ (5.120)

La normalización Z0[0] no la necesitamos, pero se calcula fácilmente yendo a la base en la que m es diagonaly se obtiene ∫

Dφe−12 φ T mφ = det

( m2π

)−1/2. (5.121)

Para un campo complejo se tendría101

Z0[J] =∫

Dφe−φ †mφ+J†φ+φ †J = eJ†sJ det(m

π

)−1. (5.122)

Con Ji→−iJ(x) y J†i →−iJ†(x) (Ji y J†

i se deben tratar como variables independientes) y m es una matrizcompleja cuya parte hermítica es definida positiva.

Prosiguiendo con el caso de campo real, hemos obtenido el funcional generador en notación de DeWitt

G0[J] = e12 si jJiJ j (5.123)

Es fácil ver que mi j es el operador −i(−∂ 2−m2), la ecuación de movimiento salvo un factor −i por lo quesu inverso si j es el propagador salvo un factor i

si j→ i∆F(x− y) (5.124)

101Dφ = ∏i d Reφid Imφ

i.

158

Page 159: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Otra forma de verlo es considerar la ecuación de movimiento de la acción en presencia de J(x)

J(x) = (−∂2−m2)φ(x) (5.125)

con solución102

φ(x) =∫

d4y∆F(x− y)J(y) (5.126)

a comparar con el mismo cálculo en notación de DeWitt:

Ji = mi jφj, φ

j = s jiJi . (5.127)

Finalmente obtenemos el funcional generador de las funciones de Green de la teoría libre

G0[J] = 〈0|Te−i∫

d4xJ(x)φ(x)|0〉= e−12∫

d4xd4y i∆F (x−y)J(x)J(y). (5.128)

Podemos comprobar el resultado a orden J2

(−i)2

2!

∫d4xd4yJ(x)J(y)〈0|T φ(x)φ(y)|0〉=−1

2

∫d4xd4y i∆F(x− y)J(x)J(y) (5.129)

es decir〈0|T φ(x)φ(y)|0〉= i∆F(x− y) (5.130)

que es el resultado correcto.

Para el campo complejo

G0[J] = 〈0|Te−i∫

d4x(J∗(x)φ(x)+φ †(x)J(x))|0〉= e−∫

d4xd4y i∆F (x−y)J∗(x)J(y). (5.131)

5.6 Teorema de Wick

Para generalizar el resultado, se define la contracción de dos campos cualesquiera φ(x), ψ(x) como〈0|T φ(x1)ψ(x2)|0〉 y se denota

〈0|T φ(x1)ψ(x2)|0〉= φ(x1)ψ(x2) (5.132)

La contracción entre campos distintos se anula (por ejemplo un campo de un pion neutro con uno de unelectrón o de un pion cargado positivamente). Para campos cargados la contracción no nula es

φ(x1)φ†(x2) = i∆F(x1− x2), φ(x1)φ(x2) = 0. (5.133)

102Al poner la prescripción +iη el operador (−∂ 2−m2 + iη) ya no es singular y no aparece una solución de la homogénea.Si no hay fuente el campo se anula.

159

Page 160: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Igualmente para el campo de Dirac

ψα(x1)ψβ (x2) = iSF αβ (x1− x2), ψα(x1)ψβ (x2) = 0. (5.134)

Si los campos son bosónicos la contracción es simétrica, si son fermiónicos antisimétrica, AB =±BA.El teorema de Wick establece que

〈0|TA1A2 · · ·An|0〉= (suma sobre todas las contracciones) (5.135)

En cada sumando todos los campos están contraídos por pares y se suma sobre todos los emparejamientosdistintos. Si n es impar el valor esperado se anula, si es par hay (n−1)!! sumandos. Así

〈0|TABCD|0〉= ABCD+ABCD+ABCD≡ ABCD±AC BD+ADBC (5.136)

En el término ACBD el signo es menos si C y B son ambos fermiónicos, y más en otro caso. Se generaun signo menos cada vez que hay que cruzar dos campos fermiónicos para desenredar el producto concontracciones. Es importante notar que el teorema se aplica a operadores A,B,C, . . . que sean campos (omás generalmente operadores lineales en a y a†) no a operadores locales arbitrarios.

El teorema de Wick se puede demostrar por inducción, o bien desarrollando ambos lados de la identidaden (5.128) (o su versión fermiónica).

En notación de DeWitt, si definimos ∂ i = ∂/∂Ji

∂i1 · · ·∂ inG0[J]

∣∣J=0 =

1Z0[0]

∫Dφe−

12 φ T mφ

φi1 · · ·φ in ≡ 〈φ i1 · · ·φ in〉0 (5.137)

〈φ i1 · · ·φ in〉0 son las funciones de Green de la teoría libre.

Calculando las derivadas sobre G0[J] = e12 JT sJ (o bien desarrollando en potencias de J) se obtiene, por

ejemplo,〈φ i

φj〉0 = si j, 〈φ i

φjφ

l〉0 = si jskl + siks jl + sils jk (5.138)

consistentemente con el teorema de Wick.

5.7 Campo libre en presencia de una corriente

La ec. (5.131) proporciona la amplitud de persistencia del vacío en presencia de una corriente, para lateoría libre,

〈0|0〉J = e−iW0[J], W0[J]≡∫

d4xd4y∆F(x− y)J∗(x)J(y). (5.139)

160

Page 161: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

La corriente J crea partículas (y antipartículas) y las destruye después de propagarse, o no. |〈0|0〉J|2 es laprobabilidad de que el estado final vuelva a ser el vacío. Esta probabilidad puede expresarse como

|〈0|0〉J|2 = e2ImW0[J] (5.140)

Algunas propiedades se ven mejor en espacio de momentos

J(k) =∫

d4xeikxJ(x), J(x) =∫ d4k

(2π)4 e−ikxJ(k) (5.141)

se tieneW0[J] =

∫ d4k(2π)4 ∆F(k)|J(k)|2. (5.142)

Y de aquí, usando (5.27)),

2ImW0[J] =−2π

∫ d4k(2π)4 δ (k2−m2)|J(k)|2. (5.143)

Se verifica2ImW0[J]≤ 0, |〈0|0〉J|2 ≤ 1. (5.144)

La interpretación de (5.143) es que J(k) representa una amplitud de probabilidad de crear una partículao absorber una antipartícula con cuadrimomento k (generalmente es una partícula virtual) y análogamenteJ∗(k). La corriente J(x) rompe invariancia traslacional espaciotemporal, la energía y el momento del campono se conservan porque la corriente puede aportar o absorber cuadrimomento. Si la corriente tiene com-ponentes de Fourier sobre la capa de masas k2 = m2 puede crear partículas reales que se propaguen hastat =+∞. En este caso hay una probabilidad de que el estado final no sea vacío. En otro caso 〈0|0〉J es unafase (W0[J] puramente real) y la probabilidad de persistencia es 1. Por ejemplo, si J(x) no depende deltiempo sólo tiene modos k0 = 0 y no puede dar o recibir energía, HJ es conservativo. La corriente debetener frecuencias |k0| ≥ m para que puedan crearse partículas en el estado final.

También es posible calcular la probabilidad de creación de n partículas o antipartículas en el estadofinal mediante

〈0|a(p1) · · ·a(pr)b(k1) · · ·b(kn−r)UJ(+∞,−∞)|0〉. (5.145)

Se obtiene una distribución de Poisson Pn = eµ µn

n!.

En general podemos considerar todos los estados finales (normalizados) posibles | f 〉 con todos losposibles números de ocupación de partículas y antipartículas. Estos forman una base ortonormal y se tiene

∑f| f 〉〈 f |= 1 (Identidad en el espacio de Fock) (5.146)

161

Page 162: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Si A0→ f = 〈 f |UJ(+∞,−∞)|0〉 es la amplitud de probabilidad del estado | f 〉 en el estado final, unitaridadimplica

∑f|A0→ f |2 = 1 . (5.147)

162

Page 163: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

6 Teoría de perturbaciones

6.1 Fórmula de Gell-Mann–Low

Queremos calcular las funciones de Green mediante una serie perturbativa alrededor de la teoría libre.La función de partición es

Z[J] =∫

Dφ(x)ei∫

d4x(L (x)−J(x)φ(x)) (6.1)

Separando el lagrangiano en partes libre y de interacción

L (x) = L0(x)+LI(x) (6.2)

se tieneZ[J] =

∫Dφ(x)ei

∫d4xL0(x)ei

∫d4x(LI(x)−J(x)φ(x)) (6.3)

Dividiendo ambos lados por Z0[0] y aplicando (5.106) para L0(x) tenemos la fórmula de Gell-Mann–Low

Z[J]≡ Z[J]Z0[0]

=⟨

ei∫

d4x(LI(x)−J(x)φ(x))⟩

0. (6.4)

donde 〈 〉0 indica el promedio en la teoría libre. Z[J] sólo difiere de Z[J] en la normalización. Para todos losefectos prácticos Z[J] y Z[J] son equivalentes (mientras L0 no varíe).

Y para el funcional generador

G[J] =Z[J]Z[0]

=〈ei

∫d4x(LI(x)−J(x)φ(x))〉0〈ei

∫d4xLI(x)〉0

(6.5)

Igualmente para observables generales

〈0∼|TA[φ ]|0

∼〉= 〈e

i∫

d4xLI(x)A[φ ]〉0〈ei

∫d4xLI(x)〉0

(6.6)

Nótese que HI tiende a cero cuando t →±∞ pero esto no contradice lo que se ha dicho antes (despuésde (5.93)). La presencia de HI fuerza un cambio en las condiciones de contorno de modo que el resultadofinal G[J] corresponde a valores esperados evaluados en |0

∼〉 no |0〉.

La fórmula De Gell-Mann–Low es útil especialmente de cara a aplicar teoría de perturbaciones (porejemplo desarrollando en potencias de LI(x)) ya que se reduce el cálculo de las funciones de Green de la

163

Page 164: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

teoría con interacción al cálculo de valores esperados en la teoría libre y ahí se aplica el teorema de Wick.

6.2 Diagramas de Feynman

6.2.1 Diagramas y reglas de Feynman para Z[J]

Consideremos una teoría genérica (para un campo bosónico real). La acción más general es de la forma

S = S0 +SI, S0 =12

mi jφiφ

j,

SI = g0 +giφi +

12

gi jφiφ

j +13!

gi jkφiφ

k +14!

gi jklφiφ

l + · · ·(6.7)

Las constantes de acoplamiento gi1...in son tensores completamente simétricos. Para la función de partición

Z[J] =∫

Dφe−S[φ ]+Jiφi. (6.8)

Si denotamos 〈 〉 el promedio con peso e−S[φ ], las funciones de Green son 〈φ i1 · · ·φ in〉 y

G[J] = ∑n

1n!

Ji1 · · ·Jin〈φ i1 · · ·φ in〉. (6.9)

De acuerdo con la fórmula de Gell-Mann–Low para la función de partición

Z[J] = 〈e−SI+Jiφi〉0. (6.10)

Podemos desarrollar e−SI+Jiφi en potencias de los acoplamientos gi1...in y Ji, y la integral funcional se reduce

a calcular promedios del tipo 〈φ j1 · · ·φ jn〉0 que se obtienen con el teorema de Wick.

Consideremos por ejemplo los términos de Z[J] que tengan exactamente dos J y un acoplamiento decuatro puntos gi jkl

(e−SI+Jiφi)J2,g4

= (− 14!

gi jklφiφ

l)(12!

JaφaJbφ

b)

Z[J]J2,g4=− 1

4!2!gi jklJaJb〈φ i

φjφ

b〉0.(6.11)

Aplicando Wick, hay 5!!= 15 contracciones que se pueden clasificar en dos tipos según que en 〈φ iφ jφ kφ lφ aφ b〉0la etiqueta a se contraiga con b o no. En el primer caso, hay tres contracciones restantes entre i jkl y todasdan la misma contribución por la simetría de gi jkl. En el segundo caso a puede contraerse con cualquiera

164

Page 165: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

de los 4 índices i jkl y b con cualquiera de los tres restantes, en total 4×3 = 12 contracciones que dan lamisma contribución. Podemos denotarlo

3× (ab)(i j)(kl)+12× (ai)(b j)(kl). (6.12)

Las dos contribuciones son entonces (recordemos que 〈φ iφ j〉0 = si j = (m−1)i j)

Z[J]J2,g4=− 1

16gi jklJaJbsabsi jskl− 1

4gi jklJaJbsaisb jskl (6.13)

Este resultado es típico: Z[J] es una suma de términos construidos con si j, gi1...in y Ji, con todos losíndices contraídos, covariantes con contravariantes, formando todas la combinaciones posibles. Puesto quetodas las combinaciones aparecen lo único que queda por especificar es con qué peso lo hacen. El coeficientenumérico es de la forma ±1/S. Hay un signo menos por cada factor gi1...in y S es el denominado factor desimetría, que es el orden del grupo de simetría del término. En el ejemplo (6.13), el primer término tieneS = 24 y el segundo S = 22. Que S sea el orden del grupo de simetría implica que es un número natural;esta identificación requiere que al definir la acción también se hayan puesto correctamente los factoresde simetría en los acoplamientos. Veremos cómo calcularlo directamente más abajo, pero en todo casoel coeficiente 1/S se puede obtener aplicando el teorema de Wick como hemos visto. Si los factores secalculan por simetría una comprobación útil es

14!

12!×5!! =

116

+14. (6.14)

j

i k

b

l k

ji

l

ba aJ J J J

Figura 5: Diagramas de Feynman correspondientes a (6.13).

Los términos en el desarrollo de Z[J] se pueden expresar mediante diagramas de Feynman. Losacoplamientos gi1...in se representan por vértices de n patas con etiquetas i1 . . . in, las Ja son vértices de unapata con etiqueta a, y si j se representan por líneas con extremos con etiquetas i y j. La Fig. 5 representalos dos términos calculados en (6.13). El primer diagrama es un diagrama disconexo el segundo es conexo.

En los diagramas de Feynman sólo importa qué está conectado con qué, no otros detalles (por ejemplosi el subdiagrama disconexo con forma de ∞ de la Fig. 5 se dibuja encima o debajo del subdiagrama quees un trazo recto, o si el trazo ab es recto o no). A partir del diagrama sin etiquetas es posible reconstruirel término completamente aplicando las reglas de Feynman. En nuestro caso éstas son

165

Page 166: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

1) etiquetar todas las líneas que salen de los vértices (incluido J) del diagrama,2) poner un factor +Ja (o la etiqueta que lleve) por cada vértice de tipo J,3) un factor −gi1...in por cada vértice de tipo g,4) un factor si j por cada línea que una i con j,5) dividir por el factor de simetría S,103y6) sumar sobre todas las etiquetas.7) Z[J] se obtiene sumando todos los diagramas (topológicamente) distintos.

Cuando se etiqueta un diagrama puede ocurrir que dos etiquetados no sean topológicamente equiva-lentes, así por ejemplo, en el segundo diagrama de la Fig. 5 si se cambian las etiquetas i y l se obtiene otroetiquetado que no es topológicamente equivalente con el anterior (no se pueden superponer por deforma-ción) en cambio si se intercambian k y l el nuevo diagrama etiquetado sí es topológicamente equivalente.La regla para calcular S es la siguiente:

El orden del grupo de simetría de un diagrama es el número de etiquetados distintos pero topológica-mente equivalentes de uno dado (no importa cuál).

Así por ejemplo, en el segundo diagrama de la Fig. 5 tenemos simetría bajo intercambio de a y b, ysimetría bajo intercambio de k y l. Eso produce S = 22. Para el primer diagrama tenemos simetría a↔ b,más i↔ j, más k↔ l, y otro factor dos por i j↔ kl, lo cual da S = 24.

El significado del factor de simetría es que una configuración espaciotemporal φ(x, t) representa unaposible historia de evolución del campo y en la integral funcional cada historia se ha de sumar una y unasola vez. Los diagramas de Feynman hacen esa suma y el factor de simetría evita que la misma contribuciónse cuente más de una vez.

En la Fig. 6 se muestran factores de simetría de algunos diagramas de vacío o de funciones de Green(en ese caso no hay J, ver más adelante Sec. 6.2.4).

En el caso de que haya campos fermiónicos hay una regla adicional.8) Un factor (−1) por cada loop fermiónico.

Por ejemplo en electrodinámica, con fotones y electrones, en el diagrama

hay que poner un signo menos por el loop de los electrones. Esto es general, si tenemos un término103A menudo para abreviar se denomina también factor de simetría a 1/S.

166

Page 167: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

128 x82

2

4!

2

x2 2 1

4

Figura 6: Algunos diagramas (de vacío o de funciones de Green) y sus factores de simetría.

del tipo〈ψ†

x ψxψ†y ψy〉0 (6.15)

donde los campos son fermiónicos, al aplicar Wick se tiene

ψ†xψxψ

†yψy+ψ

†xψxψ

†yψy = ψxψ

†xψyψ

†y −ψyψ

†xψxψ

†y (6.16)

En diagramasx yx y

+ El primer diagrama tiene dos loops fermiónicos

y el segundo un loop, con signos (−1)2 y (−1) respectivamente.

La flecha indica la dirección de flujo de la carga del campo. En general para campos cargados las líneastienen una flecha lo cual afecta al factor de simetría. Por ejemplo J†

a sabJb

J J

b a

Tiene factor de simetría 1 en vez de 2 ya que ahora a y b no son equiva-

lentes. Esto se discutirá más adelante en la Sec. 6.3.3.

6.2.2 Reglas de Feynman para G[J]

El generador de las funciones de Green corresponde al cociente

G[J] =Z[J]Z[0]

(6.17)

167

Page 168: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Z[J] se obtiene sumando sobre todos los diagramas posibles con vértices de tipo g y de tipo J. Si noincluimos vértices J lo que se obtiene es Z[0]. Este objeto sólo contiene diagramas de vacío, procesos queexisten incluso en ausencia de corriente (lo que hacen es construir el estado fundamental de H, |0

∼〉, por

acción de HI sobre |0〉 a lo largo del tiempo). Un ejemplo es el subdiagrama de vacío (con forma de ∞)en el primer diagrama de la Fig. 5. Estos subdiagramas de vacío están presentes en muchos diagramas ysu valor factoriza de modo que, como puede probarse, el efecto de los subdiagramas de vacío en Z[J] secancela al dividir por Z[0]. Tenemos así la siguiente regla:

Para obtener G[J] se aplican las mismas reglas de Feynman que para Z[J] pero sumando sobre todoslos diagramas distintos (conexos o no) que no tengan subdiagramas de vacío.

bba aJ J J J++1 +O(g )+O(J )

42

Figura 7: G[J] para la teoría SI =14! gi jklφ

iφ jφ kφ l .

Podemos verificar esto en la teoría que sólo tiene el vértice de cuatro puntos y para G[J] hasta ordenJ2,

Z[J] = 〈(1−SI +O(g2))(1+ JTφ +

12!

JTφJT

φ +O(J3))〉0

= 1−〈SI〉0 +12〈JT

φJTφ〉0−〈SI

12

JTφJT

φ〉0 +O(g2)+O(J4),

Z[0] = 1−〈SI〉0 +O(g2).

(6.18)

Tomando el cociente

G[J] = 1+12〈JT

φJTφ〉0−〈SI

12

JTφJT

φ〉0 + 〈SI〉0〈12

JTφJT

φ〉0 +O(g2)+O(J4) (6.19)

El término 〈(−SI)12

JTφJT

φ〉0 son los diagramas calculados en (6.13) (Fig. 5). Por otro lado

〈−SI〉0 =−18

gi jklsi jskl , 〈12

JTφJT

φ〉0 =12

JaJbsab (6.20)

que son los dos subdiagramas en el primer diagrama de Fig. 5. Después de cancelar esos términos queda

G[J] = 1+12

JaJbsab− 14

gi jklJaJbsaisb jskl +O(g2)+O(J4) (6.21)

Estos términos están representados en la Fig. 7.

168

Page 169: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

6.2.3 Teorema del linked-cluster

El teorema del linked-cluster afirma que la suma de todos los diagramas (conexos o no) Z[J] coincidecon la exponencial de la suma de los diagramas conexos. Y obviamente lo mismo vale para G[J].

Es decir, si definimos el funcional W [J] como

Z[J] = e−iW [J], G[J] = e−i(W [J]−W [0]), (6.22)

−iW [J] contiene sólo diagramas conexos, −iW [0] diagramas conexo de vacío y −i(W [J]−W [0]) diagramasconexos que no sean de vacío.

1+ + + + ...

Figura 8: Teorema del linked-cluster

La reglas de Feynman son tales que el valor de un diagrama disconexo es el producto de las componentesconexas, excepto quizá por el factor de simetría y no es difícil ver que estos factores reproducen la funciónexponencial [5]. Podemos comprobarlo con el ejemplo de la Fig. 8. El diagrama conexo con forma de ∞

tiene factor de simetría S = 8 y valor Γ. El diagrama disconexo con dos subdiagramas conexos tiene factorde simetría 2×82 y valor 1

2! Γ2. El factor 2 extra viene de la simetría de intercambiar los dos subdiagramas

iguales. El diagrama con n componentes conexas tendrá factor de simetría n!×8n y valor 1n! Γ

n. Al hacer lasuma sobre n = 0,1,2, . . . se obtiene exp(Γ).

La fórmula (5.123) ilustra el teorema. El único diagrama conexo en la teoría libre es 12 sabJaJb, su

exponencial proporciona G0[J].

Usando la rotación de Wick es posible comprobar que todos los diagramas de W [J] son puramentereales [5].

169

Page 170: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

6.2.4 Reglas de Feynman para las funciones de Green

La contribución a las funciones de Green 〈φ i1 · · ·φ in〉 se puede obtener derivando respecto de Ji

〈φ i1 · · ·φ in〉= ∂i1 · · ·∂ inG[J]

∣∣J=0, ∂

i =∂

∂Ji. (6.23)

bba a+ +O(g )2

Figura 9: 〈φ aφ b〉 para la teoría SI =14! gi jklφ

iφ jφ kφ l .

Si aplicamos este procedimiento a G[J] en (6.21) se tiene, para el propagador

〈φ aφ

b〉= sab− 12

gi jklsaisb jskl +O(g2) (6.24)

Los diagramas de Feynman correspondientes están representados en la Fig. 9. A diferencia de G[J], losíndices ab no son mudos. Los dos extremos libres (libres de vértices) del diagrama son distinguibles aefectos topológicos y uno lleva etiqueta a y el otro b. Entonces para el primer diagrama el factor de simetríaes S = 1. Para el segundo diagrama, el etiquetado i jkl mostrado en (6.24) tiene simetría k↔ l, lo cual daun factor de simetría S = 2. Otra forma de decirlo es que la línea cerrada se puede recorrer de dos formasdistintas pero topológicamente equivalentes.

Entonces las reglas de Feynman para 〈φ a1 · · ·φ an〉 son las mismas que para calcular los términos deG[J] de orden Jn, pero quitando los factores Ja j y la suma sobre a j y reajustando el factor de simetríateniendo en cuenta que ahora los extremos libres (sin vértices, con etiquetas a j) son topológicamenteinequivalentes (véanse ejemplos en Fig. 6). Hay que sumar todos los diagramas topológicamente distintossin subdiagramas de vacío.

6.2.5 Algunas relaciones estructurales diagramáticas

Consideremos diagramas sin J, bien de vacío bien de funciones de Green. Un diagrama de una funciónde Green de n campos tiene n extremos libres.

La líneas que unen dos vértices se denominan líneas internas, las que tienen un extremo libre son líneasexternas. Los diagramas de vacío no tienen líneas externas. En la Fig. 6, el número de líneas internas y deextremos libres de cada diagrama es (2,0), (1,2), (0,4), (4,0), (4,0), (4,0), (2,4) y (1,6), respectivamente.

170

Page 171: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Se dice que un diagrama conexo es un diagrama árbol cuando al cortar cualquier línea interna (lo cualproduce dos extremos libres) queda disconexo, y también si no tiene líneas internas. En la Fig. 6, los dia-gramas tercero y último son diagramas árbol. También es árbol un diagrama disconexo cuyas componentesconexas sean diagramas árbol.

Un diagrama conexo tiene L loops cuando hay que cortar al menos L líneas internas para llevarloa un diagrama árbol. Un diagrama árbol tiene cero loops. Para un diagrama disconexo el número deloops es la suma sobre sus componentes conexas. En la Fig. 6, el número de loops es, respectivamente,2,1,0,4,3,3,1,0.

Un diagrama conexo se dice que es reducible (más exactamente reducible a nivel de una línea, oone-particle-reducible, 1PR) cuando queda disconexo al cortar alguna línea interna. Si no es posible cortarninguna línea interna de modo que quede disconexo se dice que es irreducible (1PI). Si el diagrama esdisconexo, es irreducible si lo son todas sus componentes conexas. En la Fig. 6, los dos últimos diagramasson reducibles, el resto son irreducibles.

Un vértice es de orden n cuando en él se unen n líneas.

Si en un diagrama Pe es el número de líneas externas con un solo extremo libre, Pi el número de líneasinternas, nv el número de vértices de orden v, L el número de loops, y C el número de componentes conexas,se cumple

Pe +2Pi = ∑v

vnv, Pi +C = L+∑v

nv . (6.25)

La primera relación es evidente: a la derecha está en número de líneas que salen de todos los vértices, a laizquierda todos los extremos que acaban en un vértice (1 para una pata externa y 2 para una interna).

La segunda relación se puede ver por inducción. Basta probarla el caso conexo C = 1 y luego sumarsobre componentes conexas. Para un diagrama árbol, L = 0, la identidad Pi + 1 = ∑v nv es relativamenteobvia por inspección. Si hay L loops es que hay L líneas internas tales que al cortar una de ellas L baja enuna unidad, y al mismo tiempo Pi baja en una unidad, luego Pi−L se conserva cortando esas líneas hastallegar al caso L = 0.

De las dos relaciones se deduce, eliminando Pi,

Pe +2L = 2C+∑v(v−2)nv . (6.26)

Esta relación es interesante porque para una función de Green dada el valor de Pe es común a todos susdiagramas.104 Si sólo hay vértices con v ≥ 3 la relación implica que para una función de Green, para unvalor de L dado nv está acotado y por tanto sólo hay un número finito de diagramas.

104No exactamente, ya que puede haber subdiagramas con líneas externas que tengan ambos extremos libres y esas no estáncontadas en Pe, pero esto no cambia el argumento.

171

Page 172: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Nótese que los vértices con v = 0,1,2 en principio se pueden eliminar. g0 da una constante aditivaque sólo cambia la normalización de Z[J], gi es una corriente y se puede eliminar desplazando el campoφ i→ φ i +ai, y gi j se puede absorber en mi j de la parte libre.

Otra propiedad interesante es que h cuenta el número de loops. Si reponemos h, dado que h tieneunidades de acción, se tiene

Z[J] =∫

Dφe−S[φ ]/h+Jiφi. (6.27)

Esto equivale agi1...in →

1h

gi1...in , si j→ h si j (6.28)

en las reglas de Feynman, lo cual implica para las funciones de Green

〈φ i1 · · ·φ in〉 → hPe+Pi−∑v nv〈φ i1 · · ·φ in〉= hPe+L−C〈φ i1 · · ·φ in〉 (6.29)

Se deduce que cada nuevo loop aumenta una potencia de h.

Esto sugiere que el nivel árbol (L = 0) es el resultado h→ 0, es decir, el valor clásico. De hecho esasí. Si la integral funcional se aproxima por su punto de silla (o fase estacionaria), que se queda con elintegrando en δS = 0, que es el resultado clásico, lo que se obtiene es sólo los diagramas árbol. Los loopstienen en cuenta las fluctuaciones cuánticas (el efecto de apartarse de la solución clásica) y cada nuevoloop introduce una nueva corrección cuántica, con una potencia más de h [3].

6.3 Teoría φ 4 y otras

6.3.1 Reglas de Feynman en espacio de posiciones

Consideremos la teoría

L (x) =12

∂µφ∂µ

φ − 12

m2φ

2− 14!

gφ4 = L0(x)+LI(x) (6.30)

Es una teoría con vértices de cuatro patas. Los resultados obtenidos se aplican inmediatamente con lasidentificaciones

si j→ i∆F(x1− x2), gi jkl → igδ (x1− x2)δ (x1− x3)δ (x1− x4), 〈φ a1 · · ·φ an〉 → iG(x1, . . . ,xn) (6.31)

Así la contribución del diagrama de la Fig. 10a a iG(x1,x2) es

〈φ aφ

b〉 ← 13!

saisb jsk1l1sk2l2sk3l3(−gik1k2k3)(−g jl1l2l3) = (−ig)2 13! ∑

i jsaisb j(si j)3 (6.32)

172

Page 173: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

xx yy1 2 21 p p

k

q

k+q−p

(a) (b)

Figura 10:

Es decir,iG(x1,x2)← (−ig)2 1

3!

∫d4y1 d4y2 i∆F(x1− y1)i∆F(x2− y2)(i∆F(y1− y2))

3 (6.33)

Las reglas de Feynman de esta teoría para calcular iG(x1, . . . ,xn) implican considerar todos los diagramastopológicamente distintos (sin subdiagramas de vacío) con extremos libres x1, . . . ,xn, etiquetar todos losvértices con etiquetas y j, poner un factor i∆F(z1− z2) por cada línea uniendo el punto z1 con z2 (z puedeser de tipo x o y), y poner un factor −ig por cada vértice, luego se integra sobre todos los y j con

∫d4y j, y

se divide por el factor de simetría del diagrama.

En el ejemplo el factor de simetría es 3! por las tres líneas internas equivalentes.

Las reglas generales son igual para todas las teorías, y el propagador libre está fijado por el tipo departícula. Así que lo más característico de una teoría es la regla de Feynman para los vértices. En el presentecaso la regla es un factor −ig por vértice. La forma de obtener la regla de Feynman del vértice de unainteracción con n campos es calcular la contribución a iG(x1, . . . ,xn) en primer orden. En nuestro caso

〈0∼|T φ(x1)φ(x2)φ(x3)φ(x4)|0∼〉 (6.34)

Aplicando la fórmula de Gell-Mann–Low tenemos que considerar

1Z[0]

⟨ei∫

d4yLI(y)φ(x1)φ(x2)φ(x3)φ(x4)⟩

0(6.35)

y en primer orden ⟨−i

14!

g∫

d4yφ(y)4φ(x1)φ(x2)φ(x3)φ(x4)

⟩0. (6.36)

173

Page 174: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Para obtener la regla de Feynman del vértice sólo necesitamos el diagrama quecorresponde a las contracciones de cada φ(x j) con un φ(y) de LI(y). Hay 4! talescontracciones y todas contribuyen por igual

− ig∫

d4y φ(y)φ(y)φ(y)φ(y)φ(x1)φ(x2)φ(x3)φ(x4) =−ig∫

d4y4

∏j=1

i∆F(y− x j)

(6.37)

x x

xx

1 2

34

y

De aquí se lee que la regla de Feynman para el vértice es −ig.

6.3.2 Reglas de Feynman en espacio de momentos

x

x

y

1

2

k

p

p

(b)(a)

Figura 11:

Consideremos el diagrama de la Fig. 11a, que es una contribución a iG(x1,x2). Aplicando las reglas deFeynman vemos que su valor es

iG(x1,x2)←12(−ig)

∫d4y i∆F(x1− y)i∆F(x2− y)i∆F(y− y) (6.38)

Si ahora tomamos transformada de Fourier, (5.20) y (5.22), el propagador es

(2π)4δ (p1 + p2)iG(p1)←12(−ig)

∫d4x1d4x2 eip1x1eip2x2

∫d4y i∆F(x1− y)i∆F(x2− y)i∆F(y− y)

(6.39)

Usandoi∆F(x) =

∫ d4k(2π)4 e−ikxi∆F(k),

∫d4xeikx = (2π)4

δ (k) (6.40)

174

Page 175: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

se puede escribir

(2π)4δ (p1 + p2)iG(p1)←12(−ig)

∫d4x1d4x2d4y

d4k1

(2π)4d4k2

(2π)4d4k(2π)4 eip1x1eip2x2

× e−ik1(x1−y)e−ik2(x2−y)e−ik(y−y) i∆F(k1)i∆F(k2)i∆F(k)

(6.41)

Después de integrar sobre x1,2 e y se generan tres deltas de Dirac en espacio de momentos

(2π)4δ (p1 + p2)iG(p1)←12(−ig)

∫ d4k1

(2π)4d4k2

(2π)4d4k(2π)4 (2π)4

δ (p1− k1)(2π)4δ (p2− k2)(2π)4

δ (k1 + k2)

× i∆F(k1)i∆F(k2)i∆F(k)

(6.42)

Ahora las integrales sobre k1,2 se pueden hacer y se obtiene finalmente la delta de conservación decuadrimomento (2π)4δ (p1 + p2), que implica p1 =−p2 ≡ p, y

iG(p)← 12(−ig)(i∆F(p))2

∫ d4k(2π)4 i∆F(k) (6.43)

El procedimiento es similar para todas las funciones de Green (o diagramas de vacío) y se puedenaplicar unas reglas de Feynman directamente en espacio de momentos.105 Los diagramas (y los factores desimetría) son los mismos que en espacio de posiciones pero cambia el etiquetado.

Las reglas para un diagrama de iG(p1, . . . , pn) o de vacío, son1) Se orientan todas las líneas (con una flecha), hacia fuera en las líneas externas y arbitrariamente en lasinternas.2) Se ponen etiquetas de cuadrimomentos p1, . . . , pn en las líneas externas, y k j en las internas.3) Se pone un factor (2π)4δ (Q) en cada vértice, donde Q es la suma de todas los cuadrimomentos que

salen del vértice menos la suma de los que entran.4) Se pone un factor −ig por cada vértice (en esta teoría φ 4).5) Un factor i∆F(q) por cada línea (q puede ser de tipo p o k)6) Se integra con

∫ d4k(2π)4 por cada línea interna.

7) Se divide por el factor de simetría.8) Se añade un factor (−1) por cada loop fermiónico.

Al aplicar estas reglas la delta de conservación de cuadrimomento en un vértice fija totalmente elmomento de una de las líneas que confluyen en él. Lo usual es etiquetar sólo los momentos libres (no

105De hecho también es posible usar los campos transformados de Fourier a nivel de acción y luego desarrollar y aplicar Wickpara obtener las reglas en espacio de momentos directamente.

175

Page 176: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

fijados por conservación) y no poner las deltas correspondientes. Aún así en cada componente conexasiempre va a haber un factor (2π)4δ (P) donde P es la suma de todos los momentos p j (salientes) de esesubdiagrama conexo. Si el diagrama es conexo sólo hay una delta de conservación. En particular cuando setrata de un diagrama conexo de vacío, P≡ 0 y sale un factor (2π)4δ (0) (divergente IR). De las relacionesestructurales que se discutieron en Sec. 6.2.5 se deduce que el número de momentos libres es el númerode loops L.

Por tanto las reglas 2) y 5) se pueden cambiar: poner una etiqueta k por cada momento libre (comple-tando el resto de etiquetas de las líneas por conservación en los vértices) y poner una delta de conservaciónpor cada componente conexa.

La expresión en (6.43) se obtiene aplicando estas reglas que se corresponden con la Fig. 11b. El diagramatiene un loop. Dado que p2 saliente es −p, se ha cambiado en la figura por +p entrante. Tal y como estádefinida la transformada de Fourier p j corresponde al cuadrimomento saliente, pero no hay problema enponer la flecha hacia dentro y etiquetarla con −p j.

Como ilustración de las reglas de Feynman, para el diagrama de la Fig. 10b se tiene (aparte de la deltade conservación)

iG(p)← 13!(−ig)2(i∆F(p))2

∫ d4k(2π)4

d4q(2π)4 i∆F(k)i∆F(p)i∆F(k+q− p) (6.44)

El diagrama tiene dos loops y hay dos momentos libres, k y q.

La regla de Feynman en espacio de momentos, para un vértice de n campos, se extrae de calcularG(k1, . . . ,kn) mediante transformada de Fourier de G(x1, . . . ,xn) en primer orden en la interacción.

6.3.3 Campos cargados

Consideremos un lagrangiano

L (x) = ∂µφ†∂

µφ −m2

φ†φ − 1

4g(φ †

φ)2 = L0(x)+LI(x) (6.45)

El factor de simetría de LI(x) es 1/4 por simetría de intercambio de los dos campos φ y de intercambiode los dos campos φ †.

Para ver las diferencias con el caso cargado veamos primero la teoría libre

〈e−i∫

d4x(J∗(x)φ(x)+φ †(x)J(x))〉0 (6.46)

176

Page 177: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Desarrollando en J y notando que la contracción no nula es φφ † se tiene

1+(−i)2∫

d4xd4yJ∗(x)J(x)φ(x)φ †(x)+O(J4) = 1+ sabJ†a Jb +O(J4) (6.47)

El factor de simetría de sabJ†a Jb =

J J

b a

es 1. El intercambio de a y b no produce

un etiquetado del diagrama topológicamente equivalente al anterior (ya que J y J† son distintos). La flechaindica el flujo de la carga y rompe la simetría de intercambio, es imprescindible cuando se quitan las fuentes,al calcular la función de Green sab =

b aHay que notar que en general para

campos cargados, por ejemplo el campo de Dirac, sab no es una matriz simétrica y la flecha va de b a a.

Los diagramas de Feynman son los mismos que para el caso neutro pero poniendo una flecha en laslíneas lo cual afecta al factor de simetría de diagrama. Calculemos primero la regla de Feynman del vérticede la teoría. Consideramos

〈0∼|T φ(x1)φ(x2)φ

†(x3)φ†(x4)|0∼〉 (6.48)

Aplicando la fórmula de Gell-Mann–Low y quedándonos a primer orden⟨i∫

d4yLI(y)φ(x1)φ(x2)φ†(x3)φ

†(x4)

⟩0

=−i14

g∫

d4y⟨φ(x1)φ(x2)φ

†(y)φ †(y)φ(y)φ(y)φ †(x3)φ†(x4)

⟩0

(6.49)

Pero sólo queremos el diagrama

x x

xx1 2

34

y Esto corresponde a emparejar los φ(x1,2) con los dos

φ †(y), (2 formas) y lo mismo los φ †(x3,4) con los dos φ(y), en total cuatro contracciones que dan el mismoresultado,

−ig∫

d4yφ(x1)φ(x2)φ†(y)φ †(y)φ(y)φ(y)φ †(x3)φ

†(x4)

=−ig∫

d4y i∆F(x1− y)i∆F(x2− y)i∆F(y− x3)i∆F(y− x4))

(6.50)

De aquí se ve que la regla de Feynman del vértice es −ig.

177

Page 178: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Las reglas de Feynman en espacio de posiciones son como para el campo neutro, pero teniendo encuenta que en el vértice de esta teoría siempre hay dos líneas con flechas hacia dentro del vértice y doshacia fuera.

Así el para la función de dos puntos hasta primer orden se tienen los diagramas en Fig. 12, y aplicandolas reglas de Feynman

x1

x2

x1

x1

x2 x

2

y O(g )2

Figura 12: Función de correlación de dos puntos en espacio de posiciones.

〈0∼|T φ(x1)φ

†(x2)|0∼〉= i∆F(x1− x2)+(−ig)∫

d4y i∆F(x1− y)i∆F(y− x2)i∆F(y− y)+O(g2) (6.51)

El resultado se puede verificar partiendo del Gell-Mann–Low + Wick. Nótese que el factor de simetría deldiagrama de primer orden es S = 1 ya que no hay formas equivalentes de recorrer el loop como en el casoneutro.

O(g )2

p

p

p p

p

k

Figura 13: Función de dos puntos en espacio de momentos.

Tomando transformada de Fourier, se encuentra (extrayendo la delta de conservación de cuadrimomen-to)

iG(p) = i∆F(p)+(−ig)(i∆F(p))2∫ d4k

(2π)4 i∆F(k)+O(g2) (6.52)

Este valor se corresponde con los diagramas en la Fig. 13

178

Page 179: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Las reglas de Feynman en espacio de momentos son como en el caso de campo neutro. Hay que teneren cuenta que las flechas del flujo de carga son independientes de las de flujo de cuadrimomento. Las decarga son las importantes a la hora de dibujar el diagrama. Para las líneas internas lo natural es elegir laflecha de cuadrimomento con la misma orientación que la de carga. Para líneas externas se puede elegirla flecha de cuadrimomento igual que la de carga (con etiqueta −pi si es hacia dentro) o bien indicar laorientación aparte.

6.3.4 Reglas de Feynman para QED

Consideremos una teoría como electrodinámica cuántica, con electrones y fotones. Usando acoplamientomínimo, ∂µ → ∂µ + iqAµ , en el lagrangiano de Dirac del electrón se ve que el lagrangiano de interacción es

LI(x) =−qψγµAµψ (6.53)

donde q < 0 es la carga del electrón. Los propagadores de electrón y fotón (en el gauge de Lorenz) son

ψα(x)ψβ (y)¯ = iSFαβ (x− y), SFαβ (k) =1

γµkµ −m+ iη,

Aµ(x)Aν(y) = iDFµν(x− y) DFµν(k) =−gµν

k2 + iη

(6.54)

Aplicando el teorema de Wick se obtiene la regla de Feynman para el vértice. La reglas son

β αk= iSFαβ (k) , νkµ

= iDFµν(k) ,α

βµ =−iqγ

µ

αβ.

(6.55)

Un par de ejemplos de aplicación de las reglas:

p p1 2

µ νσ ρk

k−p1

= (−iq)2(2π)4δ (p1− p2)iDFνρ(p2)

∫ d4k(2π)4 tr(γρ iSF(k)γσ iSF(k− p1)) iDFσ µ(p1) (6.56)

179

Page 180: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

p

pp

p2

1

34

µ ν1

p − p3

σρ

βα

= (−iq)2(2π)4δ (p3 + p4− p1− p2)(iSF(p3)γ

µ iSF(p1))ρα(iSF(p4)γν iSF(p2))σβ iDFµν(p1− p3) (6.57)

6.4 Tipos de diagramas

6.4.1 Diagramas de vacío

Los diagramas de vacío son diagramas sin líneas externas (ni corrientes J), tales como los siguientes

(b)(a)

t

(6.58)

Como ya se comentó, el vacío de Fock |0〉 no es un estado propio de H. Si |0∼〉 se expresa en la base de

estados de H0 se verá poblado de partículas virtuales y esos son los estados intermedios que aparecen enlos diagramas de vacío. (Si el tiempo va hacia arriba, las partículas intermedias son las representadas porlas líneas cortadas por líneas horizontales.)

La suma de los diagramas de vacío vienen dados por

Z[0] =Z[0]Z0[0]

=Tr(e−i

∫d4xH (x))

Tr(e−i∫

d4xH0(x))(6.59)

Z[0] lo que hace es comparar la evolución desde t = T2→−∞ hasta t = T1→ +∞ generada por H con lagenerada por H0. Dado que el numerador evoluciona con |0

∼〉 y el denominador con |0〉, el numerador lleva

una fase temporal e−iE0t y el denominador e−iE0t siendo E0 y E0 las energías de los estados fundamentalesde H y H0, respectivamente. Esto implica

Z[0] = lim∆T→∞

e−i∆T ∆E0 , ∆E0 = E0−E0, ∆T = T1−T2 (6.60)

180

Page 181: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

O bien, por el teorema de linked-cluster (−iW [0] contiene los diagramas conexos)W [0] = lim

∆T→∞∆T ∆E0 (6.61)

Hay una divergencia IR de tipo temporal (∆T → ∞) y otra de tipo espacial en ∆E0 (que escala como elvolumen) porque cualquiera de los procesos descritos por los diagramas conexos pueden ocurrir en cualquierregión del espaciotiempo. Esa divergencia IR se manifiesta en los diagramas dado que llevan una delta deconservación

(2π)4δ (0) =

∫ T1

T2

dt∫

Vd3xeikx

∣∣k=0 =V ∆T (6.62)

La exponencial (que da lugar a Z[0]) tiene en cuenta que esos procesos pueden ocurrir repetidamente demanera independiente.

Podemos verificar la fórmula (6.61) en primer orden de teoría de perturbaciones. El único diagrama deprimer orden es el de la ec. (6.58a). Podemos denominar su contribución Z(1)[0].

Z[0] =Tr(e−i

∫d4x(H0+HI))

Tr(e−i∫,d4xH0)

Z(1)[0] =〈0|TU0(T1,T2)(−i)

∫ T1T2

dt HI|0〉〈0|TU0(T1,T2)|0〉

=(−i)

∫ T1T2

dt 〈0|U0(T1, t)HIU0(t,T2)|0〉〈0|TU0(T1,T2)|0〉

= (−i)∫ T1

T2

dt 〈0|HI|0〉=−i∆T ∆E(1)0

(6.63)

(Recordando que en teoría de perturbaciones estacionarias, ∆E(1)n = 〈∆H〉ψ0

n.)

6.4.2 Diagramas conexos

De acuerdo con el teorema de linked-clusterG[J] = e−i(W [J]−W [0]) ≡ eGc[J] (6.64)

donde Gc[J] sólo contiene diagramas conexos y sin subdiagramas de vacío. Derivando Gc[J] respecto de Jse obtienen los diagramas conexos de las funciones de Green.

G[J] = ∑n

1n!

Ji1 · · ·JinGi1...in Gc[J] = ∑n

1n!

Ji1 · · ·JinGi1...inc . (6.65)

Desarrollando la exponencial se obtiene la expresión de los diagramas cualesquiera en función de los conexos,así:

Gi1 = Gi1c ,

Gi1i2 = Gi1i2c +Gi1

c Gi2c ,

Gi1i2i3 = Gi1i2i3c +Gi1i2

c Gi3c +Gi1i3

c Gi2c +Gi2i3

c Gi1c +Gi1

c Gi2c Gi3

c

(6.66)

181

Page 182: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Diagramáticamente representado en la Fig. 14. Los cuadrados representan todos los diagramas y los círculoslos diagramas conexos.

Figura 14: Desarrollo en diagramas conexos hasta n = 3.

El valor esperado de un punto 〈φi〉 debería anularse en teorías con simetría S[φ ] = S[−φ ] (así como todaslas funciones de Green con n impar) y de hecho tales diagramas no aparecen a nivel perturbativo. A nivel noperturbativo puede aparecer una valor no nulo, un condensado, por rotura espontánea de simetría. Esto esposible en teoría cuántica de campos por la presencia de infinitos grados de libertad. Independientementede la simetría 〈φi〉 se puede anular desplazando el campo o bien ajustando la corriente gi en el lagrangiano.Generalmente supondremos que 〈φi〉= 0.

6.4.3 Diagramas de autoenergía

Los diagramas del propagador (que suponemos conexo) se pueden clasificar de acuerdo con el esquema

... (6.67)

El círculo más claro junto con las patas representa la suma de todos los diagramas conexos de dos patas

182

Page 183: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

(i veces el propagador), el círculo oscuro (sin incluir las patas) representa la suma de diagramas conexosirreducibles amputados. Así

...

... (6.68)

Recordemos que irreducible quería decir que cortar cualquier línea interna no desconecta el diagrama.Amputado quiere decir que no se incluyen las patas externas en el diagrama (ni al aplicar las reglas deFeynman). La serie en (6.67) se puede expresar con la serie de Dyson. En notación de DeWitt

Gabc = sab + sai(−Σi j)s jb + sai(−Σi j)s jk(−Σkl)slb + · · ·= sab− sai

Σi jG jbc (6.69)

o en espacio de momentos

iGc(k) = i∆F(k)+ i∆F(k)(−i)Σ(k)i∆F(k)+ i∆F(k)(−i)Σ(k)i∆F(k)(−i)Σ(k)i∆F(k)+ · · ·= i∆F(k)+ i∆F(k)(−i)Σ(k)iG(k)

(6.70)

La función −iΣ(k) se denomina la autoenergía y es la suma de diagramas irreducibles amputados de dospuntos. La serie de Dyson es una serie geométrica y se puede sumar

Gc = (m+Σ)−1 (DeWitt)

Gc(k) =(k2−m2− Σ(k)+ iη

)−1.

(6.71)

El efecto de la autoenergía es m2→ m2 + Σ(k) por tanto contiene (entre otras) las correcciones a la masade la partícula respecto de la masa de la teoría libre. En general los diagramas de autoenergía renormalizano visten la partícula de la teoría libre para obtener la partícula vestida de la teoría con interacción.

Los diagramas de autoenergía del tipop

(todas las líneas, en el ejemplo tres, salen del

mismo punto) son diagramas de tipo tadpole (renacuajo). Dan lugar a una autoenergía que no depende delcuadrimomento p de la línea donde está insertado. Por tanto se pueden eliminar totalmente (en cualquier

183

Page 184: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

sitio donde aparezcan) reajustando el valor de m2 en L0(x).106 Equivalentemente, no aparecen tomandoorden normal en L (x), ya que la contracción de campos ordenados normalmente es idénticamente cero.

6.4.4 Vértices irreducibles

Por inspección de los diagramas se ve que los diagramas conexos de tres o cuatro puntos tienen lasiguiente estructura general

= = + x3

(6.72)

Las líneas que atraviesan un círculo claro son los propagadores. Los círculos oscuros son diagramas irredu-cibles amputados (amputar quiere decir que no se incluyen los factores Gi j

c de líneas externas). En notaciónde DeWitt

Gabcc = (−Γi jk)Gia

c G jbc Gkc

c ,

Gabcdc = (−Γi jkl)Gia

c G jbc Gkc

c Gldc +Gai

c Gb jc (−Γi jr)Grs

c (−Γskl)Gkcc Gld

c + (2 perm.)(6.73)

Γi jk, Γi jkl (e igualmente con más patas) son los vértices irreducibles (su regla de Feynman lleva un signomenos).

Por construcción, si se aplican las reglas de Feynman pero usando como regla para los vértices −Γi1...in ,como regla para las líneas Gi j

c , e incluyendo sólo diagramas árbol (sin loops), se obtienen correctamentelas funciones de Green de S[φ ]. Los loops quedan dentro de los vértices efectivos y de la autoenergía.

6.5 Ecuaciones de Schwinger-Dyson

Para un observable cualquiera A[φ ] (suponemos buena convergencia en el infinito en el espacio de loscampos)

0 =∫

Dφ∂i

(e−S[φ ]A[φ ]

)=∫

Dφe−S[φ ] (−A[φ ]∂iS[φ ]+∂iA[φ ]) , ∂i = ∂/∂φi, (6.74)

que implica las identidades

〈A[φ ]∂iS[φ ]〉= 〈∂iA[φ ]〉 (ecuaciones de movimiento) (6.75)

Estas identidades (con A[φ ] arbitrarios) reflejan las ecuaciones de movimiento. En particular (tomando A =1) 〈∂iS[φ ]〉= 0. En el formalismo canónico ∂iS[φ ] = 0 como operador. Se puede ver que en ese formalismo

106Por las llamadas relaciones de dispersión se puede probar que Σ(p) es puramente real cuando no depende de p.

184

Page 185: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

se reproduce la relación (6.75) teniendo en cuenta la presencia de T , que no conmuta con las derivadaspresentes en ∂iS [10].

Partiendo deZ[J] =

∫Dφe−S[φ ]+Jiφ

i, (6.76)

se deduce0 =

∫Dφ∂ie−S[φ ]+Jiφ

i=∫

Dφe−S[φ ]+Jiφi(Ji−∂iS), (6.77)

que implica la ecuación equivalente a (6.75)

〈∂iS〉J = Ji . (6.78)

(〈 〉J indica valor esperado en presencia de la corriente J).

Por otro lado, considerando una teoría con acción cuártica, por concretar,

S[φ ] =12

mi jφiφ

j +14!

gi jklφiφ

l (6.79)

(6.77) implica0 =

∫Dφ(Ji−mi jφ

j− 13!

gi jklφjφ

l)e−S[φ ]+Jiφi. (6.80)

Teniendo que en cuenta que φ i→ ∂ i = ∂/∂Ji en la transformada de Fourier

0 =

(Ji−mi j∂

j− 13!

gi jkl∂j∂

k∂

l)

Z[J]. (6.81)

La solución de esta ecuación diferencial (funcional) lineal proporciona la función de partición. Su soluciónperturbativa en potencias de g va generando los diagramas de Feynman.

Usando el teorema del linked-cluster se puede escribir una ecuación (no lineal) para los diagramasconexos:

Z[J] = eW [J], ∂iZ = Z∂

iW, ∂i∂

jZ = Z(∂ i∂

jW +∂iW∂

jW ), . . . (6.82)

Sustituyendo en la ecuación de Z[J] se obtiene

Ji = mi j∂jW +

13!

gi jkl

(∂

j∂

k∂

lW +3∂j∂

kW ∂lW +∂

jW ∂kW ∂

lW)

(6.83)

Desarrollando esta expresión en potencias de J se obtienen identidades (no perturbativas ) entre funcionesde Green conexas conocidas como ecuaciones de Schwinger-Dyson. Por ejemplo, usando (suponemosque no hay rotura espontánea de simetría)

W [J] =12!

Gi jc JiJ j +

14!

Gi jklc JiJ jJkJl + · · · (6.84)

185

Page 186: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

y quedándose a primer orden en J se deduce

Ji = miaGa jc J j +

13!

giabcGabc jc J j +

12!

giabcGabc Gc j

c J j (6.85)

Cancelando J a ambos lados y multiplicando por si j se obtiene

Gi jc = si j +

13!

sil(−glabc)Gabc jc +

12!

sil(−glabc)Gabc Gc j

c (6.86)

En diagramas

= + +i j i j i jl i jl c

(6.87)

Por otro lado Gi jc = si j− silΣlrG

r jc = +

i j i j i j

cancelando si j en ambos lados de (6.86) y amputando sil y Gr jc , se obtiene

−Σlr =13!(−glabc)Gai

c Gb jc Gck

c (−Γi jkr)+12!(−glabr)Gab

c (6.88)

En diagramas

= +l l l rrr

(6.89)

6.6 Acción efectiva

Por lo que hemos visto, si usan los vértices efectivos junto con el propagador todo a nivel árbol, sereproducen las funciones de Green. De esto se deduce que la llamada acción efectiva

Γ[φ ] = Γ0 +Γiφi +

12(mi j +Σi j)φ

j +13!

Γi1i2i3φi1φ

i2φi3 + · · · (6.90)

es una acción que reproduce a nivel árbol las funciones de Green de la acción S[φ ].

Tal y como vimos en Sec. 6.2.5, el nivel árbol equivale a la solución clásica, entonces la acción efectivase puede ver como la acción clásica que reproduce los resultados de la acción (cuántica). (Sin embargo ellagrangiano de esta acción clásica equivalente no es hermítico ni local en sentido espacial o temporal.)

186

Page 187: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

La acción efectiva es la transformada de Legendre de W [J] = logZ[J]. Si se define el campo clásicocomo el valor esperado de φ i en presencia de J

ϕi[J] = 〈φ i〉J = ∂

iW [J], (6.91)

la transformada de Legendre es (eliminando J en favor de ϕ)

Γ[ϕ] =−W [J]+ Jiϕi, (6.92)

y tambiénJi[ϕ] = ∂iΓ[ϕ]. (6.93)

Esto implicaZ[J] =

∫Dφe−S[φ ]+Jiφ

i= eW [J] = e−Γ[ϕ]+Jiϕ

i. (6.94)

Lo que S[φ ] hace a nivel cuántico (integrando, lo cual permite fluctuaciones en φ), Γ[φ ] lo hace a nivelclásico (esto es buscando una solución extremal). En efecto, (6.93) no es más que la ecuación de movimientoclásica de la acción Γ[ϕ]− Jiϕ

i. Nótese que todas las funciones de Green se obtienen derivando el campoclásico respecto de la corriente, de modo que si se reproduce el campo clásico como función de J (oequivalentemente J como función de ϕ) se reproduce correctamente toda la teoría.

Si se introduce h explícitamente se puede hacer un desarrollo en potencias de h de la acción efectiva

Γ[φ ; h] =∞

∑n=0

hnΓ(n)[φ ] (6.95)

Este es el desarrollo semiclásico que generalmente es asintótico. Los términos están ordenados por númerode loops de los diagramas irreducibles correspondientes, y el nivel árbol es la acción S[φ ]

Γ(0)[φ ] = S[φ ]. (6.96)

187

Page 188: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

7 Matriz S

La matriz S o matriz de colisión es un operador unitario que describe la amplitud de probabilidadde que si en el estado inicial en t = −∞ se tienen n partículas (suponemos un campo escalar neutro porsimplicidad) con momentos p1, . . .pn, en el estado final en t =+∞ se tengan m partículas con momentosq1, . . .qm,

〈q1, . . . ,qm out|p1, . . . ,pn in〉= 〈q1, . . . ,qm|S|p1, . . . ,pn〉 (7.1)

Grosso modo la matriz S es U(+∞,−∞).

7.1 Fórmulas de reducción

Por la propia naturaleza de las funciones de correlación debe esperarse que la amplitud (7.1) estéíntimamente relacionada con107

G(q1, . . . ,qm,−p1, . . . ,−pn) (7.2)

con p0j = ω(p j) y q0

j = ω(q j) (es decir, están en la capa de masas positiva) y los signos menos en p j sedeben a que las funciones de Green están definidas con momentos salientes y p1, . . . , pn son entrantes. Enespacio de posiciones esto corresponde a

〈0∼|T φ(y1) · · ·φ(ym)φ(x1) · · ·φ(xn)|0∼〉 y0

j →+∞, x0j →−∞ (7.3)

Los límites t→±∞ son los que ponen los cuadrimomentos sobre la capa de masas, ya que sólo partículasreales (es decir, sobre la capa de masas) pueden propagarse durante tiempos arbitrariamente grandes.

La idea es que los campos crean las partículas en los x j en t →−∞ y después de propagarse e inter-accionar las partículas salientes son detectadas en los y j en t → +∞. La función de Green proporciona laamplitud de probabilidad de ese escenario. Sin embargo hay que asegurarse de normalizar correctamentelos estados |p j〉 creados en x j y lo mismo |q j〉 en y j. Para t→±∞ las partículas van a estar bien separadasunas de otras y se van a comportar como partículas libres. Por tanto en el subespacio de Hilbert de estadosde una partícula, H1, φ(x) se va a comportar como un campo libre φ0(x), y para un campo libre fácilmentepodemos extraer los operadores de creación y destrucción correctamente normalizados. Este razonamientoes correcto pero no podemos suponer directamente la relación φ(x) →

t→±∞φ0(x), sino que hay que permitir

un factor porque no es obvio que los dos campos tengan la misma normalización.

A este respecto hay que recordar la representación de Lehmann (5.51) para el propagador exacto (quedenotamos G(p) una vez extraída la delta de conservación)

G(p) =Z

p2−m2 + iη+Gcont(p) (7.4)

107En lo que sigue denotamos las funciones de Green en espacio de momentos sin ˜ ya que en los pocos casos que se usenla funciones en espacio de posiciones se distinguirán por el contexto.

188

Page 189: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Aquí m es la masa de la partícula creada por el campo. El polo describe el comportamiento del propa-gador para t →±∞. El polo es Z∆F(p), es decir Z veces el propagador de un campo libre (normalizadocanónicamente). Se deduce que la normalización correcta es108

φ(x)→√

Z φ0(x) t→±∞ . (7.5)

Otra forma de decirlo es que φ(x) crea sobre el vacío estados de una partícula con amplitud√

Z y esφ(x)/

√Z el campo que crea estados |p〉 correctamente normalizados. φ(x) crea también otros estados con

más partículas pero la condición p2 = m2 selecciona sólo los de una partícula (o el de la partícula quequeremos si φ(x) crea más de un tipo de partícula, esto no ocurre en la teoría libre pero en la teoría coninteracción puede haber varios estados ligados).

La relación asintótica (7.5) no es cierta como límite en sentido fuerte (norma) sólo en sentido débilpara elementos de matriz del tipo 〈0

∼|φ(x)|p〉 o 〈p|φ(x)|0

∼〉. Tomado literalmente como un límite fuerte en

todo H llegaríamos a una contradicción con las relaciones de conmutación canónicas para φ(x) y φ0(x),

iδ (x− y) = δ (x0− y0)[φ(x),∂tφ(y)] = Zδ (x0− y0)[φ0(x),∂tφ0(y)] = Ziδ (x− y). (7.6)

La contradicción se evita porque φ(x) actuando sobre estados de cero o una partícula produce estados conmultipartícula, es decir 〈0

∼|φ(x)|p〉 o 〈p|φ(x)|0

∼〉 no saturan todos los elementos de matriz no nulos (en otro

caso Z sería 1).

Queda la cuestión técnica de crear y destruir las partículas con los operadores de creación y destruccióndel campo libre asintótico. El resultado se puede establecer de forma no perturbativa pero es más simplerecurrir a teoría de perturbaciones. Consideremos un diagrama de Feynman en el que una partícula escreada en x1 y alcanza su primer vértice de interacción en x, en los diagramas eso da un factor

φ(x)φ(x1) = i∆F(x− x1) (7.7)

y en espacio de momentosφ(k)φ(p1)˜ ˜ = (2π)4

δ (k− p1)i∆F(p1) (7.8)

Pero la matriz S requiere poner un operador de creación en vez de φ(x1). Esto da

φ(x)a†( )p1 =e−ip1x√2ω(p1)

, φ(k)a†( )˜ p1 = (2π)4δ (k− p1)

1√2ω(p1)

. (7.9)

En estas fórmulas p01 = ω(p1). Se deduce que en la función de Green en espacio de momentos hay que

cambiar un factor i∆F(p1) por 1/√

2ω(p1), y lo mismo en todas las otras patas. Teniendo en cuenta que108En realidad hay dos relaciones, φ(x)→ Z φin(x) para t→−∞ y φ(x)→ Z φout(x) para t→+∞ siendo φin,out(x) campos libres.

189

Page 190: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

dividir por i∆F(p) es multiplicar por −i(p2−m2), (y recordando los factores 1/√

Z para usar el campocorrectamente normalizado) se obtiene la relación

〈q1, . . . ,qm out|p1, . . . ,pn in〉=n

∏j=1

p2j −m2

i√

Z√

2ω(p j)

m

∏j=1

q2j −m2

i√

Z√

2ω(q j)iG(q1, . . . ,qm,−p1, . . . ,−pn)

∣∣∣∣∣p0j=ω(p j)

q0j=ω(q j)

(7.10)

Éstas son las fórmulas de reducción de Lehmann-Symanzik-Zimmermann.

Las fórmulas de reducción son exactas (no perturbativas), se pueden derivar independientemente deteoría de perturbaciones (H0 no aparece en ellas). Además son más generales que lo visto hasta ahora yaque valen igualmente reemplazando φ(x) por otro operador local. (7.10) vale para las partículas creadaspor un operador local (que sea escalar Lorentz y neutro) O(x) cualquiera, siendo iG(x1, . . . ,xn) la funciónde Green 〈0

∼|TO(x1) · · ·O(xn)|0∼〉. Si al aplicar O(x) sobre |0

∼〉 se producen estados de una partícula (que

puede ser un estado ligado, no necesariamente la partícula del campo del lagrangiano) la representación deLehmann se aplica igual, siendo Z el residuo en el polo de G(p) situado en la masa de la partícula,

〈0∼|O(x)|b

∼,p〉=

√Z

e−ipx√2ω(p)

. (7.11)

Las fórmulas se pueden extender al caso de campos cargados, con cualquier espín y con operadores departículas distintas en cada pata (en este caso m2→ m2

j en (7.10)).

Nótese que O(x) (y en particular φ(x)) podría no sólo crear una partícula más un continuo, sino queen general puede crear varias partículas (suma de varios polos) más un continuo

〈0∼|TO(x1)O(x2)|0∼〉=

n

∑j=1

Z ji∆F(x1− x2;m2j)+

∫d(m2)σ(m2)i∆F(x1− x2;m2) (7.12)

La fórmula de reducción se aplica igualmente seleccionando la capa de masas de la partícula correspondiente.

Es importante notar que el lado derecho de (7.10) es independiente de la normalización del campo φ(x)o más generalmente O(x). Si se cambia la normalización O(x)→O′(x) = λO(x), las funciones de Green seescalan con

Gn→ G′n = λnGn (7.13)

pero también√

Z →√

Z′ = λ√

Z. Por supuesto el lado izquierdo no depende de ninguna normalización;la matriz S es unitaria, las amplitudes al cuadrado son las probabilidades y no se pueden reescalar, debensumar 1. Frecuentemente se elige la normalización del campo de modo que Z = 1.109

109Podría parecer que la normalización del campo no puede elegirse ya que G(k) se obtiene unívocamente a partir dellagrangiano y las reglas de Feynman, pero como veremos en el tema de renormalización las integrales que aparecen en lasreglas de Feynman son ambiguas al no ser propiamente convergentes en general.

190

Page 191: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

El siguiente problema es por qué el lado derecho de las fórmulas de reducción (7.10) no es idénticamentecero, teniendo en cuenta que los factores p2

j−m2 y q2j−m2 se anulan sobre la capa de masas. Lo que ocurre

es que cuando se desarrolla iGn en vértices irreducibles se tiene, por ejemplo para 1+2→ 3+4,

iG(p1, p2, p3, p4) = iG(p1)iG(p2)iG(p3)iG(p4)(−i)Γ(p1, p2, p3, p4) (7.14)

(para simplificar suponemos que no hay vértices irreducibles con número impar de patas, en este caso Γ3).De acuerdo con la representación de Lehmann iG(p) tiene un polo en p2 = m2 con residuo Z, lo cualproduce

(−i)(p2j −m2)iG(p j)

∣∣p0

j=ω(p j)= Z (7.15)

y se obtiene

〈p3,p4 out|p1,p2 in〉=4

∏j=1

√Z

2ω(p j)(−i)Γ(−p1,−p2, p3, p4)

∣∣∣p0

j=ω(p j). (7.16)

Este mecanismo es general y el resultado razonable. La partícula es creada en t =−∞ con amplitud 1 yse propaga hasta llegar al vértice irreducible que conecta con otras partículas y se acopla con una amplitudproporcional a

√Z a un campo de LI(x). Y análogamente para las partículas salientes.

Por tanto finalmente las reglas para obtener la amplitud

〈p`+1, . . .pn out|p1, . . .p` in〉 (7.17)

son:1) Calcular la función iG(−p1, . . . ,−p`, p`+1, . . . , pn) amputada (esto es, sin incluir factores iG(p j)),2) poner los cuadrimomentos sobre la capa de masas con p0

j = ω(p j), y3) añadir un factor

√Z/2ω(p j) por cada pata.

Efectivamente las funciones de Green tienen polos al poner las partículas sobre la capa másica yesencialmente la matriz S es el residuo en esos polos.

7.2 Amplitud invariante

De acuerdo con lo que acabamos de ver, la forma general de la amplitud de colisión es

〈p`+1, . . .pn out|p1, . . .p` in〉=−i(2π)4δ (Pf −Pi)

n

∏j=1

√1

2ω(p j)M (p`+1, . . .pn|p1, . . .p`) (7.18)

donde Pi = ∑`j=1 p j y Pf = ∑

nj=`+1 p j.

191

Page 192: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

En el problema de colisión siempre se excluyen los casos en los que alguna partícula no interaccione, locual daría un factor iG(pi)(2π)4δ (pi−q j) en la función de Green, correspondiendo a partículas que pasande largo el blanco y siguen hacia delante.110 La amplitud de colisión estrictamente hacia delante es singular,se mezcla con la no interacción -que es casi todo-. La colisión hacia delante (por ejemplo para el teoremaóptico) se define como el límite de ángulos de deflexión pequeños.

La amplitud M es invariante Lorentz (ya que las funciones de Green lo son) y se suele denominaramplitud invariante (o de Feynman).111 La matriz S es invariante Poincaré, sus elementos de matriz (laparte izquierda de (7.18)) no son invariantes sólo porque los estados |p〉 no están normalizados de modoinvariante Lorentz.

Consideremos por ejemplo una teoría

LI(x) =−14!

gφ4(x) (7.19)

y el proceso 1+2→ 3+4. En primer orden en g el único diagrama que contribuye es

1

43

2

(7.20)

Después de amputar sólo queda el vértice, por tanto la contribución de orden 1 a M es

− iM (1) =−ig . (7.21)

A segundo orden se obtienen los siguientes diagramas

++

3 4

3 4

1 2 1 2

34

21

(7.22)

Hay otros diagramas, tales como

1 2

3 4

pero al amputar éste es el diagrama de primer orden

110Equivalentemente, a M sólo contribuyen los diagramas “amputables”, es decir, tales que cada línea externa llega a unvértice.

111El convenio de normalización de M no es universal, (7.18) es el convenio de [8].

192

Page 193: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

ya calculado.

Para el primer diagrama en (7.22) las reglas de Feynman producen para la amplitud invariante

− iM1 =12(−ig)2

∫ d4k(2π)4 i∆F(k)i∆F(p1 + p2− k)≡ 1

2(−ig)2I(p1, p2, p3, p4) (7.23)

Análogamente

− iM2 =12(−ig)2I(p1,−p3,−p2, p4), −iM3 =

12(−ig)2I(p1,−p4,−p2, p3). (7.24)

La amplitud completa a segundo orden es la suma

M (2) = M1 +M2 +M3 (7.25)

Hay que notar que la función I(p1, p2, p3, p4) sólo está definida en el subespacio p1+ p2 = p3+ p4 y cumplelas propiedades112

I(p1, p2, p3, p4) = I(p2, p1, p3, p4) = I(p3, p4, p1, p2) = I(−p1,−p2,−p3,−p4) (7.26)

De aquí se deducen las siguientes propiedades de simetría de la amplitud (que son válidas a todos losórdenes). Por un lado

M (2)(p1, p2, p3, p4) = M (2)(p2, p1, p3, p4) = M (2)(p1, p2, p4, p3) (7.27)

Esta la simetría de Bose: intercambiar 1 con 2 no cambia el estado inicial (ni siquiera su fase) y cambiar3 con 4 no cambia el estado final, por ser partículas idénticas bosónicas. Esto se refleja en la amplitud,pero nótese que en general no se cumple para cada diagrama por separado. El primer diagrama sí tienesimetría de Bose, los otros dos se intercambian al bajo las trasposiciones (12) o (34).

Por otro lado la amplitud tiene simetría de cruce:

M (2)(p1, p2, p3, p4) = M (2)(p1,−p3,−p2, p4) (7.28)

Esta simetría se deduce de M (p1, p2, p3, p4)∼ G(−p1,−p2, p3, p4) siendo Gn una función completamentesimétrica, y es un tanto sutil ya que no se aplica a amplitudes físicas directamente porque −p0

3,−p02 son

negativos y para amplitudes físicas deberían ser positivos. La amplitud invariante está definida de maneranatural para cuadrimomentos cualesquiera (fuera de la capa de masas) y la parte derecha de (7.28) serefiere a la continuación analítica de la amplitud, desde p0

2,3 positivos a negativos.

112Son propiedades formales, en realidad estas integrales son divergentes UV. Al regularizar y renormalizar habrá que darsentido a estas integrales intentando mantener las propiedades formales. Cuando esto no es posible se obtiene lo que se llamauna anomalía cuántica.

193

Page 194: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Esta propiedad es general (tal y como se deduce de las fórmulas de reducción): bajo continuaciónanalítica

M (X +A(p)→ X ′) = M (X → X ′+ A(−p)) (7.29)

que relaciona la amplitud de una reacción con una partícula en el estado inicial con la misma reacción perocon la antipartícula en el estado final. Esta simetría no sobrevive al límite no relativista porque este es unlímite de masas grandes y la continuación analítica de p a −p deja de ser predictiva.

X

X’ A (−p)

X A

X ’

(p)

= (7.30)

Tal y como está definida la amplitud invariante incluye los factores√

Z que están por añadir en M (1) yM (2). Si se elige una normalización tal que Z = 1 esto no es necesario. En otro caso habría que determinarel residuo en el polo de G(p), pero sólo sería necesario hasta primer orden, Z = 1+Z(1)+O(g2). A primer

orden el único diagrama del propagador esp

. La autoenergía correspondiente no depende de p por

lo que sólo desplaza el polo pero no cambia el residuo, es decir Z = 1+O(g2) y la expresión de M escorrecta hasta el orden calculado.

7.3 Anchura de una partícula

Como ilustración veamos cómo calcular la anchura de una partícula

A→ B1 +B2 (7.31)

con momentos p = p′1 + p′2.

Primero derivamos la fórmula de la anchura. La amplitud |i〉 → | f 〉 es

S f i =−i(2π)4δ (p′1 + p′2− p)

√1

2ω ′1

√1

2ω ′2

√1

2ωM f i (7.32)

La probabilidad es |S f i|2, al elevar al cuadrado la delta de Dirac se obtiene una divergencia IR,113((2π)4

δ (Q))2

= (2π)4δ (Q)(2π)4

δ (0), (2π)4δ (0) =

∫d4x =V T (7.33)

113Esta divergencia no es especial de teoría cuántica de campos y se debe a trabajar con estados no normalizados y es-tacionarios. Se evita trabajando con paquetes de ondas pero el tratamiento presentado aquí es el más habitual ya que esconsiderablemente más simple.

194

Page 195: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

V es el volumen del espacio, que ponemos en una caja, y T el tiempo durante el cual actúa la interacción.Se tiene entonces

w≡|S f i|2

V T= (2π)4

δ (p′1 + p′2− p)1

2ω ′1

12ω ′2

12ω|M f i|2 (7.34)

w es la probabilidad por unidad de tiempo del proceso p→ p1 + p2. Dividir por T hace que sea porunidad de tiempo. La división por V se debe a que para calcular la anchura se quiere |i〉 normalizado a 1pero la matriz S está calculada con estados normalizados a

√V , 〈p|p〉= (2π)3δ (p−p) =V .

La anchura total se obtiene sumando w sobre estados finales. Suponemos partículas escalares porsimplicidad (de modo que el estado de una partícula está totalmente especificado por su momento p).Básicamente lo que se está haciendo al sumar sobre estados finales es calcular

1 = ‖S|i〉‖2 = 〈i|S†S|i〉= ∑f〈i|S†| f 〉〈 f |S|i〉= ∑

f|S f i|2 (7.35)

donde se ha usado Parseval1 = ∑

f| f 〉〈 f |= ∑

nPn (7.36)

siendo Pn es el proyector sobre el espacio de n partículas. Para n = 1 se tiene

P1 =∫ d3k

(2π)3 |k〉〈k|=∫ d3k

(2π)3 a†(k)|0〉〈0|a(k) (7.37)

Teniendo en cuenta la normalización de los estados usados al construir la matriz S se comprueba fácilmenteque en efecto P1|p〉= |p〉. En nuestro caso necesitamos P2 y la anchura es

Γ = 〈i|S†P2S|i〉 (7.38)

Hay que distinguir dos casos, que las partículas B1 y B2 sean distintas o bien que sean partículas idénticas.En el primer caso

P2 =∫ d3 p1

(2π)3d3 p2

(2π)3 a†1(p1)a

†2(p2)|0〉〈0|a1(p2)a2(p1) (7.39)

y en el segundo caso

P2 =12!

∫ d3 p1

(2π)3d3 p2

(2π)3 a†(p1)a†(p2)|0〉〈0|a(p2)a(p1) (7.40)

La amplitud S f i es del tipo 〈0|a(p′2)a(p′1)Sa†(p)|0〉 (sin factores 1/√

2!) por tanto para la anchura seobtiene

Γ =1S

∫ d3 p′1(2π)3

d3 p′2(2π)3 (2π)4

δ (p′1 + p′2− p)1

2ω ′1

12ω ′2

12ω|M f i|2 (7.41)

siendo el factor de simetría S = 1,2 según que las partículas B1,2 sean distinguibles o idénticas. Si laspartículas emitidas tuvieran espín habría una suma adicional sobre sus estados de espín.

195

Page 196: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Es instructivo comprobar las dimensiones en esta fórmula. La matriz S es adimensional pero no así suselementos de matriz ya que |p〉 tiene dimensiones de M−3/2. Entonces S f i tiene dimensiones (M−3/2)3 =M−9/2 y M f i tiene dimensiones M−9/2+4+3/2 = M (M4−n para n partículas). La parte derecha de (7.41)tiene entonces dimensiones M2−3−4+3+3 = M. Y en efecto, la anchura es el inverso de la vida media y tienedimensiones de masa o energía.

Recordando que d3 p′

(2π)31

2ω(p′)es invariante Lorentz al igual que M , se ve que

Γ =1

ω(p)× (invariante Lorentz) (7.42)

Esto es correcto, la vida media de una partícula depende del sistema de referencia por dilatación temporalrelativista y el factor de dilatación es γ = (1−v2)−1/2 = E/m de modo que Γ ∝ 1/ω(p). La anchura de unpartícula se suele definir para la partícula en reposo por tanto tomamos

p = (mA,0), ω = mA, p= 0 (7.43)

y por la delta de conservación esto implica

p′1 =−p′2 ≡ k (7.44)

Γ =1S

∫ d3k(2π)3 2πδ (ω ′1 +ω

′2−mA)

12ω ′1

12ω ′2

12mA|M f i|2 (7.45)

La delta de conservación de la energía determina el módulo del momento de las partículas salientes q≡ |k|por la ecuación

mA =√

m21 +q2 +

√m2

2 +q2. (7.46)

La ecuación tiene solución siempre que mA ≥ m1 +m2, en otro caso no hay desintegración por este canal,se dice que no hay espacio fásico. La solución es

q2 =1

(2mA)2 (mA +m1 +m2)(mA−m1 +m2)(mA +m1−m2)(mA−m1−m2) (7.47)

o equivalentemente

q2 =1

(2mA)2 λ (m2A,m

21,m

22), λ (x,y,z)≡ x2 + y2 + z2−2xy−2xz−2yz. (7.48)

En coordenadas polares d3k = dkk2dΩ. La delta de conservación permite hacer la integral sobre |k|,usando la fórmula

δ ( f (x)) = ∑x0

δ (x− x0)

| f ′(x0)|, (7.49)

196

Page 197: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

donde x0 son ceros simples de f (x). En nuestro caso, teniendo en cuenta que dω(k)dk

=k

ω(k)

δ (ω1(k)+ω2(k)−mA) =ω1(k)ω2(k)

mAqδ (k−q) (7.50)

y se obtieneΓ =

1S

∫dΩ

132π2

qm2

A|M f i|2 (7.51)

Si no hay espín, invariancia rotacional implica que |M f i|2 es isótropo lo cual nos da para la anchura

Γ =1S

18π

qm2

A|M f i|2. (7.52)

La anchura por unidad de ángulo sólido (sean las partículas B1,2 idénticas o no) viene dada por

dΩ=

132π2

qm2

A|M f i|2 (7.53)

Cuando B1 y B2 son distinguibles dΓ/dΩ es la probabilidad de detección de B1 en la dirección k (oequivalentemente B2 en −k). Cuando son idénticas dΓ/dΩ es la probabilidad de detección de algunapartícula en la dirección k. Si contamos todas las partículas que llegan en cualquier dirección, esto es∫

dΩdΓ/dΩ, se va a contar cada proceso dos veces, de ahí que en este caso Γ = 12∫

dΩdΓ/dΩ.

Podemos ahora aplicar esta fórmula. Consideremos un lagrangiano efectivo114

L (x) =12

∂µφ∂µ

φ − 12

m2Aφ

2 +12

∂µψ∂µ

ψ− 12

m2Bψ

2− g2!

φψ2 (7.54)

Todos los campos son escalares y neutros. Es inmediato obtener la regla de Feynman del vértice φψψ

φψ

ψ

−ig (7.55)

Entonces, suponiendo que mA ≥ 2mB, para el proceso A→ B+B al orden más bajo se tiene M = g y

Γ =1

16π

qm2

Ag2, q =

12

√m2

A−4m2B . (7.56)

114Un lagrangiano que modela un proceso y se usa al orden más bajo, sin loops.

197

Page 198: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

7.4 Interacción mediada por un potencial

El concepto de energía potencial de interacción entre partículas no existe en el caso relativista ya queimplica una interacción instantánea. De todos modos para partículas pesadas se puede todavía hablar de unpotencial equivalente. La interacción se produce por intercambio de un mediador (una partículas ligera) ylos efectos de retardo en el mediador se puede despreciar porque las partículas pesadas se mueven despacio.

Consideremos por ejemplo el lagrangiano de (7.54) pero ahora mB es grande comparada con mA o losmomentos de las partículas. Las partículas B interaccionan intercambiando partículas A según el esquema

p

p

1

p

p2

p

p

1

p

p2

34

p3

−1p

34

p−1

+p4

(7.57)

La contribución a la amplitud de colisión es

〈p3,p4|S|p1,p2〉= (−ig)2 (i∆F(p1− p3;m2A)+ i∆F(p1− p4;m2

A)) 4

∏j=1

1√2ω j

(2π)4δ (Pf −Pi) (7.58)

El segundo diagrama es el diagrama de intercambio del primero por simetría de Bose. Dado que el mis-mo efecto existe en el tratamiento no relativista obviaremos el intercambio en ambos tratamientos paracompararlos. También se puede aproximar ω(p j)≈ mB,

〈p3,p4|S|p1,p2〉=(−ig)2

4m2B

i∆F(p1− p3;m2A)(2π)4

δ (Pf −Pi). (7.59)

De acuerdo con teoría de colisiones mediadas por un potencial V (r), en la aproximación de Born (es decir,en primer orden en V ) se tiene

〈p3,p4|S|p1,p2〉=−iV (p1−p3)(2π)4δ (Pf −Pi), V (r) =

∫ d3k(2π)3 eikrV (k). (7.60)

En el límite de partículas pesadas hay intercambio de momento pero no energía, de modo que para compararse puede despreciar p0

1− p03 en el propagador. Así se obtiene

− iV (k) =(−ig)2

4m2B

i−k2−m2

A, V (r) =− g2

16πm2B

1r

e−mAr. (7.61)

Corresponde a un potencial de Yukawa atractivo.115

115Es atractivo independientemente del signo de g, de hecho el signo no puede influir porque se puede cambiar cambiando elsigno del campo φ .

198

Page 199: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

También es instructivo obtener el resultado no relativista (7.60) con los métodos que hemos visto. Lapartícula no relativista se puede describir mediante un campo con acción libre

S0 =∫

d4xψ†(x)

(i∂t +

∇2

2mB

)ψ(x) (7.62)

correspondiendo a un propagador en espacio de momentos∫d4xeikx

ψ(x)ψ†(0) =i

k0−k2/(2mB)+ iη. (7.63)

El término de interacción es una acción no local en sentido espacial (pero sí temporal, todavía hay unlagrangiano y un hamiltoniano):

SI =−12

∫d4x1

∫d4x2 δ (x0

1− x02)ψ

†(x1)ψ(x1)V (x1−x2)ψ†(x2)ψ(x2). (7.64)

Aplicando el teorema de Wick se obtiene la regla de Feynman del vértice

x1 x

2− iV (x1−x2)δ (x0

1− x02) (7.65)

y en espacio de momentos

k− iV (k) (7.66)

De aquí se obtiene inmediatamente (7.60).

199

Page 200: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

8 Teoría de campos en espaciotiempo euclídeo

8.1 Rotación de Wick

Consideremos un diagrama de Feynman tal comop

, que da lugar a la integral

I =∫ d4k

(2π)41

k2−m2 + iη=∫ d3k

(2π)3

∫ +∞

−∞

dk0

1k02−ω(k)2 + iη

. (8.1)

Inciso: La integral sobre k no es convergente para k→ ∞ pero esto no es relevante para el argumento quesigue. Se podría igualmente ilustrar con 1/(k2−m2 + iη)3 y no habría problema de convergencia UV.

k0

Figura 15: Rotación de Wick en espacio de momentos.

La integral sobre k0 es sobre R con polos en el plano complejo k0 =±(ω(k)− iη). Se puede cambiarpor una integral a lo largo del eje imaginario desde k0 = −i∞ a +i∞, sin que cambie el resultado. Estoestá justificado porque al rotar el camino de integración no se cruzan singularidades ni a distancia finita niinfinita (la integral converge en el infinito). Para el nuevo camino ya se puede tomar el límite η → 0 antesde integrar

I =∫ d3k

(2π)3

∫ +i∞

−i∞

dk0

1k02−k2−m2 . (8.2)

Si definimos k0 = ik4, k4 va de −∞ a +∞ y dk0 = idk4

I = i∫ d3k

(2π)3

∫ +∞

−∞

dk4

1−k2

4−k2−m2 (8.3)

200

Page 201: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Ahora se ve que I imaginario puro. Si se define un cuadrimomento euclídeo kE,µ = (−k4,k) con normaeuclídea k2

E = δµνkE,µkE,ν = k24 +k2,

I =−i∫ d4kE

(2π)41

k2E +m2 (8.4)

La integral no tiene polos en el camino de integración (el grado de divergencia UV no ha cambiado).

En cualquier diagrama de vacío (esto es, sin patas externas) se puede hacer la rotación de Wick entodas las componentes k0 de los loops. Podemos ahora comprobar que los diagramas conexos de vacío sontodos puramente imaginarios. Esquemáticamente, preocupándonos sólo del número de líneas (Pi), vértices(n) y loops (L),

Γc ∼ (−ig)n∫(d4k)L

(i

k2−m2 + iη

)Pi

= (−i)niL(−i)Pign∫(d4kE)

L(

1k2

E +m2

)Pi

(8.5)

Pero según (6.25) L = Pi−n+1 para un diagrama conexo, por tanto Γc es imaginario puro. Esto implicaque W [0] es puramente real y Z[0] es una fase, en buen acuerdo con la discusión en Sec. 6.4.1.

Más generalmente para un diagrama cualquiera (con patas externas) se puede definir su versión euclídeahaciendo la rotación de Wick también en los momentos externos, y al final del cálculo deshacer la rotación,por continuación analítica. La rotación de Wick da integrales mejor comportadas a nivel numérico quelas integrales originales al eliminar los polos en el camino de integración. Una conclusión importante quese deduce es que los polos en los propagadores no producen divergencias por muy complicado que sea eldiagrama.

8.2 Espacio euclídeo

8.2.1 Tiempo imaginario

A menudo es conveniente trabajar con el operador de evolución en tiempo imaginario en lugar detiempo real, es decir, en vez de e−itH usar e−τH con τ > 0 (se supone que H está acotado inferiormente).La idea es calcular

FE(τ) = 〈ψ1|e−τH |ψ2〉 τ > 0 (8.6)

y recuperarF(t) = 〈ψ1|e−itH |ψ2〉 t ∈ R (8.7)

mediante continuación analítica con τ = it, F(t) = FE(it), ilustrada en la Fig. 16. La continuación analíticase puede hacer a t > 0 o t < 0. Se habla de evolución en tiempo imaginario porque t es imaginario cuando

201

Page 202: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

variable variable

t

− τi

itτ=

t=

τt

Figura 16: Continuación analítica desde τ = it > 0 a t ∈ R.

τ es real (y viceversa).

La ventaja de este procedimiento es que el elemento de matriz con tiempo imaginario es mejor com-portado. En efecto, si se desarrolla en estados propios de H se tiene

〈ψ1|e−τH |ψ2〉= ∑n

e−τEn〈ψ1|n〉〈n|ψ2〉 (8.8)

Para H acotado inferiormente, pero no superiormente, la suma converge mejor para Re(τ) > 0 que paraτ = it con t ∈ R, por tanto extiende el dominio del operador de evolución en el espacio de Hilbert. Nótesesin embargo que para el semiplano Re(τ) < 0 es todo lo contrario. El valor del elemento de matriz enRe(τ)≤ 0 se define mediante continuación analítica. La “evolución” con τ siempre es hacia τ crecientes yno decrecientes.

plano t

x

x 0E

0

Figura 17: Rotación de Wick en espacio de posiciones.

202

Page 203: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Para calcular la evolución en tiempo imaginario de forma sistemática lo que se hace es introducir lacoordenada temporal x0

E en el plano complejo x0 mediante

x0E = ix0, (8.9)

y la evolución se cambia de x0 crecientes a x0E crecientes con x0

E real y por tanto x0 imaginario. Es decir seaplica una rotación de −π/2 a la línea de evolución en plano complejo t. La evolución está representada enla Fig. 17. Esta es la rotación de Wick en espacio de posiciones. Si comparamos con la Fig. 4 en la Sec.5.4.3 lo que se está haciendo es acabar de deformar el camino del eje real t al eje imaginario en direccióndescendente (x0

E creciente). Nótese que a pesar de la Fig. 17, no es que se esté admitiendo τ < 0, τ es elintervalo x0

E,final− x0E,inicial y debe ser positivo, la coordenada x0

E misma puede ser positiva o negativa.

La coordenada x0E se denomina tiempo imaginario (aunque el que es imaginario ahora es x0) o también

tiempo euclídeo porque la métrica pasa a ser euclídea. En efecto, se definen las coordenadas euclídeas xµ

E

x0E = ix0, xi

E = xi, xµ

E = xE,µ = (ix0,x) (8.10)

E usa la métrica δµν de modo que coinciden componentes contravariantes y covariantes

x2 = gµνxµxν = x02−x2 =−x0E −x2 =−δµνxµ

ExνE ≡−x2

E . (8.11)

8.2.2 Acción euclídea

Se puede hacer toda la evolución en tiempo imaginario, calcular funciones de Green etc, y luego hacerla continuación analítica a tiempo real. La forma más práctica de hacer esto es partir directamente de unaacción euclídea, con continuaciones analíticas de campos y corrientes

φE(xE) = φ(x), JE(xE) =−J(x), (8.12)

Teniendo en cuenta que

dx0 =−idx0E , d4x =−id4xE ∂0 = i∂ E

0 , ∂µ∂µ =−∂

Eµ ∂

Eµ , (8.13)

La función de partición

Z[J] =∫

Dφ(x)exp(

i∫

d4x(

12

∂µφ∂µ

φ − 12

m2φ

2− g4!

φ4− Jφ

))(8.14)

se puede reescribir en variables euclídeas como

Z[J] =∫

DφE(xE)exp(−∫

d4xE

(12(∂ µ

φ)2E +

12

m2φ

2E +

g4!

φ4E − JEφE

)). (8.15)

203

Page 204: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

La relación entre expresiones en Minkowski y euclídeo es

Z[J] =∫

Dφ(x)eiSJ [φ ]

∣∣∣∣M=∫

Dφ(x)e−SJ [φ ]

∣∣∣∣E

(8.16)

conSJ

E [φ ] =∫

d4x(

12(∂ µ

φ)2 +12

m2φ

2 +g4!

φ4− Jφ

)∣∣∣∣E. (8.17)

SE [φ ] es la acción euclídea. Para interacciones del tipo V (φ(x)) la acción euclídea es real y acotada in-feriormente, y el peso de Boltzmann e−SE [φ ] es positivo. Esta propiedad es frecuente pero no completamentegeneral; dependiendo de la teoría se pueden encontrar pesos complejos incluso en la versión euclídea.

Nótese que la condición que se ponía al construir Z[J] (Sec. 5.4.3) de que x0 iba desde −∞+ i∞ a+∞− i∞ ahora es simplemente que x0

E va de −∞ a +∞, y tiene igualmente el efecto de filtrar el estadofundamental en los dos extremos.

La medida Dφ(x) (en espacio euclídeo o Minkowski) no tiene sentido matemático riguroso (permiteconfiguraciones demasiado irregulares). La medida Dφ(x)eiS0[φ ] (teoría libre) aunque mejor comportadatampoco lo tiene pero en cambio dµ0[φ ] = Dφ(x)e−SE,0[φ ] sí se puede definir con todo rigor como unamedida en el espacio de configuraciones suficientemente regulares (lo mismo ocurre en 0+1 dimensiones,es decir, integral de caminos).

En presencia de interacción el problema matemático es dar sentido a la medida dµ[φ ] = dµ0[φ ]e−SE,I [φ ].Eso se ha conseguido para teorías de tipo φ 4 en 1+1 y 2+1 dimensiones pero no en 3+1, y tampoco parateorías gauge [9]. En todo caso la formulación euclídea es siempre el punto de partida ya que es muchomejor comportada matemáticamente que la versión con tiempo real.

Es importante matizar que no cualquier funcional SE [φ ] es una acción euclídea admisible, en el sentido deprovenir de una acción hermítica en espacio de Minkowski. La condición sobre SE [φ ] que traduce unitaridaden Minkowski se denomina positividad bajo reflexión.

Los valores esperados se calculan con

〈A[φ ]〉E =

∫Dφ(x)e−SE [φ ]A[φ ]∫

Dφ(x)e−SE [φ ](8.18)

Cuando SE [φ ] es real esto es totalmente equivalente al valor esperado de una variable aleatoria, dondeφ(x) tiene distribución de probabilidad dµ[φ ]/Z[0]. Esto tiene gran interés práctico ya que existen métodosMonte Carlo eficientes para obtener esos promedios lo cual puede permitir en principio obviar el tener querecurrir a teoría de perturbaciones. Esto no se puede hacer de modo inmediato ya que hay muchas variables(una variable real por cada punto del espaciotiempo para un campo neutro). Generalmente se recurre a

204

Page 205: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

un retículo, una discretización del espaciotiempo (lo cual introduce un regulador UV) y poniendo ademásel sistema en una caja espaciotemporal (lo que introduce un regulador IR), de modo que el número devariables pasa a ser estrictamente finito. El problema posterior es estimar el límite de los observables amedida que se quitan los reguladores.

8.2.3 Funciones de correlación euclídeas

Las funciones de correlación euclídeas o funciones de Schwinger se definen como116

〈φ(x1) · · ·φ(xn)〉E =

∫Dφ(x)e−SE [φ ]φ(x1) · · ·φ(xn)∫

Dφ(x)e−SE [φ ]≡ GE(x1, . . . ,xn) (8.19)

Las funciones de Schwinger son completamente simétricas en el caso bosónico y antisimétricas en elfermiónico. De forma análoga a las funciones de Green en espacio de Minkowski, las funciones de Schwingerpueden reescribirse como

〈φ(x1) · · ·φ(xn)〉E = 〈0∼|φ(x1)e−(x

01−x0

2)H · · ·e−(x0n−1−x0

n)Hφ(xn)|0∼〉. (8.20)

donde x j son los puntos reordenados de modo que x0i−1 > x0

i y todos los operadores de evolución tienenτ > 0.

Las funciones de Schwinger son invariantes bajo rotaciones euclídeas (de SO(4)) y son analíticas exceptoen los puntos de coincidencia xi = x j. Las funciones de Green (de tiempo real) se obtienen de las euclídeaspor continuación analítica,

iG(x1, . . . ,xn) = GE(xE,1, . . . ,xE,n). (8.21)

Esto implementa la rotación de Wick en espacio de momentos vista en la Sec. 8.1.

Podemos analizar el propagador euclídeo (función de dos puntos) en la teoría libre, que denotamosD(x1− x2). Partiendo de (8.15) y (8.19) para g = 0 y usando la fórmula (parte del teorema de Wick)∫

Dφe−12 mi jφ

iφ jφ aφ b∫

Dφe−12 mi jφ iφ j

= (m−1)ab = sab, mi js jk = δki , (8.22)

se ve que D(x) es la solución de la ecuación

(−∂2µ +m2)D(x) = δ (x) (8.23)

lo cual produce117

D(x) =1

(2π)2mτ

K1(mτ), τ =+√

x2E . (8.24)

116En lo que sigue usamos x, φ , etc para indicar las variables euclídeas si así lo indica el contexto.117Con métrica euclídea no hay que especificar las condiciones de contorno; no hay polos en la transformada de Fourier que

requieran una elección de ±iη.

205

Page 206: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

K1(z) es una función Bessel modificada. Esta función tiene un punto de ramificación en z = 0 y es analíticaen C\R−. En el límite m = 0 se encuentra

D(x) =1

(2π)21x2

E(m = 0). (8.25)

Se puede recuperar el propagador de Feynman mediante extensión analítica:

iG(x) = GE(xE), (8.26)

y al deshacer la rotación de Wick se tiene

x0E = ix0 + ε(x0)η , (8.27)

es decir, x0 debe entenderse como x0− iε(x0)η porque para x0 > 0 se llega desde el semiplano inferior, ypara x0 < 0 desde el semiplano superior (Fig. 17), o también |x0| → |x0|− iη . Entonces x2

E =−x2 + iη y seobtiene para el propagador de Feynman en espacio de Minkowski con m = 0

∆F(x) =i

(2π)21

x2− iη(m = 0). (8.28)

La relación (8.23) se puede obtener también en el formalismo canónico, con (8.20):

D(x) = θ(x0)〈0|φ(x)e−x0Hφ(0)|0〉+θ(−x0)〈0|φ(0)ex0H

φ(x)|0〉

=∫ d3k

(2π)31

2ω(k)e−|x

0|ω(k)eikx =∫ d4k

(2π)4ei(k0x0+kx)

k20 +k2 +m2

(8.29)

La última igualdad se verifica integrando sobre k0 y equivale a (8.23).

8.2.4 Formalismo euclídeo en espacio de momentos

La rotación de Wick en espacio de momentos se define con

k0E = ik0, kE = k, kµ

E = kE,µ = (ik0,k) (8.30)

de modo que, siendo la métrica euclídea δµν ,

k2E =−k2, kExE =−kx. (8.31)

Con esta definición e−ikx∣∣M = eikx

∣∣E y kµ = i∂ µ en espacio de Minkowski pasa a kµ =−i∂ µ en euclídeo.118

118La regla es que el espacio euclídeo se comporta como la parte espacial de Minkowski. En este sentido una signatura(−,+,+,+) sería ventajosa.

206

Page 207: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

El propagador libre euclídeo es

φ(x)φ(0) = D(x) =∫ d4k

(2π)4 eikxD(k), D(k) =1

k2 +m2 . (8.32)

La regla de Feynman del vértice (para la teoría φ 4(x)) también se lee de (8.15), desarrollando hasta primerorden en g y aplicando el teorema de Wick

k D(k) −g(8.33)

Por lo demás las reglas de Feynman euclídeas para las funciones de correlación en espacio de momentosson las mismas que en espacio de Minkowski.

8.3 Mecánica estadística

8.3.1 Relación con mecánica estadística clásica

En mecánica estadística clásica, la función de partición es

Z = ∑ϕ(x)

e−βH[ϕ] (8.34)

donde β = 1/T es el inverso de la temperatura absoluta y H[ϕ] es la energía de la configuración ϕ(x). Lasuma, o integral

∫Dϕ(x), es sobre todas las configuraciones, y x puede ser discreto (por ejemplo puntos

de una red) o no.

Comparando (8.34) y (8.15), si se hacen las identificaciones

β ←→ 1h, H[ϕ]←→ SE [φ ] ϕ(x)←→ φ(x) (8.35)

se ve que la función de partición de la teoría de campos cuánticos euclídea en d = D+1 dimensiones (Ddimensiones espaciales y una temporal) equivale a un sistema de mecánica estadística clásica en d + 1dimensiones, en el que cada punto del espaciotiempo x es un punto del espacio x en d dimensiones, laconfiguración espaciotemporal φ(x) es la configuración espacial ϕ(x), la acción euclídea SE [φ ] es la energíaH[ϕ] y h desempeña el papel de temperatura T .

Las fluctuaciones cuánticas de un sistema corresponden a las fluctuaciones térmicas del otro. Así en ellímite h→ 0 el sistema de campos se vuelve clásico y selecciona el mínimo de la acción (que es la solución

207

Page 208: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

de las ecuaciones de movimiento en versión euclídea). En la versión de mecánica estadística T → 0, elsistema se congela en la configuración de energía mínima.

8.3.2 Teoría de campos a temperatura finita

Hasta ahora hemos estudiado la teoría cuántica a temperatura cero. En espacio euclídeo es fácil intro-ducir temperatura en una teoría de campos cuánticos.

Si T es la temperatura, β = 1/T , y H es el hamiltoniano del sistema cuántico, la función de partición(térmica) es

Z = Tr(e−βH) (8.36)

Se ve que e−βH no es más que el operador de evolución euclídeo con τ = β .

Por otro lado, al igual que en tiempo real, el elemento de matriz 〈ϕ1|e−τH |ϕ2〉 se puede expresar comouna suma de configuraciones espacio temporales φ(x) pesadas con el factor de Boltzmann euclídeo e−SE [φ ]

y condiciones de contorno φ(x,0) = ϕ2(x) y φ(x,τ) = ϕ1(x). La traza implicada en la función de particiónequivale a tomar ϕ ≡ ϕ1 = ϕ2 y sumar sobre ϕ. Se tiene entonces

Z =∫

φ(x,β )=φ(x,0)Dφ(x)e−

∫d3x

∫ β

0 dx0LE (x), (8.37)

es decir, la función de partición cuántica coincide con la térmica con la prescripción de sumar sobreconfiguraciones que evolucionan en espacio euclídeo durante un tiempo β y con condiciones periódicas decontorno. Cuando β → ∞ se recupera el resultado de temperatura cero. En ese límite las condiciones decontorno dejan de ser relevantes, y sólo quedan los elementos de matriz en el estado fundamental. Lospotenciales químicos que se introducen en la función de partición térmica son un caso particular de lascorrientes que se introducen en la acción cuántica.

Este resultado junto que el obtenido previamente indica que mecánica estadística cuántica en d dimen-siones espaciotemporales equivale a un sistema de mecánica estadística clásica en una dimensión más.

En espacio de momentos, el efecto de las condiciones de contorno periódicas es que en lugar de uncontinuo de frecuencias k0, las frecuencias a temperatura T está discretizadas, dando lugar a las frecuenciasde Matsubara, k0 = 2πT n, n ∈ Z. Para fermiones las condiciones de contorno son antiperiódicas en vezde periódicas y se tiene k0 = πT (2n+1).

208

Page 209: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

9 Renormalización

9.1 Parámetros desnudos y renormalizados

Las funciones de correlación están directamente relacionadas con observables. Por ejemplo estudiando〈0∼|T φ(x)φ(0)|0

∼〉 y buscando polos en espacio de momentos se encuentra la masa de la partícula (o par-

tículas) creada por el campo φ . Esto no es simplemente una definición, de acuerdo con la discusión en laSec. 5.2, el polo en espacio de momentos se corresponde con la propagación no virtual sino real, esto es,estados estacionarios propios del hamiltoniano, los estados que se propagan un tiempo suficiente para serdetectados.

Consideremos por ejemplo la teoría

L (x) =12

∂µφ∂µ

φ − 12

m20φ

2− g0

4!φ

4. (9.1)

A nivel árbol el único diagrama, esk

=i

k2−m20 + iη

. El polo está en k2 = m20, y en esta apro-

ximación, m0 es la masa de la partícula. Si vamos a un loop

+

iG(k)≈ i∆F(k)+ i∆F(k)(−i)Σ1(k)i∆F(k), −iΣ1(k) =−12

ig0

∫ d4q(2π)4 i∆F(q). (9.2)

En este caso particular, la autoenergía no depende de k, es constante. En todo caso el propagador truncadono obedece a la representación de Lehmann

G(k) =∫

0d(m2)ρ(m2)

1k2−m2 + iη

(9.3)

porque no hay una densidad espectral positiva, más bien

ρ(m2)≈ δ (m2−m20)−δ

′(m2−m20)Σ1 (9.4)

Sin embargo, si se suma toda la serie de Dyson

G(k)≈ ∆F(k)∞

∑n=0

(Σ1∆F(k)

)n=

1k2−m2

0− Σ1 + iη, (9.5)

sí se obtiene algo aceptableρ(m2)≈ δ (m2−m2

0− Σ1) (9.6)

209

Page 210: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

teniendo en cuenta que Σ1 es real y positivo (g0 ≥ 0 para que haya un estado fundamental)

Σ1 =g0

2

∫ d4q(2π)4

1q2

E +m20

(9.7)

aunque también divergente UV. Volveremos sobre este problema enseguida. En esta aproximación la masade la partícula sería

m2 = m20 + Σ1 (9.8)

Como ya se comentó este tipo de diagramas tadpole no aparecen si se pone orden normal en el lagrangiano,o equivalentemente se pueden omitir usando m2

0 + Σ1 como parámetro en el lagrangiano. Pero hay muchosmás diagramas de autoenergía. Lo que se quiere mostrar con esta discusión es que m0 es un parámetro dellagrangiano pero no la masa física m, m0 es la masa sólo a nivel árbol.

Lo mismo ocurre con la constante de acoplamiento. Si Γn denota la función vértice de n patas, Γ4nos indica la intensidad de la interacción (suponemos que en esta teoría no hay funciones de Green con nimpar). Por concretar se puede definir g, la constante de acoplamiento física, como Γ4(p1, p2, p3, p4) contodos los trimomentos nulos y sobre la capa de masas

g = Γ4|p j=(m,0) . (9.9)

Otras definiciones pueden ser preferibles pero esto es irrelevante para la presente discusión. En diagramasΓ4 se obtiene con

= + + + . . . (9.10)

Al orden más bajo Γ4 = g0, pero hay correcciones a órdenes superiores. g se puede medir experimentalmente,no así g0. Por supuesto, aparte de la interacción de cuatro puntos que había en el lagrangiano la interacciónproduce interacciones de orden superior Γ6, etc.

En general, los parámetros desnudos m0, g0 no son observables directamente, a diferencia de losrenormalizados o vestidos, la masa física m y la constante de acoplamiento física g. En principio lo quese tiene es

m = m(m0,g0), g = g(m0,g0) (9.11)

calculado por ejemplo perturbativamente, y m0 y g0 se ajustan a posteriori para reproducir los valores de my g observados experimentalmente. Como todas las funciones de Green dependen de (m0,g0) todo quedafijado por m y g o en general dos parámetros independientes.

210

Page 211: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

El esquema que acabamos de presentar es muy naive porque, como ya se ha indicado, los loops producenintegrales que divergen en el ultravioleta (k grande).

9.2 Esquemas de regularización

Frecuentemente los diagramas con loops son divergentes al integrar sobre los momentos en la regiónde momentos grandes, son divergencias ultravioletas (UV).

Hay varias formas de regular las divergencias de modo que cuando se quita el regulador Λ se recuperala teoría original. Entre otras, se tiene

1) Regulador tridimensional. Las integrales sobre d3k se cortan para |k| > Λ. Λ es el regulador o

momento de corte (cutoff). Por ejemplo parap

IΛ =∫ d4k

(2π)4θ(Λ−|k|)

k2−m20 + iη

=−i∫

Λ d3k(2π)3

12ω(k)

. (9.12)

Para Λ→ ∞ la integral está dominada por los k grandes y se puede despreciar la masa en ω(k)

iIΛ ∼∫

Λ d3k(2π)3

12|k|

=Λ2

8π2 . (9.13)

Se trata de una divergencia cuadrática en Λ. La siguiente corrección va como log(Λ/m0) (divergencialogarítmica).

Que el diagrama diverge cuadráticamente se puede ver sin hacer la integral, por contaje de potenciasde k para kµ grande.

∫d4k crece como una potencia cuártica mientras que ∆F(k) va como 1/k2∫

ddk ∼ Λd , ∆F(k)∼ 1/Λ

2 . (9.14)

Cada loop introduce una integral que da una potencia Λ4, cada propagador una potencia 1/Λ2. Este contajenos da el grado de divergencia superficial del diagrama. Como se verá este contaje no es suficiente cuandohay subdiagramas divergentes (subdivergencias).

Más generalmente se puede introducir un corte suave

IΛ =∫ d4k

(2π)4 F(k2/Λ2)

1k2−m2

0 + iη(9.15)

211

Page 212: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

donde F(x) debe cumplirF(x) →

x→01, F(x) →

x→∞0 . (9.16)

Además para x grande F(x) debe ir a 0 suficientemente deprisa para que la integral converja. Dado quelos diagramas producen integrandos del tipo 1/kn para k grande, una caída exponencial es suficiente, porejemplo F(x) = e−x.

2) Regulador cuadridimensional. El método anterior rompe invariancia Lorentz, aunque se deberecuperar al quitar el regulador, Λ→∞. En la versión euclídea se puede preservar simetría euclídea cortandok2,

iIΛ =∫ d4k

(2π)4 F(k2/Λ2)

1k2 +m2

0. (9.17)

Aunque este método es mejor que el regulador tridimensional al respetar invariancia Lorentz es inadecuadoen teorías gauge ya que éstas requieren invariancia bajo translaciones en kµ , que se pierde al imponerk2 < Λ2.

3) Pauli-Villars. En este método de regularización se cambia el propagador por uno sustraído

1k2−m2

0→ 1

k2−m20− 1

k2−Λ2 . (9.18)

EL propagador sustraído es más convergente. La regla se puede introducir sistemáticamente a nivel deacción añadiendo un campo con masa Λ y el signo cambiado en el lagrangiano que se acople igual queφ(x) a las corrientes externas J(x). El signo menos en el residuo del polo indica que ese campo violapositividad del producto escalar en el espacio de Hilbet (unitaridad de la teoría). De hecho de acuerdocon la representación de Lehmann, ρ(m2) ≥ 0 implica que el propagador se comporta como 1/k2 para kgrande y no hay modo de hacerlo más convergente (de regular la teoría y evitar divergencias UV) sin violaralguna de las condiciones usadas al obtener la representación de Lehmann (unitaridad, invariancia Lorentz,localidad).

Pauli-Villars conserva invariancia Lorentz y gauge pero no es práctica en teorías gauge no abelianas,ahí generalmente se usa regularización dimensional para cálculos perturbativos.

4) Regularización dimensional. Este método respeta todas la simetrías (Lorentz, gauge, etc) exceptoaquella que son anómalas (que existen a nivel clásico pero no cuántico). La idea es que el grado dedivergencia de las integrales en los diagramas depende de la dimensión del espaciotiempo. Es posibleentonces definir las integrales para dimensiones d en las que converjan y luego hacer una continuaciónanalítica a d = 4. Las divergencias vuelven a aparecer cuando d→ 4 y el parámetro ε,119

d = 4−2ε, (9.19)119Esta definición de ε no es universal, se usan también otros convenios.

212

Page 213: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

regula la divergencia en vez de Λ.

Veamos cómo funciona esto en el ejemplo de antes (usando la versión euclídea):

iI =∫ ddk

(2π)d1

k2 +m20=∫ ddk

(2π)d

∫∞

0due−u(k2+m2

0) (9.20)

Ahora la integral sobre k en d dimensiones se puede calcular fácilmente∫

ddk e−k2=

(∫dxe−x2

)d

= πd/2. (9.21)

Tenemos entonces

iI =1

(4π)d/2

∫∞

0du

e−um20

ud/2 (9.22)

Regularización dimensional no distingue el grado de divergencia, pero teniendo en cuenta que la región dek grande estaba controlada por u pequeño, se ve que si se pone un corte u > Λ−2 (por dimensiones), d = 4y se desprecia m, se tiene

iI ∼ 1(4π)2

∫∞

Λ−2du

1u2 =

116π2 Λ

2, (9.23)

que reproduce la divergencia cuadrática. Volviendo a regularización dimensional, usando∫∞

0duuα−1e−u = Γ(α) (9.24)

se tieneiI =

1(4π)d/2 Γ(1− d

2)md−2

0 =1

(4π)2−εΓ(−1+ ε)m2−2ε

0 . (9.25)

La función Γ(z)120 es meromorfa con polos en los z enteros no positivos,

Γ(ε−n) =(−1)n

n!1ε+O(1), n = 0,1,2, . . . (9.26)

Se tiene entoncesiI =−

m20

(4π)21ε+O(1) (9.27)

La divergencia UV de la integral original se manifiesta como un polo en ε = 0 en la versión reguladadimensionalmente. El orden del polo indica el número de loops.

120Propiedades: Γ(n+1) = n!, zΓ(z) = Γ(z+1), Γ(1/2) =√

π.

213

Page 214: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Aunque no lo necesitamos aquí, para futura referencia, notemos que calculando (9.21) en coordenadaspolares se deduce para el ángulo sólido en d dimensiones∫

dd−1Ω =

2πd/2

Γ(d/2). (9.28)

Así se obtiene 2, 2π, 4π, 2π2 para d = 1,2,3,4.

5) Retículo. En este método se regulan las divergencias UV poniendo los puntos del espaciotiempo enuna red hipercúbica. El parámetro de la red (separación entre puntos contiguos) a corresponde a un cutoffΛ = 1/a, de modo que cuando se recupera el límite de espaciotiempo continuo, a→ 0 se quita el reguladorUV, Λ→ ∞. Este método viola invariancia Lorentz pero mantiene gauge. A nivel de diagramas es muypoco práctico pero tiene la virtud de permitir un tratamiento no perturbativo, mediante Monte Carlo ensu versión euclídea. De hecho la definición en el retículo es la única definición precisa de una teoría comoQCD.121

9.3 Teoría regulada

Como hemos visto una teoría queda regulada en espacio euclídeo con la prescripción∫d4k→

∫d4k F(k2/Λ

2) (9.29)

que se aplica a cada línea interna. Esto implica modificar la regla de Feynman de la línea

kF(k2/Λ

2)D(k) (9.30)

y equivale a modificar la masa m20 → M(k2/Λ;m2

0) de modo que la partícula se vuelve muy masiva parak > Λ y no se propaga. Alternativamente, el mismo efecto se consigue modificando la regla de Feynmandel vértice

−g(2π)4δ (k1 + k2 + k3 + k4)

4

∏i=1

F1/2(k2i /Λ

2). (9.31)

En este punto de vista la interacción se desconecta para k Λ. El factor F también se puede aplicar a laslíneas externas, es irrelevante al quitar Λ o para k Λ.

121En principio un lagrangiano definiría una teoría de manera precisa, pero eso no es así por las divergencias UV. Los diagramasson ambiguos y lo mismo la acción, hasta que se da una prescripción precisa, pero por ejemplo regularización dimensional noexiste más allá de teoría de perturbaciones y las series perturbativas no son convergentes sino a lo sumo asintóticas.

214

Page 215: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

El lagrangiano (euclídeo) de la teoría regulada con (9.30) pasa a ser

L (x) =12

φ(x)−2+m2

0F(−2/Λ2)

φ(x)+g0

4!φ

4(x). (9.32)

Es absolutamente esencial que las funciones de Green deriven de un lagrangiano (aunque sólo sea local enel límite Λ→ ∞). El lagrangiano de la teoría se denomina lagrangiano renormalizado.

Una vez que la teoría está regulada todos los diagramas de Feynman dan resultados finitos. Otracuestión es si la suma sobre diagramas converge. Eso no nos preocupa ahora (se podría usar un retículo ytodo estaría definido a nivel no perturbativo). En lugar de (9.11) ahora se tiene

m = m(m0,g0,Λ), g = g(m0,g0,Λ) (9.33)

(m0,g0) hay que ajustarlos para reproducir (m,g) para un Λ dado122

m0 = m(Λ;m,g), g0 = g(Λ;m,g). (9.34)

En el espacio (m0,g0,Λ) cada valor de m y g define lo que se llama una curva de física constante,refiriéndose a que los valores de m y g no cambian a lo largo de la curva.

La teoría regulada no es local porque suprime momentos por encima de Λ (aparte de otras posiblespatologías, tales como rotura de invariancia gauge, etc) y sólo es útil para energías por debajo de Λ.

Si nos movemos por la línea de física constante tenemos asegurado que m y g se reproducen correc-tamente para el valor de Λ correspondiente. Respecto de otras funciones de Green, éstas dependerán delregulador explícitamente, en general

Gn(x1, . . . ,xn;Λ;m,g) (9.35)

Estas funciones divergen en el límite de coincidencia xi = x j incluso en el caso libre. En espacio de momentos,las funciones

Gn(k1, . . . ,kn;Λ;m,g) (9.36)

divergen si k j→ ∞ pero no divergen para k finitos si Λ es finito.123 Sin embargo en general volverán a serdivergentes cuando Λ→ ∞.

Si, para una teoría dada, al quitar el regulador las funciones de Green divergen (con m,g fijos), siendoéstas magnitudes físicas, esto indica que Λ no puede quitarse totalmente. El máximo valor Λc que produceresultados razonables es una escala física de la teoría. Para energías mayores que Λc la teoría no sirve, es

122Suponemos que tal inversión (m0,g0)↔ (m,g) es posible. Esto siempre es cierto perturbativamente pero no necesariamenteen el caso no perturbativo, como veremos en la Sec. 9.8.

123En espacio euclídeo Gn no tiene polos para k j real.

215

Page 216: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

decir, es una teoría efectiva, quizá de otra teoría subyacente a nivel más microscópico, posiblemente conotros grados de libertad.

En cambio si existe el límite Λ→ ∞ de las funciones de Green (para x j no coincidentes o k j finitos)con m,g fijados se dice que la teoría es renormalizable. Tal teoría produce predicciones finitas y acordescon principios físicos (causalidad, localidad, invariancia Lorentz, unitaridad, etc). Una teoría renormalizablees viable a cualquier escala, no se hace inconsistente a altas energías. Otra cosa es que reproduzca elexperimento a partir de cierto valor de Λ, pero es internamente consistente en el límite Λ→∞. Un ejemplode tal teoría es QCD. La teoría φ 4 (en cuatro dimensiones) y QED son ejemplos de teorías renormalizablespero sólo en sentido perturbativo, el límite Λ→ ∞ existe en cada orden perturbativo, pero no a nivel noperturbativo.

Aquí hay que matizar, ya que tal y como se ha definido pocas o ninguna sería renormalizable. Engeneral hay que permitir también cambiar la normalización del campo para que el límite exista. Esto es, siconsideramos un campo φ ′(x) que difiera de φ(x) en su normalización

φ′(x) = Z−1/2

0 φ(x) (9.37)

donde Z0 es cierto factor, las funciones de Green asociadas serán

G′n(x1, . . . ,xn;Λ;m,g) = Z−n/20 Gn(x1, . . . ,xn;Λ;m,g) (9.38)

La teoría es renormalizable si es posible elegir la función Z0(Λ;m,g) de modo que el límite Λ→ ∞ existapara todo n.124 Obviamente si este es el caso, el residuo en el polo de la función de dos puntos G′2 debeser finito y por tanto una elección de Z0 válida va a ser tomar Z0 = Z, el residuo en el polo de la funciónde dos puntos de φ(x), ya que con esta elección G′2 tendrá residuo 1.

Se podría argumentar que de acuerdo con la representación de Lehmann, para el campo canónicamentenormalizado ∫

0d(m2)ρ(m2) = 1 (9.39)

y si G′(k) es finito, su ρ ′(m2) será finito y lo mismo su integral, por tanto Z0 debe ser finito y se puedetomar Z0 = 1 (además se deduce que Z es finito). En realidad esto no es así. La condición (9.39) se deducede la relación de conmutación canónica y π(x) = ∂tφ(x), pero esta última condición no se mantiene en lateoría regularizada. En efecto, el regulador equivale a una interacción no local y eso cambia el momentocanónico. Por ejemplo, si parte del efecto del regulador es añadir un término de modo que

12(∂φ)2→ 1

2(∂φ)2 +

12(Z1−1)(∂φ)2, π = ∂tφ(x)→ π = Z1∂tφ(x) (9.40)

124Excluimos casos degenerados tales como G′n→ 0.

216

Page 217: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

con lo que la normalización de ρ pasa a ser 1/Z1. En la práctica para aΛ→ ∞ lo que se encuentra es queZ→ 0, ρ(m2)→ 0 (lo cual no es incompatible con que su integral se mantenga finita), mientras que paraG′2, Z′ = 1 y ρ ′(m2) es finito pero con normalización infinita.

En principio adoptamos la condición Z0 = Z (residuo en el polo igual a 1). Es frecuente cambiar lanotación y denotar el campo que siempre hemos llamado φ como φ0, este es el campo desnudo, y φ ′ pasaa llamarse φ o campo renormalizado

φ0(x) = Z1/2φ(x), (9.41)

y a partir de ahora se entiende que las funciones de Green son las del campo renormalizado (por ejemploen (9.9)).

El lagrangiano de la teoría es

L (x) =12

∂µφ0∂µ

φ0−12

m20φ

20 −

g0

4!φ

40 =

Z2

∂µφ∂µ

φ − Z2

m20φ

2− Z2g0

4!φ

4, (9.42)

(Omitimos, como es usual, explicitar el efecto del regulador. El lagrangiano completo es el de (9.32).)

Obsérvese que hay tres constantes (m0,g0,Z) una por cada término del lagrangiano, y se fijan con trescondiciones, posición del polo en m, vértice irreducible (del campo renormalizado no del desnudo) igual ag y residuo en el polo igual a 1. Por dimensiones:

m = m0 f1(m0/Λ,g0), g = f2(m0/Λ,g0), Z = f3(m0/Λ,g0),m0 = mh1(m/Λ,g), g0 = f2(m/Λ,g), Z = h3(m/Λ,g). (9.43)

Se ha supuesto que no hay divergencias infrarrojas. Si por ejemplo m = 0 podrían surgir tales divergenciasy se pueden regular introduciendo una masa µ que luego va a cero.

9.4 Renormalización perturbativa

Consideramos un campo escalar con interacción LI(x) =g3!

φ3 en 5+1 dimensiones (d = 6) y métrica

euclídea. Tal teoría se suele denotar φ 36 . Esta teoría no es realista (el hamiltoniano no está acotado inferior-

mente) pero el problema no se manifiesta a nivel perturbativo y tiene diagramas más simples, con vérticesde tres puntos.

El lagrangiano de siempre de la teoría es el llamado lagrangiano renormalizado,

L (x) =12(∂µφ0)

2 +m2

02

φ20 +

g0

3!φ

30 , (9.44)

Éste (junto con el método de regular las divergencias) es el que aparece en la integral funcional y con elque se calculan todos los observables. φ0, es el campo desnudo, m0 la masa desnuda y g0 la constantede acoplamiento desnuda.

217

Page 218: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Las funciones de correlación Gn(x1, . . . ,xn) se refieren no a φ0 sino al campo renormalizado φ(x) =Z−1/2φ0(x). En principio se trataría de calcular con este lagrangiano perturbativamente reajustando cadavez m0, g0 y Z para satisfacer tres condiciones de renormalización (por ejemplo, masa física, constante deacoplamiento física y campo normalizado de modo que el residuo en el polo sea 1). Sin embargo, es mejororganizar el cálculo de otra forma. Por conveniencia el lagrangiano renormalizado se expresa en la forma

L (x) = Lb(x)+Lct(x), (9.45)

con

Lb(x) =12(∂µφ)2 +

m2

2 +g3!

φ3,

Lct(x) =δZ2(∂µφ)2 +

δm2

2 +δg3!

φ3,

(9.46)

Lb(x) es el lagrangiano básico y Lct(x) los contratérminos. m y g son parámetros finitos. En vez de

Z = 1+δZ, m20 = Z−1(m2 +δm2), g0 = Z−3/2(g+δg), (9.47)

se reajustan δZ, δm2 y δg a medida que se hace el cálculo perturbativo. La ventaja es que los contratérminosse pueden tratar como una perturbación, junto con g

3!φ

3.

Una forma estándar de organizar una suma infinita es asignar a cada término una potencia de unparámetro λ , que al final se pone igual a uno. Para las contribuciones generadas por el cálculo perturbativoasignamos un orden en h. Para un lagrangiano tal como el básico (que no tiene dependencia implícita enh) el contaje en h equivale a uno en loops.125 A los diagramas árbol de Lb(x) le asignamos O(h0) y cadanuevo loop introduce una nueva potencia de h. Puesto que el lagrangiano básico ya va a satisfacer lascondiciones de renormalización a nivel árbol, se deduce que los contratérminos deben cancelar el efecto delos diagramas con loops (generados por el lagrangiano básico y los propios contratérminos), por tanto, aδZ, δm2 y δg se le debe asignar O(h),

Lb(x) = O(h0), Lct(x) = O(h). (9.48)

Los diagramas se construyen con 12(∂µφ)2+

m2

2 como parte libre, y g3!

φ3+Lct(x) como perturbación.

Lct(x) contiene vértices de dos y tres puntos. Además añadimos una forma de regular las integrales. Una125Para un diagrama G, L = Pi−∑ν nν +C, donde Pi es el número de líneas internas, C es el número de componentes conexas,

L el número de loops, y nν el número de vértices de orden ν. Si se reescala la acción S→ S/h en Z =∫

Dφe−S, eso equivale a

gν → gν/h, D(p) = hD(p) (D(p)∼(

δ 2Sδφδφ

)−1

). Entonces, G→ hPe+Pi−∑ν nν G = hPe+L−CG. Para G conexo, Gn→ Gnhn+L−1.

Es decir, cada loop da una potencia más de h.

218

Page 219: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

forma es modificar la parte libre de modo que su propagador no sea el usual sino

D(p) = D(p)F(p), D(p) =1

p2 +m2 , (9.49)

donde F(p) es una función del regulador (cutoff) Λ de modo que F(p)→ 1 si p Λ y F(p)→ 0 (sufi-cientemente deprisa) si p Λ.

Las reglas de Feynman (euclídeas) son:

i) por cada línea con momento p un factor D(p). El factor F(p) se puede omitir para líneas externas.

ii) Por cada vértice de tres puntos de Lb, un factor −g.

iii) Por cada vértice de dos puntos con momento k de Lct, un factor −δm2− k2δZ

iv) Por cada vértice de tres puntos de Lct, un factor −δg.

−g

x δm2− x δ g−

2Z kδ

~D(k)

Figura 18: Reglas de Feynman.

Por simplicidad usaremos renormalización a momento cero. Esto quiere decir que las condiciones derenormalización a imponer son:

G−1(p) = m2 + p2 +O(p4),

Γ3(p,q) = g+O(p,q).(9.50)

G(p) es el propagador de dos puntos G2, Γ3(p,q) es la función vértice de tres puntos,126

G3(p,q,k) =−G(p)G(q)G(p+q)Γ3(p,q)(2π)4δ (p+q− k). (9.51)

126La definición de Γ3 incluye un signo para que coincida con g al orden más bajo.

219

Page 220: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Se supone que las funciones tienen desarrollo en serie en momentos en torno a cero. Las condiciones derenormalización son en realidad tres condiciones, a saber,

G−1(p)∣∣∣

p=0= m2,

dG−1(p)d(p2)

∣∣∣p=0

= 1, Γ3(p,q)∣∣∣

p,q=0= g. (9.52)

Los parámetros m y g son inputs; cada elección da una teoría distinta. m y g no son exactamente lamasa física (definida por la posición del polo del propagador) y la constante de acoplamiento física (definidapara partículas sobre la capa másica), pero sirven para renormalizar la teoría. La segunda ecuación equivalea fijar la normalización del campo (similar a fijar el residuo en el polo en la renormalización on-shell). Unavez renormalizada la teoría se puede determinar la posición del polo, etc, y reajustar los parámetros (haceruna renormalización finita).

Procedemos a calcular Γ3(p,q) y G(p). El resultado a nivel árbol (sin loops) se obtiene inmediatamenteaplicando las reglas de Feynman:

G(p) = D(p)+O(h), Γ3(p,q) = g+O(h). (9.53)

Las condiciones de renormalización se cumplen hasta O(h0).

Para Γ3(p,q) hasta O(h) inclusive, se tiene + + x

=−(g+Γb3(p,q)+δg). La corrección de O(h) de Lb a Γ3 procede del diagrama

p

q

p+q

=−Γb3(p,q) =−g3

∫ d6k(2π)6 D(k)D(k+q)D(k− p). (9.54)

Esta integral diverge logarítmicamente, es decir, es O(logΛ) para Λ→ ∞. La divergencia se puedecancelar eligiendo

δg =−Γb3(0,0)+O(h2). (9.55)

Γb3(0,0) = g3

∫ d6k(2π)6 D(k)3 = g3 1

(4π)3 logΛ

m+O(Λ0). (9.56)

El término dominante, O(logΛ), es independiente de la elección de F(p). Nótese que igualmente se obtieneun resultado finito tomando

δg = δgfinito−Γb3(0,0)+O(h2), (9.57)

220

Page 221: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Pero ya no se cumpliría Γ3(0,0)= g. Equivaldría a una renormalización finita adicional (a cambiar la elecciónde g).

Combinando las contribuciones se obtiene

Γ3(p,q) = g+g3∫ d6k

(2π)6

(D(k)D(k+q)D(k− p)− D(k)3)+O(h2). (9.58)

Después de la sustracción el integrando es convergente incluso sin regulador, así que se puede tomar ya ellímite Λ→ ∞:

Γ3(p,q) = g+g3∫ d6k

(2π)6

(D(k)D(k+q)D(k− p)−D(k)3)+O(h2). (9.59)

Obsérvese que no se trata simplemente de sustraer lo que haga falta para que el diagrama quede finito.El punto clave es que δg, δZ y δm2 son parámetros, sin dependencia en momentos (pero con dependenciaen Λ, g y m). La renormalización ha sido posible porque se ha podido elegir un δg cumpliendo estapropiedad.

Para sistematizar el procedimiento, introducimos los operadores Tn, n = 0,1,2, . . .. Por definición, elefecto de Tn sobre una expresión I(p1, p2, . . . , pm) se obtiene quedándose con los términos hasta O(pn)inclusive de I. Es decir, se desarrolla I(λ p1,λ p2, . . . ,λ pm) en serie de potencias de λ , se quitan los términosO(λ n+1) y se pone λ = 1. (El desarrollo en serie debe existir si F(p) es una función suave.) Así las condicionesde renormalización se pueden escribir

T2 G−1(p) = m2 + p2, T0 Γ3(p,q) = g. (9.60)

O también, si introducimos la autoenergía (diagramas irreducibles de una partícula)127

G−1(p) = m2 + p2 +Σ(p) (9.61)

y Γ3(p,q) = g+δΓ3(p,q),T2 Σ(p) = 0, T0 δΓ3(p,q) = 0. (9.62)

La renormalización de Γ3 hasta O(h) se puede expresar como

x =−T0 +O(h2)

127Esta es la versión euclídea de la autoenergía. En la versión Minkowski G−1(p) = D−1(p)−Σ(p).

221

Page 222: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

y por tanto

−Γ3 = +(1−T0) +O(h2).

El diagrama es logarítmicamente divergente. Eso implica que al derivar una vez respec-

to de los momentos externos el resultado ya es convergente. Al aplicar ∂/∂ pµ o ∂/∂qµ , la derivada cae sobre

los propagadores de las líneas internas y eso aumenta el grado de convergencia.

Una importante consecuencia es que, en un desarrollo de Γ3 en serie de potencias de los momentos externos,sólo el término de orden 0 es divergente. Ese término es el que se ha sustraído. Si la divergencia hubierasido mayor, digamos cuadrática en d = 8, habría que derivar más de dos veces para hacer la integral finita,por tanto la parte cuadrática en momentos sería divergente. Pero δg no es un polinomio de grado dos enmomentos, sino de grado cero. No se podría cancelar la divergencia y la teoría no sería renormalizable. Elargumento de derivar respecto de pµ implica que la divergencia es logarítmica y también que esa divergenciano depende de p ó q.

Al mismo tiempo, la primera corrección a Γ3 se obtiene aplicando el operador 1− T0 al diagrama.Por construcción, esta corrección se anula a orden 0 128 en un desarrollo en momentos externos, que esjustamente lo que dice la condición de renormalización ec. (9.62).

Consideremos ahora el propagador. La condición de renormalización es T2Σ(p) = 0. Σ(p) empieza a

O(h). Hasta este orden inclusive las contribuciones son + X

Σ(p) = Σb(p)+δm2 +δZ p2 +O(h2). (9.63)

Σb(p) =−g2

2

∫ d6k(2π)6 D(k)D(p− k). (9.64)

La divergencia de la integral es cuadrática. Derivando 3 o más veces respecto de pµ se convierte en

convergente, Eso implica que la parte divergente es un polinomio de grado 2 en pµ :

128Tn es idempotente, por tanto T0(1−T0) = 0.

222

Page 223: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

= c0 + c1 p2 + finito, c0 = O(Λ2), c1 = O(logΛ). (9.65)

Por tanto basta elegirδm2 =−c0 +O(h2), δZ =−c1 +O(h2). (9.66)

Los contratérminos cancelan las divergencias y están elegidos de modo que se cumplen las condiciones de

renormalización. En diagramas X =−T2 +O(h2)

Obsérvese que el argumento de derivar respecto de p implica que las divergencias son polinomios enp, y por tanto corresponden a operadores locales: las divergencias superficiales se pueden eliminar conoperadores locales añadidos al lagrangiano. El motivo es que las divergencias vienen de distancias cortas yson locales.

En conjunto

Σ(p) = (1−T2) +O(h2).

Nótese que el operador 1−T2 se puede aplicar dentro del integrando en Σb(p), de modo que igual que paraΓ3(p,q), el integrando es automáticamente convergente, sin que en ningún momento se necesite especificarun F(p). Manifiestamente el resultado no depende del regulador (propiedad de universalidad en el límitedel continuo).

n=4

Como es fácil comprobar, las funciones vértice de n puntos con n > 3 son todas directamente UV finitasa un loop. Las de 0 y 1 puntos divergen, pero se pueden eliminar añadiendo contratérminos δλ0+δλ1φ(x)en Lct.

9.5 Renormalizabilidad perturbativa

La teoría λφ 3 es renormalizable perturbativamente en d = 6 pero no para dimensiones mayores. Por

223

Page 224: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

ejemplo, si d = 8, = O(Λ4). Renormalizar esta contribución requiere

(1−T4) , con un contratérmino −T4 = a0 +a2 p2 +a4 p4, es decir,

Lct(x) = δm2φ

2 +δZ(∂φ)2 +δZ4(∂2φ)2. (9.67)

El término (∂ 2φ)2 no está en el lagrangiano original, y por tanto ya no se trataría de reajustar parámetros.En principio se podría decir que ese término estaba presente con acoplamiento cero. El problema es que unavez se introduce el operador no renormalizable (∂ 2φ)2 ese operador va a aparecer en todos los diagramas yva a producir más y más diagramas divergentes que requerirán toda clase de nuevos operadores en Lct(x)de dimensiones cada vez mayores.

Para que la teoría sea perturbativamente renormalizable por divergencias UV 129 es necesario queno contenga operadores de dimensión mayor que la dimensión del espacio, o equivalentemente, que lasconstantes de acoplamiento de cada operador no tengan dimensión negativa.130 Para ver esto, calculemoslas varias dimensiones involucradas. Sea un lagrangiano en d dimensiones

S =∫

ddxL (x), L (x) =12(∂φ)2 +

12

m2φ

2 +gν!

φν , ν = 0,1,2, . . . (9.68)

[S] = M0, [L (x)] = Md , [m] = [∂ ] = M,

[φ ] = Mdφ , dφ =d2−1, [gφ

ν ] = Md , [g] = Mdg , dg = d−ν(d2−1)

[Gn] = [〈φ n〉] = Mndφ , [Gn] = [(∫

ddx)n−1Gn] = M−d(n−1)+ndφ = M(2−n)( d2+1)−2

[Γn] = [GnG−n2 ] = Mdn , dn = 2− 1

2(n−2)(d−2).

(9.69)

Aquí Γn(p1, . . . , pn−1) es la función vértice de n-puntos (incluida la autoenergía), en espacio de momentos,amputada, y no incluye la delta de conservación.

Consideremos un diagrama conexo amputado Γ con nΓ vértices que contribuya a Γn(p1, . . . , pn−1).Genéricamente

Γ = gnΓIΓ, (9.70)

donde IΓ es una integral sobre momentos de los loops. Sea δ (Γ) la dimensión de la integral. Si el diagrama esdivergente, cuando los momentos internos sean muy grandes, las masas en los propagadores y los momentos

129Suponemos que m > 0 de modo que en ningún momento consideramos divergencias infrarrojas.130Esto basta para partículas de espín j ≤ 1/2. Para partículas con j = 1 es necesario además que se acoplen a corrientes

conservadas ya que la parte longitudinal de sus propagadores en espacio de momentos tiende a constante en vez de decrecerpara k grande.

224

Page 225: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

externos serán irrelevantes, la integral irá como Λδ (Γ) por dimensiones. Por ese motivo δ (Γ) se denominael grado de divergencia superficial del diagrama. Si δ (Γ) es positivo la integral es divergente. Si escero, también (logarítmicamente divergente). Si es negativo, la integral es convergente si sólo contieneun loop, pero generalmente puede ser aún divergente por subdiagramas con loops. Sin embargo, como severá, si se pueden eliminar las divergencias superficiales también se pueden eliminar las subdivergencias.En consecuencia, de momento nos preocupamos sólo de la divergencia superficial. Como la dimensión totaldel diagrama es dn independientemente del diagrama concreto, tendremos

dn = δ (Γ)+nΓdg ó δ (Γ) = dn−nΓdg. (9.71)

Podemos distinguir tres casos, según sea ν , o equivalentemente, dg, la dimensión de la constante deacoplamiento. Consideramos sólo d > 2. Los casos d ≤ 2 se pueden estudiar por separado.

dg < 0. Esto ocurre si

ν > νc(d) =2d

d−2. (9.72)

Es decir, si ν supera un valor crítico que depende de la dimensión del espacio. En este caso, δ (Γ)será positivo para un diagrama de orden nΓ suficientemente alto. La teoría es no renormalizableya que contiene divergencias en todas las funciones vértice. Cada función vértice corresponde a unoperador, por tanto para cancelar todas las divergencias se requerirán infinitos contratérminos. (Estoequivale a decir que reinventamos completamente el lagrangiano de la teoría.)

dg = 0. Cuando ν = νc(d), habrá divergencias sólo en las funciones de n puntos tales que dn ≥ 0. Esto ocurresi

n≤ νc(d). (9.73)

Se concluye que sólo hay un número finito de funciones vértice, o equivalentemente operadores,a renormalizar. Estos son precisamente los operadores con dimensión no mayor que d.131 Hay unnúmero finito de contratérminos y la teoría se considera (perturbativamente) renormalizable. Sinembargo, cada operador recibirá correcciones de todos los órdenes, de modo que aunque sólo hay unnúmero finito de funciones de Green superficialmente divergentes, cada una tiene un número infinitode diagramas divergentes.

dg > 0. En este caso δ (Γ) acabará siendo negativo para nΓ suficientemente alto. Es decir, no sólo hayun número finito de operadores a renormalizar, sino que sólo hay un número finito de diagramasdivergentes. La teoría es superrenormalizable. Hay un número finito de contratérminos y cadacontratérmino es un polinomio en g.

131Para esta dimensión se cuenta sólo el operador, no la dimensión de la constante de acoplamiento asociada. Así Z(∂φ)2

tiene dimensión d, m2φ 2 tiene dimensión d−2, m2 no se incluye.

225

Page 226: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Así la teoría gφ 3 es renormalizable si d = 6, que es cuando g es adimensional. Los operadores divergentesson

++ +

Λ Λ Λ6 4 2

Λlog

La teoría es superrenormalizable si d < 6 y no renormalizable si d > 6. Análogamente, λφ 4 y las teoríasgauge son renormalizables en d = 4.

9.6 Renormalización perturbativa a todos los órdenes

Consideremos los siguientes diagramas en la teoría φ 36 ,

(1)

(2)

Superficialmente el primer diagrama es de orden (Λ6)2(Λ−2)5 = Λ2, una divergencia cuadrática. Sin

embargo, la divergencia no es local, como se puede ver derivando respecto de p. En efecto, al aplicar d3

d p3

se obtiene, entre otras, la contribución que no es UV finita porque contiene una subdi-

vergencia. Esto implica que la parte divergente no es un polinomio en p y no se va simplemente reajustandolas constantes de acoplamiento en los contratérminos (que son locales). Sin embargo la subdivergencia secancela con el contratérmino de un loop en el segundo diagrama y como puede comprobarse, el resultadoya sólo tiene divergencias superficiales que se pueden sustraer con un contratérmino local de orden O(h2)(tercer diagrama).

En conjunto se obtiene

R = (1−TG)(1−Tγ)

226

Page 227: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

donde Tγ indica la parte divergente del subdiagrama y TG la parte divergente del diagrama completo(sustraído).

Un caso más complicado es el siguiente. G =p p

q

k−q

q+pp+k

k

De nuevo la divergencia es aparentemente Λ2 pero en realidad no es local. Al aplicar d3

d p3 se ob-

tiene la contribución que no es UV finita porque contiene una subdivergencia:

q

p+k

k−q

k

q+p

p

El diagrama G contiene dos subdiagramas divergentes, γ1 y γ2,

G

21γ γ

Las subdivergencias γ1 y γ2 causan el problema, pero también tenemos los siguientes diagramas del mismoorden en h, procedentes de L

(1)ct (x) (los contratérminos hasta O(h))132

+ xx

(1) (1)

= (−Tγ1−Tγ2)

En conjunto + +x x = (1−Tγ1−Tγ2)

Como se puede comprobar esta integral ya no tiene subdivergencias (han sido sustraídas). La integral

no es todavía UV finita, pero al aplicar d3

d p3 produce una integral convergente. Por tanto sólo tiene la

divergencia superficial y se sustrae como siempre, añadiendo un término O(h2) a los contratérminos.132Tγ denota la operación de aislar la parte divergente del diagrama γ.

227

Page 228: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

R = (1−TG)(1−Tγ1−Tγ2)

El término añadido −TG(1−Tγ1−Tγ2) = x

(2)

es local (polinomio de grado dos en p) y añade δm2(2) y δZ(2) en L(2)

ct (x).

Forest formula. La regla general es [10], dado un diagrama G y siendo γi, i = 1,2, . . ., sus subdiagramasdivergentes (incluido G)

(G)R = ∏i

′(1−Tγi)Gbásico, (BPHZ) (9.74)

donde ∏′ indica desarrollar la expresión y quitar todos los productos de Tγ con pares γi y γ j que se solapen

parcialmente. Por definición solaparse parcialmente quiere decir que γi∩ γ j 6= /0 pero γi 6⊂ γ j y γ j 6⊂ γi.

Así produce

(1−TG)(1−Tγ1)(1−Tγ2)

= (1−TG)(1−Tγ1−Tγ2 +Tγ1Tγ2)

El término Tγ1Tγ2 debe suprimirse porque los subdiagramas γ1 y γ2 se solapan. TGTγ1 y TGTγ2 no debenquitarse porque γ1,2 ⊂ G.

R = (1−TG)(1−Tγ1−Tγ2) .

En regularización dimensional todo funciona igual, excepto que Tγ es el operador que extrae (se quedasólo con) la parte divergente del diagrama. Esta es la parte principal del desarrollo en ε = d−4 (esquemaMS). Sobre esto se puede hacer renormalizaciones finitas (esquema MS).

228

Page 229: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Es importante señalar que el método BPHZ no es simplemente una forma de quitar divergencias yproducir resultados directamente finitos (a un orden dado del desarrollo perturbativo), sino que garantizaque los resultados realmente provienen de un lagrangiano renormalizado, aunque no haga falta especificarlode manera explícita.

9.7 Renormalización no perturbativa

9.7.1 Teoría regulada en el retículo

Consideremos una teoría φ 4. Ponemos el sistema en una red euclídea, xµ = anµ , n ∈ Z4. a es elparámetro de la red, la separación entre vecinos próximos. El límite del continuo es a→ 0. Esto poneun regulador UV con Λ = 1/a. En la práctica también hay que poner un regulador IR quedándose sólocon nµ entre 1 y N (y condiciones periódicas de contorno) de modo que hay N4 puntos en total, pero porsimplicidad no ponemos esa restricción.133 Para las derivadas se puede aproximar

φ(x)→ φn, ∂µφ(x)→ 1a

(φ(x+aeµ)−φ(x)

)≡ ∆µφn (9.75)

Entonces la función de partición pasa a ser

Z[J] =∫

∏n

dφn exp(−∑

na4(

Z2(∆µφn)

2 +Z2

m20φ

2n +

Z2g0

4!φ

4n − Jnφn

))(9.76)

Aquí Z es un parámetro positivo a elegir, igual que m0 y g0. Esto es completamente equivalente a unsistema de los encontrados en mecánica estadística.134 Representa una variable aleatoria φn distribuidacon el peso de Boltzmann e−SE , de modo que la variable fluctúa en torno al mínimo de la acción φn ≡ 0.Valores no nulos de φn están suprimidos por los términos de masa y de interacción y valores no constantesde φn (es decir, que cambien de nodo a nodo de la red) están suprimidos por el término cinético. Jn sirvepara generar las funciones de Green, pero también puede usarse para mover el mínimo otra configuración.

Cuando g0 = 0 la integral es gaussiana y se puede hacer explícitamente. El problema se simplifica enespacio de momentos,

φ(k) = ∑n

e−ikxnφ(xn), φn =∫

π/a

−π/a

d4k(2π)4 eikx

φ(k). (9.77)

133Esto sería para temperatura cero, si se quiere poner el sistema a temperatura finita la dirección temporal se toma menorque las espaciales, de acuerdo con la discusión en 8.3.2.

134Curiosamente lo que en mecánica estadística sería una interacción de vecinos próximos en la teoría de campos es la energíacinética, es decir, no-interacción.

229

Page 230: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

φ(k) es una función de kµ con periodo 2π/a. La integral se puede hacer sobre la primera zona de BrillouinB = [−π/a,π/a]4. Aquí se ve que la red ha suprimido valores de |kµ | por encima de π/a. Para la derivada

∆µφn→eiakµ −1

aφ(k), (9.78)

y para la función de partición libre de interacción y corriente se tiene

Z0[0] =∫

D φ(k)exp

(−∫

B

d4k(2π)4

Z2

(m2

0 +2a2

3

∑µ=0

(1− cos(akµ)

))φ(−k)φ(k)

)(9.79)

con D φ(k) = ∏k∈B dφ(k). La integral es separable.

Los modos típicos en la zona de Brillouin son aquéllos con k ∼ 1a= Λ, pero comparada con el término

de masa tienen una energía cinética del orden de Λ2. En la exponencial están muy suprimidos en el límitedel continuo, no se propagan. Los modos que dominan la integral son aquellos con k Λ o a|kµ | 1. Esdecir, con longitud de onda 2π/|kµ | a, digamos modos “macroscópicos” (comparados con la red). Paraestos modos

2a2

3

∑µ=0

(1− cos(akµ)

)= ∑

µ

k2µ +O(a2) (9.80)

y se recupera el propagador del continuo

Z−1

k2 +m20+O(a2). (9.81)

En espacio de posiciones esto implica una función de correlación del tipo

〈φ(x)φ(x+ r)〉 ∼ra

e−m0r. (9.82)

La caída exponencial indica que m0 es la masa de la partícula intercambiada entre x y x+ r. En tiemporeal se tiene este mismo comportamiento cuando la separación es tipo espacio, si r es un tiempo t se tieneen cambio e−itm0 correspondiendo a un estado estacionario de energía m0. En espacio euclídeo todas lasdirecciones son equivalentes y es una caída exponencial dominada a largas distancias por el estado másligero que es el correspondiente a k = 0, es decir, con energía igual a la masa.

Dado que el término de energía cinética conecta vecinos próximos podría esperarse una correlaciónque dependiera de una distancia L1, ∑µ |x

µ

1 − xµ

2 | en vez de L2 r =√

∑µ |xµ

1 − xµ

2 |2. Sin embargo (9.80)demuestra que no es así; notablemente para los modos más bajos se recupera (emerge) la simetría euclídea

230

Page 231: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

aunque se parte una red que viola esta simetría.

9.7.2 Límite del continuo

Hasta ahora hemos considerado el límite del continuo como aquél en el que el parámetro a tiendea cero en las fórmulas. Sin embargo este punto de vista es insuficiente. La situación es similar al límiteclásico o el límite no relativista. El límite clásico no es exactamente h→ 0, de hecho se puede elegir h = 1,más bien un tratamiento clásico será suficientemente válido para sistemas cuyas acciones (y cambios deacción) son grandes en unidades naturales. En ese caso puede ser útil usar unidades macroscópicas enlos que h es pequeño relativamente. Igualmente, un tratamiento no relativista será suficientemente válidopara sistemas con partículas cuyas energías cinéticas (u otros tipos de energía que no sea la masa) seanpequeñas comparadas con sus masas. En esa situación se va a tener una ley de conservación de la masatotal porque cualquier transferencia importante de masa en energía cinética haría que el tratamiento norelativista dejara de ser válido.

Si decimos que a es grande o pequeño hay que especificar comparado con qué. Dado que los parámetrosm0,g0,Z están por elegir, el candidato obvio es 1/m. a es pequeño si am 1, pero aún no sabemos lo quees m. Para ver esto mejor notemos que a se puede absorber en las distintas magnitudes que aparecen en laacción y se puede trabajar con magnitudes adimensionales. (También se puede decir que elegimos unidadesa = 1 o equivalentemente Λ = 1.) Si definimos las variables

ϕn = Z1/2aφn, m0 = am0, Jn = Z−1/2a3Jn (9.83)

la función de partición se expresa como

Z[J] =∫

∏n

dϕn exp

(−∑

n

(12 ∑

µ

(ϕn+µ −ϕn)2 +

12

m20ϕ

2n +

g0

4!ϕ

4n − Jnϕn

))(9.84)

Esta expresión es puramente matemática, no hay parámetros dimensionales, y de aquí tiene que salir todo(no hay escalas externas de referencia). Las unidades físicas deben emerger de la propia red matemática.

Si consideramos la correlación entre campos en distintos puntos 〈ϕnϕn+`〉c se va a ver que la correlacióndisminuye exponencialmente a medida que la separación crece (digamos a lo largo de un eje)

〈ϕnϕn+`〉c ∼`→∞

e−`/ξ . (9.85)

El parámetro ξ se denomina longitud de correlación, es la distancia hasta donde hay una correlaciónapreciable entre dos observables locales. ξ depende de los únicos parámetros disponibles, m0 y g0. Lalongitud de correlación define una unidad de longitud natural en el sistema. En unidades de la longitud decorrelación a = 1/ξ y el límite del continuo a→ 0 corresponde a

ξ → ∞ (límite del continuo). (9.86)

231

Page 232: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Se puede entonces identificar el continuo en el plano (m0,g0) como la línea sobre la que ξ diverge (ob-viamente suponiendo que tal línea exista). Visto como un sistema de mecánica estadística, la divergenciade ξ identifica un punto (o línea) crítica correspondiente a una transición de fase de segundo orden. Lejosde la línea crítica ξ es del orden de la unidad y crece a medida que nos acercamos a los valores críticos.Estrictamente hablando no puede haber transición de fase si el sistema es finito (N finito) pero sí de modoaproximado para 1 ξ . N.

Hay que notar que en la práctica nunca se va a trabajar con valores críticos sino sólo “cerca” de lalínea crítica. Esto es así primero porque cuando la longitud de correlación crece todos los nodos de la redse acoplan y las fluctuaciones divergen. Pero existe el problema adicional de que la red va a ser de tamañofinito, con N puntos en cada dirección. El tamaño físico es L = aN y para N fijo L tiende a cero cuandoa→ 0, esto es al acercarnos al punto crítico. Hay que buscar un compromiso entre tener Λ suficientementegrande y V (volumen) también suficientemente grande. En todo caso se necesita N lo más grande posible,generalmente limitado por los recursos de cálculo disponibles.

El siguiente paso es fijar la escala física. Por la representación de Lehmann (esto es por unitaridad einvariancia Lorentz) se debe tener el comportamiento

〈φ(x)φ(x+ r)〉c ∼r→∞

e−mr, (9.87)

donde m es la masa de la partícula más ligera creada al aplicar φ(x) sobre el vacío. (Suponemos m > 0, parapartículas sin masa se obtendría una caída tipo inverso de una potencial en vez de exponencial, Coulomben vez de Yukawa.) La teoría matemática no tiene ninguna escala externa y no puede fijar el valor de m enunidades tales como GeV. Nosotros decidimos arbitrariamente el valor de m, por ejemplo m = 0.94GeV ocualquier otro valor y eso fija la escala de la red.135 Comparando con (9.85).

〈φ(x)φ(x+ r)〉c ∼r→∞

e−mr, 〈ϕnϕn+`〉c ∼`→∞

e−`/ξ , (9.88)

y teniendo en cuenta que r = a` , se deduce m =1

aξ, es decir

a =1

mξ, Λ =

1a= mξ . (9.89)

Dado que m es conocido y ξ también eso fija el tamaño de a en unidades físicas (por ejemplo fm) y portanto Λ.

Una vez que se ha fijado la escala se pueden obtener las masas de otras partículas. Tomando un operadorlocal O(x) que produzca estados con masa mO se tendrá

〈O(x)O(x+ r)〉 ∼r→∞

e−mOr, 〈OnOn+`〉c ∼`→∞

e−`/ξO , (9.90)

135En el universo descrito por (9.84) m = 0.94GeV sería la definición de lo que es 1GeV.

232

Page 233: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

siendo ξO la longitud de correlación para el operador O en la red. De aquí se deduce

mO =1

aξO= m

ξ

ξO. (9.91)

Todo esto está hecho para un punto (m0,g0) tal que ξ es relativamente grande, pero no infinito. Paraque exista un límite al continuo propiamente dicho se deben cumplir al menos dos condiciones. Una esque se restaure la invariancia rotacional, es decir, las longitudes de correlación sean isótropas usando unamétrica euclídea. Otra es que las longitudes de correlación ξO de distintos observables escalen de modo queξO/ξO′ tenga un límite cuando nos acercamos a la línea crítica (hipótesis de escalamiento). En realidadla escala física y el límite al continuo lo van a fijar los operadores que produzcan estados más ligeros (esdecir, con mayor longitud de correlación). Si hay operadores con ξO que no crece o crece menos que otrosesto no invalida escalamiento, simplemente esos operadores producen estados con masas del orden de Λ

que no se propagan en unidades físicas y no sobreviven en el continuo. Ese sería el caso de los operadoresque rompen invariancia rotacional.

ξ =

m

g

0

0

g= cte

Figura 19: Evolución sobre la línea de física constante. La flecha indica la dirección de ξ creciente.

En este esquema m está fijado (a mano), no depende de (m0,g0). Si comparamos con (9.43), teniendoen cuenta que m0/Λ = am0 = m0, se tiene

m = Λm0 f1(m0,g0), f1(m0,g0) =1

m0ξ (m0,g0)(9.92)

que da la relación entre f1 y ξ . Por otro lado

g = f2(m0,g0) (9.93)

es válida en el retículo ya que g se define sin necesidad de teoría de perturbaciones a partir de la correlaciónentre cuatro campos (u otros operadores locales) en la red. La línea de física constante es la curva enel plano (m0,g0) correspondiente a un valor dado de g (m ya es constante en todo el plano). Idealmentese tendría una situación como en la Fig. 19. Un punto sobre la curva corresponde a un cierto valor de

233

Page 234: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Λ = mξ . El límite al continuo con g constante se obtiene acercándose a la línea crítica sobre la curvade física constante. Si todo va bien todas las funciones de correlación escalan correctamente y se obtieneresultados físicos.

ξ

g

g

ξ2

2

0

g1

g2

<

g1

ξ1

c

c

Figura 20: Problema de trivialidad. Las curvas de física constante llegan a un valor máximo ξ < ξ c(g) que sólopuede aumentarse con g→ 0.

Para QCD el punto crítico está en gc = 0 y la renormalización funciona por la propiedad de libertadasintótica. No es así para QED o φ 4 que tienen el problema de trivialidad (no son renormalizables a nivelno perturbativo). Lo que ocurre para φ 4 se puede ver mejor usando como variables (ξ ,g0) en vez de (m0,g0)(Fig. 20). El problema es que la curva de física constante, al mover g0 de modo que ξ crezca, tiende aun valor constante de ξ . Por tanto no llega a ξ = ∞ necesario para Λ→ ∞. La única forma de que crezcaξ es tomar un valor de g más pequeño, eventualmente sólo hay límite al continuo si g = 0, es decir si lateoría es libre o trivial. Para un g dado no trivial hay un valor máximo del regulador, Λc. La teoría funcionarazonablemente bien para escalas de energía k por debajo de Λc y no puede usarse a escalas mayores. ParaQED la escala es el polo de Landau, ΛLandau = mee3π/2α = me10280. Este es un valor enorme por lo queQED no presenta inconsistencias en aplicaciones prácticas. Nótese que ΛLandau es infinito en cualquier ordenperturbativo, la teoría es renormalizable en cada orden de teoría de perturbaciones.

9.8 Grupo de renormalización

9.8.1 Trivialidad

Consideremos la teoría φ 44 (φ 4 en d = 4) y en espacio euclídeo (esto no es relevante). La regla de

Feynman del vértice es −g0. De acuerdo con el cálculo perturbativo

= + 3x + O(g )30

−Γ4 = (9.94)

234

Page 235: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

La constante renormalizada se puede definir como g = Γ4∣∣

p=0, y eso nos da

g = g0−g20IΛ +O(g3

0) (9.95)

conIΛ = 3

∫ d4k(2π)4 DkDk+p

∣∣∣p=0

= c log(Λ/m)+O(1), c > 0 (9.96)

Usando (9.28) y notando que la masa se puede despreciar en la integral se obtiene c = 3/(8π2). Aunquem es irrelevante para el valor de c sí aparece en IΛ. Siempre va a haber una escala IR (de baja energía)acompañando a log(Λ).

Para renormalizar la teoría debemos elegir g0(Λ) de modo que g no dependa de Λ. Pero hay unaobstrucción: si escribimos (9.95) para 1/g se tiene

1g=

1g0

+ IΛ +O(g0). (9.97)

Cuando Λ→ ∞ también IΛ→+∞, eso quiere decir que al acercarnos al límite del continuo eventualmenteIΛ > 1/g lo cual requerirá un g0 < 0 pero valores negativos de g0 no son admisibles ya que producen unateoría con hamiltoniano no acotado inferiormente (V (φ)∼ g0φ 4 es aditivo en H). Si queremos que g0 > 0eso pone un límite al valor máximo de Λ para un g dado. Por otro lado si con g0 > 0 insistimos en llevarΛ→∞ la única opción es hacer g→ 0. Es decir, la teoría es trivial, es la teoría libre. Este es el problema detrivialidad para algunas teorías que son renormalizables perturbativamente. En esta conclusión es esencialel argumento de estabilidad del hamiltoniano y que c > 0.

9.8.2 Función beta

El mismo resultado se puede formular mediante la función beta. Esta función se define como

β (g0) =dg0

d logΛ(9.98)

La derivada se refiere a que g0 tiene un running al variar Λ para reproducir un g dado. Teniendo en cuentaque

dgd logΛ

= 0 (9.99)

(g no cambia con Λ), podemos derivar respecto logΛ en (9.95) y se tiene (para Λ grande)

0 =−cg20 +β (1−2g0c log(Λ/m)+O(g2

0))+O(g30) (9.100)

235

Page 236: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

es decirβ (g0) = cg2

0 +O(g30) (9.101)

Usando este resultado y la definición de β tenemos una ecuación diferencial que se puede integrar para dar

1g0

=−c log(Λ/µ)+O(g0) (9.102)

siendo la escala µ una constante de integración. Dado que c > 0 se deduce que eventualmente, para Λ > µ

la constante de acoplamiento desnuda pasará a ser negativa. Otra forma de decirlo

ξ =Λ

µ= e−1/(cg0)+O(1) (9.103)

implica que en la red la longitud de correlación sólo puede ir a infinito cuando g0→ 0−.

La situación es similar en QED. En QCD, la función vértice de tres gluones se puede usar para definirg renormalizada. Hasta un loop se tienen los diagramas

++

que dan lugar a

g = g0 + cg30 log(Λ/µ)+O(g5

0) c =1

(4π)2

(113

Nc−23

N f

)(9.104)

A la constante c contribuye el loop de gluones positivamente y los quarks negativamente, siendo Nc elnúmero de colores y N f el número de sabores de quark. Para tres colores y seis sabores c > 0 y hay libertadasintótica. (En QED sólo hay loop de electrones y resulta c < 0.) De nuevo se puede reescribir la ecuacióncomo

1g2 =

1g2

0− c log(Λ2/µ

2)+O(g20) (9.105)

Para que el lagrangiano sea hermítico g0 debe ser real y por tanto g20 > 0, pero ahora no hay ningún

problema en compensar Λ→∞ con g0→ 0 (g0 = 0 es el valor crítico en QCD) de modo que g se mantengaconstante.

Para la función beta se tieneβ (g0) =−cg3

0 +O(g50) (9.106)

236

Page 237: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Integrando la ecuación que define la función beta se tiene (hasta un loop)

g20 =

1c log(Λ2/Λ2

QCD), ξ =

Λ

ΛQCD= e1/(2cg2

0). (9.107)

No hay obstrucción para que ξ diverja al acercarse al valor crítico g0 = 0. Que g0 disminuya al quitar elregulador refleja la propiedad de libertad asintótica, la interacción se debilita en el UV. ΛQCD es la escalapor encima de la cual se puede utilizar teoría de perturbaciones (g0 es pequeña).

Notablemente un resultado similar se satisface para φ 36 que también tiene libertad asintótica como se

ve de (9.54) (c > 0), aunque en este caso la teoría no es estable ya que φ 3 no está acotado inferiormente.

En gluodinámica (QCD con N f = 0, esto es, sin quarks) la acción en el retículo es la acción de Wilson,la versión discreta de 1

4g20F2

µν con Fµν no abeliano [11]. Sólo hay una constante de acoplamiento. El límitedel continuo se alcanza para g0→ 0. La escala se fija calculando la longitud de correlación del operadorO(x) = F2

µν por ejemplo y asignando una masa a ese estado (el glueball más ligero). Aunque la teoríaclásica es invariante de escala su versión genera una escala (arbitraria) espontáneamente, es el fenómenode transmutación dimensional.

En QCD con dos sabores de quarks ligeros degenerados en masa (u y d) y otro más pesado (s) haytres parámetros (g0 y las dos masas desnudas) que se pueden fijan por ejemplo con la masa del nucleón oel mesón ρ (esto esencialmente fija a para un g0 dado), el pión (fija la masa desnuda ligera) y el kaón (fijala masa desnuda del quark extraño). A partir de ahí está todo fijado en el límite g0→ 0.

9.8.3 Running de la constante de acoplamiento

A efectos de renormalizar la teoría cualquier definición razonable de g es válida, por ejemplo a momentocero, pero si estamos trabajando en una cierta escala de energía el valor relevante puede ser otro. Así paraφ 4

4 y para una escala µ se puede definir g como el valor de Γ4(p1, p2, p3, p4) con p j de orden de µ

g(µ) = Γ4(p1, p2, p3, p4)∣∣

p j≈µ(9.108)

por ejemplo p1 = p3 = (µ,0), p2 = p4 = (0,0). El valor de la constante de acoplamiento cambia con laescala de energía. Al orden más bajo

g(µ) = g0−g20 IΛ(µ), IΛ(µ) = c log(Λ/µ), c > 0. (9.109)

Se supone µ & m de modo que m se puede despreciar y µ domina la escala IR de la integral. Se tieneentonces

1g(µ)

=1

g0(Λ)+ c log(Λ/µ) (9.110)

237

Page 238: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

g depende de µ pero no de Λ y g0 depende de Λ pero no de µ. Dado que c > 0, la fórmula indica que gcrece con µ y g0 crece con Λ y lo hacen de la misma forma, como se ve escribiendo la ecuación de modosimétrico entre (g,µ) y (g0,Λ)

1g(µ)

+ c log(µ) =1

g0(Λ)+ c log(Λ)≡ c log(Λc) (9.111)

El valor de Λc no depende de la escala µ ni del regulador Λ. Queda fijado para toda la teoría una vezse especifica el valor de g para alguna escalar µ. Como se ha visto la teoría φ 4

4 no se renormalizable (ensentido no perturbativo) ya que Λ no puede superar el valor de Λc y lo mismo le pasa a µ.

Para QCD en cambio (a un loop)

1g2(µ)

=1

g20(Λ)

−2c log(Λ/µ), c > 0 (9.112)

o equivalentemente1

g2(µ)−2c log(µ) =

1g2

0(Λ)−2c log(Λ)≡−2c log(ΛQCD). (9.113)

La fórmula a un loop es aplicable sólo para µ ΛQCD de modo que g(µ) sea pequeña. g(µ) tiene libertadasintótica. Hasta un loop

g2(µ) =1

2c log(µ/ΛQCD)µ ΛQCD. (9.114)

Se define una función beta para g(µ) de forma completamente similar a la de g0(Λ),

β (g) =dg

d log µ(9.115)

Para QCD hasta un loop β (g) = −cg3 +O(g5). Nótese que β depende sólo de g no de µ. En general,calculando β (g) se puede obtener el running de la constante de acoplamiento con la escala, integrando laecuación

log(µ/µ0) =∫ g(µ)

g(µ0)

dgβ (g)

(9.116)

donde µ0 es una escala de referencia.

238

Page 239: INTRODUCCIÓN A LA TEORÍA DE CAMPOS …salcedo/public/tcc/curso.pdfUsando la métrica se puede pasar de las componentes covariantes a las contravariantes de un tensor y viceversa:

Referencias

[1] Gravitation, C. W. Misner, K. S. Thorne and J. A. Wheeler (Freeman, 1973).

[2] R. F. Streater and A. S. Wightman, PCT, spin and statistics, and all that, (Princeton Univ. Press,2000) 207 p.

[3] J. W. Negele and H. Orland, QUANTUM MANY PARTICLE SYSTEMS, (Addison-Wesley, 1988)459p.

[4] L. L. Salcedo, Integral de Caminos,http://www.ugr.es/local/salcedo/public/mc2/curso.pdf

[5] K. Huang, Quantum field theory: From operators to path integrals, (Wiley, 1998) 426p.

[6] T. Banks, Modern Quantum Field Theory, (Cambridge University Press, 2008)

[7] F. Mandl and G. Shaw, Quantum field theory, (John Wiley, 1993).

[8] M. Tanabashi et al. [Particle Data Group], Review of Particle Physics, Phys. Rev. D 98 (2018) no.3,030001. doi:10.1103/PhysRevD.98.030001

[9] J. Glimm and A. M. Jaffe, Quantum physics. A functional integral point of view, (Springer, 1987)535p

[10] J. C. Collins, Renormalization. An introduction to renormalization, the renormalization group, and theoperator product expansion, (Cambridge Univ. Press, 1984) 380p.

[11] M. Creutz, Quarks, gluons and lattices, (Cambridge Univ. Press, 1985)

239