Mónica Bècue Crono

Embed Size (px)

DESCRIPTION

ANÁLISIS DE UN CORPUS CRONÓLOGICO

Citation preview

Introduccin

ANLISIS DE UN CORPUS CRONLOGICO:

UN CORPUS DE SENTENCIAS DEL TRIBUNAL SUPREMO

Mnica Bcue Bertaut e-mail: [email protected]

Universitat Politcnica de Catalunya

Indice de la exposicin:

1: Introduccin

2: Corpus

3:Objetivos y metodologa

4: El vocabulario de las sentencias

5: Segmentacin en perodos temporales homogneos

6: Caracterizacin lxica de los perodos

7: Progresividad de los cambios

8. Importancia de las personas

9. Conclusin

1. Introduccin

Las sentencias judiciales constituyen un ejemplo privilegiado del funcionamiento de la institucin judicial.

Se decidi analizar un corpus de sentencias del Tribunal Supremo emitidas entre 1979 y 1996.

Todas las sentencias tienen que traducir una misma norma jurdica y se puede considerar el conjunto como un discurso emitido por una misma fuente textual, el Tribunal Supremo, aunque estn pronunciadas por distintos jueces, y redactadas por ponentes distintos que dejan su propio sello.

2. Corpus

El corpus est constituido por

fundamentos de derechode todas las sentencias del Tribunal Supremo emitidas entre 1979 y 1996 concernientes a delitos relativos a la prostitucin,

430 sentencias.

Ha sido constituido por Carmen Rodrguez a partir de la base de datos de jurisprudencia del Tribunal Supremo de Aranzadi.

36 jueces distintos participan en la elaboracin de dichas sentencias.

Normalizacin del corpus

798081828384858687888990919293949596

C.P.15412010000000000014

G.S.52350100200000000018

H.P.31132301000000000014

G.L.C.22222400000000000014

L.B.03422431000000000019

R.L.00032114100000000012

C.M.P.12312112000202111222

D.P.41000001002212100014

G.M.24227100024213311035

H.A.L.32221303010201000020

V.M.02211241110100000016

M.M.00321220032200142024

D.V.R.00000010000024101211

Mo.M.00000000101012212010

S.N.00000000102110231112

G.A.00000000011231030011

R.V.00000000001144312016

B.Z.00000000002021130413

M.F.C00000000001212226016

M.P.00000000000111521011

P.L.00000000000201412111

M.P.R.00000000000002642418

C.P.F.00000000000000552012

TOTAL2124262422221313681620172637312314363

Cuadro 1. Reparto de las sentencias por ao y ponente.

798081828384858687888990919293949596

C.P.

G.S.

H.P.

G.L.C.

L.B.

R.L.

C.M.P.

D.P.

G.M.

H.A.L.

V.M.

M.M.

D.V.R.

Mo.M.

S.N.

G.A.

R.V.

B.Z.

M.F.C

M.P.

P.L.

M.P.R.

C.P.F.

Cuadro 2. Perodos de actividad de los ponentes

3. Objetivos y metodologa

Para los socilogos: estudiar el proceso de toma de decisin de los jueces

Para los estadsticos: metodologa para estudiar un corpus cronolgico a varias voces y, si necesario.

Se intenta responder a las siguientes preguntas:

existe o no una evolucin en el proceso de decisin?

si existe en qu fecha se producen los cambios?

cules son sus caractersticas?,

la evolucin observada corresponde a los cambios realizados en el Cdigo Penal o se realiza independientemente de los cambios en la doctrina?

Se utilizan:

Herramientas provenientes de la estadstica lxica:

el reparto del vocabulario

el modelo de crecimiento del vocabularioHerramientas provenientes del anlisis de datos textuales:

anlisis de correspondencias clasificacin automtica

seleccin de palabras caractersticas de las partes del corpus

4. El vocabulario de las sentencias: frecuencia, reparto e incremento del vocabulario

Longitud del corpus: 507.475 ocurrencias

Palabras distintas: 19.376 palabras distintas.

Palabras pronunciadas al menos 10 veces: 3494 (93% del corpus)

Longitud promedia de las sentencias pronunciadas en 1979: 803.5 palabras

Longitud promedia de las sentencias de 1996: 1436 palabras

Las sentencias del ao 1983 son, con 653 palabras, las ms cortas y las sentencias de 1991, con 1887 palabras, las ms largas

El ponente H. A.-L. es el menos prolijo y C.-P. F. el ms prolijo con sentencias de longitud media, respectivamente, 579 y 2611 palabras.

Glosario de las palabras ms frecuentes

Entre las palabras ms frecuentes, se encuentran palabras ligadas a las siguientes temticas:

doctrina penal y leyes (artculo, ley)

actuaciones procesales (casacin, recurso, sentencia, delito, resolucin, tribunal, causa,)

delitos relativos a la prostitucin (prostitucin, tercera, rufianismo,)

circunstancias del delito (local, pesetas,)

actores usuales en un proceso (procesado/a/os, acusado/a/os, autor, fiscal, letrado ), actores usuales en una situacin de prostitucin (clientes, camareras,),

fundamentos de la decisin judicial (moral, inmoral, escndalo, prueba, presuncin de inocencia, atenuante, agravante,)

palabras argumentativas generales (considerando, confrontar,)

palabras herramientas

Incremento del vocabulario

El vocabulario aparece progresivamente en el corpus: a medida que el corpus se alarga

El ritmo de aparicin de palabras nuevas disminuye, aunque siempre aparecen nuevas palabras.

El ritmo de aparicin de vocabulario nuevo (Muller (1977); Hubert y Labb (1993)) constituye una informacin relevante

FigFigura 1. Incremento del vocabulario:

Diferencia entre incremento observado e incremento esperado

Reparto del vocabulario

El ndice de reparto (Hubert et Labb, 1990) mide la regularidad del reparto de las palabras.

Vara entre 0 y 1:

prximo a 1: uso regular

prximo a 0 : uso local de la palabra.

Entre las palabras regulares:

trminos judiciales relativamente comunes (doctrina, ley, caso, infraccin, preceptos esenciales, sentencia, legalidad, etc.)

eventualmente ligados al hecho de interponer un recurso (casacional, revisin, etc.)

relativas al tipo de delito comn a todas las sentencias (sexo, ilcito, ejerca, ejercer, etc.)

adverbios que indican la conviccin

Las palabras localizadas corresponden a:

aspectos muy particulares de algunas sentencias (presencia de otro delito como la droga, presencia de armas, etc.),

propias de un ponente (costumbres verbales, por ejemplo) o

estar ligadas a un periodo y ser, por tanto, resultado de la evolucin del vocabulario

Nota: existe un nmero importante de palabras que presentan un valor del ndice de reparto entre 0.4 y 0.6

5. Segmentacin del corpus en perodos temporales homogneos

Metodologa

Tabla Aos ( Palabras (palabras utilizadas al menos 10 veces) = tabla de contingencia

Anlisis de correspondencias de la tabla Aos ( Palabras

Clasificacin automtica para reagrupar los aos que presentan perfiles lxicos similares.

Anlisis de correspondencias

Figura 2. Primer plano factorial del anlisis

Clasificacin de los aos a partir de sus coordenadas factoriales

Figura 3. rbol jerrquico construido a partir de las distancias entre aos

6. Caracterizacin lxica de los perodos

Antes de 1988: palabras sobrerepresentadas

Sustantivos: camareras, prostitucin, considerandos, hombres, bar, procesada, tercera, procesado, trfico, favorecimiento, decreto, auxilio, precepto, nmero, corrupcin, precio, modalidades, escndalo, texto, mujeres, entrega, resumen, ponente, clientes, seor, jurisdiccin, prostitutas, cooperacin, casacin, consistencia, omisiones, facilitacin, inciso, lacra, resolucin, reservado, proxenetismo, huella, delito, improcedencia, corriente, estrago, sujetos, causa, reservado, camarera, lucro, mrito, ndole, urgencia, empleo, cantidades, pudor, peligrosidad, matrimonio, comercio, consumiciones, trato, procesados, origen, grado, yacimiento, pisos, moralidad, apartados, vicio, mitad

Adjetivos: carnal, seguida, criminal, dictada, inmoral, interpuesto, siendo, moral, mentado, legal, empleadas, refundido, marginal, excelentsimo, impugnada, sealada, explotado, relativos, carnales, fctica, citado, locativa, lcita, impdicas, delictiva, tica, incardinada, ajenas, perniciosos, venal, mismos, encaminadas, activos, colectiva, organizada, buenas, prostituidas, general, inferiores, viciosa, social, defensiva, acuartelada, terminante

Verbos: considerando, resultando, cohabitar, desestimar, comprende, careciendo, revisado, tipifica, solicitaban, explotar, declara, facilitar, quedan, anula

Adverbios: ordinariamente, anteriormente, indiscriminadamente, explicitamente

Pronombres: cuyo

Abreviaciones y nmeros que hacen referencias a leyes, a instituciones judiciales o a otras sentencias:RJ, 1, 1963/759, 691/1963, TS, dis_estudiadas, CP, 16, 1981/1517, 3096/1973, 1956/438, 1982/3544, 438, 1973\2255, 1975\2330, 1981\2093, 900, 1009 28, 17, VII, 1981\147, 1981\143, DL

A partir de 1988: palabras sobrerepresentadas

Sustantivos: prueba, derecho, declaraciones, inocencia, acusado, presuncin, juicio, vulneracin, fundamentos, pruebas, cargo, motivo, error, hecho, acusados, registro, fundamento, documentos, valoracin, constitucin, principio, folio, instruccin, libertad, folios, apreciacin, defensa, acta, violacin, va, vctima, fiscal, juzgado, credibilidad, testigos, entrada, denuncia, apoyo, ministerio, testimonio, conviccin, testigo, juez, agresin, detencin, inmediacin, acusada, garantas, existencia, informe, autor, manifestaciones, declaracin, documento, proceso, respuesta, base, jurisprudencia, polica, diligencias, relacin, inadmisin, intervencin, contradiccin, secretario, experiencia, letrado, pub, igualdad, impugnacin, violencia, atestado, validez, seccin, mdico, inhabilitacin, asistencia

Adjetivos: oral, probatoria, judicial, constitucional, fundamental, casacional, desestimado, documental, prestadas, plenario, provincial, efectiva, procesal, acusatorio, correlativo, especial

Verbos: ha, vanse, confrontar, dijo, existe, debe, aduce, dice, podido, cabe

Adverbios: no, aqu, ni

Pronombres: nos, ello, ti

Abreviaciones y nmeros que hacen referencias a leyes, a instituciones judiciales o a otras sentencias: APNDL, CE, RTC, 24, LOPJ, 1978\2836, 2875, 1985\1578, 8375, 2635, 849, 885, LECR, TC, dieciocho, 3/1989, 85, 1989\1352

7. Progresividad de los cambios

Incrementos lxicos caractersticos

Los incrementos lxicos (Salem, 1991 y 1993) permiten comparar el vocabulario de un perodo con los vocabularios de los perodos anteriores

En 1985 crece la frecuencia de error, acusado, folio, inocencia, y presuncin: el cambio es ms marcado a partir de 1988, pero se incuba antes.

Las fechas parecen coincidir con el relevo generacional que se produce, principalmente, entre 1985 y 1988.

Especificidades cronolgicas

Ciertas palabras pueden caracterizar no slo un perodo sino un grupo de perodos consecutivos.

Se determinan:

las palabras caractersticas de cada perodo (es decir, del primer nivel)

las de grupos de dos perodos consecutivos (palabras caractersticas del segundo nivel),

las de grupos de tres perodos consecutivos (palabras caractersticas del tercer nivel

Cada palabra se asocia al perodo o grupo de perodos que mejor caracteriza; es decir, aquel para el cual la probabilidad asociada al test es la menor

Aqu, se opera ao por ao, para as decidir sin a priori los grupos de aos que caracteriza una palabra.

Esto permite confirmar que existe un corte principal en 1988: numerosos trminos caracterizan globalmente los aos 79-87 y otros 88-96.

No obstante, derecho, presuncin, inocencia, juicio, fundamentos y CE caracterizan el conjunto de los aos que van desde 1985 hasta 1996.

8. Importancia de las personas

Cul es el ponente ms original (de un punto de vista lxico)?;

Cul es el ms central?

La distancia entre jueces es o no ms importante que la distancia entre aos? o, con otras palabras,

Cul es la importancia relativa de la cronologa y del factor humano?.

Quin es el primer ponente que emplea un cierto tipo de argumentacin?

Otros ponentes le siguen?

Existe una tendencia global seguida por el conjunto de los ponentes?

Se entremezclan, y eventualmente se contraponen, distintos modelos de toma de decisin en un mismo perodo?

Ejemplo: la palabra defensa es

la palabra ms caracterstica del conjunto de las sentencias redactadas por B-Z (68 de las 233 citaciones provienen de este conjunto)

un incremento especfico para cada uno de los aos en los cuales B-Z redacta la mayora de las sentencias (es decir, 1989, 1991, 1994, 1996).

9. Conclusin

Los resultados se obtienen a partir del texto en bruto, sin necesitar ningn tratamiento previo

Se efecta un anlisis sin a priori que permite limitar de manera considerable la subjetividad del investigador por una parte.

Las herramientas estadsticas empleadas se pueden aplicar sin ninguna dificultad a corpus muy voluminosos, lo que les constituye en un poderoso instrumento para extraer informacin de textos.

Los anlisis no agotan toda la informacin contenido en este corpus: el estudio diferencial de los ponentes es uno de los principales objetivos de la continuacin de este trabajo.

Nota sobre el software

Se ha utilizado el software DTM (Data and Text Mining; Lebart L., Bcue M., Lambert T.), concebido como un software universitario. El reparto del vocabulario y el Modelo de incremento del vocabulario, estn programados en rutinas independientes Mnica Bcue segn las indicaciones dadas por D. Labb en las publicaciones citadas

Referencias

Bcue M. (2000) (Ed) Instrumentos metodolgicos para el estudio de las instituciones. GRES, UAB, Barcelona

Bcue M., Rodrguez C. (2000) Las sentencias del Tribunal Supremo. Un discurso a varias voces in: Instrumentos metodolgicos para el estudio de las instituciones. Bcue M. (ed), GRES, UAB, Barcelona

Bolasco S. (1992),Sur diffrentes stratgies dans une analyse des formes textuelles : Une exprimentation partir de donnes d'enqute, inActes de les Jornades Internacionals d'Anlisi de Dades Textuals, M. Bcue, N. Rajadell y L. Lebart (Eds), Servei de Publicacions de la UPC, Barcelona.

Hubert, P., Labb, D.(1998),Un modle de partition du vocabulaire in Etudes sur la richesse et structure lexicales, D. Labb, Ph. Thoiron y D Serant (Eds), Slatkine-Champion, Pars-Ginebra.

Hubert P., Labb D. (1990), La rpartition des mots dans le vocabulaire prsidentiel, Mots, 22, pp. 80-92.

Labb D., Thoiron Ph., Serant D. (1988), Etudes sur la richesse et la structure lexicales. Champion-Slatkine, Paris-Genve.

Lafon, P.(1981), Dpouillements et statistiques en lexicomtrie, Slatkine-Champion, Pars

Lebart L., Salem A, Bcue M. (2000), Anlisis estadstico de datos, Milenio, Lrida.

Muller Ch. (1977), Principes et mthodes de statistique lexicale, Hachette, Pars.

Salem A. (1991), La lexicomtrie chronologique in: 4 colloque de Lexicologie Politique. Paris.

El estudio de este corpus, en colaboracin con Carmen Rodrguez, se encuentra publicado en Instrumentos metodolgicos para el estudio de las instituciones, M. Bcue (ed), publicacin del Gres, UAB, bajo el ttulo Las sentencias del Tribunal Supremo. Un discurso a varias voces.

1213

_1034960124.doc

4

0

0

3

0

0

2

0

0

1

0

0

0

-

1

0

0

-

2

0

0

I

n

d

e

x

C

2

1

9

9

6

1

9

9

5

1

9

9

4

1

9

9

3

1

9

9

2

1

9

9

1

1

9

9

0

1

9

8

9

1

9

8

8

1

9

8

7

1

9

8

6

1

9

8

5

1

9

8

4

1

9

8

3

1

9

8

2

1

9

8

1

1

9

8

0

1

9

7

9

Aos

Vocabulario observado-vocabulario esperado segn el modelo

_1056444283.doc

1979

1981

1980

1982

1987

1985

1983

1984

1986

1988

1989

1990

1992

1991

1996

1993

1995

1994