Upload
jamesaugusto
View
217
Download
0
Embed Size (px)
DESCRIPTION
ANÁLISIS DE UN CORPUS CRONÓLOGICO
Citation preview
Introduccin
ANLISIS DE UN CORPUS CRONLOGICO:
UN CORPUS DE SENTENCIAS DEL TRIBUNAL SUPREMO
Mnica Bcue Bertaut e-mail: [email protected]
Universitat Politcnica de Catalunya
Indice de la exposicin:
1: Introduccin
2: Corpus
3:Objetivos y metodologa
4: El vocabulario de las sentencias
5: Segmentacin en perodos temporales homogneos
6: Caracterizacin lxica de los perodos
7: Progresividad de los cambios
8. Importancia de las personas
9. Conclusin
1. Introduccin
Las sentencias judiciales constituyen un ejemplo privilegiado del funcionamiento de la institucin judicial.
Se decidi analizar un corpus de sentencias del Tribunal Supremo emitidas entre 1979 y 1996.
Todas las sentencias tienen que traducir una misma norma jurdica y se puede considerar el conjunto como un discurso emitido por una misma fuente textual, el Tribunal Supremo, aunque estn pronunciadas por distintos jueces, y redactadas por ponentes distintos que dejan su propio sello.
2. Corpus
El corpus est constituido por
fundamentos de derechode todas las sentencias del Tribunal Supremo emitidas entre 1979 y 1996 concernientes a delitos relativos a la prostitucin,
430 sentencias.
Ha sido constituido por Carmen Rodrguez a partir de la base de datos de jurisprudencia del Tribunal Supremo de Aranzadi.
36 jueces distintos participan en la elaboracin de dichas sentencias.
Normalizacin del corpus
798081828384858687888990919293949596
C.P.15412010000000000014
G.S.52350100200000000018
H.P.31132301000000000014
G.L.C.22222400000000000014
L.B.03422431000000000019
R.L.00032114100000000012
C.M.P.12312112000202111222
D.P.41000001002212100014
G.M.24227100024213311035
H.A.L.32221303010201000020
V.M.02211241110100000016
M.M.00321220032200142024
D.V.R.00000010000024101211
Mo.M.00000000101012212010
S.N.00000000102110231112
G.A.00000000011231030011
R.V.00000000001144312016
B.Z.00000000002021130413
M.F.C00000000001212226016
M.P.00000000000111521011
P.L.00000000000201412111
M.P.R.00000000000002642418
C.P.F.00000000000000552012
TOTAL2124262422221313681620172637312314363
Cuadro 1. Reparto de las sentencias por ao y ponente.
798081828384858687888990919293949596
C.P.
G.S.
H.P.
G.L.C.
L.B.
R.L.
C.M.P.
D.P.
G.M.
H.A.L.
V.M.
M.M.
D.V.R.
Mo.M.
S.N.
G.A.
R.V.
B.Z.
M.F.C
M.P.
P.L.
M.P.R.
C.P.F.
Cuadro 2. Perodos de actividad de los ponentes
3. Objetivos y metodologa
Para los socilogos: estudiar el proceso de toma de decisin de los jueces
Para los estadsticos: metodologa para estudiar un corpus cronolgico a varias voces y, si necesario.
Se intenta responder a las siguientes preguntas:
existe o no una evolucin en el proceso de decisin?
si existe en qu fecha se producen los cambios?
cules son sus caractersticas?,
la evolucin observada corresponde a los cambios realizados en el Cdigo Penal o se realiza independientemente de los cambios en la doctrina?
Se utilizan:
Herramientas provenientes de la estadstica lxica:
el reparto del vocabulario
el modelo de crecimiento del vocabularioHerramientas provenientes del anlisis de datos textuales:
anlisis de correspondencias clasificacin automtica
seleccin de palabras caractersticas de las partes del corpus
4. El vocabulario de las sentencias: frecuencia, reparto e incremento del vocabulario
Longitud del corpus: 507.475 ocurrencias
Palabras distintas: 19.376 palabras distintas.
Palabras pronunciadas al menos 10 veces: 3494 (93% del corpus)
Longitud promedia de las sentencias pronunciadas en 1979: 803.5 palabras
Longitud promedia de las sentencias de 1996: 1436 palabras
Las sentencias del ao 1983 son, con 653 palabras, las ms cortas y las sentencias de 1991, con 1887 palabras, las ms largas
El ponente H. A.-L. es el menos prolijo y C.-P. F. el ms prolijo con sentencias de longitud media, respectivamente, 579 y 2611 palabras.
Glosario de las palabras ms frecuentes
Entre las palabras ms frecuentes, se encuentran palabras ligadas a las siguientes temticas:
doctrina penal y leyes (artculo, ley)
actuaciones procesales (casacin, recurso, sentencia, delito, resolucin, tribunal, causa,)
delitos relativos a la prostitucin (prostitucin, tercera, rufianismo,)
circunstancias del delito (local, pesetas,)
actores usuales en un proceso (procesado/a/os, acusado/a/os, autor, fiscal, letrado ), actores usuales en una situacin de prostitucin (clientes, camareras,),
fundamentos de la decisin judicial (moral, inmoral, escndalo, prueba, presuncin de inocencia, atenuante, agravante,)
palabras argumentativas generales (considerando, confrontar,)
palabras herramientas
Incremento del vocabulario
El vocabulario aparece progresivamente en el corpus: a medida que el corpus se alarga
El ritmo de aparicin de palabras nuevas disminuye, aunque siempre aparecen nuevas palabras.
El ritmo de aparicin de vocabulario nuevo (Muller (1977); Hubert y Labb (1993)) constituye una informacin relevante
FigFigura 1. Incremento del vocabulario:
Diferencia entre incremento observado e incremento esperado
Reparto del vocabulario
El ndice de reparto (Hubert et Labb, 1990) mide la regularidad del reparto de las palabras.
Vara entre 0 y 1:
prximo a 1: uso regular
prximo a 0 : uso local de la palabra.
Entre las palabras regulares:
trminos judiciales relativamente comunes (doctrina, ley, caso, infraccin, preceptos esenciales, sentencia, legalidad, etc.)
eventualmente ligados al hecho de interponer un recurso (casacional, revisin, etc.)
relativas al tipo de delito comn a todas las sentencias (sexo, ilcito, ejerca, ejercer, etc.)
adverbios que indican la conviccin
Las palabras localizadas corresponden a:
aspectos muy particulares de algunas sentencias (presencia de otro delito como la droga, presencia de armas, etc.),
propias de un ponente (costumbres verbales, por ejemplo) o
estar ligadas a un periodo y ser, por tanto, resultado de la evolucin del vocabulario
Nota: existe un nmero importante de palabras que presentan un valor del ndice de reparto entre 0.4 y 0.6
5. Segmentacin del corpus en perodos temporales homogneos
Metodologa
Tabla Aos ( Palabras (palabras utilizadas al menos 10 veces) = tabla de contingencia
Anlisis de correspondencias de la tabla Aos ( Palabras
Clasificacin automtica para reagrupar los aos que presentan perfiles lxicos similares.
Anlisis de correspondencias
Figura 2. Primer plano factorial del anlisis
Clasificacin de los aos a partir de sus coordenadas factoriales
Figura 3. rbol jerrquico construido a partir de las distancias entre aos
6. Caracterizacin lxica de los perodos
Antes de 1988: palabras sobrerepresentadas
Sustantivos: camareras, prostitucin, considerandos, hombres, bar, procesada, tercera, procesado, trfico, favorecimiento, decreto, auxilio, precepto, nmero, corrupcin, precio, modalidades, escndalo, texto, mujeres, entrega, resumen, ponente, clientes, seor, jurisdiccin, prostitutas, cooperacin, casacin, consistencia, omisiones, facilitacin, inciso, lacra, resolucin, reservado, proxenetismo, huella, delito, improcedencia, corriente, estrago, sujetos, causa, reservado, camarera, lucro, mrito, ndole, urgencia, empleo, cantidades, pudor, peligrosidad, matrimonio, comercio, consumiciones, trato, procesados, origen, grado, yacimiento, pisos, moralidad, apartados, vicio, mitad
Adjetivos: carnal, seguida, criminal, dictada, inmoral, interpuesto, siendo, moral, mentado, legal, empleadas, refundido, marginal, excelentsimo, impugnada, sealada, explotado, relativos, carnales, fctica, citado, locativa, lcita, impdicas, delictiva, tica, incardinada, ajenas, perniciosos, venal, mismos, encaminadas, activos, colectiva, organizada, buenas, prostituidas, general, inferiores, viciosa, social, defensiva, acuartelada, terminante
Verbos: considerando, resultando, cohabitar, desestimar, comprende, careciendo, revisado, tipifica, solicitaban, explotar, declara, facilitar, quedan, anula
Adverbios: ordinariamente, anteriormente, indiscriminadamente, explicitamente
Pronombres: cuyo
Abreviaciones y nmeros que hacen referencias a leyes, a instituciones judiciales o a otras sentencias:RJ, 1, 1963/759, 691/1963, TS, dis_estudiadas, CP, 16, 1981/1517, 3096/1973, 1956/438, 1982/3544, 438, 1973\2255, 1975\2330, 1981\2093, 900, 1009 28, 17, VII, 1981\147, 1981\143, DL
A partir de 1988: palabras sobrerepresentadas
Sustantivos: prueba, derecho, declaraciones, inocencia, acusado, presuncin, juicio, vulneracin, fundamentos, pruebas, cargo, motivo, error, hecho, acusados, registro, fundamento, documentos, valoracin, constitucin, principio, folio, instruccin, libertad, folios, apreciacin, defensa, acta, violacin, va, vctima, fiscal, juzgado, credibilidad, testigos, entrada, denuncia, apoyo, ministerio, testimonio, conviccin, testigo, juez, agresin, detencin, inmediacin, acusada, garantas, existencia, informe, autor, manifestaciones, declaracin, documento, proceso, respuesta, base, jurisprudencia, polica, diligencias, relacin, inadmisin, intervencin, contradiccin, secretario, experiencia, letrado, pub, igualdad, impugnacin, violencia, atestado, validez, seccin, mdico, inhabilitacin, asistencia
Adjetivos: oral, probatoria, judicial, constitucional, fundamental, casacional, desestimado, documental, prestadas, plenario, provincial, efectiva, procesal, acusatorio, correlativo, especial
Verbos: ha, vanse, confrontar, dijo, existe, debe, aduce, dice, podido, cabe
Adverbios: no, aqu, ni
Pronombres: nos, ello, ti
Abreviaciones y nmeros que hacen referencias a leyes, a instituciones judiciales o a otras sentencias: APNDL, CE, RTC, 24, LOPJ, 1978\2836, 2875, 1985\1578, 8375, 2635, 849, 885, LECR, TC, dieciocho, 3/1989, 85, 1989\1352
7. Progresividad de los cambios
Incrementos lxicos caractersticos
Los incrementos lxicos (Salem, 1991 y 1993) permiten comparar el vocabulario de un perodo con los vocabularios de los perodos anteriores
En 1985 crece la frecuencia de error, acusado, folio, inocencia, y presuncin: el cambio es ms marcado a partir de 1988, pero se incuba antes.
Las fechas parecen coincidir con el relevo generacional que se produce, principalmente, entre 1985 y 1988.
Especificidades cronolgicas
Ciertas palabras pueden caracterizar no slo un perodo sino un grupo de perodos consecutivos.
Se determinan:
las palabras caractersticas de cada perodo (es decir, del primer nivel)
las de grupos de dos perodos consecutivos (palabras caractersticas del segundo nivel),
las de grupos de tres perodos consecutivos (palabras caractersticas del tercer nivel
Cada palabra se asocia al perodo o grupo de perodos que mejor caracteriza; es decir, aquel para el cual la probabilidad asociada al test es la menor
Aqu, se opera ao por ao, para as decidir sin a priori los grupos de aos que caracteriza una palabra.
Esto permite confirmar que existe un corte principal en 1988: numerosos trminos caracterizan globalmente los aos 79-87 y otros 88-96.
No obstante, derecho, presuncin, inocencia, juicio, fundamentos y CE caracterizan el conjunto de los aos que van desde 1985 hasta 1996.
8. Importancia de las personas
Cul es el ponente ms original (de un punto de vista lxico)?;
Cul es el ms central?
La distancia entre jueces es o no ms importante que la distancia entre aos? o, con otras palabras,
Cul es la importancia relativa de la cronologa y del factor humano?.
Quin es el primer ponente que emplea un cierto tipo de argumentacin?
Otros ponentes le siguen?
Existe una tendencia global seguida por el conjunto de los ponentes?
Se entremezclan, y eventualmente se contraponen, distintos modelos de toma de decisin en un mismo perodo?
Ejemplo: la palabra defensa es
la palabra ms caracterstica del conjunto de las sentencias redactadas por B-Z (68 de las 233 citaciones provienen de este conjunto)
un incremento especfico para cada uno de los aos en los cuales B-Z redacta la mayora de las sentencias (es decir, 1989, 1991, 1994, 1996).
9. Conclusin
Los resultados se obtienen a partir del texto en bruto, sin necesitar ningn tratamiento previo
Se efecta un anlisis sin a priori que permite limitar de manera considerable la subjetividad del investigador por una parte.
Las herramientas estadsticas empleadas se pueden aplicar sin ninguna dificultad a corpus muy voluminosos, lo que les constituye en un poderoso instrumento para extraer informacin de textos.
Los anlisis no agotan toda la informacin contenido en este corpus: el estudio diferencial de los ponentes es uno de los principales objetivos de la continuacin de este trabajo.
Nota sobre el software
Se ha utilizado el software DTM (Data and Text Mining; Lebart L., Bcue M., Lambert T.), concebido como un software universitario. El reparto del vocabulario y el Modelo de incremento del vocabulario, estn programados en rutinas independientes Mnica Bcue segn las indicaciones dadas por D. Labb en las publicaciones citadas
Referencias
Bcue M. (2000) (Ed) Instrumentos metodolgicos para el estudio de las instituciones. GRES, UAB, Barcelona
Bcue M., Rodrguez C. (2000) Las sentencias del Tribunal Supremo. Un discurso a varias voces in: Instrumentos metodolgicos para el estudio de las instituciones. Bcue M. (ed), GRES, UAB, Barcelona
Bolasco S. (1992),Sur diffrentes stratgies dans une analyse des formes textuelles : Une exprimentation partir de donnes d'enqute, inActes de les Jornades Internacionals d'Anlisi de Dades Textuals, M. Bcue, N. Rajadell y L. Lebart (Eds), Servei de Publicacions de la UPC, Barcelona.
Hubert, P., Labb, D.(1998),Un modle de partition du vocabulaire in Etudes sur la richesse et structure lexicales, D. Labb, Ph. Thoiron y D Serant (Eds), Slatkine-Champion, Pars-Ginebra.
Hubert P., Labb D. (1990), La rpartition des mots dans le vocabulaire prsidentiel, Mots, 22, pp. 80-92.
Labb D., Thoiron Ph., Serant D. (1988), Etudes sur la richesse et la structure lexicales. Champion-Slatkine, Paris-Genve.
Lafon, P.(1981), Dpouillements et statistiques en lexicomtrie, Slatkine-Champion, Pars
Lebart L., Salem A, Bcue M. (2000), Anlisis estadstico de datos, Milenio, Lrida.
Muller Ch. (1977), Principes et mthodes de statistique lexicale, Hachette, Pars.
Salem A. (1991), La lexicomtrie chronologique in: 4 colloque de Lexicologie Politique. Paris.
El estudio de este corpus, en colaboracin con Carmen Rodrguez, se encuentra publicado en Instrumentos metodolgicos para el estudio de las instituciones, M. Bcue (ed), publicacin del Gres, UAB, bajo el ttulo Las sentencias del Tribunal Supremo. Un discurso a varias voces.
1213
_1034960124.doc
4
0
0
3
0
0
2
0
0
1
0
0
0
-
1
0
0
-
2
0
0
I
n
d
e
x
C
2
1
9
9
6
1
9
9
5
1
9
9
4
1
9
9
3
1
9
9
2
1
9
9
1
1
9
9
0
1
9
8
9
1
9
8
8
1
9
8
7
1
9
8
6
1
9
8
5
1
9
8
4
1
9
8
3
1
9
8
2
1
9
8
1
1
9
8
0
1
9
7
9
Aos
Vocabulario observado-vocabulario esperado segn el modelo
_1056444283.doc
1979
1981
1980
1982
1987
1985
1983
1984
1986
1988
1989
1990
1992
1991
1996
1993
1995
1994