Estadıstica (30304007)
Grado en Criminologıa y Seguridad
Departamento de Estadıstica e Investigacion Operativa
Curso 2012/13
Universidad de Cadiz
1
Contenidos:
(1) Fuentes de datos en criminologıa
(2) Estudio descriptivo unidimensional de la actividad criminologica
(3) Estudio descriptivo bidimensional de la actividad criminologica
(4) Series temporales
(5) La utilizacion de la probabilidad en criminologıa
(6) Modelos probabilısticos asociados a la criminologıa
2
Capıtulo 1: FUENTES DE DATOS EN CRIMINOLOGIA
1.1.-Introduccion
1.2.-Diversas fuentes de datos
3
Seccion 1.1: Introduccion
4
.
′′ Without statistics, conducting research about crimeand justice would be virtually impossible ′′ (Weisburd, D.& Britt, Ch. (2007). Statistics in Criminal Justice (Thirdedition), New York: Springer)′′ Disponer de una buena informacion estadıstica y usarlade una manera intensiva y eficiente es una necesidadineludible para la mejora de la gestion de la Justicia. Estambien una obligacion de cara a la sociedad a la que sedebe rendir cuenta de su funcionamiento ′′ (Problemasde la Estadıstica Judicial y propuestas de actuacion. ConsejoGeneral del Poder Judicial)′′ La subestimacion de la informacion empırica y, en par-ticular, de la informacion estadıstica esta todavıa muyarraigada en la tradicion jurıdica ′′ (Benito y Benıtez deLugo, J.L. de & Pastor Prieto, S. (2001). La Estadısticacomo instrumento de la Polıtica Judicial en Los proble-mas de la investigacion empırica en criminologıa: La situacionespanola, Valencia: Tirant Lo Blanch)
5
.
La palabra ′′estadıstica′′ suele emplearse con dos significa-
dos distintos:
′′estadısticas′′, en plural y, generalmente, escrita en minus-
culas, indicando colecciones de datos numericos presen-
tados de forma ordenada y sistematica.
′′Estadıstica′′, en singular y, quizas escrita en mayuscu-
las, ciencia que estudia el comportamiento de los fenome-
nos llamados de colectivo.
Las estadısticas reflejan el conocimiento de las institucio-
nes oficiales sobre determinados asuntos. Este conocimien-
to es, fundamentalmente, numerico. Por tanto el analisis
estadıstico nos proporciona, en general, un metodo cuan-
titativo para el analisis de aquellas situaciones que puedan
ser de nuestro interes.
Pueden realizarse estadısticas por instancias privadas, sin
embargo las mas representativas son las oficiales.
6
Seccion 1.2: Diversas fuentes de datos
7
Fuentes internacionales:
(a) Organismos e instituciones internacionales que ofrecen
exclusivamente informacion sobre algun aspecto de la jus-
ticia: Bureau of Justice Statistics (BJS)
(b) Organismos e instituciones internacionales que ofrecen
informacion de diferentes sectores, entre ellos el judicial:
Research Development and Statistics (RDS), Organizacion
de las Naciones Unidas (UN)
(c) Organismos y oficinas estadısticas que ofrecen todo ti-
po de informacion: Oficina Estadıstica de las Comunidades
Europeas (EUROSTAT),
8
BJS(Bureau of Justice Statistics)
(http://www.ojp.usdoj.gov/bjs/)
′′Tiene como mision recoger, analizar, publicar y divulgar
informacion sobre el crimen, el delincuente, las vıctimas, y
las diferentes operaciones de los sistemas de justicia′′
9
10
RDS(Research Development and Statistics)
(http://homeof f
ice.gov.uk/science-research/research-statistics/)
Country of origin information service
British Crime Survey –
Measuring crime for 25 years
Home Office Recorded Crime
Counting Rules
Crime Statistics - An independent review
Last updated 20 May 2008
© Crown Copyright 2008
′′RDS publica bajo la supervision de cualificados
especialistas en estadıstica, investigacion, economistas,
profesionales de la comunicacion y cientıficos, trabajos e
informes que sirvan de ayuda al Parlamento y para el
conocimiento del publico en general ′′
11
12
UN(Organizacion de las Naciones Unidas)
(http://www.un.org/spanish/)
(Derecho Internacional)
Página 1 de 1
27/11/2008file://C:\Documents and Settings\Juan Antonio\Mis documentos\Mis imágenes\Logo_...
Entre los Organos Principales de la ONU se encuentra la
Corte Internacional de Justicia que ′′sera el organo judicial
principal de las Naciones Unidas′′ (Artıculo 92 de la Carta
de las Naciones Unidas)
13
14
EUROSTAT(Oficina Estadıstica de las Comunidades Europeas)
(http://epp.eurostat.ec.europa.eu/portal/page/
portal/eurostat/home/)
(Populations and social conditions Crime and criminal
justice)
′′La mision de Eurostat consiste en proporcionar un
servicio de informacion estadıstica de alta calidad a la
Union Europea′′
15
16
Fuentes nacionales:
(a) Fuentes que ofrecen informacion jurıdica relacionada
con el estudio y la investigacion del sector: Consejo general
del Poder Judicial (CGPJ)
(b) Fuentes que ofrecen todo tipo de informacion estadısti-
ca: Instituto Nacional de Estadıstica de Espana (INE), Ins-
tituto de Estadıstica de Andalucıa (IEA)
17
CGPJ(Consejo General del Poder Judicial)
(http://www.poderjudicial.es/eversuite/)
(Consejo General del Poder Judicial Estadıstica)
LIBRO I
2 0 0 7
MEMORIASOBRE EL ESTADO, FUNCIONAMIENTO
Y ACTIVIDADES DEL CONSEJO GENERALDEL PODER JUDICIAL Y DE LOS JUZGADOS
Y TRIBUNALES
CENTRO DE DOCUMENTACIÓN JUDICIAL
CONSEJO GENERAL DEL PODER JUDICIAL
′′Disponer de una buena informacion estadıstica y usarla
de una manera intensiva y eficiente es una necesidad
ineludible para la mejora de la gestion de la Justicia. Es
tambien una obligacion de cara a la sociedad a la que se
debe rendir cuenta de su funcionamiento ′′
18
19
INE(Instituto Nacional de Estadıstica de Espana)
(http://www.ine.es/)
(Sociedad Seguridad y Justicia)
′′Le corresponde la investigacion, desarrollo,
perfeccionamiento y aplicacion de la metodologıa
estadıstica, en el marco del Plan Nacional de Investigacion
Cientıfica y Desarrollo Tecnologico′′
20
21
IEA(Instituto de Estadıstica de Andalucıa)
(http://www.juntadeandalucia.es/
institutodeestadisticaycartograf ia/)
(Sociedad Justicia)
9 Instituto de Estadística de AndalucíaCONSEJERÍA DE ECONOMÍA Y HACIENDA
3er trimestre de 2007
Andalucía y su población
Información Estadística AndalucíaInformación Estadística Andalucía
Unión Europea
Fondo Social Europeo
′′Es el responsable de la actividad estadıstica de la
Comunidad Autonoma de Andalucıa′′
22
23
SEIC(Sociedad Espanola de Investigacion Criminologica)
(http://www.criminologia.net)
ESTATUTOS DE LA SEIC
Sociedad Española de Investigación Criminológica 1
Capítulo I. Denominación, fines, domicilio y ámbito Capítulo II. Órganos de la asociación Capítulo III. Asamblea general Capítulo VI. Socios Capítulo V. Recursos económicos Capítulo VI. Disolución Capítulo I. Denominación, fines, domicilio y ámbito Artículo 1. Con la denominación de SOCIEDAD ESPAÑOLA DE INVESTIGACIÓN CRIMINOLÓGICA se constituye una Asociación que se acoge a lo dispuesto en la Ley 191/64, de 24 de Diciembre y normas complementarias del Decreto 1440/65, de 20 de Mayo, careciendo de ánimo de lucro y por tiempo indefinido. Artículo 2. La Asociación gozará de personalidad jurídica propia y distinta de la de sus asociados y su régimen se regirá por lo establecido en los presentes Estatutos y por los acuerdos adoptados por sus Órganos de Gobierno. Artículo 3. La existencia de esta Asociación tiene como fines: Promover la investigación y los estudios criminológicos tanto en el ámbito académico como en el institucional y en aquellos otros que tengan interés en esta área de conocimiento. Fomentar la participación de jóvenes científicos en la investigación criminológica. Establecer relaciones con asociaciones, redes y grupos, nacionales e internacionales, afines en aras al desarrollo de la investigación en el ámbito de la Criminología. Fomentar las relaciones institucionales con el fin de fortalecer la formación e investigación en criminología así como tareas de asesoría y consultorías con entidades públicas y privadas. Servir de vínculo de comunicación entre científicos y fomentar las transferencias de resultados de investigación en el ámbito nacional e internacional. Desarrollar la Criminología como instrumento de comprensión y análisis de la realidad social que favorezca una vía práctica de análisis y prevención del delito. Promover una concepción de la comunidad científica criminológica al servicio de la paz y el progreso social que impulse un concepto activo de esta disciplina como instrumento solidario y democrático de acción y realización de los Derechos Humanos en toda su plenitud. Cualquier otro fin que impulse la Criminología como un instrumento útil de análisis y solución de problemas sociales. Artículo 4. Para el cumplimiento de estos fines se realizarán todas las actividades lícitas que sean necesarias. Artículo 5. La Asociación establece su domicilio social en la Universidad de Castilla-La Mancha,Facultad de Derecho, Unidad de Investigación en Criminología, Plaza de la Universidad nº 1, (02071) Albacete (España), y su ámbito territorial de actuación comprende todo el ámbito del Estado Español. Capítulo II. Órganos de la asociación Artículo 6. La Asociación será dirigida y administrada por una Junta Directiva y una Asamblea General. Todos los cargos que componen la Junta Directiva serán gratuitos y serán designados por la Asamblea General y su mandato tendrá una duración de dos años. Artículo 7. La Junta Directiva está formada por el Presidente, Secretario, el Tesorero y el número de vocales que determine la Asamblea General. Los miembros de la Junta directiva, serán elegidos por la Asamblea General, deberán gozar de la condición de asociados y estar al corriente en el pago de las cuotas. La Junta Directiva se reunirá dos veces al año y a iniciativa o petición de la mayoría simple de sus miembros. Quedará constituida cuando asista la mitad más uno de sus miembros. Adoptará sus acuerdos por el voto favorable de la mayoría simple de sus miembros.
′′Esta asociacion tiene como fin, entre otros, el promover
la investigacion y los estudios criminologicos tanto en el
ambito academico como en el institucional y en aquellos
otros que tengan interes en esta area de conocimiento′′
24
25
Otras webs de informacion criminologica y judicial:
(a) Instituto de Criminologıa de la Universidad de Cambrid-
ge
(b) Centro de Criminologıa de la Universidad de Oxford
(c) Instituto Australiano de Criminologıa
(d) Sociedad Britanica de Criminologıa
26
SEIC(Instituto de Criminologıa de la Universidad de Cambridge)
(http://www.crim.cam.ac.uk)
M.St. in Applied Criminology, Penology and Management Alumni Event 13 September 2012
Delegate Registration Form
Fee £60 (This includes the dinner and event attendance)
First name:
Last name:
Telephone: Email: Correspondence address:
Delegate fees (please choose the relevant fee) Please tick for attendance Conference Dinner (Caius College, 6.30 for 7pm)
Afternoon Event (Faculty of Law, 1.30 – 5pm)
Please note that accommodation is not included for this event
Payment Details (bookings will not be accepted unless full payment is made)
Cheque enclosed (payable to The University of Cambridge) for £60
Invoice me for £60 with Purchase order number: Invoice address:
Please return this form to:
Lucinda Bowditch, Institute of Criminology, Sidgwick Avenue, Cambridge CB3 9DA Email: [email protected]
For further conference information or enquiries, please go to www.crim.cam.ac.uk or telephone Lucinda Bowditch on 01223 335373
Closing Date for first registration is Monday 27 August 2012
′′Fundado hace 50 anos fue uno de los primeros Institutos
Criminologicos de Europa. Alberga la biblioteca
Radzinowicz que contiene la mas extensa coleccion de
criminologıa del Reino Unido.′′
27
28
SEIC(Centro de Criminologıa de la Universidad de Oxford)
(http://www.crim.ox.ac.uk/Links/index.htm)
© Probation Studies Unit, Centre for Criminological Research, University of Oxford, 12 Bevington Road, Oxford, OX2 6LH. Probation Services are permitted to reproduce this document for use within the Probation Service.
1
Emerging ACE Data: Further Analysis of Needs and Risk
Simon Merrington
KEY POINTS
1. This bulletin provides a similar analysis of criminogenic needs to the one in Bulletin 1, but for a much larger sample of cases - over 10,000. These are all initial assessments, the great majority having been completed at PSR stage.
2. ACE indicates a fairly similar pattern of problems and offending-related problems across the country, in rural, urban and metropolitan areas. The pattern of problems is also remarkably similar to the one provided two years previously by Bulletin 1. It suggests that ACE is a stable assessment tool, and that risk factors do not vary greatly between areas.
3. The data suggests that programmes such as Think First which target impulsiveness, poor reasoning skills, difficulties with control over one's actions, and poor victim awareness, should be extremely valuable. Not only are these problems frequently judged to be offending-related, they were also found in HORS 211 to be good predictors of reconviction.
4. Another group of problems are also frequently judged to be offending-related: the offender's own lifestyle, friends causing a risk, drugs and alcohol. HORS 211 found that the first three were good reconviction predictors. It is less clear how probation can effectively address lifestyle and peer influence problems, but the need for drugs and alcohol programmes is well accepted.
5. Finances were also among the most frequent offending-related problems, and this too was a good predictor in HORS 211. There was surprisingly little regional variation in the assessed problem level, but more variation in financial status with 72% dependent on state benefits in Northumbria but only 49% in Middlesex. Relatively low numbers were in employment or on training schemes, even in a period of prosperity.
6. ACE offending-related scores averaged around 21 or 22 for most areas, but Middlesex and Northumbria were significantly higher. The average ORS score in HORS 211 was also 21, suggesting ACE has performed stably for some time.
Probation Studies Unit ACE Practitioner Bulletin 4
November 2001
Further copies can be obtained from http://www.crim.ox.ac.uk/publications/psubull.htm
© Probation Studies Unit, Centre for Criminological Research, University of Oxford, 12 Bevington Road, Oxford, OX2 6LH. Probation Services are permitted to reproduce this document for use within the Probation Service.
1
Emerging ACE Data: Further Analysis of Needs and Risk
Simon Merrington
KEY POINTS
1. This bulletin provides a similar analysis of criminogenic needs to the one in Bulletin 1, but for a much larger sample of cases - over 10,000. These are all initial assessments, the great majority having been completed at PSR stage.
2. ACE indicates a fairly similar pattern of problems and offending-related problems across the country, in rural, urban and metropolitan areas. The pattern of problems is also remarkably similar to the one provided two years previously by Bulletin 1. It suggests that ACE is a stable assessment tool, and that risk factors do not vary greatly between areas.
3. The data suggests that programmes such as Think First which target impulsiveness, poor reasoning skills, difficulties with control over one's actions, and poor victim awareness, should be extremely valuable. Not only are these problems frequently judged to be offending-related, they were also found in HORS 211 to be good predictors of reconviction.
4. Another group of problems are also frequently judged to be offending-related: the offender's own lifestyle, friends causing a risk, drugs and alcohol. HORS 211 found that the first three were good reconviction predictors. It is less clear how probation can effectively address lifestyle and peer influence problems, but the need for drugs and alcohol programmes is well accepted.
5. Finances were also among the most frequent offending-related problems, and this too was a good predictor in HORS 211. There was surprisingly little regional variation in the assessed problem level, but more variation in financial status with 72% dependent on state benefits in Northumbria but only 49% in Middlesex. Relatively low numbers were in employment or on training schemes, even in a period of prosperity.
6. ACE offending-related scores averaged around 21 or 22 for most areas, but Middlesex and Northumbria were significantly higher. The average ORS score in HORS 211 was also 21, suggesting ACE has performed stably for some time.
Probation Studies Unit ACE Practitioner Bulletin 4
November 2001
Further copies can be obtained from http://www.crim.ox.ac.uk/publications/psubull.htm
Institute of Criminology
Centre for Criminology University of Oxford
Institute of Criminology
Centre for Criminology University of Oxford
Institute of Criminology
Centre for Criminology University of Oxford
′′Es uno de los centros de criminologıa mas destacados del
Reino Unido. Realiza publicaciones de sus investigaciones
de gran calidad.′′
29
30
AIC(Instituto Australiano de Criminologıa)
(http://www.aic.gov.au/en/statistics.aspx)
Australia’s national research and knowledge centre on crime and justice
Trends & issuesin crime and criminal justice
No. 394 May 2010
Financing of terrorism: Risks for AustraliaRussell G Smith, Rob McCusker & Julie Walters
Terrorists aim at intimidating people, compelling states to comply with their demands,
or destabilising or destroying the fundamental political, constitutional, economic or social
structures of a country or an organisation (Europol 2009: 5).
Terrorist groups may have a range of motivations and justifications for their actions including
support of a particular religious faith; promotion of international recognition and political
self-determination for ethno-nationalist and separatist groups; the achievement of entire
political, social, or economic system change according to extremist left- or right-wing
models; or simply changing a specific policy or practice as in the case of animal
experimentation.
One of the main responses to threats of terrorist activity involves the use of financial
transaction reporting and monitoring. This operates in two ways—first, by placing
impediments in the path of those who seek to accrue and to move funds using the
regulated financial sector and second, by enabling law enforcement and intelligence
agencies to follow the financial trail of transactions left by those who make use of the
regulated financial sector, so as to detect and to prevent possible attacks.
This paper examines the global environment in which the financing of terrorism occurs,
particularly with respect to the activities of transnational, organised groups that may
have an involvement with terrorist organisations. Consideration is then given to how
the financing of terrorism occurs, first through the use of illegally obtained funds and
then through financing derived from legitimate sources, such as charitable donations,
which are diverted for use in terrorist activities. Evidence of the financing of terrorism
in Australia is then examined and cases which have been detected and prosecuted in
Australia that entail an element of terrorist financing are reviewed. Although the number
of cases is small, they are indicative of the fact that Australia is not immune from terrorist
activities that are being financed by Australian individuals and organisations.
Foreword | To date, Australia has been
relatively quarantined from large-scale,
organised terrorist activities such as
those which have emerged in central and
southeast Asia, Europe and the United
States. Nonetheless, as a well-resourced
country, Australia is at risk of being a
location from which funds for terrorist
activities may be drawn—even if
the activities themselves are based
predominantly in other countries.
This paper presents information on
the environments in which the financing
of terrorism have taken place in recent
years and the trajectory of financing of
terrorism risk which is likely to emerge
for Australia and globally in the years
ahead. Consideration is given to how
financing of terrorism occurs, not only
through the use of illegally obtained
funds, but also through financing
derived from legitimate sources, such
as charitable donations, which are
diverted for use in terrorist activities.
It is concluded that although evidence
of financing of terrorism is limited in
Australia, risks are present that need
to be addressed, not only through
effective gathering and the use of
financial intelligence, but also through
the prosecution and punishment of
offenders and the education of those
individuals and communities most at risk
of becoming involved in illegal activities,
both intentionally and inadvertently.
Adam Tomison
Director
′′Es el centro nacional australiano de investigacion en
criminologıa y justicia.′′
31
32
BSC(Sociedad Britanica de Criminologıa)
(http://www.britsoccrim.org/links.htm)
ISSN 1759-0043
Papers from the British Criminology
Conference An Online Journal by the British Society of Criminology
Volume 9, 2009
www.britsoccrim.org/conferences.htm
′′Se propone fomentar el conocimiento tanto del personal
academico como profesional que estan ligados de alguna
forma por trabajo o ensenanza, investigacion o educacion
publica sobre el crimen, el comportamiento criminal y los
sistemas de justicia criminal en el Reino Unido.′′
33
34
Capıtulo 2: ESTUDIO DESCRIPTIVO
UNIDIMENSIONAL DE LA ACTIVIDAD
CRIMINOLOGICA
2.1.-Principales conceptos de Estadıstica Descriptiva
35
Seccion 2.1: Principales conceptos de Estadıstica
Descriptiva
36
Se conocen como variables estadısticas a las caracterısticas
que poseen los elementos de una poblacion y que van a ser
objeto de estudio estadıstico.
Ejemplo 1 Sea la poblacion formada por los 4543 jueces
y magistrados en los diferentes organos judiciales que for-
maban la plantilla a 1 de enero de 2007 (segun datos del
CGPJ).
37
Las variables a analizar pueden ser de tres tipos:
Cualitativas o atributos: no expresables numericamente
(Ejemplo: ′′Comunidad Autonoma de destino′′)
Ordinales: sus valores pueden ser ordenados (Ejemplo:′′Satisfaccion con la actual polıtica judicial′′)
Cuantitativas: pueden ser expresadas numericamente.
Las variables cuantitativas se subdividen en:
(i) Cuantitativas Discretas, si el conjunto de sus po-
sibles valores tiene cardinal finito o infinito numerable
(Ejemplo: ′′Numero de expedientes resueltos durante el
ano 2006′′)(ii) Cuantitativas Continuas, si pueden tomar los infini-
tos valores de un intervalo (Ejemplo: ′′Antiguedad en el
cuerpo′′)
38
Las variables estadısticas suelen representarse con letras
mayusculas del final del alfabeto: X, Y , Z, ... Los valores
que toman (datos) los escribiremos con letras minusculas:
x1, x2, x3, ... ; y1, y2, y3, ... o z1, z2, z3, ...
Ejemplo 2
X= ′′Numero de expedientes resueltos durante el ano
2006 por cada uno de los 4543 jueces y magistrados en
los diferentes organos judiciales que formaban la plantilla
a 1 de enero de 2007′′
x1= 206 expedientes, x2= 124 expedientes, · · · x4543=
338 expedientes.
39
.
Distribuciones de frecuencias
A partir de un conjunto de datos queremos clasificarlos de
modo que la informacion contenida en ellos quede presen-
tada de forma clara, concisa y ordenada. Si representamos
por N al numero total de datos, se conoce como frecuencia:
(a) Absoluta del valor xi, al numero de veces que se pre-
senta dicho valor en el conjunto de datos. Se representa
por ni.
(b) Absoluta acumulada del valor xi, al numero de datos
que hay iguales o inferiores a xi. Se representa por Ni.
(c) Relativa del valor xi, al cocienteni
N. Se representa por
fi.
(d) Relativa acumulada del valor xi, al cocienteNi
N. Se re-
presenta por Fi.
40
Llamaremos distribucion de frecuencias al conjunto de losvalores que presenta una variable estadıstica junto con susfrecuencias. En general, escribiremos (xi;ni)i=1,2,...,k, don-
de ni es la frecuencia absoluta del valor xi y N =k∑i=1
ni es
la frecuencia total.
Para presentar los resultados se acostumbra a usar la lla-mada tabla estadıstica, de la forma siguiente:
li−1 − li ni xi cil0 − l1 n1 x1 c1l1 − l2 n2 x2 c2
... ... ... ...lk−1 − lk nk xk ck
siendo xi =li−1 + li
2, la marca de clase o valor ideal del
intervalo, y ci = li − li−1 , la amplitud del intervalo.
41
Observaciones:
(a) El agrupamiento de los datos da lugar a cierta perdidade informacion pero con ello se gana en manejabilidadde los mismos.
(b) El numero de intervalos y las amplitudes de los mismosdeben ser escogidos convenientemente.
(c) En la practica, es frecuente la eleccion de intervalosde amplitud constante, ya que con ello se facilita elcalculo de la mayorıa de las caracterısticas descriptivasque analiza la estadıstica. Un criterio empırico consisteen considerar como numero de intervalos, k, el dadopor la formula de Sturges, k = 1 + [3,3log10N ], donde [x]
denota la parte entera de x.
42
Ejemplo 3 Sea la variable
X= ′′Numero de penados en los diferentes Centros Peni-tenciarios espanoles, en el ano 2006′′
x1 = 1475 penados (A Lama, Pontevedra)x2 = 299 penados (Albacete)x3 = 1707 penados (Albolote)...x77 = 1400 penados (Villabona)
(Fuente: Anuario Estadıstico del Ministerio del Interior. 2006)
(k = 1 + [3,3log1077] = 1 + [6,2254] = 7)
minxi = 61 (Sta. Cruz de la Palma);maxxi = 2466 (Valencia)
c =2466− 61
7= 343,5714 ≈ 360
43
li−1 − li xi ni Ni fi Fi0− 360 180 22 22 0,2857 0,2857
360− 720 540 21 43 0,2727 0,5584
720− 1080 900 8 51 0,1039 0,6623
1080− 1440 1260 9 60 0,1169 0,7792
1440− 1800 1620 13 73 0,1688 0,9480
1800− 2160 1980 3 76 0,0390 0,9870
2160− 2520 2340 1 77 0,0130 1
Totales N = 77 1
44
Representaciones graficas
Consiste en presentar, a golpe de vista, el comportamiento
de la distribucion. Se usan como complemento del traba-
jo estadıstico, y a veces, como punto de partida para un
posterior analisis.
Tipos de graficos:
(a) Para variables cualitativas preferentemente: basan su
construccion en establecer proporcionalidad entre areas
y frecuencias.
45
Ejemplo 4 Se considera el estudio de la variable ′′lugar de
procedencia de los condenados en Espana durante el ano
2008 ′′
Lugar de procedencia Numero de condenados (ni)
Espana 137 872Resto de Union Europea 17 174
Resto de Europa 1 894Resto del Mundo 39 040
N = 195 980(Fuente: Explotacion del INE del Registro Central de Penados)
46
Ejemplo 4a Diagrama de sectores:
Procedencia de los condenados en España durante el año 2008
EspañaResto de Unión EuropeaResto de EuropaResto del mundo
70,35%
8,76%
0,97%
19,92%
47
Ejemplo 4b Diagrama de rectangulos:
Procedencia de los condenados en España durante el año 2008
0
3
6
9
12
15
(X 10000)
Esp
aña
Res
to d
e U
nión
Eur
opea
Res
to d
e E
urop
a
Res
to d
el m
undo
48
(b) Para variables cuantitativas: Se realizan mediante un
sistema de ejes cartesianos representando en el eje de
abcisas los valores de la variable y en el de ordenadas
las frecuencias correspondientes.
49
Ejemplo 5 Se pretende estudiar la variable ′′edad de la
poblacion reclusa penada en enero de 2010 ′′
li−1 − li ni ci hi18− 21 638 3 0, 0035721− 26 7 226 5 0, 0242626− 31 12 450 5 0, 0418031− 41 20 694 10 0, 0347441− 61 17 035 20 0, 0142961− 70 1 523 9 0, 00284
N = 59 566
(hi =
ni
Nci
)
Fuente: Ministerio del Interior. Secretarıa General de Instituciones
Penitenciarias
50
Ejemplo 5a Histograma:
51
Ejemplo 6 Polıgono de frecuencias (Solo para intervalos
de igual amplitud). Consideremos la variable ′′edad de una
muestra correspondiente a 91 casos de alcoholemias posi-
tivas detectados por la Policıa Local de Estepona en el ano
2003 ′′
li−1 − li ni ci hi15− 25 17 10 0, 0186825− 35 28 10 0, 0307735− 45 22 10 0, 0241745− 55 18 10 0, 0197855− 65 5 10 0, 0054965− 75 1 10 0, 00109
N = 91
(hi =
ni
Nci
)
FUENTE: Boletın Criminologico. Instituto andaluz interuniversitario
de Criminologıa. Numero 80, junio-julio 2005
52
Ejemplo 6a Polıgono de frecuencias:
53
.
Medidas de posicion
Son valores que pretenden resumir las caracterısticas basi-
cas de la informacion disponible.
(a) Media aritmetica: x =
k∑i=1
xini
N=
k∑i=1
xifi
(b) Mediana: Me = li−1 +
N
2−Ni−1
Ni −Ni−1· ci
(c) Percentiles: Qr/k = li−1 +
r
k·N −Ni−1
Ni −Ni−1· ci
54
Ejemplo 7 (Datos correspondientes al Ejemplo 3)
li−1 − li xi ni Ni xini0− 360 180 22 22 3960
360− 720 540 21 43 11340720− 1080 900 8 51 72001080− 1440 1260 9 60 113401440− 1800 1620 13 73 210601800− 2160 1980 3 76 59402160− 2520 2340 1 77 2340Totales N = 77 63180
(a) x = 820,5195 penados (b) Me = 642,8571 penados(c) Q70/100 = 1196 penados
55
.
Medidas de dispersion
Se entiende por dispersion estadıstica a la mayor o me-nor separacion de los valores (datos) respecto a otro quepretende ser la sıntesis de ellos.
(a) Varianza: s2 =k∑i=1
(xi − x)2 ·ni
N=
k∑i=1
x2i ·ni
N− x2
(a’) A veces se usa tambien la cuasivarianza, definida por:
s2c =
k∑i=1
(xi − x)2 ·ni
N − 1. Evidentemente: s2 =
N − 1
N· s2c
(b) Desviacion tıpica: s = +√s2 = +
√√√√ k∑i=1
x2i ·ni
N− x2
(c) Coeficiente de variacion de Pearson: V =s
|x|
56
Ejemplo 8 (Datos correspondientes al Ejemplo 3)
li−1 − li xi ni xini x2ini
0− 360 180 22 3960 712800360− 720 540 21 11340 6123600720− 1080 900 8 7200 64800001080− 1440 1260 9 11340 142884001440− 1800 1620 13 21060 341172001800− 2160 1980 3 5940 117612002160− 2520 2340 1 2340 5475600Totales N = 77 63180 78958800
(a) s2 = 352 186,7431 penados2 (b) s2c = 356 820,7792 penados2
(c) s = 593,4532 penados (d) V = 0,7233
57
Capıtulo 3: ESTUDIO DESCRIPTIVO BIDIMENSIONAL
DE LA ACTIVIDAD CRIMINOLOGICA
3.1.-Introduccion
3.2.-Independencia de variables estadısticas
3.3.-Enunciado del problema
3.4.-Regresion lineal
3.5.-Correlacion
58
Seccion 3.1: Introduccion
59
La mayorıa de las variables que interesan en el mundo cri-
minologico suelen estar relacionadas entre sı, en mayor o
menor medida. Una vez que hemos realizado el estudio
de las distribuciones unidimensionales, obtenidas al estu-
diar una determinada caracterıstica sobre los elementos de
una poblacion, nos disponemos ahora a introducir las dis-
tribuciones bidimensionales, que surgen cuando analizamos
simultaneamente dos caracterısticas sobre cada elemento
de la poblacion.
Como ejemplo podemos considerar el gasto en actividades
de ocio de un centro penitenciario y el numero de reinci-
dencias de sus internos, o el grado de calidad de sus insta-
laciones y el grado de conflictividad, etc.
60
Supongamos que tenemos una poblacion cuyos elementos
son clasificados segun dos caracterısticas cuantitativas, que
llamaremos X e Y . Sus diferentes valores los represen-
taremos por xi e yj, respectivamente, con i = 1, 2, ..., k y
j = 1, 2, ..., h.
Se denomina distribucion bidimensional de frecuencias al
conjunto de valores (xi, yj;nij) i = 1, 2, ..., kj = 1, 2, ..., h
, donde nij es la
frecuencia absoluta conjunta del par (xi, yj) y N =k∑i=1
h∑j=1
nij
es la frecuencia total.
61
Para disponer los resultados podemos usar la llamada tabla
de correlacion, que es una tabla de doble entrada como la
siguiente:
yjxi
y1 y2 · · · yj · · · yh ni·
x1 n11 n12 · · · n1j · · · n1h n1·x2 n21 n22 · · · n2j · · · n2h n2·... ... ... · · · ... · · · ... ...xi ni1 ni2 · · · nij · · · nih ni·... ... ... · · · ... · · · ... ...xk nk1 nk2 · · · nkj · · · nkh nk·n·j n·1 n·2 · · · n·j · · · n·h N
donde ni· =h∑j=1
nij ; n·j =k∑i=1
nij ; N =k∑i=1
ni· =h∑j=1
n·j
62
.
Observaciones:
(a) Si dividimos cada frecuencia de la tabla anterior en-tre el numero total de elementos observados, N, ob-tendrıamos una nueva tabla, semejante a la primera,salvo que reflejarıa las proporciones o frecuencias rela-tivas. Llamaremos fij a la frecuencia relativa conjunta
del par (xi, yj), fij =nij
N. Analogamente se definicionnen
las frecuencias relativas marginales fi· =ni·N
=h∑j=1
fij y
f·j =n·jN
=k∑i=1
fij
(b) Como en el caso unidimensional, las distribuciones bidi-mensionales pueden venir expresadas con valores de lavariable agrupados en intervalos o sin agrupar. Tambienpuede ocurrir que las caracterısticas en estudio tengandistinta naturaleza.
63
Ejemplo 9 Un criminologo esta interesado en encontrar
la posible relacion existente entre la edad en la que un
delincuente juvenil comete su primer delito y su posterior
actividad criminal en la vida de adulto.
Concretamente esta interesado en encontrar ′′explicaciones′′
al numero de arrestos en edad adulta, Y , conociendo la edad
del primer arresto juvenil, X.
Los datos recogidos se presentan en la tabla siguiente:
xi 14 12 15 13 16 17 13 15 16 16 17 16yj 5 3 4 5 0 1 2 0 2 1 0 1
FUENTE: Datos no reales tomados de Elementary Statistics in Criminal
Justice Research
64
Escribiendo los datos en forma de una tabla de correlacion,
nos queda:
yjxi
0 1 2 3 4 5 ni·
12 0 0 0 1 0 0 113 0 0 1 0 0 1 214 0 0 0 0 0 1 115 1 0 0 0 1 0 216 1 2 1 0 0 0 417 1 1 0 0 0 0 2
n·j 3 3 2 1 1 2 N = 12
65
.A veces interesa estudiar aisladamente cada una de las va-riables. De esta forma obtendrıamos dos distribuciones uni-dimensionales, que serıan las correspondientes a cada unade las variables X e Y . A estas distribuciones se les llamadistribuciones marginales.
La distribucion marginal de X es la distribucion que sigue lavariable X independientemente de los valores de la variableY .
xi ni· fi·x1 n1· f1·x2 n2· f2·... ... ...xi ni· fi·... ... ...xk nk· fk·
N 1
donde ni· =h∑j=1
nij y fi· =ni·N
son, respectivamente, las frecuen-
cias absolutas y relativas margi-
nales de la variable X, con i =
1, 2, ..., k.
66
Analogamente se define la distribucion marginal de Y .
La distribucion marginal de Y es la distribucion que sigue la
variable Y independientemente de los valores de la variable
X.
yj n·j f·jy1 n·1 f·1y2 n·2 f·2... ... ...yj n·j f·j... ... ...yh n·h f·h
N 1
donde n·j =k∑i=1
nij y f·j =n·jN
son, respectivamente, las frecuen-
cias absolutas y relativas margi-
nales de la variable Y , con j =
1, 2, ..., h.
67
Las distribuciones marginales correspondientes a los datos
recogidos en el Ejemplo 9, son:
xi ni· fi·12 1 0,083
13 2 0,16
14 1 0,083
15 2 0,16
16 4 0.3
17 2 0,16N = 12 1
yj n·j f·j0 3 0,251 3 0,25
2 2 0,16
3 1 0,083
4 1 0,083
5 2 0,16N = 12 1
68
Otro tipo de distribuciones unidimensionales que se obtie-
nen a partir de las bidimensionales son las distribuciones
condicionadas. Son distribuciones que se obtienen mante-
niendo fijo un valor en una de las variables y considerando
los valores que toma la otra con sus respectivas frecuencias.
La distribucion condicionada de X respecto de Y = yj es
la distribucion que sigue la variable X cuando la variable Y
toma el valor yj.
69
xi/Y = yj ni/j fi/jx1 n1j f1/j
x2 n2j f2/j... ... ...xi nij fi/j... ... ...xk nkj fk/j
n·j 1
Se han escrito las frecuencias condi-
cionadas absolutas como ni/j (= nij)
y las frecuencias condicionadas rela-
tivas como fi/j =nij
n·j(proporcion de
valores, entre los que Y = yj, para
los cuales X = xi, con i = 1, 2, ..., k).
Observese que las frecuencias de la
distribucion X/Y = yj son las corres-
pondientes a la j-esima columna de la
tabla de correlacion.
70
De forma analoga se obtiene la distribucion condicionada
de Y respecto de X = xi, distribucion de los valores de Y
cuando X toma el valor xi.
La distribucion condicionada de Y respecto de X = xi es
la distribucion que sigue la variable Y cuando la variable X
toma el valor xi.
71
yj/X = xi nj/i fj/iy1 ni1 f1/i
y2 ni2 f2/i... ... ...yj nij fj/i... ... ...yh nih fh/i
ni· 1
Se han escrito las frecuencias condi-
cionadas absolutas como nj/i (= nij)
y las frecuencias condicionadas rela-
tivas como fj/i =nij
ni·(proporcion de
valores, entre los que X = xi, para
los cuales Y = yj, con j = 1, 2, ..., h).
Observese que las frecuencias de la
distribucion Y/X = xi son las corres-
pondientes a la i-esima fila de la tabla
de correlacion.
72
De entre todas las posibles distribuciones condicionadas co-
rrespondientes al Ejemplo 9, hemos seleccionado las dos
siguientes:
xi/Y = 2 ni/3 fi/312 0 013 1 0,514 0 015 0 016 1 0,517 0 0
n·3 = 2 1
yj/X = 16 nj/5 fj/50 1 0,251 2 0,52 1 0,253 0 04 0 05 0 0
n5· = 4 1
73
Seccion 3.2: Independencia de variables estadısticas
74
Diremos que X e Y dependen funcionalmente si podemos
establecer una aplicacion que nos transforme los valores de
una de las variables en los de la otra.
Diremos que X e Y dependen estadısticamente cuando la
variacion de una de las variables influye en la distribucion
de la otra.
75
Diremos que las variables X e Y son estadısticamente in-
dependientes si para todo (i, j) se verifica que
fij = fi·f·j
Si la igualdad no se verifica para algun par (i, j), diremos
que las variables son estadısticamente dependientes.
Para las variables X e Y del Ejemplo 9, como se verifica
que: f14 =1
126= f1·f·4 =
1
12·
1
12, deducimos que X e Y no
pueden considerarse independientes.
76
Seccion 3.3: Enunciado del problema
77
Para medir la asociacion lineal entre dos variables, X e Y ,
se definicionne la covarianza como:
sXY =k∑i=1
h∑j=1
(xi − x)(yj − y) ·nij
N=
k∑i=1
h∑j=1
xiyj ·nij
N− x · y
78
.
Si seguimos utilizando los datos del Ejemplo 9, para calcular
la sXY procedemos de la forma siguiente:
yjxi
0 1 2 3 4 5 ni· xini·
h∑j=1
xiyjnij
12 0 0 0 1 0 0 1 12 3613 0 0 1 0 0 1 2 26 9114 0 0 0 0 0 1 1 14 7015 1 0 0 0 1 0 2 30 6016 1 2 1 0 0 0 4 64 6417 1 1 0 0 0 0 2 34 17
n·j 3 3 2 1 1 2 N = 12 180 338
yjn·j 0 3 4 3 4 10 24
y, por tanto, sXY =k∑i=1
h∑j=1
xiyj ·nij
N− x · y =
338
12−
180
12·
24
12=
= −1,83
79
Cuando X e Y varıan conjuntamente de forma lineal, grafi-
cas (A) y (B), la covarianza sera alta. Cuando no exista
relacion entre X e Y , grafica (C), o exista una relacion
marcadamente no lineal, grafica (D), la covarianza sera ce-
ro.
(A) (B) (C) (D)
X
Y
0 4 8 12 16 20
3
5
7
9
11
X
Y
0 4 8 12 16 20
2,5
4,5
6,5
8,5
10,5
X
Y
0 4 8 12 16 20
3
5
7
9
11
X
Y
0 10 20 30 40
0
4
8
12
16
20
24
80
Si sXY > 0 ⇒ X e Y varıan de forma lineal en el mismo
sentido y diremos que hay asociacion lineal directa, (A).
Si sXY < 0 ⇒ X e Y varıan de forma lineal en sentido
opuesto, y presentan asociacion lineal inversa, (B).
Cuando sXY = 0, es decir haya ausencia de asociacion lineal,
diremos que las variables X e Y son incorreladas.
81
Como en nuestro ejemplo sXY = −1,83, podemos concluir
que las variables X e Y varıan de forma lineal en sentido
opuesto, y presentan asociacion lineal inversa.
La representacion grafica nos confirma esta conclusion:
12 13 14 15 16 17
0
1
2
3
4
5
82
Seccion 3.4: Regresion lineal
83
La regresion tiene por objeto poner de manifiesto, a par-
tir de la informacion de que se disponga, la estructura de
dependencia que mejor explique el comportamiento de una
variable Y (variable dependiente o explicada) a traves de
un conjunto de variables X1, X2, . . . , Xp (variables indepen-
dientes o explicativas), con las que se supone que esta re-
lacionada.
El caso que nos disponemos a estudiar es el mas senci-
llo, utiliza una sola variable explicativa, y se conoce como
Regresion Simple.
84
Una vez confirmado que la observacion de la nube de puntos
nos indica una cierta estructura de dependencia lineal entre
nuestros datos, la recta de regresion de Y sobre X es:
y = a+ bx
b =sXY
s2X
a = y − bx
Por tanto, la ecuacion de la recta que nos explicara el com-
portamiento de la variable Y conocido el de la X, puede ser
expresada como sigue:
rY/X ≡ y =
(y −
sXY
s2X
· x)
︸ ︷︷ ︸a
+sXY
s2X︸ ︷︷ ︸b
·x
85
Ejemplo 10 Los datos que han dado lugar a la nube de
puntos
X
Y
0 4 8 12 16 20
3
5
7
9
11
proporcionan los valores siguientes:
x = 10,4104; y = 3,1791; sXY = 8,5085; s2X = 29,3501
86
Por tanto, la ecuacion de la recta que nos explicara el com-
portamiento de la variable Y conocido el de la X, recta de
regresion de Y sobre X, es:
rY/X ≡ y = a+ bx =
(y −
sXY
s2X
· x)
+sXY
s2X
· x
rY/X ≡ y = 0,1611 + 0,2898x
X
Y
0 4 8 12 16 20
3
5
7
9
11
87
Seccion 3.5: Correlacion
88
La regresion nos ha proporcionado la forma funcional de larelacion entre dos variables. Pero es necesario analizar tam-bien la intensidad de esa relacion. El objetivo de la correla-cion es estudiar el grado de asociacion existente entre lasvariables, es decir, proporcionar unos coeficientes que nosmidan el grado de dependencia mutua entre las variables.
Diremos que la dependencia es ′′perfecta′′ o que existe unadependencia ′′funcional′′ entre las variables si todos los pun-tos del diagrama de dispersion se encuentran sobre la lıneade regresion.
Lineal intensa Lineal debil Lineal perfecta
X
Y
0 4 8 12 16 20
3
4
5
6
7
8
9
X
Y
0 4 8 12 16 20
2,5
4,5
6,5
8,5
10,5
X
Y
0 2 4 6 8 10 12 14 16 18 20
3,6
5,6
7,6
9,6
89
.
Cuanto mas lejos se encuentren dichos puntos de la lınea
de regresion, menor sera la intensidad de la dependencia
entre las variables consideradas.
6
-
xi
ej
Valor teorico → y∗j
Valor observado → yj
X
Y
•••
••• •
•
*•
Toda lınea de regresion debe ir acompanada de una medida
de la ′′bondad′′ o ′′representatividad′′.
90
.
La varianza residual es el coeficiente que mide la variabilidad
de los residuos o errores y viene dada por la expresion
s2rY
=k∑i=1
h∑j=1
(yj − y∗j )2 ·nij
N=
k∑i=1
h∑j=1
e2j ·nij
N
siendo los valores ej = yj − y∗j los residuos o errores.
(a) Valores grandes de s2rY
indican que, en promedio, los
errores ej = yj − y∗j son grandes, y como consecuencia,
la lınea de regresion es poco representativa.
(b) Valores pequenos de s2rY
indicarıan que, en promedio, los
errores ej = yj − y∗j son pequenos, y por tanto, la lınea
de regresion es representativa. La maxima representa-
tividad se tiene si ej = 0 para todo j, es decir, cuando
s2rY
= 0, que es el mınimo valor que la varianza residual
puede alcanzar.
91
.
La varianza residual tiene el inconveniente de que dependede las unidades de medida al cuadrado. Esto hace que nosea posible comparar el grado de dependencia entre gruposde variables expresadas en distintas unidades de medida.Necesitamos por tanto una medida adimensional.
Se define el coeficiente de determinacion como
R2 = 1−s2rY
s2Y
Al estar R2 definido por cociente entre varianzas es unparametro independiente de las unidades de medida. Es-to nos permitira comparar resultados entre las asociacionesde diferentes grupos de variables.
Otra ventaja de este coeficiente es que su rango de va-riacion es acotado, 0 ≤ R2 ≤ 1, ya que se verifica que0 ≤ s2
rY≤ s2
Y .
92
.
(a) Si el ajuste es perfecto, es decir, todos los puntos del
diagrama de dispersion se situan sobre la curva calculada
(s2rY
= 0), entones R2 = 1.
(b) Cuanto mayor sea la distancia de los puntos a la cur-
va, mayor es s2rY
y menor R2. El valor mınimo de este,
R2 = 0, se alcanza cuando s2rY
= s2Y , en cuyo caso no
se consigue ninguna explicacion de la variable Y rela-
cionandola con la X mediante la curva considerada.
Cuando el coeficiente de determinacion vale como mınimo
0,75, el modelo ajustado suele aceptarse. Si el coeficiente
es inferior a dicho valor, concluiremos que la relacion ele-
gida no es adecuada, debiendose ensayar con otro tipo de
funcion.
93
.
Se define el coeficiente de correlacion lineal como
r =sXY
sXsY
Este coeficiente nos proporciona el grado de asociacion
lineal entre las variables, y el tipo de dicha relacion.
Puede demostrarse que, en el caso lineal, se verifica que
R2 = r2.
Al verificarse que R2 = r2 y que 0 ≤ R2 ≤ 1, se tendra que
−1 ≤ r ≤ 1. El signo hace alusion al tipo (lineal directa o
lineal inversa) y su valor en terminos absolutos, a la inten-
sidad de la relacion.
94
Interpretacion del valor de r
-1 -0.87 -0.5 0 0.5 0.87 1
FuerteInversa↑
EscasaInversa↑
EscasaDirecta↑
FuerteDirecta↑
↓PerfectaInversa
↓Incorreladas
↓PerfectaDirecta
↓RegularInversa
↓RegularDirecta
95
Ejemplo 11 Comparemos los valores de R2 y r obtenidos
con los datos que nos han proporcionado las graficas si-
guientes:
Perfecta directa Fuerte directa Regular directa
X
Y
0 2 4 6 8 10 12 14 16 18 20
3,6
5,6
7,6
9,6
X
Y
0 4 8 12 16 20
3
4
5
6
7
8
9
X
Y
0 4 8 12 16 20
2,5
4,5
6,5
8,5
10,5
R2 = 1 R2 = 0,9320 R2 = 0,6198r = +1 r = +0,9654 r = +0,7872
96
Capıtulo 4: SERIES TEMPORALES
4.1.-Introduccion
4.2.-Analisis de la tendencia de una serie temporal
4.3.-Analisis de la estacionalidad
97
Seccion 4.1: Introduccion
98
.
Llamamos serie temporal a una sucesion de observacionescuantitativas de un fenomeno, ordenadas en el tiempo.
En una serie temporal es esencial la ordenacion que el tiem-po induce en los datos. Esta ordenacion no puede variarse.
Vamos a considerar una serie temporal como una variablebidimensional (t, Yt), en la que una de las componentes, ladependiente, es la magnitud que queremos analizar, mien-tras que la independiente es el tiempo.
El analisis de una serie temporal debe iniciarse con unarepresentacion grafica en un sistema de ejes cartesianos.Representaremos en el de abcisas el tiempo, t, y en el deordenadas la magnitud observada, Yt. Con esto se consi-gue el diagrama de dispersion de la distribucion (ti, yti). Launion mediante segmentos de sus puntos nos proporcionaun ′′diagrama de sierra′′ del cual extraeremos las conclusio-nes iniciales sobre el comportamiento de nuestra serie.
99
Ejemplo 12 En la siguiente tabla se recogen las cifras re-
lativas a la poblacion reclusa existente en los diferentes
centros penitenciarios de Espana (Fuente: INE)
Meses 2002 2003 2004 2005 2006
Enero 48 398 52 547 56 814 59 668 61 447Febrero 49 031 53 091 57 725 59 966 61 930Marzo 49 685 53 525 58 068 60 078 62 426Abril 50 107 53 633 58 547 60 602 62 794Mayo 50 683 54 360 59 043 60 702 63 111Junio 50 961 54 770 59 125 60 887 63 552Julio 50 519 54 784 59 254 61 067 63 800Agosto 51 161 55 244 59 249 61 269 64 120
Septiembre 51 454 55 477 59 385 61 156 64 233Octubre 52 001 55 999 59 658 61 274 64 195
Noviembre 52 342 56 411 59 695 61 257 64 325Diciembre 51 882 56 096 59 375 61 054 64 021
100
Poblacion reclusa
1/02 1/03 1/04 1/05 1/06 1/07
48
51
54
57
60
63
66
(X 1000)
Serie temporal de la poblacion reclusa existente en los
diferentes centros penitenciarios de Espana
101
.
Supondremos que las series temporales estan formadas porcuatro componentes teoricas:
(a) Tendencia, Tt: evolucion de la serie a largo plazo.
(b) Estacional, Et: fluctuaciones de la serie que se producenen un periodo igual o inferior a un ano, y que se repro-ducen de manera reconocible en los diferentes anos. Sedeben a efectos de la climatologıa sobre la actividadeconomica o a algunos habitos sociales.
(c) Cıclica, Ct: oscilaciones que se producen con un periodosuperior al ano, debidas a la alternancia de etapas deprosperidad y depresion.
(d) Residual, rt: movimientos originados por fenomenos im-previsibles, como huelgas, catastrofes, etc., que afectana la variable de manera casual y no permanente.
102
¿Como se combinan las cuatro componentes teoricas para
formar la serie que observamos?. En el estudio clasico de
las series temporales se consideran los modelos siguientes:
(a) Modelo aditivo: Yt = Tt + Et + Ct + rt
(b) Modelo multiplicativo puro: Yt = Tt · Et · Ct · rt
(c) Modelo multiplicativo-aditivo: Yt = Tt · Et · Ct + rt
Para elegir uno u otro modelo existen varios metodos. En
el presente curso no vamos a profundizar en este tema y,
en todos los supuestos que vamos a estudiar se nos indi-
cara que modelo debemos utilizar.
103
Seccion 4.2: Analisis de la tendencia de una serie
temporal
104
.
Para realizar un estudio de la tendencia en una serie tem-poral, existen diferentes metodos. Vamos a desarrollar elque se conoce como Metodo de las medias moviles
Consiste en el suavizado de la serie dada, promediando susobservaciones con valores contiguos, anteriores y posterio-res, con lo que se consigue eliminar la componente residual.Para calcular medias moviles de orden o tamano p se pro-cede como sigue:
(a) La primera media movil se obtiene calculando la mediaaritmetica de las p primeras observaciones.
(b) Para calcular las siguientes, vamos excluyendo la primeraobservacion del grupo anterior e incluyendo la posteriora la ultima tomada.
(c) El proceso se repite hasta que no se puedan formar masgrupos que contengan p observaciones.
La tendencia sera la lınea quebrada que une las sucesivasmedias moviles.
105
Ejemplo 13
Usando medias moviles de orden 3,
ti yti Tendencia
t1 yt1
t2 yt2yt1 + yt2 + yt3
3= yt2
t3 yt3yt2 + yt3 + yt4
3= yt3
t4 yt4yt3 + yt4 + yt5
3= yt4
t5 yt5yt4 + yt5 + yt6
3= yt5
t6 yt6
La tendencia es la lınea quebrada que une los puntos
(t2, yt2), (t3, yt3), (t4, yt4) y (t5, yt5).
106
Debemos tener en cuenta que:
(a) Existen observaciones para las que no se dispone de
medias moviles.
(b) La eleccion del orden de las medias moviles no es facil, y
esta ligado a las periodicidades de las fluctuaciones que
se desean suavizar. Si los datos se refieren a perıodos
inferiores al ano, se aconseja tomar como valor de p
el numero de dichos perıodos. Cuando los datos de la
serie son anuales, y por tanto no existe componente
estacional, debemos tomar como orden el numero de
anos que comprenda un ciclo.
107
(c) A mayor orden de las medias moviles, mayor suaviza-
do, pero menor numero de observaciones para calculos
posteriores.
(d) Cuando se calculen medias moviles de orden par, las ob-
servaciones no quedaran centradas en el tiempo. Por ello
deberemos repetir el proceso a los promedios obtenidos
inicialmente, utilizando el orden 2.
108
Ejemplo 14
Usando medias moviles de orden 4,
ti yti yti Tendencia
t1 yt1t2 yt2
yt3
t3 yt3 yt3 =yt3 + yt4
2yt4
t4 yt4 yt4 =yt4 + yt5
2yt5
t5 yt5t6 yt6
La tendencia es la lınea que une los puntos (t3, yt3) y (t4, yt4).
109
Ejemplo 15 Durante el perıodo 1975-1986, la inversion en
instalaciones penitenciarias, expresada en millones de u.m.,
en cierto paıs fue la siguiente:
Anos 1975 1976 1977 1978 1979 1980Inversion 600 800 750 400 350 500
Anos 1981 1982 1983 1984 1985 1986Inversion 1 000 950 810 540 720 1 160
Suponiendo que la inversion considerada se comporta cıcli-
camente con perıodo de 4 anos, calculese la tendencia.
110
.
Segun se nos indica en el enunciado, debemos tomar como
valor de p el numero de anos que se supone comprende un
ciclo, es decir 4.
ti 1975 1976 1977 1978 1979 1980yti − − 606,25 537,5 531,25 631,25
ti 1981 1982 1983 1984 1985 1986yti 757,5 820 790 781,25 − −
111
Si el tamano del ciclo fuese 5, las medias moviles deberıan
calcularse de orden 5.
ti 1975 1976 1977 1978 1979 1980yti − − 580 560 600 640
ti 1981 1982 1983 1984 1985 1986yti 722 760 804 836 − −
112
Seccion 4.3: Analisis de la estacionalidad
113
En la gran mayorıa de las series temporales las fluctuacio-
nes debidas a la componente estacional, pueden provocar
una distorsion sobre la evolucion real de la misma. Debe-
mos, por tanto, identificar la componente estacional y a
continuacion eliminarla. A este procedimiento se la llama
desestacionalizacion. De igual manera que para el estudio
de la tendencia, para el analisis de la estacionalidad tam-
bien existen varios metodos. Nosotros usaremos el de las
medias moviles o metodo mecanico
114
.
Consta de los siguientes pasos:
(a) Determinamos la tendencia calculando las medias mo-
viles centradas en los perıodos, yti o yti . Para ello es-
cogeremos como orden de la media movil, p , el numero
de perıodos estacionales en que se divide el ano.
(b) Eliminamos de forma conjunta la tendencia y la compo-
nente cıclica de los datos originales yti.
(i) Si el modelo es aditivo, por diferencia:
yti − yti o yti − yti
(ii) Si el modelo es multiplicativo-aditivo, por cociente:
ytiyti
oytiyti
115
(c) Eliminamos la componente residual calculando los pro-
medios de los valores obtenidos en el apartado (b) para
cada perıodo estacional:
(i) Si el modelo es aditivo:
yej =1
qj
qj∑i=1
(y(j)ti− y(j)
ti) o yej =
1
qj
qj∑i=1
(y(j)ti− y(j)
ti)
donde qj es el numero de datos a promediar para el
j-esimo perıodo estacional y los sumandos son los va-
lores obtenidos en el apartado (b) para dicho perıodo.
Estos promedios son ya las diferentes componentes
estacionales. Es decir, ej = yej.
116
.
(ii) Si el modelo es multiplicativo-aditivo:
yej =1
qj
qj∑i=1
y(j)ti
y(j)ti
o yej =1
qj
qj∑i=1
y(j)ti
y(j)ti
siendo qj es el numero de datos a promediar para elj-esimo perıodo estacional y los sumandos son los va-lores obtenidos en el apartado (b) para dicho perıodo.Para obtener las componentes estacionales obtenemosla base, media aritmetica de los valores anteriores, conla que efectuaremos las comparaciones:
y =ye1
+ ye2+ . . .+ yep
p
Ası, las componentes estacionales seran
ej =yej
y,
llamadas tambien ındices de variacion estacional (IVE).
117
Ejemplo 16 La siguiente tabla recoge informacion sobre
el consumo de materia prima realizado por los estableci-
mientos penitenciarios de cierta Comunidad Autonoma en
el perıodo 1998-2003. Calculense las componentes estacio-
nales.
1998 1999 2000 2001 2002 2003
Trimestre 1 310 330 339 365 370 460Trimestre 2 290 305 320 355 375 401Trimestre 3 285 310 325 365 379 450Trimestre 4 330 345 360 390 400 500
118
(a) Determinamos la tendencia por el metodo de las medias
moviles de orden igual a 4, calculando las medias moviles
centradas, yti.
En un primer paso calculamos las medias moviles de
tamano 4 no centradas.
1998 1999 2000 2001 2002 2003
Trimestre 1318,75 332,25 361,25 378,50 427,75
Trimestre 2303,75 322,50 336,00 368,75 381,00 452,75
Trimestre 3308,75 324,75 342,50 370,00 403,50
Trimestre 4312,50 328,50 351,25 375,00 410,00
119
En un segundo paso calculamos las medias moviles de ta-mano 4 centradas, yti.
1998 1999 2000 2001 2002 2003
Trimestre 1 315,625 330,375 356,250 376,750 418,875Trimestre 2 320,625 334,125 365,000 379,750 440,250Trimestre 3 306,250 323,625 339,250 369,375 392,250Trimestre 4 310,625 326,625 346,875 372,500 406,750
120
.
(b) Eliminamos la tendencia y la componente cıclica de losdatos originales:
(i) Si el modelo es aditivo, haremos:
yti − yti
1998 1999 2000 2001 2002 2003
T1 14,375 8,625 8,750 −6,750 41,125T2 −15,625 −14,125 −10,000 −4,750 −39,250T3 −21,250 −13,625 −14,000 −4,375 −13,250T4 19,375 18,375 13,125 17,500 −6,750
(ii) Si el modelo es multiplicativo-aditivo, calcularemos:ytiyti
1998 1999 2000 2001 2002 2003
T1 1,04554 1,02610 1,02456 0,98208 1,09817T2 0,95126 0,95765 0,97260 0,98749 0,91084T3 0,93061 0,95789 0,95799 0,98815 0,96622T4 1,06237 1,05625 1,03783 1,04697 0,98340
121
.
(c) Eliminamos la componente residual calculando los pro-medios de los valores obtenidos en el apartado (b) paracada perıodo estacional, es decir, para cada trimestre:
(i) Si el modelo es aditivo:
Componente estacional: ej = yejTrimestre 1 13,225Trimestre 2 −16,750Trimestre 3 −13,300Trimestre 4 12,325
Si se supone que el incremento medio registrado enun trimestre considerado como ′′normal ′′ es 0 , en-tonces el consumo de materia prima por parte de laComunidad por el concepto considerado se ve incre-mentado en 13,225 unidades en los trimestres primerosy 12,325 unidades en los trimestres cuartos de cadaano. Por contra, en los trimestres segundo y tercerode cada ano el consumo de materia prima desciendeen 16,750 y 13,3 unidades, respectivamente.
122
.
(ii) Si el modelo es multiplicativo-aditivo:
Medias trimestrales: yejTrimestre 1 1,03529Trimestre 2 0,95596Trimestre 3 0,96017Trimestre 4 1,03736
A continuacion obtenemos la base, es decir, la media
de todos los valores anteriores:
y =ye1
+ ye2+ ye3
+ ye4
p=
3,98878
4= 0,9971
Por ultimo calcularemos las componentes estaciona-les
ej =yejy
Componente estacional: ejTrimestre 1 1,038202Trimestre 2 0,958648Trimestre 3 0,962870Trimestre 4 1,040277
123
.
Multiplicadas por cien, obtenemos la expresion porcentualde mas facil interpretacion:
e1 : 103,8202 %; e2 : 95,8648 %
e3 : 96,2870 %; e4 : 104,0277 %
El consumo de materia prima por parte de los estableci-mientos de la Comunidad se ve incrementado en un 3,8202 %
en los primeros trimestres y en un 4,0277 % en los trimestrescuartos de cada ano. Por contra, en los trimestres segundo ytercero de cada ano el consumo de materia prima desciendeen un 4,1352 % y en un 3,713 % , respectivamente.
124
Obtenidas las componentes estacionales, podemos deses-
tacionalizar la serie restandole a cada dato original de la
correspondiente estacion el valor de su componente estacio-
nal, si el modelo es aditivo, y dividiendo cada dato original
entre la correspondiente componente estacional expresada
en tantos por uno, en el caso multiplicativo-aditivo.
(i) Si el modelo es aditivo:
1998 1999 2000 2001 2002 2003
T1 296,775 316,775 325,775 351,775 356,755 446,775T2 306,750 321,750 336,750 371,750 391,750 417,750T3 298,300 323,300 338,300 378,300 392,300 463,300T4 317,675 332,675 347,675 377,675 387,675 487,675
125
(ii) Si el modelo es multiplicativo-aditivo:
1998 1999 2000 2001 2002 2003
T1 298,593 317,857 326,526 351,569 356,385 443,073T2 302,509 318,156 333,803 370,312 391,175 418,297T3 295,989 321,953 337,532 379,074 393,614 467,352T4 317,222 331,642 346,061 374,899 384,512 480,640
126
Serie desestacionalizada bajo el modelo
multiplicativo-aditivo
127
Capıtulo 5: LA UTILIZACION DE LA PROBABILIDAD
EN CRIMINOLOGIA
5.1.-Experimentos aleatorios. Definiciones
5.2.-Diversas concepciones de probabilidad
5.3.-Probabilidad condicionada
5.4.-Sucesos dependientes e independientes
128
Los protagonistas
Daniel Bernoulli (1700 - 1782)
Pertenecio a una de las familias mas singulares de
la historia de las ciencias. Al menos ochos de sus miembros
brillaron en diferentes campos de las matematicas. Daniel
destaco en ecuaciones diferenciales, calculo de probabilida-
des, mecanica, nautica, etc.
129
Blas Pascal (1623 - 1662)
Fue un genio precoz a quien su padre inicio muy
pronto en la geometrıa. Destaco en filosofıa, fısica y ma-
tematicas. Junto con Fermat, se considera iniciador de los
estudios de probabilidad tal y como los entendemos hoy en
dıa.
130
Pierre Fermat (1601 - 1665)
Matematico de gran importancia en el desarrollo
de la Teorıa de Numeros. En su correspondencia con Pascal
se situa el inicio del moderno calculo de probabilidades.
131
Andrei N. Kolmogorov (1903 - 1987)
Establecio las bases modernas de la teorıa axiomati-
ca de la probabilidad.
132
Seccion 5.1: Experimentos aleatorios. Definiciones
133
Definicion Los fenomenos aleatorios son aquellos en los
que no se puede predecir el resultado final incluso realizando-
se en las mismas condiciones.
Ejemplo 17 Son ejemplos de experimentos aleatorios el
lanzamiento de un dado equilibrado, la eleccion al azar de
un numero entre 0 y 1, consumo diario de agua de una
ciudad, etc...
Definicion La Teorıa de la Probabilidad estudia los meto-
dos de analisis que son comunes en el tratamiento de los
fenomenos aleatorios, cualquiera que sea el area en que
estos se presenten.
134
La correspondencia de Fermat con Pascal, consistente en
7 cartas entre julio y octubre de 1654, se considera el co-
mienzo del Calculo de Probabilidades. Concretamente las
misivas resolvieron el llamado Problema del Reparto:
′′Un jugador juega a que saca un seis de ocho tiradas,
pero despues de tres tiradas no lo ha conseguido y
la partida no se continua. ¿Que proporcion de la
apuesta total debe recibir? ′′
135
Definicion Se llama espacio muestral asociado a un experi-
mento aleatorio al conjunto formado por todos los posibles
resultados del experimento aleatorio. Suele representarse
por Ω.
Ejemplo 18 Consideremos el experimento aleatorio consis-
tente en lanzar un dado equilibrado de seis caras al aire y ob-
servar el numero de puntos que figuran en la cara superior.
Su correspondiente espacio muestral sera Ω = 1, 2, 3, 4, 5, 6.
Definicion Se denomina suceso a todo subconjunto A del
espacio muestral, (A ⊆ Ω). Es un resultado en que se con-
creta el experimento.
136
Los sucesos suelen representarse por letras mayusculas: A,
B, C,...
Ejemplo 19 En el lanzamiento de un dado, son sucesos:
A= ′′sacar puntuacion par ′′ = 2, 4, 6;
B= ′′sacar puntuacion 2 ′′ = 2.
137
Existen distintos tipos de sucesos:
(a) Suceso imposible es aquel que no ocurre nunca. Se re-
presenta por ∅.
(b) Suceso seguro es aquel que ocurre siempre. Se repre-
senta por Ω.
(c) Suceso elemental es el formado por un solo punto mues-
tral.
(d) Suceso compuesto es el formado por mas de un punto
muestral.
138
.
Definicion Se llama espacio de sucesos, S, al conjunto
formado por todos los sucesos asociados al experimento
aleatorio en cuestion.
Ejemplo 20 Ω = 1, 2, 3, 4, 5, 6 es el espacio muestral en el
lanzamiento de un dado de seis caras, entonces el espacio
de sucesos sera:
S = P (Ω) = ∅, 1, . . . , 6, 1, 2, . . . , 5, 6,
1, 2, 3, . . . , 3, 4, 5, 6, . . . , 2, 3, 4, 5, 6,Ω
Un suceso elemental es B= ′′sacar puntuacion 2 ′′ = 2.Un suceso compuesto es A= ′′sacar puntuacion par ′′ =
2, 4, 6.
139
.
Hemos establecido una correspondencia entre sucesos y
conjuntos. Vamos a recordar algunas operaciones y rela-
ciones entre conjuntos, que ahora, seran de interes para
trasladarlas a los sucesos.
Definicion Dado el suceso A de un espacio muestral Ω,
definimos suceso complementario de A, que se denota por
A, al suceso formado por todos los puntos muestrales que
no pertenecen a A.
A = ω ∈ Ω/ω /∈ A
El suceso A ocurre si y solo si no ocurre A.
Ejemplo 21 En el lanzamiento de un dado de seis caras
⇒ Ω = 1, 2, 3, 4, 5, 6. Entonces:
A= ′′sacar puntuacion par ′′ = 2, 4, 6 ⇒ A= ′′sacar pun-
tuacion impar′′ = 1, 3, 5140
.
Definicion Dados los sucesos A y B de un espacio muestralΩ, la union de ambos, que se denota por A∪B, es el sucesoformado por todos los puntos muestrales que pertenecenal menos a uno de los sucesos.
A ∪B = ω ∈ Ω/ω ∈ A o ω ∈ B
El suceso A∪B ocurre siempre que ocurra A o B o ambos.
Ejemplo 22 En el lanzamiento de un dado de seis caras,sean los sucesos A y B siguientes:
A= ′′sacar puntuacion par ′′ = 2, 4, 6
B= ′′sacar puntuacion mayor que 4 ′′ = 5, 6Entonces
A ∪B =′′sacar puntuacion par o puntuacion mayor que 4′′ = 2, 4, 5, 6
141
.Definicion Dados los sucesos A y B de un espacio muestralΩ, la interseccion de ambos, que denotamos por A ∩ B,es el suceso formado por todos los puntos muestrales quepertenecen a ambos sucesos.
A ∩B = ω ∈ Ω/ω ∈ A y ω ∈ B
El suceso A ∩B ocurre siempre que ocurran A y B.
Ejemplo 23 En el lanzamiento de un dado de seis caras,sean los sucesos A y B siguientes:
A= ′′sacar puntuacion par ′′ = 2, 4, 6
B= ′′sacar puntuacion mayor que 4 ′′ = 5, 6Entonces
A∩B = ′′sacar puntuacion par y puntuacion mayor que 4′′ = 6
142
.Definicion A y B son sucesos incompatibles o mutuamenteexcluyentes, si la ocurrencia simultanea de ambos es impo-sible, es decir: A ∩B = ∅.
Ejemplo 24 En el lanzamiento de un dado de seis caras,son incompatibles los sucesos:
A= ′′sacar puntuacion menor que 3 ′′ = 1, 2 y B= ′′sacarpuntuacion mayor que 4 ′′ = 5, 6
Observacion Un suceso y su complementario son siempresucesos incompatibles.
Leyes de De Morgan
(a) A ∪B = A ∩B
(b) A ∩B = A ∪B
143
Seccion 5.2: Diversas concepciones de probabilidad
144
.
Dado un suceso, A, perteneciente al espacio de sucesos
S asociado al espacio muestral Ω, la probabilidad trata de
asignar a A una medida teorica de la ocurrencia de A.
(a) DEFINICION CLASICA O DE LAPLACE (1812)
Deben establecerse dos hipotesis necesarias:
(i) El espacio muestral ha de ser finito, y
(ii) Todos los sucesos elementales han de ser igualmente
favorables
entonces se define la probabilidad del suceso A como
p(A) =numero de casos favorables a A
numero total de sucesos elementales posibles=](A)
](Ω)
145
Ejemplo 25 En el lanzamiento de un dado de seis caras
no cargado, consideremos Ω = 1, 2, 3, 4, 5, 6. Sea el suceso
A= ′′sacar puntuacion menor que 3 ′′ = 1, 2, entonces:
p(A) =](A)
](Ω)=
2
6= 0.3
146
.
(b) DEFINICION FRECUENCIALISTA O DE VON MISES(1919)
Si repetimos un experimento N veces, llamamos fre-cuencia relativa del suceso A, que denotamos por f(A),al cociente entre el numero de veces que este se pre-senta y el total de pruebas. La frecuencia relativa no esmas que una medida relativa y empırica de la ocurrenciade un suceso.
Es un hecho comprobado empıricamente que, la fre-cuencia relativa de un suceso tiende a estabilizarse cuan-do el numero de pruebas aumenta. La definicion fre-cuencialista de probabilidad se basa en este hecho, yasigna como probabilidad al suceso A el numero:
p(A) = lımN→∞
f(A) = lımN→∞
n(A)
N=
= lımN→∞
frecuencia absoluta de A
numero total de pruebas
147
Estas conclusiones llevan el nombre de Primera Ley de los
Grandes Numeros: Cuando el numero de realizaciones de un
experimento aleatorio crece mucho, la frecuencia relativa
del suceso asociado se va acercando cada vez mas hacia un
cierto valor. Este valor se llama probabilidad del suceso.
148
(c) DEFINICION AXIOMATICA O DE KOLMOGOROV
(1933)
Dado el espacio de sucesos S asociado a un espacio
muestral Ω, se define una medida de probabilidad, p,
como una funcion:
p : S → [0, 1]
que verifique los siguientes axiomas:
Axioma 1: p(A) ≥ 0, ∀A ∈ S
Axioma 2: p(Ω) = 1
Axioma 3: p
⋃i
Ai
=∑i
p(Ai), ∀Ai ∈ S, Ai ∩Aj = ∅, i 6= j
149
Observacion Los axiomas anteriores permiten demostrar
las dos propiedades siguientes:
(a) p(A) = 1− p(A)
(b) p(A ∪B) = p(A) + p(B)− p(A ∩B)
Definicion Se denomina espacio probabilıstico a la terna
(Ω,S, p), donde S es el espacio de sucesos asociado al es-
pacio muestral Ω, y p es una medida de probabilidad.
150
Caso 1 El ciudadano norteamericano Wayne Williams fue
acusado de las muertes de dos hombres negros en Atlan-
ta, Georgia. La evidencia contra Williams consistıa en un
numero de fibras de moqueta encontradas sobre los cuer-
pos, que se parecıan a las fibras encontradas en su entorno.
Estas fibras pertenecen a un tipo de moqueta poco usual.
Un experto concluye que ese tipo de fibra solo se encuentra
en 10 areas del Estado. Asumiendo que las ventas han sido
iguales en las 10 areas y que solo se ha enmoquetado una
habitacion por casa, el experto cifra, por la cantidad de mo-
queta vendida, que solo 81 casas de Atlanta contenıan esa
fibra de 638992, luego si llamamos al suceso A= ′′la casa
seleccionada tiene la moqueta considerada ′′ entonces:
p(A) =81
638992= 0,0001267 u
1
8000
151
La habitacion de Wayne Williams tenıa moqueta con esa
fibra y el fiscal arguyo que ′′habıa solo una posibilidad so-
bre 8000 de que hubiera otra casa en Atlanta que tuviera
la misma moqueta que la casa de Williams′′. El acusado
finalmente serıa declarado culpable.
152
Seccion 5.3: Probabilidad condicionada
153
En los ejemplos que hemos planteado hasta ahora, siem-
pre hemos supuesto que cualquiera de los resultados puede
ocurrir en el experimento. La incorporacion de una infor-
macion adicional, como por ejemplo, el conocimiento de la
ocurrencia de otro suceso, puede hacer que determinados
resultados no puedan ocurrir, con lo que el espacio muestral
cambia y cambian las probabilidades.
154
.
Ejemplo 26 Supongamos el experimento consistente la ex-
traccion de una bola de un bolsa que contiene seis bolas
numeradas del uno al seis y observar el resultado obtenido.
El correspondiente espacio muestral es Ω = 1, 2, 3, 4, 5, 6, y
la probabilidad inicial del suceso A= ′′sacar numero primo′′
= 2, 3, 5 es:
p(A) =3
6=
1
2
Observacion Dado un numero entero n > 1, diremos que
n es un numero primo, si 1 y n son los unicos divisores
positivos de n. Por tanto los primeros numeros primos son
2, 3, 5, 7, 11, etc.
155
Supongamos ahora que las bolas correspondientes a los
numeros pares han sido introducidas en una bolsa de color
rojo y las correspondientes a los impares en una de color
amarillo. Seleccionamos al azar una de las dos bolsas re-
sultando seleccionada la roja. Si a continuacion extraemos
una bola de dicha bolsa, ¿que probabilidad hay de que la
cifra obtenida sea numero primo?
156
La informacion del color de la bolsa produce, en este caso,
una reduccion del espacio muestral a:
Ωroja = Ωpar = 2, 4, 6
con lo que,
p(A si se elegio bolsa roja) = p(A/puntuacion par) =1
3
Como vemos, en este caso, la informacion disponible ha
hecho disminuir la probabilidad.
157
Otras veces una informacion adicional aumenta dicha pro-
babilidad. Supongamos que el color de la bolsa seleccionada
hubiese sido amarilla, entonces:
Ωamarilla = Ωimpar = 1, 3, 5
y, por tanto,
p(A si se eligio bolsa amarilla) = p(A/puntuacion impar) =2
3
158
Definicion Cuando consideremos la probabilidad de ocu-
rrencia de un suceso A perteneciente a un espacio de su-
cesos sabiendo que ha acontecido otro suceso B, diremos
que estamos calculando la probabilidad de A condiciona-
da a B. Lo denotamos por p(A/B), donde A es el suceso
condicionado y B es el suceso condicionante.
159
En el ejemplo anterior podemos expresar la probabilidad de
obtener numero primo, habiendo obtenido cifra par como:
p(A/puntuacion par) =1
3=
1
63
6
=p(A ∩ puntuacion par)
p(puntuacion par)
y, la probabilidad de obtener numero primo, habiendo ob-
tenido cifra impar como:
p(A/puntuacion impar) =2
3=
2
63
6
=p(A ∩ puntuacion impar)
p(puntuacion impar)
160
Definicion Sea (Ω,S, p) un espacio probabilıstico y B un
suceso de S con probabilidad no nula, p(B) > 0. Sea A un
suceso cualquiera de S, llamaremos probabilidad del suce-
so A condicionada porque haya acontecido otro suceso B
o, sencillamente, probabilidad de A condicionada por B, al
cociente
p(A/B) =p(A ∩B)
p(B)
161
Teorema Sean A1, A2, . . . , An ∈ S tales que p(A1 ∩A2 ∩ . . .∩An−1) 6= 0 entonces
p(A1 ∩A2 ∩ . . . ∩An) =
= p(A1) · p(A2/A1) · p(A3/A1∩A2) · · · p(An/A1∩A2∩ · · · ∩An−1)
162
Ejemplo 27 De un lote de doce artıculos, de los cuales
cuatro son defectuosos, se toman tres artıculos escogidos
al azar uno tras otro sin reemplazamiento. Calcula la proba-
bilidad de que los tres artıculos sean no defectuosos. Sean
los sucesos
A1= ′′ el primer artıculo seleccionado es no defectuoso ′′
A2= ′′ el segundo artıculo seleccionado es no defectuoso ′′
A3= ′′ el tercer artıculo seleccionado es no defectuoso ′′
Entonces:
p(A1∩A2∩A3) = p(A1)·p(A2/A1)·p(A3/A1∩A2) =8
12·
7
11·
6
10=
14
55
163
Seccion 5.4: Sucesos dependientes e independientes
164
.
Ejemplo 28 Consideremos el experimento consistente en
lanzar un dado no cargado y sean los sucesos A y B siguien-
tes:
A= ′′ obtener cifra mayor que 2 ′′ = 3, 4, 5, 6 ⇒ p(A) =4
6
B= ′′ obtener cifra par ′′ = 2, 4, 6 ⇒ p(B) =3
6
A ∩B= ′′ obtener cifra par mayor que 2 ′′ = 4, 6 ⇒
p(A ∩B) =2
6, entonces
p(A/B) =p(A ∩B)
p(B)=
2
63
6
=2
3= p(A)
p(B/A) =p(B ∩A)
p(A)=
2
64
6
=2
4= p(B)
165
Como observamos, la informacion suministrada por el suce-so condicionante resulta indiferente en cuanto a la proba-bilidad de ocurrencia del suceso condicionado. Los sucesosA y B se diran independientes.
Definicion Sea el espacio probabilıstico (Ω,S, p) y sean A yB sucesos de S con p(B) > 0. Diremos que los sucesos A yB son independientes si se verifica que
p(A/B) = p(A)
O dicho de otra forma:
Definicion Diremos que dos sucesos A y B son indepen-dientes si y solo si se verifica que:
p(A ∩B) = p(A) · p(B)
166
Caso 2 En Miller v. State, 240 Ark. 340, 399 S.W.2d 268(1966), un experto testifico basado en las probabilidadesde los siguientes sucesos:
1. A1= ′′ Encontrar al azar una fibra de un determinadocolor′′, p(A1) = 1/10,
2. A2= ′′ Encontrar al azar una fibra de una determinadatextura′′, p(A2) = 1/100 y
3. A3= ′′ Encontrar al azar una fibra de una determinadadensidad′′, p(A3) = 1/1000
luego
p(A1∩A2∩A3) = p(A1) ·p(A2) ·p(A3) =1
10·
1
100·
1
1000=
1
1000000
167
por tanto, el acusado fue condenado en base a que la pro-
babilidad de encontrar al azar una fibra incriminatoria como
la encontrada sobre su ropa era de 1/1000000=0.000001.
En la corte de apelacion, la condena fue revocada por no
considerar adecuada tal probabilidad.
168
Caso 3 En Collidge v. State, 109 N.H. 403, 260 A. 2d 547
(1969). Un experto obtuvo fibras del vestido de la vıctima,
de la ropa del acusado y del automovil donde se creıa que un
crimen se habıa perpetrado. Estudios previos indican que la
probabilidad de encontrar partıculas similares en rastreos de
una serie de automoviles era de 1/10. El experto concluye
que si llamamos
A= ′′Encontrar 27 partıculas similares′′, entonces
p(A) =1
1027
Otro experto sostuvo que las 27 partıculas pueden no ser
independientes unas de otras, pero la corte opta por la
condena del acusado.
169
Teorema de la probabilidad total Dado un espacio proba-
bilıstico (Ω,S, p), si A1, A2, . . . , An ∈ S es una coleccion de
sucesos mutuamente excluyentes, todos con probabilidades
no nulas, y tales que Ω =n⋃i=1
Ai, se verifica para todo B ∈ S:
p(B) =n∑i=1
p(B/Ai) · p(Ai)
170
.
Teorema de Bayes Dado un espacio probabilıstico (Ω,S, p),
si A1, A2, . . . , An ∈ S es una coleccion de sucesos mutuamen-
te excluyentes, todos con probabilidades no nulas, y tales
que Ω =n⋃i=1
Ai, se verifica para todo B ∈ S:
p(Aj/B) =p(Aj ∩B)
p(B)=
p(B/Aj) · p(Aj)n∑i=1
p(B/Ai) · p(Ai)
, con j = 1, 2, . . . , n.
A las probabilidades p(Aj) se les llama probabilidades a prio-
ri, y son las probabilidades iniciales que tenemos de los su-
cesos Aj. Ante una determinada evidencia experimental, B,
corregimos el grado de creencia de las Aj obteniendo unas
nuevas probabilidades, p(Aj/B), llamadas probabilidades a
posteriori, a traves de las verosimilitudes, p(B/Aj).
171
.
Caso 4 US v. Lopez, 328 F. Supp. 1077 (EDNY 1971). En
1980 la administracion americana introduce un programa
para ayudar a identificar pasajeros con sustancias ilegales
en los aviones. Consideremos el suceso:
A= ′′ Una persona elegida al azar lleva sustancias ilegales′′
Supongamos que, aproximadamente, una persona de cada
25000 viajeros lleva una sustancia ilegal. Es decir que se
tiene que p(A) =1
25000= 0,00004, probabilidad llamada a
priori.
Para confirmar tal suposicion, usamos un test o prueba
que previamente ha sido evaluada sobre dos grupos de in-
dividuos, unos que llamaremos ′′afectados′′ (con sustancias
ilegales, en este caso) y otros que no.
172
Ası, se ha estimado de modo frecuencialista que el test tiene
una sensibilidad del 90 % y una especificidad del 99.95 %.
La sensibilidad de un test es la proporcion de individuos
afectados que son dados como positivos, correctamente,
por el test, es decir, p(+/A) = 0,90.
El termino tasa de falsos negativos hace referencia al com-
plementario de la sensibilidad.
Tasa de falsos negativos=1- sensibilidad=p(−/A) = 0,10
173
La especificidad de un test es la proporcion de individuos
de entre los no afectados que son dados como negativos,
correctamente, por el test, es decir, p(−/A) = 0,9995.
El termino tasa de falsos positivos hace referencia al com-
plementario de la especificidad.
Tasa de falsos positivos=1- especificidad=p(+/A) = 0,0005
A partir de lo anterior y usando el Teorema de Bayes, po-
demos calcular las probabilidades a posteriori (en funcion
de los resultados del test): los llamados valores predictivos
positivo y negativo.
Valor predictivo positivo=p(A/+)
Valor predictivo negativo=p(A/−)
174
.
Dos pasajeros muestran el perfil sospechoso. Son cachea-
dos, se les encuentra heroına y son arrestados. La pregunta
que hace la defensa es cual es la proporcion de personas
que llevan una sustancia ilegal supuesto que que el test los
ha calificado de ′′alto riesgo′′, es decir, supuesto que el test
ha sido positivo.
Aplicando el teorema de Bayes dicha probabilidad sera
p(A/+) =p(+/A) · p(A)
p(+/A) · p(A) + p(+/A) · p(A)=
=0,90 · 0,00004
0,90 · 0,00004 + 0,0005 · 0,99996= 0,067
es decir, un 6.7 % de individuos calificados como de alto
riesgo lleva sustancias ilegales.
175
Luego nuestra suposicion de que un 0,004 % de pasajeros
llevaban sustancias ilegales, es del 6,7 % una vez realizada
la prueba. Nuestra opinion a priori ha sido modificada por
el resultado del experimento.
La defensa arguye que esta proporcion es demasiado baja
para justificar un breve arresto de los detenidos.
176
.
Caso 5 En 1986 la administracion de Reagan declara el uso
de drogas incompatible con un empleo en la administracion
estadounidense y autoriza la realizacion de un test de orina
para los nuevos aspirantes a funcionarios o para los ya fun-
cionarios de los que se sospeche que consumen drogas. En
la orden se asegura que el test debe tener una sensibilidad
del 98 %, una especificidad del 95 % y se supone que el 1 %
de la poblacion laboral toma drogas.
Consideremos los sucesos
A= ′′una persona elegida aleatoriamente toma drogas′′
A= ′′una persona elegida aleatoriamente no toma drogas′′
+= ′′en una persona elegida al azar el test da positivo ′′
−= ′′en una persona elegida al azar el test da negativo′′
177
De estos sucesos conocemos
Las probabilidades a priori, que son p(A) = 0,01; p(A) = 0,99
La sensibilidad p(+/A) = 0,98;
La tasa de falsos negativos p(−/A) = 0,02;
La especificidad p(−/A) = 0,95;
La tasa de falsos positivos p(+/A) = 0,05.
178
.El valor predictivo positivo del test, es decir, la proporcionsobre todos los tests positivos que realmente se correspon-den con personas consumidoras de droga es de
p(A/+) =p(+/A) · p(A)
p(+/A) · p(A) + p(+/A) · p(A)=
=0,98 · 0,01
0,98 · 0,01 + 0,05 · 0,99= 0,1652
El valor predictivo negativo es de
p(A/−) =p(−/A) · p(A)
p(−/A) · p(A) + p(−/A) · p(A)=
=0,95 · 0,99
0,95 · 0,99 + 0,02 · 0,01= 0,9997
179
Capıtulo 6: MODELOS PROBABILISTICOS
ASOCIADOS A LA CRIMINOLOGIA
6.1.-Variables aleatorias
6.2.-Caracterısticas de las variables aleatorias
6.3.-Modelos probabilısticos
180
Seccion 6.1: Variables aleatorias
181
Ejemplo 29 Cierto establecimiento penitenciario contabili-
za el numero de accidentes laborales diarios. Los datos del
ultimo mes fueron:
Numero de accidentes 0 1 2 3 4
Numero de dıas 10 12 5 2 1
Considerando la variable estadıstica
X =′′ N0 de accidentes diarios ′′,
puede considerarse la distribucion de frecuencias:
xi 0 1 2 3 4
ni 10 12 5 2 1fi 1/3 2/5 1/6 1/15 1/30
182
Para dicha distribucion podemos calcular una serie de coe-
ficientes como por ejemplo x, Me, s2, etc... Estas medidas
empıricas tienen su fundamento en las frecuencias observa-
das de los valores de la variable.
Despues de observar el comportamiento de dicha variable
durante un numero elevado de meses, las regularidades ob-
servadas en las frecuencias relativas permiten la definicion
de una distribucion de probabilidad que trate de explicar el
comportamiento futuro del fenomeno.
xi 0 1 2 3 4
pX(xi) 1/3 2/5 1/6 1/15 1/30
183
De forma analoga al caso de la variable estadıstica podemos
resumir los aspectos mas relevantes de esta distribucion me-
diante una serie de medidas teoricas como por ejemplo la
esperanza, la mediana, la varianza, etc... Ası podemos rela-
cionar conceptos como los que se muestran en la siguiente
tabla:
Medidas Empıricas Medidas Teoricas
Frecuencia relativa ProbabilidadFrecuencia relativa acumulada Funcion de distribucion
Variable estadıstica Variable aleatoriaMedia aritmetica (x) Esperanza matematica (µ)
Varianza (s2) Varianza (σ2)
184
Ejemplo 30 Realicemos el experimento consistente en lan-zar una moneda no cargada dos veces. Su espacio muestralsera:
Ω = (c, c), (c,+), (+, c), (+,+)donde todos los puntos muestrales son equiprobables.
Nos fijaremos en una determinada caracterıstica numericadel experimento, como por ejemplo,
X=′′numero de caras obtenidas en los dos lanzamientos ′′.
Podemos considerar X como una aplicacion que asocia acada resultado del espacio muestral un valor numerico
X : Ω −→ R(c, c) −→ 2(c,+) −→ 1(+, c) −→ 1(+,+) −→ 0
185
Ademas, cada uno de estos valores se toma con una cierta
probabilidad inducida por la aleatoridad del fenomeno al que
esta asociado. Ası, podemos escribir, por ejemplo:
p[X = 0] = p[(+,+)] =1
4
p[X = 1] = p[(c,+) ∪ (+, c)] =1
4+
1
4=
1
2
p[X = 2] = p[(c, c)] =1
4
186
La nocion de variable aleatoria es la de una funcion que
asigna un valor numerico a cada suceso elemental. De este
modo trasladamos la probabilidad definida sobre sucesos a
subconjuntos de la recta real.
Definicion Sea (Ω,S, p) un espacio probabilıstico, se deno-
mina variable aleatoria (v.a.) a una aplicacion:
X : Ω −→ Rw ∈ Ω −→ X(w) ∈ R
187
Definicion Se denomina funcion de distribucion (f.d.D.)
de una variable aleatoria X a la funcion FX definida como
sigue:
FX : R −→ [0, 1]
FX(x) = p [X ≤ x] , ∀x ∈ R.
La funcion de distribucion de la variable aleatoria X describe
la acumulacion de probabilidad por la variable a lo largo de
la recta real. Tiene su antecedente en la frecuencia relativa
acumulada.
188
Definicion Una variable aleatoria X es discreta si el con-
junto de valores que puede tomar X con probabilidad no
nula es discreto (finito o infinito numerable)
Si la variable es discreta y toma pocos valores distintos,
podemos dar esos valores con sus probabilidades de for-
ma explıcita, pero si presenta muchos valores diferentes o
es de otro tipo, debemos apoyarnos en funciones que nos
resuman sus caracterısticas esenciales.
189
Definicion Se conoce como funcion de masa de proba-
bilidad o funcion de probabilidad de una variable aleatoria
discreta X que toma los valores x1, x2, . . . , xn, . . . con proba-
bilidades no nulas a la funcion
pX : R→ [0, 1]
definida por:
pX(x) =
p[X = xk], si x = xk, k = 1, 2, . . . , n, . . .0, en otro caso.
190
Sea X una variable aleatoria discreta que toma los valores
x1, x2, . . . , xn, . . . entonces se verifican las siguientes propie-
dades:
(a) 0 ≤ pX(xk) ≤ 1 para todo k.
(b)∑k
pX(xk) = 1.
(c) FX(x) = p[X ≤ x] =∑xk≤x
pX(xk).
(d) pX(xk) = FX(xk)− FX(xk−1).
191
Ejemplo 31 Consideremos el Ejemplo 30, y sea X=′′nume-
ro de caras obtenidas en dos lanzamientos de la moneda′′.Sus posibles valores son X = 0, 1, 2. Calculemos primero
FX en los posibles valores de X:
FX(0) = p [X ≤ 0] = p [X = 0] =1
4
FX(1) = p [X ≤ 1] = p [X = 0] + p [X = 1] =3
4FX(2) = p [X ≤ 2] = p [X = 0] + p [X = 1] + p [X = 2] = 1
Observemos que FX esta definida en todo el conjunto de
los numeros reales, por tanto:
FX(x) =
0, si x < 01/4, si 0 ≤ x < 13/4, si 1 ≤ x < 21, si x ≥ 2
192
.La representacion grafica de FX es la siguiente:
6
-
1 2
0.25
0.75
1
-
-
-
-
ee
ee
Observemos que los saltos de la funcion de distribucion seproducen justamente en los valores que toma la variable yson de amplitud igual a las probabilidades con que los toma.Es decir,
p[X = 0] = 0,25
p[X = 1] = 0,5
p [X = 2] = 0,25
193
Definicion Una variable aleatoria X con funcion de distri-
bucion FX se dice que es continua, si existe una funcion
fX(x) ≥ 0 tal que:
FX(x) = p [X ≤ x] =
∫ x
−∞fX(t) dt, ∀x ∈ R.
A fX(x) se le denomina funcion de densidad (f.d.d.) de la
variable aleatoria continua X.
194
Asociadas a la funcion de densidad tenemos las siguientespropiedades:
(a)
∫ +∞
−∞fX(t) dt = 1, (FX (+∞) = 1)
(b) fX(x) = F ′X
(x) , es decir, la f.d.d. puede obtenerse atraves de la f.d.D.
(c) p[X = a] = 0, ∀a ∈ R. (Como FX es continua, no tienesaltos)
(d) p[X ≤ b] = p[X < b] =
FX(b)∫ b
−∞fX(t) dt
195
(e) p[X > a] = p[X ≥ a] =
1− FX(a)∫ +∞
afX(t) dt
(f) p[a < X ≤ b] = p[a ≤ X < b] = p[a < X < b] =
= p[a ≤ X ≤ b] =
FX(b)− FX(a)∫ b
afX(t) dt
196
Seccion 6.2: Caracterısticas de las variables aleatorias
197
Definicion Sea X una variable aleatoria discreta que to-
ma los valores x1, x2, . . . , xn, . . . con probabilidades pX(xi) >
0. Llamaremos esperanza matematica, media, valor medio
o valor esperado de X, E[X], a:
E[X] =∞∑i=1
xi pX(xi) =∞∑i=1
xi p[X = xi]
Definicion Sea X una variable aleatoria continua con fun-
cion de densidad fX(x). Se llama esperanza matematica,
media, valor medio o valor esperado de X, E[X], a:
E[X] =
∫ +∞
−∞x fX(x) dx.
198
Definicion Sea X una variable aleatoria con media µ, con-
tinua con funcion de densidad fX(x) o discreta con funcion
de probabilidad pX(x). Se llama varianza de X a
V ar [X] =
∞∑i=1
(xi − µ)2 pX(xi), si X es discreta
∫ +∞
−∞(x− µ)2 fX(x) dx, si X es continua
199
Ejemplo 32 Un concesionario de automoviles, A, vende
2 coches la mitad de los dıas y 16 la otra mitad. Otro
concesionario, B, vende 8 coches la mitad de los dıas y 10
la otra mitad. Queremos calcular el numero de coches que
se espera que vendan cada uno de los concesionarios un dıa
cualquiera y dar una medida de la representatividad de la
citada medida.
Sean XA =′′numero de coches que vende el concesionario
A en un dıa ′′ y XB =′′numero de coches que vende el
concesionario B en un dıa ′′.
xi 2 16
pXA(xi) 0.5 0.5
xi 8 10
pXB(xi) 0.5 0.5
200
Calculemos la esperanza y la varianza de cada variable:
E[XA] = 2 · 0,5 + 16 · 0,5 = 9
E[XB] = 8 · 0,5 + 10 · 0,5 = 9
V ar[XA] = (−7)2 · 0,5 + 72 · 0,5 = 49
V ar[XB] = (−1)2 · 0,5 + 12 · 0,5 = 1
Ambos concesionarios venden por termino medio el mismo
numero de coches al dıa, pero para el concesionario B es-
te promedio puede considerarse mas representativo ya que
tiene una menor dispersion.
201
Seccion 6.3: Modelos probabilısticos
202
Una de las preocupaciones de los cientıficos dedicados al
Calculo de Probabilidades ha sido construir modelos de dis-
tribuciones de probabilidad que pudieran representar el com-
portamiento teorico de diferentes fenomenos aleatorios que
aparecen en el mundo real. Se puede observar como dife-
rentes distribuciones de probabilidad tienen una estructura
matematica parecida, es decir, responden a un mismo mo-
delo.
Una distribucion de probabilidad queda definida mediante
la especificacion de la variable, su campo de variacion y la
determinacion de sus probabilidades.
203
Si un conjunto de distribuciones tienen sus funciones de
definicion (funcion de distribucion, de densidad, de pro-
babilidad) con la misma estructura funcional, diremos que
pertenecen a la misma familia de distribuciones o al mismo
modelo de probabilidad.
La estructura matematica de las funciones de definicion de
las distribuciones de la misma familia, suele depender de
uno o varios parametros a los que llamaremos parametros
de la distribucion.
Las ventajas de trabajar con modelos es que podemos apli-
car unas formulas matematicas que permiten facilmente
calcular probabilidades.
204
La distribucion o modelo Binomial
Consideremos un experimento aleatorio que puede dar lu-
gar unicamente a dos resultados, A (llamado habitualmente
exito) y A (llamado habitualmente fracaso), con probabili-
dades de ocurrencia respectivas p y q (p+ q = 1).
Definicion Un experimento como el anterior recibe el nom-
bre de experimento de Bernouilli.
205
Supongamos que se realizan n repeticiones independientesde un experimento de Bernouilli con probabilidades de exitoy fracaso respectivas p y q que permanecen invariantes a lolargo de todo el proceso. Si estamos interesados en estudiarel numero de veces que ocurre el suceso A (exito) en lasn repeticiones del experimento, podemos definir la variablealeatoria siguiente:
X = ′′ numero de exitos que ocurren en las n pruebasindependientes ′′
Esta variable tiene como posibles valores
X = 0, 1, 2, . . . , ny su correspondiente funcion de probabilidad es
p[X = k] =
(n
k
)pkqn−k, para k = 0, 1, 2, . . . , n
206
A la distribucion de la variable anterior se la conoce con el
nombre de distribucion Binomial de parametros n y p , que,
simbolicamente representaremos por:
X B(n, p)
Sus principales caracterısticas son:
(a) E[X] = np
(b) V ar[X] = npq
207
Caso 6 La llamada Sexta Enmienda de la Constitucion de
los Estados Unidos expresa que:
′′Los paneles de jurados deben ser seleccionados de
una fuente representando una seccion cruzada justa
de la comunidad de la que el acusado forma parte.′′
En Whitus v. Georgia, 385 US 545 (1967), la poblacion de
raza negra constituıa el 27 % de donde se selecciona el ju-
rado. De una lista inicial se seleccionan al final 90 personas
que solo incluye a 7 personas de color. Se plantea cual es
la probabilidad de que se de tal hecho y si se ha producido
una rotura de la representacion racial.
208
Sea X =′′ numero de panelistas de raza negra de 90 ′′ B(90, 0,27)
p[X = 7] = 0,000003
Se hace notar que el jurado, que finalmente condena al
acusado, no tiene ninguna persona de color.
209
.
Caso 7 En Alexander v. Louisiana, 405 US 625 (1972),
para elegir un panel de jurados se repartieron una serie de
cuestionarios. De los 7374 que se devuelven, 1015 corres-
ponden a personas de color, es decir, solo un 13.76 %. Con
dichos cuestionarios se crea un panel revisado de posibles
jurados compuesto por 400 personas de las que solo 27 son
de raza negra.
Se considera la variable aleatoria:
X =′′ numero de panelistas de raza negra de 400 ′′
Teniendo en cuenta que X B(400, 0,1376), la corte calcula
la probabilidad de que el numero de personas de color se-
leccionadas sea menor o igual que 27 de una lista de 400,
cifrandose esta en:
p[X ≤ 27] = p[X = 0]+p[X = 1]+ · · ·+p[X = 27] = 0,0000069511
210
.
La distribucion o modelo de Poisson
Supongamos que se realiza un experimento consistente en
observar la aparicion de ciertos acontecimientos puntuales
o exitos que ocurren sobre un soporte continuo (tiempo,
espacio, longitud, etc...) con las siguientes condiciones:
(a) El numero medio de exitos a largo plazo es constante.
(b) Los exitos ocurren aleatoriamente de forma indepen-
diente.
A este tipo de experimentos se les llama procesos de Pois-
son y son ejemplos del mismo la llegada de clientes a cierta
ventanilla de un banco en una hora, los defectos que apa-
recen en cada rollo de cable, etc.
211
Para este tipo de procesos, podemos definir la variable:
X= ′′numero de exitos en un intervalo de amplitud
determinada ′′
que puede tomar como posibles valores
X = 0, 1, 2 . . .
con funcion de probabilidad
p[X = k] = e−λ ·λk
k!, para k = 0, 1, 2 . . .
212
Diremos que una variable de este tipo sigue una distribucion
de Poisson de parametro λ (λ > 0) y escribiremos
X P(λ)
Sus principales caracterısticas son:
(a) E[X] = λ
(b) V ar[X] = λ
213
Aproximacion de Poisson a la distribucionBinomial
Teorema Sea X una variable aleatoria con distribucion
B(n, p) se verifica que si
p ≤ 0,1 y np = λ < 5
la distribucion de X tiende a ser P(np).
214
.
Caso 8 En Avery v. Georgia, 345 US 559 (1953), un acu-sado de raza negra era condenado por un jurado compuestotodo por personas de raza blanca extraıdo de un panel de60 personas tambien todas blancas. Los nombres de estospanelistas son sacados de una caja que contienen papele-tas amarillas para las personas de color y papeletas blancaspara los blancos. El 5 % de las papeletas son amarillas yno es seleccionado para el panel ninguna papeleta amarilla.¿Cual es la probabilidad de que se de tal hecho?
Sea X =′′ numero de panelistas de raza negra de 60 ′′ B(60, 0,05) P(3)(aprox)
p[X = 0] =
0,046069,usando B(60, 0,05)0,049787,usando P(3)
En tal sentido un juez escribio: ′′No solamente los ojos, sinotambien la mente de la justicia, debe ser ciega para atribuiresta situacion a un mero hecho fortuito′′
215
.
La distribucion o modelo Normal
Podemos resumir la importancia de la distribucion Normal
diciendo que:
(a) Un gran numero de fenomenos reales pueden modelizar-
se con ella. Por ejemplo, las medidas fısicas del cuerpo
humano en una poblacion, las caracterısticas psıquicas
medidas por tests de inteligencia o personalidad, las me-
didas de calidad en muchos procesos industriales, etc.
(b) Muchas otras distribuciones pueden aproximarse me-
diante la distribucion Normal.
(c) Todas aquellas variables que puedan considerarse cau-
sadas por un gran numero de pequenos efectos tienden
a distribuirse como una distribucion Normal.
216
Definicion Se dira que la variable aleatoria X sigue una
distribucion Normal de parametros µ y σ si su funcion de
densidad es de la forma:
fX(x) =1
σ√
2π· e
−1
2
(x− µσ
)2
x ∈ R, σ > 0, µ ∈ R
Simbolicamente escribiremos
X N (µ, σ)
Sus principales caracterısticas son:
(a) E[X] = µ
(b) V ar[X] = σ2
217
Algunas aproximaciones mediante la dis-tribucion Normal
(a) Aproximacion de la distribucion binomial mediante la
distribucion Normal.
Teorema de De Moivre-Laplace Sea X una variable alea-
toria con distribucion B(n, p). Se verifica que si
p < 0,1 y np > 5 o 0,1 < p < 0,9 y n > 30
la distribucion de X tiende a ser N(np,√npq
).
218
(b) Aproximacion de la distribucion de Poisson mediante la
distribucion Normal.
Teorema Sea X una variable aleatoria con distribucion
P(λ). Se verifica que si
λ > 10
la distribucion de X tiende a ser N(λ,
√λ).
219