|
Anexo
III
DOCUMENTO
ELABORADO POR LA AAAS1
METODOLOGÍA INTERMUESTRA I: INTRODUCCIÓN
Y RESUMEN
El objetivo y el problema
-
¿Cuántas personas fueron asesinadas en
Guatemala durante el período del mandato de la CEH, 1960-1996?
Tomando en cuenta la información de las tres bases de
datos sobre violaciones de Derechos Humanos (CEH, CIIDH, REMHI),
recogida por medio de entrevistas con testigos directos y víctimas,
surgen algunas preguntas: a) ¿cuántos asesinatos fueron
documentados por los tres proyectos? y b) ¿cuántos asesinatos
se estiman que ocurrieron -en total- durante el conflicto armado?
-
Este análisis trata los dos temas. En
la parte I, se establece la información recogida por
los tres proyectos y los objetivos del análisis. En la
parte II se explican los métodos científicos utilizados
para estimar cifras que responden las preguntas empíricas
mencionadas. En la parte III se presentan los resultados con
interpretaciones. La parte IV, se enfoca en cuatro Regiones
en las que, posiblemente, ocurrió genocidio en el período
1981-1983 y se presenta los resultados desagregados según
la etnia de las víctimas. Finalmente, en la parte V se
presentan las diversas formas en que los tres proyectos concuerdan
en términos estadísticos, sobre los patrones y
tendencias de violencia en Guatemala.
La información recogida
-
Las tres bases de datos que han sido elaboradas
con información recogida en entrevistas con testigos
y víctimas, contienen listas de víctimas de asesinato
obtenidas de cada proyecto. No obstante, no tenian definiciones
precisas en común. La medida en este estudio es muertos,
y no la categoria mas juridicamente precisa de "ejecución
extrajudicial" utilizada en el informe de la CEH. Las tres proyectos
tenian definiciones distinctas de asesinato, y para juntalos,
fue necesario usar la definición del fenómeno
más amplio. Las cifras de la CEH en este estudio deben
ser comparados con los de totales de muertos en el informe.
-
Muchos asesinatos no fueron reportados a ningún
proyecto y, por eso, la cantidad expuesta en la Tabla 1 es menor
que el total de víctimas que ocurrieron en la realidad.
El total, en cada una de las tres bases se presenta, por Región
y por época, en la última fila de al Tabla 1.
Tabla 1. 2Cantidad
de asesinatos documentados (víctimas con y sin nombres),
por época, región, y proyecto
|
Región
|
CEH
|
CIIDH3
|
REMHI
|
|
1960-1977
|
1978-1996
|
1960-1977
|
1978-1996
|
1960-1977
|
1978-1996
|
|
Región 0 (otros)
|
271
|
9,916
|
18
|
2,586
|
84
|
6,888
|
|
Región I (área
Ixil)
|
14
|
4,609
|
0
|
4,028
|
9
|
5,423
|
|
Región II (Cahabón)
|
1
|
532
|
0
|
135
|
7
|
453
|
|
Región III (Rabinal)
|
0
|
1,379
|
0
|
1,297
|
0
|
1,354
|
|
Región IV (San
Martín Jilo.)
|
0
|
1,347
|
1
|
20
|
0
|
68
|
|
Región V (Nte.
De Huehue)
|
0
|
1,746
|
0
|
1
|
0
|
1,032
|
|
Región VI (área
Zacualpa)4
|
0
|
1,951
|
0
|
238
|
1
|
1,674
|
|
Región VII (Guatemala)
|
91
|
245
|
1
|
15
|
10
|
111
|
|
Región VIII (área
Panzós)
|
0
|
169
|
11
|
41
|
1
|
1,167
|
|
Región IX (Ixcán)
|
3
|
2,421
|
0
|
48
|
5
|
2,751
|
|
Región X (área
Costa Sur)
|
25
|
190
|
2
|
91
|
23
|
139
|
|
Total
|
405
|
24,505
|
33
|
8,500
|
140
|
21,060
|
-
Nótese que los tres proyectos no cubrieron
todas las Regiones: los tres realizaron investigaciones en el
área Ixil sobre violaciones en la época 1978-1996,
pero solamente la CEH recogió información adecuada
en San Martín Jilotepeque. 5 También
es claro que ninguno de los tres proyectos cubrió bien
la época 1960-1977, que incluye las matanzas de los años
1968-1973. Cualquier estimación tiene que tomar en cuenta
estas limitaciones.
-
Si no hubiese víctimas reportadas en
más de un proyecto, el total de víctimas documentadas
sería la suma de las tres bases de datos, es decir, la
suma de la última línea de la tabla, 405+24,505+33+8,500+140+21,060
= 54,643. Sin embargo, muchas víctimas fueron reportadas
en dos o los tres proyectos, por eso, no se puede presumir que
el total de víctimas documentadas sea igual a la suma
simple. Los totales de cada proyecto no se pueden sumar para
estimar el total de asesinados reportados.
-
Los proyectos fueron manejados independientemente:
por eso la misma víctima puede estar reportada en más
de un proyecto. Por ejemplo, imagine que Juan Pérez fue
asesinado. La esposa de Juan Pérez pudo haber reportado
su asesinato al CIIDH en 1994; el hijo del mismo Señor
Pérez pudo dar su testimonio a REMHI en 1996; y el vecino
del Señor Pérez pudo relatar el mismo hecho a
la CEH en 1997. Si se sumaran las tres bases de datos, la violación
que pasó a Juan Pérez sería contabilizada
tres veces.
-
El reportaje duplicado de violaciones en más
de una base de datos es la causa del fenómeno de "traslape"
entre bases de datos. Para estimar el número total de
víctimas, los traslapes entre las bases de datos tienen
que ser estimados y las sumas finales reducidas en esa cantidad.
-
Hay dos posibilidades que muestran los límites
del problema de traslape. Como sugerimos antes, si no hubiese
ninguna víctima que aparezca en más de una base
de datos, la suma lógica y correcta de las tres sería
igual a la suma aritmética de las tres (54,643); éste
se llama el límite superior. El otro límite, el
inferior, representa la posibilidad de que la mayor de las tres
bases (la CEH) contenga todos los casos de los otros. En esta
situación, la cantidad total de asesinados sería
igual al número reportado por la más grande, la
CEH (405+24,505=24,910). La cantidad de víctimas únicas
sumadas, de las tres bases de datos, cae entre estos límites,
es decir, entre 24,910 y 54,643. El análisis para estimar
la cantidad de asesinatos documentados es para reducir este
rango.
-
También resulta que muchos asesinatos
nunca fueron reportados a ningún proyecto. En la sección
de abajo, se expone una estimación de la cantidad de
asesinatos 6 no considerados por la CEH, el
CIIDH, ni el REMHI. La estimación de este análisis
es que ocurrieron entre 119,300 – 145,000 asesinatos, siendo
la máxima probabilidad de 132,000. La distribución
de probabilidades alrededor de la estimación de 132,000
se presenta en la Figura 1. Esta cifra se justifica en las siguientes
secciones.
Figura 1:
Probabilidad de que la cifra real caiga dentro del intervalo
METODOLOGÍA INTERMUESTRA II: SUMAR VÍCTIMAS
DE ASESINATO SOBRE TRES BASES DE DATOS INDEPENDIENTES
Análisis de "traslape"
-
La información contenida en las tres
bases de datos representa víctimas identificadas o enumeradas
por los testigos; algunas (pero no todas) las víctimas
fueron identificadas por nombre. 7 La cantidad
de asesinados en cada base está identificada por la notación
expuesta abajo.
MCEH = la cantidad de víctimas
en la base de datos de la CEH
MCIIDH = la cantidad de víctimas
en la base de datos del CIIDH
MREMHI = la cantidad de víctimas
en la base de datos de la REMHI
-
Ninguna de las bases de datos estimó,
en forma directa, cuántos asesinados ocurrieron en total
en todo el país. Cada base es un listado de las víctimas
de matanza que fueron reportadas directamente al proyecto y
verificado según la metodología del mismo proyecto.
Como ya fue mencionado, muchas víctimas no fueron reportadas
a ninguno de los tres proyectos. El total de las víctimas
asesinadas en Guatemala puede estar representado en las ocho
categorías expuestas abajo.
N000 = víctimas que no
fueron reportados a ninguna de las tres: la CEH, el CIIDH,
ni el REMHI
N111 = víctimas que fueron
reportados a todas (los tres proyectos)
N110 = víctimas reportadas
a la CEH y al CIIDH, pero no al REMHI
N101 = víctimas reportadas
a la CEH y al REMHI, pero no al CIIDH
N011 = víctimas reportadas
al CIIDH y al REMHI, C pero no a la CEH
N100 = víctimas reportadas
solamente a la CEH, y no al CIIDH ni al REMHI
N010 = víctimas reportadas
solamente al CIIDH, y no a la CEH ni al REMHI
N001 = víctimas reportadas
solamente al REMHI, y no a la CEH ni al CIIDH
-
El total de víctimas de asesinato en
Guatemala, N, es la suma de estas ocho categorías.
El total de víctimas reportadas a uno, dos o tres proyectos,
Nk, es la suma de las siete categorías que
son calculables directamente de las bases de datos, es decir,
N111 a N001. Veáse la ecuación
1.
-
Para contabilizar la cantidad de víctimas
reportadas a uno o más proyectos, hay que estimar el
número de víctimas reportado a todos los proyectos
(N111, concordado tres veces) y entre cada pareja
de proyectos (N110, N101, y N011).
El complemento de cada proyecto (N100, N010,
and N001) determina las cifras requeridas para Nk.
Concordancia
-
Es muy difícil encontrar la misma víctima
en dos bases de datos con un programa de computadora. Las víctimas
son reportadas a los tres proyectos, con información
que varía en cada reporte. Los nombres y apellidos de
las mismas personas son deletreados de distinta forma, por ejemplo,
por ser traducido de idiomas mayas a español en formas
inconsistente, los reportes de fechas de nacimiento y de defunción
pueden estar equivocados.
-
No es práctico ni preciso concordar bases
en forma automatizada, con programas de computadora. Para encontrar
a una persona de una base de datos (la fuente) en otra de las
bases (el objeto), un analista tiene que comparar la persona
de la fuente contra todos los registros en el objeto. Este proceso
se llama concordar a las bases. 8
-
Concordar las bases es tedioso y requiere mucho
tiempo. A cambio de intentar de concordar todos los registros
de cada base de datos contra las otras, se tomaron muestras
aleatorias de las víctimas identificadas por nombre de
cada una de las tres bases de datos. 9 El número
de registros tomado en cada muestra está denotada por
la letra m (m CEH, m CIIDH, m REMHI).
Incluyendo todas las Regiones, la cantidad de registros seleccionados
de los tres proyectos fue de 1,412, 1,351, y 1,122, respectivamente
(Tabla 2). 10
-
Cada persona, en la muestra de cada base, fue
comparada con todos los registros en las demás bases.
Cuando la misma persona fue encontrada en una de las demás
bases, fue anotada como concordada doble; cuando la misma persona
fue encontrada en las tres bases, fue anotada como concordada
triple.
-
Se tomaron cuatro cuatro grupos de muestras
de las tres bases; un analista trató tres grupos, y el
otro trató uno. Solamente se encontraron diferencias
muy pequeñas entre las tasas de concordancia que resultaron
del trabajo de los dos analistas; la implicación es que
el error que resultó de factores fuera del proceso de
tomar la muestra fueron mínimos. 11
Los números de personas concordadas, tomando todas las
Regiones, se presentan en la Tabla 2.
Tabla 2: Cantidad de concordados
encontrados entre las tres bases
|
|
CEH
|
CIIDH
|
REMHI
|
|
m111
|
21
|
73
|
19
|
|
m110
|
48
|
153
|
|
|
m101
|
210
|
|
226
|
|
m011
|
|
121
|
27
|
|
m100
|
1,133
|
|
|
|
m010
|
|
1,004
|
|
|
m001
|
|
|
850
|
|
Muestra total
|
1,412
|
1,351
|
1,122
|
-
La Tabla 2 indica que en la muestra de 1,412
víctimas seleccionadas de la base de datos de la CEH,
21 fueron encontradas en la base de datos del CIIDH y también
en la base de datos de REMHI; esos 21 son triples. También,
se encontraron 48 registros de la CEH en la base de datos del
CIIDH pero no en REMHI, y 210 más de la CEH fueron encontrados
en la base de datos del REMHI pero no en la del CIIDH; 1,133
de los registros seleccionados de la base de datos de la CEH
no fueron encontrados en ninguna de los otras dos.
-
Al dividir cada mxyz (Tabla 2), por
el total de la muestra de cada base, los números en Tabla
2 se convierten a tasas. Las tasas de concordancia se presentan
en la Tabla 3.
Tabla 3: Tasas de concordancia
para las tres bases de datos
|
|
CEH
|
CIIDH
|
REMHI
|
|
r111
|
1.5%
|
5.4%
|
1.7%
|
|
r110
|
3.4%
|
11.3%
|
|
|
r101
|
14.9%
|
|
20.1%
|
|
r011
|
|
9.0%
|
2.4%
|
|
r100
|
80.2%
|
|
|
|
r010
|
|
74.3%
|
|
|
r001
|
|
|
75.8%
|
-
En la segunda línea r110 indica
que 3.4% de las víctimas en la base de datos de la CEH
están también en la base de datos del CIIDH. Pero
la base de datos del CIIDH es más pequeña que
la base de la CEH, y por eso, la misma estimación, desde
el punto de vista del CIIDH, es que 11.3% de las víctimas
registradas en la base de datos del CIIDH están en la
base de datos de la CEH.
-
Nótese que las diferencias en las estimaciones
de las tasas no están exactamente en proporción
a las diferencias de tamaño entre las bases. Estas diferencias
entran por la variación que resultó del proceso
de tomar la muestra aleatoria, y por el error del proceso de
concordar las bases, y está tratada en la sección
de análisis de error (abajo).
Estimación de totales de víctimas
reportadas
Como se ha mencionado en la sección de Análisis,
el número de asesinatos se estima por la suma de los siete
términos de "traslape", como se presenta en la Ecuación
1.

-
Si se aplican las tasas a la Tabla 3, arriba,
a la última línea de la Tabla 1 (total de víctimas
1978-1996), se saca una estimación de los componentes
de Nk basada en la información de las
tres bases de datos. Veáse el resultado en Tabla 4.
Tabla 4: Cantidad de asesinatos,
estimados por categoría y proyecto
|
|
CEH
|
CIIDH
|
REMHI
|
|
N111
|
364
|
459
|
357
|
|
N110
|
833
|
963
|
|
|
N101
|
3,645
|
|
4,242
|
|
N011
|
|
761
|
507
|
|
N100
|
19,663
|
|
|
|
N010
|
|
6,317
|
|
|
N001
|
|
|
15,955
|
-
Sin embargo, para estimar un Nk en
común entre las tres bases de datos, hay que reconciliar
las varias estimaciones del número de registros que concuerdan
entre las bases de datos (N111, N110,
N101, and N011). Se
toma el promedio de los valores en cada fila en la Tabla 4,
en que hay más de una estimación, y así
se estima la suma en Tabla 5.
Tabla 5: Número estimado
de asesinados en las tres bases de datos (CEH, CIIDH, REMHI)
|
|
promedio
|
|
N111
|
393
|
|
N110
|
898
|
|
N101
|
3,943
|
|
N011
|
634
|
|
N100
|
19,663
|
|
N010
|
6317
|
|
N001
|
15,955
|
|
Nk
|
47,803
|
Así, el número estimado de asesinados
reportados a los tres proyectos sin duplicación es aproximadamente
47,803. Pero como será mostrado abajo, este número
está sujeto a algunos sesgos que se pueden controlar.
Teoría demográfica y la estimación
de N000
En el apartado anterior se explica cómo estimar
el número de asesinatos documentados. Todavía está
pendiente una estimación del número de asesinatos
no documentados, N000 en la notación definida.
Abajo, en las Figuras 2a, 2b, y 2c, se presentan tres posibilidades
de cómo están relacionados los proyectos.
Figura 2a: Distribución de proyectos
en el universo de violaciones (ninguna relación).

Figura 2b: Distribución de proyectos
en el universo de violaciones (equivalencia completa).

Figura 2c: Distribución de proyectos
en el universo de violaciones (duplicación parcial).

En la Figura 2a, los proyectos no comparten ninguna
violación. En Figura 2b, todas las violaciones estan contenidas
en el proyecto más grande. En Figura 2c, alguunas violaciones
están compartidas. Del apartado anterior, se infiere que
Figura 2c representa la realidad de los tres proyectos.
Presumamos, por el momento, que los proyectos son
independientes, es decir, que la probabilidad de que un testimonio
a un proyecto tiene correlación cero con la probabilidad
de que el mismo declarante dé el testimonio a otros proyectos.
¿Qué implicación sobre el universo tiene cada figura?
En Figura 2a, la implicación es que el universo es inmenso
en relación a los proyectos porque trabajando independientamente,
los proyectos se distribuyeron en las violaciones sin encontrarse
con otros proyectos. En Figura 2b, la implicación es a la
inversa, que el universo es muy reducido, y los proyectos son equivalentes.
Pero en la Figura 2c, se ve que los niveles de "traslape" son parciales.
Con los niveles de "traslape", se puede inferir la escala del universo.
Considerar el caso con dos proyectos, A y B, que tiene
un "traslape" M en un universo de violaciones N.12
Nótese que la probabilidad que cualquier asesinato sea seleccionada
por A es es decir que
y la probabilidad de que
cualquier asesinato sea seleccionada por B es Pr(B) = B/N. La probabilidad
de un asesinato contenido en las dos bases de datos, Pr(M),
es igual a Pr(M) = M/N, y por la definición de un evento
compuesto de dos eventos independientes, Pr(M) = Pr(A|B) = Pr(A)
* Pr(B).
Intercambiando los términos, ,
que reduce a 
Dada la primera relacion con
el resultado anterior nos da ,
y entonces . Para estimar
solamente los asesinatos que fueron excluidos de los dos proyectos,
, o en la notación
de los tres proyectos,
Con la misma lógica, se puede derivar un estimador para
n000: la medida del número de asesinatos que no
fueron documentados por ninguno de los tres proyectos.13
Este estimador está presentado en la Ecuación 3.
Medir error del estimador y de la muestra14
-
Los estimadores de n 000 y el número
total de asesinatos  dependen
de los niveles de "traslape" entre las tres bases de datos.
Estos niveles (como los presentados en Tabla 3, arriba) se multiplican
por el total de violaciones en cada base, para sacar estimaciones
para las categorías n 111, n 110,
…, n 001 que suman a N k. Con la Ecuación
3, se estima n 000; sumando, se puede estimar  .
No obstante, se requiere otro método que se llama el
método de "jackknife" para lograr dos objetivos: a) quitar
el sesgo de razón que resulta de la Ecuación 3;
y b) para determinar la variación de los tres estimadores
necesarios para este análisis (N k, n 000,
y  ). En la explicación
general del método (abajo), el estimador  representa
a cada uno de los tres en los cálculos. Por ejemplo,
N k en la Tabla 5 (arriba), 47,803, es  para
N k tomada a nivel nacional.
-
El método empieza por dividir aleatoriamente
la muestra de los registros concordados (que tiene un total
de n registros) a k grupos, conteniendo cada cual
m registros: n = mk.  está
calculada de la misma manera como  pero
con una muestra reducida de tamaño m(k-1) obtenida por
omitir el grupo 
. Definir
-
La Ecuación 4 nos da un vector de tamaño
k de  calculado
de las muestras reducidas por omitir los grupos; el promedio
de vector de  es  (véase
Ecuación 5), se llama el "estimador de Quenouille", que
quita varios sesgos que afectan a  .
Este estimador es lo que se presenta en la Tabla 7 (Resultados,
en la Parte III).
-
El otro resultado beneficioso del método
de "jackknife" es si los valores de 
están distribuidos normalmente.15
El error estándard del estimador (la raíz cuadrada
de la variación) se estima con la Ecuación 6.
-
Los errores estandares presentados en la Tabla
7 fueron calculados según la Ecuación 6.
Cobertura en tiempo y espacio y su efecto en
n000
Fue anotado en la discusión de la Tabla 1
que ninguno de los proyectos cubrieron bien las violaciones del
período 1960-1977, y por eso ninguna estimación
para este período es posible con los datos disponibles.
La complicación más importante para la estimación
de n000 es que los proyectos no cubrieron todas las
Regiones con la misma intensidad. Si no se tratan aparte las Regiones
con niveles de cobertura distintas, se puede sesgar la estimación.
Considerar la Región IV, en que la CEH encontró
más de 1,300 asesinatos, mientras los otros dos proyectos
reportaron solamente algunas docenas. Por supuesto, los niveles
de traslape son bajos, pero estos niveles no se pueden utilizar
en una estimación de n000 porque el concepto
de traslape requiere que los proyectos hubieran trabajado en las
mismas áreas. Así que la estimación de n000
tuvo que basarse solamente en aquellos proyectos que realmente
lograron trabajar en cada región. Los proyectos que contribuyeron
a la estimación de n000 están en la Tabla
6.
Tabla 6: Proyectos utilizados
para estimar n000, por región
|
Región
|
Proyectos con cobertura
adecuada
|
Ecuación para n000
|
|
Región 0 (otro)
|
Los tres
|
Ecuación 3
|
|
Región I (área
Ixil)
|
Los tres
|
Ecuación 3
|
|
Región II (Cahabón)
|
Los tres
|
Ecuación 3
|
|
Región III (Rabinal)
|
Los tres
|
Ecaución 3
|
|
Región IV (San
Martín Jilotepeque)
|
Solamente CEH
|
No se puede estimar n000
|
|
Región V (Norte
de Huehuetenango)
|
CEH & REMHI
|
Ecuación 2
|
|
Región VI (área
Zacualpa)
|
Los tres
|
Ecuación 3
|
|
Región VII (Guatemala)
|
CEH & REMHI
|
Ecuación 2
|
|
Región VIII (área
Panzós)
|
CEH & REMHI
|
Ecuación 2
|
|
Región IX (Ixcán)
|
CEH & REMHI
|
Ecuación 2
|
|
Región X (área
Costa Sur)
|
Los tres
|
Ecaución 3
|
METODOLOGÍA INTERMUESTRA III: RESULTADOS
Y ALGUNAS LIMITACIONES DE LA INTERPRETACIÓN
Ahora se pueden presentar resultados por categoría
y región.
Tabla 7: Totales de asesinatos
en Guatemala 1978-1996, por categoría de estimación
y región
|
|
Región
|
|
|
Categoría
|
0
|
I
|
II
|
III
|
IV
|
V
|
VI
|
VII
|
VIII
|
IX
|
X
|
Total
|
|
N111
|
67
|
141
|
15
|
146
|
0
|
0
|
17
|
2
|
0
|
2
|
2
|
391
|
|
N110
|
378
|
406
|
8
|
98
|
5
|
0
|
67
|
3
|
0
|
16
|
2
|
983
|
|
N101
|
1,358
|
1,010
|
204
|
170
|
13
|
206
|
336
|
24
|
43
|
681
|
13
|
4059
|
|
N011
|
133
|
419
|
16
|
122
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
690
|
|
N100
|
8,260
|
3,187
|
221
|
1,028
|
1,325
|
1,597
|
1,642
|
226
|
156
|
1,720
|
182
|
19,545
|
|
N010
|
2,256
|
2,708
|
85
|
836
|
16
|
1
|
195
|
15
|
41
|
30
|
91
|
6,274
|
|
N001
|
5,228
|
3,999
|
295
|
926
|
59
|
765
|
1,166
|
77
|
1,099
|
2,054
|
106
|
15,773
|
|
Nk (sin duplicación)
|
17,679
|
11,870
|
844
|
3,328
|
1,418
|
2,569
|
3,416
|
347
|
1,339
|
4,501
|
396
|
47,706
|
|
SE (Nk)
|
110
|
135
|
24
|
79
|
11
|
44
|
76
|
9
|
26
|
77
|
5
|
228
|
|
N000
|
38,856
|
17,397
|
466
|
6,467
|
0
|
5,548
|
5,836
|
561
|
2,265
|
5,052
|
2,019
|
84,468
|
|
SE (N000)
|
3,809
|
2045
|
105
|
1,152
|
0
|
1,826
|
1,890
|
350
|
3,062
|
995
|
1,840
|
6,388
|
|
|
56,535
|
29,267
|
1,310
|
9,795
|
1,418
|
8,117
|
9,252
|
908
|
3,604
|
9,553
|
2,415
|
132,174
|
|
|
3,918
|
2175
|
127
|
1,218
|
11
|
1,870
|
1,964
|
357
|
3,087
|
1,072
|
1,844
|
6,568
|
-
En la Tabla 7 se ve que en la Región
0 fueron documentados N k = 17679 asesinatos entre
los tres proyectos. Sobre todas las Regiones, fueron documentados
únicamente 47706 asesinatos, siendo ésta la suma
de las estimaciones Regionales. 16 El error
estandar SE(N k) no es la suma simple de las Regiones,
sino es raíz cuadrada de la suma de los valores Regionales
( i=0, I, …, X) al cuadrado:

-
Igualmente, los valores para N 000
y N son los valores Regionales sumados, y el error estandar
para N 000 y  es
la raíz cuadrada de la suma de los valores Regionales
al cuadrado. Así que se estima que fueron aproximadamente
84,468 asesinatos que no fueron reportados en la CEH, el CIIDH,
ni en el proyecto REMHI. Sumando N k y n 000
a  , el análisis
llega a la estimación final, que hubo 132,174 asesinatos
en Guatemala entre 1978-1996, con un error estándar de
6,568.
Correcciones posibles y limitaciones en la interpretación
de la Tabla 7
-
Hay cinco fuentes de error que no se puede cuantificar
en este análisis, por falta de tiempo, recursos o de
datos adecuados. En algunas investigaciones preliminares, el
efecto global de estas correcciones es conservador, o mejor
dicho, tiende a reducir la estimación de  .
La conclusión del apartado es que el efecto acumulado
de estos sesgos no es significativo.
Correlación entre fuentes
-
La estimación de n000 depende
de la presunción de independencia entre las fuentes,
es decir que la probabilidad de que cada declarante dé
su testimonio a un proyecto tiene correlación cero con
la probabilidad que el mismo declarante dé su testimonio
a otros proyectos. Es cierto que esta correlación no
es cero, sino positiva, mayor que cero, por dos razones.
-
Primero, porque investigaciones realizadas
por psicólogos han mostrado que sobrevivientes de violaciones
de derechos humanos que pueden dar testimonios, en condiciones
que afirman su humanidad, mejoran su estado psicológico.
Es probable entonces que personas que dan testimonios en estas
condiciones busquen más oportunidades para darlo, incremetando
así el nivel de "traslape".
-
Segundo, es conocido que varias organizaciones
sociales organizaron sus bases para presentar testimonios a
los tres proyectos. Así, los miembros de estas organizaciones,
que tienen mayor probabilidad de dar su testimonio más
de una vez, también aumentan el nivel de "traslape".
Los dos efectos -que son ciertos- tienen el efecto de sesgar
la estimación de n000 para abajo.
Errores en concordancia
-
Si los analistas que hicieron la concordancia
no encontraron víctimas en común, por casualidad
o por datos inadecuados en las fuentes originales, estas omisiones
tendrían el efecto de bajar el nivel de traslape estimado
y, en consecuencia, sesgar la estimación de n 000
para arriba. En investigaciones superficiales (lo único
que fue posible con los datos actuales) se encuentran efectos
mínimos de este tipo, por lo que se tendría una
escala de no más que 12% de la estimación final
de n 000, implicando 8% a  .
Considerando las demás fuentes de sesgo listadas en este
apartado, y reconociendo que los datos para el análisis
de este error fueron muy reducidos, se decidió no incluir
la cuantificación de este error en el análisis
final.
Duplicación interna
-
Todos los proyectos que reciben información
de fuentes primarias tienen el problema de duplicación,
que es el resultado de reportes múltiples del mismo hecho. 17
La duplicación interna tiene la tendencia a aumentar
artificialmente la estadística de cuántos asesinados
estan representados en una base de datos. Los tres proyectos
tomaron muchas medidas para depurar las duplicaciones internas,
pero todavía quedaron algunas. En un análisis
preliminar, no aparecen suficientes víctimas duplicadas
para requerir una cuantificación.
Tasas de traslape entre clases de víctimas
-
La medida de "traslape" entre las tres bases
de datos fue tomada sobre víctimas identificadas por
un nombre y un apellido. Sin embargo, muchas víctimas
no son identificadas con nombre, como consecuencia de violencia
masiva que sobrecargó la capacidad de los testigos para
recordar a todas las víctimas. Es posible que los niveles
de "traslape" entre víctimas no identificadas por nombre,
sea mayor o menor que los niveles de "traslape" medidos entre
las víctimas identificadas. Dada la dificultad para detectar
"traslape" entre víctimas no identificadas, no es posible
cuantificar la diferencia entre niveles de "traslape".
Áreas geograficas excluidas por todos
los proyectos
-
En la Tabla 7 fue anotado que en la Región
IV, no hubo datos adecuados para hacer una estimación
de n000. Dada la experiencia de otras Regiones en
que la razón entre Nk y n000 varía
entre 0.5 y 2, con un modo y promedio cercana a 0.5, es probable
que el valor de n000 para la Región IV sea
aproximadamente de 2500. Dado que en otras Regiones Nk
ésta compuesto por lo menos por dos proyectos, y lo recogido
en la Región IV corresponde a la CEH solamente, es posible
que la razón entre Nk y n000 para
la Región IV sea 0.25 o menos, aumentando la estimación
por un factor de dos o más. La falta de certeza sobre
este número no es verificable por otros métodos,
y por eso, no se incluye en la estimación final.
-
La Región IV es un ejemplo de un problema
mucho más fundamental: que esta metodología solamente
sirve para las áreas cubiertas por lo menos por dos de
los tres proyectos, aunque sólo sea parcialmente. En
áreas trabajadas por uno o ninguno de los tres proyectos,
no hay una base para hacer una proyección al total de
víctimas excluidas (n000); en cambio, en estas
situaciones solamente Nk entra a la estimación.
Dado el enfoque común de los tres proyectos en áreas
de Guatemala, en que las violaciones en gran escala fueron conocidas
por fuentes periodísticas o por organizaciones que trabajaban
en dichas áreas, no es muy probable que las áreas
excluidas dejaran muchas violaciones afuera del análisis.
Sin embargo, cada área que fue excluida de las tres proyectos
-pero en las que se cometieron asesinatos- aumentaría
la estimación.
METODOLOGÍA INTERMUESTRA IV: ESTIMACIÓN
DE TASAS DE ASESINATOS, POR GRUPO ÉTNICO Y REGIÓN
-
La tasa de asesinatos es la proporción
de personas de un grupo definido que son asesinadas, es decir,
es igual al número de asesinados dividido por el número
en total del grupo. La CEH está interesada en las cifras
relativas (proporciones) de personas asesinadas, comparadas
entre grupos étnicos, durante el período 1981-1983.
-
Seis Regiones fueron identificadas como aquellas
en que, según las fuentes secundarias y evidencia anecdotal,
la violencia del Estado fue especialmente concentrada contra
gente indígena. Las Regiones de interés están
en el listado de la Tabla 8, con la población según
el censo de 1981, por grupo étnico.
Tabla 8: Población en
seis Regiones por grupo étnico, 1981
|
|
Indígena
|
No- indígena
|
|
Región I: área
Ixil
|
38,902
|
5,882
|
|
Región II: Cahabón
|
20,706
|
868
|
|
Región III: Rabinal
|
18,610
|
4,120
|
|
Región IV: San
Martín Jilotepeque
|
31,690
|
4,876
|
|
Región V: norte
de Huehuetenango
|
53,556
|
11,123
|
|
| |