|
Anexo
III
DOCUMENTO
ELABORADO POR LA AAAS1
Medir error del estimador y de la muestra14
-
Los estimadores de n 000 y el número
total de asesinatos  dependen
de los niveles de "traslape" entre las tres bases de datos.
Estos niveles (como los presentados en Tabla 3, arriba) se multiplican
por el total de violaciones en cada base, para sacar estimaciones
para las categorías n 111, n 110,
…, n 001 que suman a N k. Con la Ecuación
3, se estima n 000; sumando, se puede estimar  .
No obstante, se requiere otro método que se llama el
método de "jackknife" para lograr dos objetivos: a) quitar
el sesgo de razón que resulta de la Ecuación 3;
y b) para determinar la variación de los tres estimadores
necesarios para este análisis (N k, n 000,
y  ). En la explicación
general del método (abajo), el estimador  representa
a cada uno de los tres en los cálculos. Por ejemplo,
N k en la Tabla 5 (arriba), 47,803, es  para
N k tomada a nivel nacional.
-
El método empieza por dividir aleatoriamente
la muestra de los registros concordados (que tiene un total
de n registros) a k grupos, conteniendo cada cual
m registros: n = mk.  está
calculada de la misma manera como  pero
con una muestra reducida de tamaño m(k-1) obtenida por
omitir el grupo 
. Definir
-
La Ecuación 4 nos da un vector de tamaño
k de  calculado
de las muestras reducidas por omitir los grupos; el promedio
de vector de  es  (véase
Ecuación 5), se llama el "estimador de Quenouille", que
quita varios sesgos que afectan a  .
Este estimador es lo que se presenta en la Tabla 7 (Resultados,
en la Parte III).
-
El otro resultado beneficioso del método
de "jackknife" es si los valores de 
están distribuidos normalmente.15
El error estándard del estimador (la raíz cuadrada
de la variación) se estima con la Ecuación 6.
-
Los errores estandares presentados en la Tabla
7 fueron calculados según la Ecuación 6.
Cobertura en tiempo y espacio y su efecto en
n000
Fue anotado en la discusión de la Tabla 1
que ninguno de los proyectos cubrieron bien las violaciones del
período 1960-1977, y por eso ninguna estimación
para este período es posible con los datos disponibles.
La complicación más importante para la estimación
de n000 es que los proyectos no cubrieron todas las
Regiones con la misma intensidad. Si no se tratan aparte las Regiones
con niveles de cobertura distintas, se puede sesgar la estimación.
Considerar la Región IV, en que la CEH encontró
más de 1,300 asesinatos, mientras los otros dos proyectos
reportaron solamente algunas docenas. Por supuesto, los niveles
de traslape son bajos, pero estos niveles no se pueden utilizar
en una estimación de n000 porque el concepto
de traslape requiere que los proyectos hubieran trabajado en las
mismas áreas. Así que la estimación de n000
tuvo que basarse solamente en aquellos proyectos que realmente
lograron trabajar en cada región. Los proyectos que contribuyeron
a la estimación de n000 están en la Tabla
6.
Tabla 6: Proyectos utilizados
para estimar n000, por región
|
Región
|
Proyectos con cobertura
adecuada
|
Ecuación para n000
|
|
Región 0 (otro)
|
Los tres
|
Ecuación 3
|
|
Región I (área
Ixil)
|
Los tres
|
Ecuación 3
|
|
Región II (Cahabón)
|
Los tres
|
Ecuación 3
|
|
Región III (Rabinal)
|
Los tres
|
Ecaución 3
|
|
Región IV (San
Martín Jilotepeque)
|
Solamente CEH
|
No se puede estimar n000
|
|
Región V (Norte
de Huehuetenango)
|
CEH & REMHI
|
Ecuación 2
|
|
Región VI (área
Zacualpa)
|
Los tres
|
Ecuación 3
|
|
Región VII (Guatemala)
|
CEH & REMHI
|
Ecuación 2
|
|
Región VIII (área
Panzós)
|
CEH & REMHI
|
Ecuación 2
|
|
Región IX (Ixcán)
|
CEH & REMHI
|
Ecuación 2
|
|
Región X (área
Costa Sur)
|
Los tres
|
Ecaución 3
|
METODOLOGÍA INTERMUESTRA III: RESULTADOS
Y ALGUNAS LIMITACIONES DE LA INTERPRETACIÓN
Ahora se pueden presentar resultados por categoría
y región.
Tabla 7: Totales de asesinatos
en Guatemala 1978-1996, por categoría de estimación
y región
|
|
Región
|
|
|
Categoría
|
0
|
I
|
II
|
III
|
IV
|
V
|
VI
|
VII
|
VIII
|
IX
|
X
|
Total
|
|
N111
|
67
|
141
|
15
|
146
|
0
|
0
|
17
|
2
|
0
|
2
|
2
|
391
|
|
N110
|
378
|
406
|
8
|
98
|
5
|
0
|
67
|
3
|
0
|
16
|
2
|
983
|
|
N101
|
1,358
|
1,010
|
204
|
170
|
13
|
206
|
336
|
24
|
43
|
681
|
13
|
4059
|
|
N011
|
133
|
419
|
16
|
122
|
0
|
0
|
0
|
0
|
0
|
0
|
0
|
690
|
|
N100
|
8,260
|
3,187
|
221
|
1,028
|
1,325
|
1,597
|
1,642
|
226
|
156
|
1,720
|
182
|
19,545
|
|
N010
|
2,256
|
2,708
|
85
|
836
|
16
|
1
|
195
|
15
|
41
|
30
|
91
|
6,274
|
|
N001
|
5,228
|
3,999
|
295
|
926
|
59
|
765
|
1,166
|
77
|
1,099
|
2,054
|
106
|
15,773
|
|
Nk (sin duplicación)
|
17,679
|
11,870
|
844
|
3,328
|
1,418
|
2,569
|
3,416
|
347
|
1,339
|
4,501
|
396
|
47,706
|
|
SE (Nk)
|
110
|
135
|
24
|
79
|
11
|
44
|
76
|
9
|
26
|
77
|
5
|
228
|
|
N000
|
38,856
|
17,397
|
466
|
6,467
|
0
|
5,548
|
5,836
|
561
|
2,265
|
5,052
|
2,019
|
84,468
|
|
SE (N000)
|
3,809
|
2045
|
105
|
1,152
|
0
|
1,826
|
1,890
|
350
|
3,062
|
995
|
1,840
|
6,388
|
|
|
56,535
|
29,267
|
1,310
|
9,795
|
1,418
|
8,117
|
9,252
|
908
|
3,604
|
9,553
|
2,415
|
132,174
|
|
|
3,918
|
2175
|
127
|
1,218
|
11
|
1,870
|
1,964
|
357
|
3,087
|
1,072
|
1,844
|
6,568
|
-
En la Tabla 7 se ve que en la Región
0 fueron documentados N k = 17679 asesinatos entre
los tres proyectos. Sobre todas las Regiones, fueron documentados
únicamente 47706 asesinatos, siendo ésta la suma
de las estimaciones Regionales. 16 El error
estandar SE(N k) no es la suma simple de las Regiones,
sino es raíz cuadrada de la suma de los valores Regionales
( i=0, I, …, X) al cuadrado:

-
Igualmente, los valores para N 000
y N son los valores Regionales sumados, y el error estandar
para N 000 y  es
la raíz cuadrada de la suma de los valores Regionales
al cuadrado. Así que se estima que fueron aproximadamente
84,468 asesinatos que no fueron reportados en la CEH, el CIIDH,
ni en el proyecto REMHI. Sumando N k y n 000
a  , el análisis
llega a la estimación final, que hubo 132,174 asesinatos
en Guatemala entre 1978-1996, con un error estándar de
6,568.
Correcciones posibles y limitaciones en la interpretación
de la Tabla 7
-
Hay cinco fuentes de error que no se puede cuantificar
en este análisis, por falta de tiempo, recursos o de
datos adecuados. En algunas investigaciones preliminares, el
efecto global de estas correcciones es conservador, o mejor
dicho, tiende a reducir la estimación de  .
La conclusión del apartado es que el efecto acumulado
de estos sesgos no es significativo.
Correlación entre fuentes
-
La estimación de n000 depende
de la presunción de independencia entre las fuentes,
es decir que la probabilidad de que cada declarante dé
su testimonio a un proyecto tiene correlación cero con
la probabilidad que el mismo declarante dé su testimonio
a otros proyectos. Es cierto que esta correlación no
es cero, sino positiva, mayor que cero, por dos razones.
-
Primero, porque investigaciones realizadas
por psicólogos han mostrado que sobrevivientes de violaciones
de derechos humanos que pueden dar testimonios, en condiciones
que afirman su humanidad, mejoran su estado psicológico.
Es probable entonces que personas que dan testimonios en estas
condiciones busquen más oportunidades para darlo, incremetando
así el nivel de "traslape".
-
Segundo, es conocido que varias organizaciones
sociales organizaron sus bases para presentar testimonios a
los tres proyectos. Así, los miembros de estas organizaciones,
que tienen mayor probabilidad de dar su testimonio más
de una vez, también aumentan el nivel de "traslape".
Los dos efectos -que son ciertos- tienen el efecto de sesgar
la estimación de n000 para abajo.
Errores en concordancia
-
Si los analistas que hicieron la concordancia
no encontraron víctimas en común, por casualidad
o por datos inadecuados en las fuentes originales, estas omisiones
tendrían el efecto de bajar el nivel de traslape estimado
y, en consecuencia, sesgar la estimación de n 000
para arriba. En investigaciones superficiales (lo único
que fue posible con los datos actuales) se encuentran efectos
mínimos de este tipo, por lo que se tendría una
escala de no más que 12% de la estimación final
de n 000, implicando 8% a  .
Considerando las demás fuentes de sesgo listadas en este
apartado, y reconociendo que los datos para el análisis
de este error fueron muy reducidos, se decidió no incluir
la cuantificación de este error en el análisis
final.
Duplicación interna
-
Todos los proyectos que reciben información
de fuentes primarias tienen el problema de duplicación,
que es el resultado de reportes múltiples del mismo hecho. 17
La duplicación interna tiene la tendencia a aumentar
artificialmente la estadística de cuántos asesinados
estan representados en una base de datos. Los tres proyectos
tomaron muchas medidas para depurar las duplicaciones internas,
pero todavía quedaron algunas. En un análisis
preliminar, no aparecen suficientes víctimas duplicadas
para requerir una cuantificación.
Tasas de traslape entre clases de víctimas
-
La medida de "traslape" entre las tres bases
de datos fue tomada sobre víctimas identificadas por
un nombre y un apellido. Sin embargo, muchas víctimas
no son identificadas con nombre, como consecuencia de violencia
masiva que sobrecargó la capacidad de los testigos para
recordar a todas las víctimas. Es posible que los niveles
de "traslape" entre víctimas no identificadas por nombre,
sea mayor o menor que los niveles de "traslape" medidos entre
las víctimas identificadas. Dada la dificultad para detectar
"traslape" entre víctimas no identificadas, no es posible
cuantificar la diferencia entre niveles de "traslape".
Áreas geograficas excluidas por todos
los proyectos
-
En la Tabla 7 fue anotado que en la Región
IV, no hubo datos adecuados para hacer una estimación
de n000. Dada la experiencia de otras Regiones en
que la razón entre Nk y n000 varía
entre 0.5 y 2, con un modo y promedio cercana a 0.5, es probable
que el valor de n000 para la Región IV sea
aproximadamente de 2500. Dado que en otras Regiones Nk
ésta compuesto por lo menos por dos proyectos, y lo recogido
en la Región IV corresponde a la CEH solamente, es posible
que la razón entre Nk y n000 para
la Región IV sea 0.25 o menos, aumentando la estimación
por un factor de dos o más. La falta de certeza sobre
este número no es verificable por otros métodos,
y por eso, no se incluye en la estimación final.
-
La Región IV es un ejemplo de un problema
mucho más fundamental: que esta metodología solamente
sirve para las áreas cubiertas por lo menos por dos de
los tres proyectos, aunque sólo sea parcialmente. En
áreas trabajadas por uno o ninguno de los tres proyectos,
no hay una base para hacer una proyección al total de
víctimas excluidas (n000); en cambio, en estas
situaciones solamente Nk entra a la estimación.
Dado el enfoque común de los tres proyectos en áreas
de Guatemala, en que las violaciones en gran escala fueron conocidas
por fuentes periodísticas o por organizaciones que trabajaban
en dichas áreas, no es muy probable que las áreas
excluidas dejaran muchas violaciones afuera del análisis.
Sin embargo, cada área que fue excluida de las tres proyectos
-pero en las que se cometieron asesinatos- aumentaría
la estimación.
METODOLOGÍA INTERMUESTRA IV: ESTIMACIÓN
DE TASAS DE ASESINATOS, POR GRUPO ÉTNICO Y REGIÓN
-
La tasa de asesinatos es la proporción
de personas de un grupo definido que son asesinadas, es decir,
es igual al número de asesinados dividido por el número
en total del grupo. La CEH está interesada en las cifras
relativas (proporciones) de personas asesinadas, comparadas
entre grupos étnicos, durante el período 1981-1983.
-
Seis Regiones fueron identificadas como aquellas
en que, según las fuentes secundarias y evidencia anecdotal,
la violencia del Estado fue especialmente concentrada contra
gente indígena. Las Regiones de interés están
en el listado de la Tabla 8, con la población según
el censo de 1981, por grupo étnico.
Tabla 8: Población en
seis Regiones por grupo étnico, 1981
|
|
Indígena
|
No- indígena
|
|
Región I: área
Ixil
|
38,902
|
5,882
|
|
Región II: Cahabón
|
20,706
|
868
|
|
Región III: Rabinal
|
18,610
|
4,120
|
|
Región IV: San
Martín Jilotepeque
|
31,690
|
4,876
|
|
Región V: norte
de Huehuetenango
|
53,556
|
11,123
|
|
Región VI: Chiché,
Zacualpa, Joyabaj
|
51,105
|
10,997
|
-
Para calcular la tasa de matanza, hay que estimar
el número de víctimas; este procedimiento se hace
dos veces (obtendremos dos cifras), primero el total de víctimas
documentadas por las tres bases de datos, y segundo la cantidad
proyectada según la metodología descrita en Parte
II. Se requieren los siguientes pasos:
-
El número de asesinados que ocurrieron
entre 1981-1983, menos los atribuidos a la URNG, fueron calculados
por grupo étnico (indígena, no indígena,
etnia desconocida) para cada una de las seis Regiones en las
tres bases de datos. Este paso es, como en la Tabla 1, arriba,
limitada al período 1981-1983 y desagregada por étnia
de la víctima.
-
Las cantidades de concordados y tasas de "traslape"
fueron calculadas para cada una de las seis Regiones (lógicamente
parecida a lasTablas 2 y 3). 18
-
El número de víctimas fue estimado
por grupo étnico de las tasas de "traslape" Regiónal
y el número de víctimas en cada una de las bases
(semejante a laTabla 4).
-
Se toma el promedio del número de víctimas
estimadas entre las tres bases de datos (semejante a la Tabla
5) produciendo así, estimaciones de los totales para
cada región.
-
El método "jackknife" fue aplicado
a cada grupo definido por etnia y región, siguiendo
con las ecuaciones 4, 5, y 6, para estimar N k y
 (y sus errores
estandar) para cada etnia en cada región. Los valores
de N k se presentan en la Tablas 9a y 9b, y los
de  en la Tablas
11a y 11b.
Tabla 9a: Número
de asesinatos documentados (Nk) en las tres bases
de datos, 1981-1983
|
|
|
Región I
|
Región II
|
Región III
|
Región IV
|
Región V
|
Región VI
|
|
Indígena
|
Nk
|
1388
|
340
|
1071
|
1012
|
1020
|
1126
|
|
SE(Nk)
|
25.5
|
13.12
|
33.71
|
0.67
|
17.11
|
16.7
|
|
No-Indígena
|
Nk
|
32
|
2
|
13
|
16
|
8
|
6
|
|
SE(Nk)
|
0.49
|
0.07
|
0.33
|
0.14
|
0.12
|
0.13
|
|
Sin etnia conocida
|
Nk
|
4339
|
186
|
1669
|
10
|
752
|
1208
|
|
SE(Nk)
|
62.87
|
9.02
|
47.75
|
0.64
|
31.95
|
46.79
|
-
Tomando de la Tabla 9a las víctimas con
etnia conocida, las víctimas sin etnia conocida fueron
proporcionadas a las categoría "indígena" o la
categoría "no-indígena" según las proporciones
en Tabla 10 a la Tabla 9b.
Tabla 9b: Número de asesinatos
documentados (Nk) en las tres bases de datos, por grupo
étnico incluyendo víctimas sin identificar, 1981-1983
|
|
|
Región I
|
Región II
|
Región III
|
Región IV
|
Región V
|
Región VI
|
|
Indígena
|
Nk
|
5,632
|
525
|
2,720
|
1,022
|
1,767
|
2,327
|
|
SE(Nk)
|
66.56
|
15.90
|
57.98
|
0.92
|
36.05
|
49.42
|
|
No-Indígena
|
Nk
|
127
|
3
|
33
|
16
|
13
|
13
|
|
SE(Nk)
|
0.49
|
0.07
|
0.33
|
0.14
|
0.12
|
0.13
|
Tabla 10: Proporción
indígena de víctimas en laTabla 9a con etnia conocida
|
|
Región I
|
Región II
|
Región III
|
Región IV
|
Región V
|
Región VI
|
|
Proporción indígena
|
97.8%
|
99.6%
|
98.8%
|
98.5%
|
99.3%
|
99.4%
|
|
Proporción de víctimas
con etnia conocida
|
24.7%
|
64.7%
|
39.4%
|
99.1%
|
57.7%
|
48.4%
|
-
Con la información de Tablas 8, 9 y 10,
se saca la proporción de cada etnia con su error estándar
para cada región. Los datos, presentados abajo en la
Figura 3, explican inter alia que según los datos
documentados por la CEH, el CIIDH, y el REMHI, más del
14% de la población indígena del área Ixil,
de 1981, fue asesinado entre 1981-1983, mientras en el mismo
período y área, fue asesinado el 2% de la población
no-indígena.
Figura 3:
Proporción de la población víctima de asesinato
documentado, cometidos por fuerzas estatales en Guatemala 1981-1983,
por región y grupo étnico, con rango de confianza
de 95%.19
-
Nótese que los datos presentados para
la Region VI (área Zacualpa) en la Figura 3 no corresponde
exactamente a la cifra presentada en el apartado de genocidio
porque la definición de la Región IV empleada
aqui incluye los municipios de Chiche, Joyabaj y Zacualpa. En
el apartado de genocidio se incluye únicamente el municipio
de Zacualpa. Por lo que la cifras en Figura 3 y el apartado
de genocidio para Región VI fueron calculados sobre bases
diferentes aunque con la misma metodología.
- Los totales proyectados (
)
de cada etnia en cada Región fueron calculados por las
mismas metodologías descritas en las ecuaciones 2-6, y
con los mismos datos que son la base de la Tabla 10. Las cifras
se presentan en la Tabla 11, y resumidas en forma per capita
en la Figura 4.
Tabla 11a: Número de asesinatos
proyectados ( ) en las
tres bases de datos, por grupo étnico, 1981-1983
|
|
Región I
|
Región II
|
Región III
|
Región IV
|
Región V
|
Región VI
|
|
Indígena
|
|
2578
|
443
|
2983
|
1012
|
1020
|
2723
|
|
SE( )
|
190.28
|
39.13
|
587.58
|
0.67
|
17.11
|
386.43
|
|
No-Indígena
|
|
63
|
2
|
13
|
15.7
|
7.5
|
6
|
|
SE( )
|
5.4
|
0.07
|
0.33
|
0.14
|
0.12
|
0.13
|
|
Sin etnia conocida
|
|
14014.6
|
394
|
4791
|
10
|
752
|
1208
|
|
SE( )
|
1841.44
|
151.12
|
874.1
|
0.64
|
31.95
|
46.79
|
Tabla 11b: Número de asesinatos
proyectados ( ) en las
tres bases de datos, por grupo étnico incluyendo víctimas
sin identificar, 1981-1983
|
|
Región I
|
Región II
|
Región III
|
Región IV
|
Región V
|
Región VI
|
|
Indígena
|
|
16,284
|
835
|
7,717
|
1,022
|
1,767
|
3,924
|
|
SE( )
|
1,811.0
|
155.5
|
1,044.5
|
0.9
|
36.1
|
389.2
|
|
No-Indígena
|
|
371
|
4
|
70
|
16
|
13
|
13
|
|
SE( )
|
40.9
|
0.6
|
10.5
|
0.1
|
0.3
|
0.3
|
Figura
4: Proporción proyectada
de la población víctima de asesinatos cometidos por
fuerzas estatales en Guatemala 1981-1983, por región y grupo
étnico, con rango de confianza de 95%
-
Nótese que las figuras 3 y 4 tienen dos
interpretaciones fundamentales. 20 Primera:
las Regiones I y III fueron las más afectadas por la
violencia estatal. En los dos Regiones hay señales claras
de que, en términos cuantitativos, la matanza fue tan
masiva que llega a ser genocidio. Segunda: en todas las Regiones
las víctimas son, desproporcionalmente, personas indígenas.
En las barras por Región de la Figura 4, en la I, se
estima que más del 40% de la población indígena
fue asesinada mientras 8% de la población no-indígena
sufrió lo mismo; la diferencia entre las dos etnias representa
un factor de 5, lo que indica que algo, en la estructura de
la violencia cometida por el Estado guatemalteco, variaba cualitativamente
entre las dos etnias.
METODOLOGÍA INTERMUESTRA V: COMPARACIONES
ENTRE LAS BASES DE DATOS
-
En el análisis de bases de datos múltiples,
se puede comparar las bases para determinar los niveles de acuerdo
intermuestra en términos temporales, geográficos,
y de responsabilidad atribuida a los hechores. Esta parte profundiza
la consideración de tendencias y cifras en común
entre los tres proyectos.
-
En la Tabla 1, es claro que el nivel de acuerdo
geográfico es intermedio. En unas Regiones los tres proyectos
encontraron muchas violaciones, como en Regiones 0, I, y III,
mientras en otras Regiones solamente dos proyectos las cubrieron
a fondo (por ejemplo, Regiones V, VI, IX), mientras en la Región
IV unicamente la CEH realizó una investigación
intensa.
-
Aunque los proyectos cubrieron áreas
distintas, el segundo apartado de esta parte muestra que las
tres bases de datos todavía coinciden en la identificación
de los meses en que ocurrieron los picos de violencia en el
pais. El tercer apartado profundiza el análisis de los
resultados de los tres proyectos sobre las cifras de responsabilidad
para los hechos.
Coincidencia en tiempo
-
Si se ordena los datos mensuales del total de
asesinatos en cada una de las tres bases de datos, se encuentra
un nivel de acuerdo muy alto. En la Tabla 12 los meses fueron
ordenados por cantidad de asesinatos contenidos en cada base,
presentandose con los porcentajes del total de asesinatos, de
los diez meses más violentos en el período 1979-1984.
Tabla 12: Los diez meses más
violentos en tres bases de datos, 1979-198421
|
|
CEH
|
|
CIIDH
|
|
REMHI
|
|
Rango
|
Mes
|
Total
|
Pctje.
|
|
Mes
|
Total
|
Pctje.
|
|
Mes
|
Total
|
Pctje.
|
|
1
|
82-01
|
2,256
|
9%
|
|
82-02
|
610
|
12%
|
|
82-03
|
1,330
|
12%
|
|
2
|
82-03
|
2,253
|
9%
|
|
81-06
|
390
|
7%
|
|
82-02
|
807
|
7%
|
|
3
|
82-02
|
1,880
|
8%
|
|
83-03
|
297
|
6%
|
|
82-07
|
792
|
7%
|
|
4
|
82-08
|
1,819
|
8%
|
|
82-06
|
279
|
5%
|
|
82-05
|
657
|
6%
|
|
5
|
82-07
|
1,719
|
7%
|
|
82-07
|
234
|
4%
|
|
81-09
|
629
|
6%
|
|
6
|
81-01
|
1,423
|
6%
|
|
82-01
|
233
|
4%
|
|
82-01
|
470
|
4%
|
|
7
|
82-06
|
1,146
|
5%
|
|
82-04
|
222
|
4%
|
|
82-04
|
428
|
4%
|
|
8
|
82-04
|
937
|
4%
|
|
82-05
|
210
|
4%
|
|
81-07
|
397
|
4%
|
|
9
|
82-05
|
895
|
4%
|
|