../../cap2/vol1/Indice%20general%20del%20informe
../../cap2/vol1/Anterior
../../cap2/vol1/Siguiente

Anexo III

Instrumentes legales y operativos para el funcionamiento de la CEH

  • Acuerdo de Oslo
  • Estatuto Juridico de la CEH
  • Ley de Reconciliación Nacional. Decreto numero 145-96 del Congreso de la República
  • Punto Resolutivo número 6-98 del Congreso de la República

Selección de correspondencia entre la CEH y las instituciones de la República de Guatemala

Colaboración de organizaciones e instituciones nacionales e internacionales

Instrumentos estadisticos

Metodolgía intermuestra. Documento elaborado por la Asociación Americana para el Avance de la Ciencia -AAAS-

Anexo III

DOCUMENTO ELABORADO POR LA AAAS1

METODOLOGÍA INTERMUESTRA I: INTRODUCCIÓN Y RESUMEN

El objetivo y el problema

  1. ¿Cuántas personas fueron asesinadas en Guatemala durante el período del mandato de la CEH, 1960-1996? Tomando en cuenta la información de las tres bases de datos sobre violaciones de Derechos Humanos (CEH, CIIDH, REMHI), recogida por medio de entrevistas con testigos directos y víctimas, surgen algunas preguntas: a) ¿cuántos asesinatos fueron documentados por los tres proyectos? y b) ¿cuántos asesinatos se estiman que ocurrieron -en total- durante el conflicto armado?
  2. Este análisis trata los dos temas. En la parte I, se establece la información recogida por los tres proyectos y los objetivos del análisis. En la parte II se explican los métodos científicos utilizados para estimar cifras que responden las preguntas empíricas mencionadas. En la parte III se presentan los resultados con interpretaciones. La parte IV, se enfoca en cuatro Regiones en las que, posiblemente, ocurrió genocidio en el período 1981-1983 y se presenta los resultados desagregados según la etnia de las víctimas. Finalmente, en la parte V se presentan las diversas formas en que los tres proyectos concuerdan en términos estadísticos, sobre los patrones y tendencias de violencia en Guatemala.
  3. La información recogida

  4. Las tres bases de datos que han sido elaboradas con información recogida en entrevistas con testigos y víctimas, contienen listas de víctimas de asesinato obtenidas de cada proyecto. No obstante, no tenian definiciones precisas en común. La medida en este estudio es muertos, y no la categoria mas juridicamente precisa de "ejecución extrajudicial" utilizada en el informe de la CEH. Las tres proyectos tenian definiciones distinctas de asesinato, y para juntalos, fue necesario usar la definición del fenómeno más amplio. Las cifras de la CEH en este estudio deben ser comparados con los de totales de muertos en el informe.
  5. Muchos asesinatos no fueron reportados a ningún proyecto y, por eso, la cantidad expuesta en la Tabla 1 es menor que el total de víctimas que ocurrieron en la realidad. El total, en cada una de las tres bases se presenta, por Región y por época, en la última fila de al Tabla 1.
  6. Tabla 1. 2Cantidad de asesinatos documentados (víctimas con y sin nombres), por época, región, y proyecto

    Región

    CEH

    CIIDH3

    REMHI

    1960-1977

    1978-1996

    1960-1977

    1978-1996

    1960-1977

    1978-1996

    Región 0 (otros)

    271

    9,916

    18

    2,586

    84

    6,888

    Región I (área Ixil)

    14

    4,609

    0

    4,028

    9

    5,423

    Región II (Cahabón)

    1

    532

    0

    135

    7

    453

    Región III (Rabinal)

    0

    1,379

    0

    1,297

    0

    1,354

    Región IV (San Martín Jilo.)

    0

    1,347

    1

    20

    0

    68

    Región V (Nte. De Huehue)

    0

    1,746

    0

    1

    0

    1,032

    Región VI (área Zacualpa)4

    0

    1,951

    0

    238

    1

    1,674

    Región VII (Guatemala)

    91

    245

    1

    15

    10

    111

    Región VIII (área Panzós)

    0

    169

    11

    41

    1

    1,167

    Región IX (Ixcán)

    3

    2,421

    0

    48

    5

    2,751

    Región X (área Costa Sur)

    25

    190

    2

    91

    23

    139

    Total

    405

    24,505

    33

    8,500

    140

    21,060

     

  7. Nótese que los tres proyectos no cubrieron todas las Regiones: los tres realizaron investigaciones en el área Ixil sobre violaciones en la época 1978-1996, pero solamente la CEH recogió información adecuada en San Martín Jilotepeque.5 También es claro que ninguno de los tres proyectos cubrió bien la época 1960-1977, que incluye las matanzas de los años 1968-1973. Cualquier estimación tiene que tomar en cuenta estas limitaciones.
  8. Si no hubiese víctimas reportadas en más de un proyecto, el total de víctimas documentadas sería la suma de las tres bases de datos, es decir, la suma de la última línea de la tabla, 405+24,505+33+8,500+140+21,060 = 54,643. Sin embargo, muchas víctimas fueron reportadas en dos o los tres proyectos, por eso, no se puede presumir que el total de víctimas documentadas sea igual a la suma simple. Los totales de cada proyecto no se pueden sumar para estimar el total de asesinados reportados.
  9. Los proyectos fueron manejados independientemente: por eso la misma víctima puede estar reportada en más de un proyecto. Por ejemplo, imagine que Juan Pérez fue asesinado. La esposa de Juan Pérez pudo haber reportado su asesinato al CIIDH en 1994; el hijo del mismo Señor Pérez pudo dar su testimonio a REMHI en 1996; y el vecino del Señor Pérez pudo relatar el mismo hecho a la CEH en 1997. Si se sumaran las tres bases de datos, la violación que pasó a Juan Pérez sería contabilizada tres veces.
  10. El reportaje duplicado de violaciones en más de una base de datos es la causa del fenómeno de "traslape" entre bases de datos. Para estimar el número total de víctimas, los traslapes entre las bases de datos tienen que ser estimados y las sumas finales reducidas en esa cantidad.
  11. Hay dos posibilidades que muestran los límites del problema de traslape. Como sugerimos antes, si no hubiese ninguna víctima que aparezca en más de una base de datos, la suma lógica y correcta de las tres sería igual a la suma aritmética de las tres (54,643); éste se llama el límite superior. El otro límite, el inferior, representa la posibilidad de que la mayor de las tres bases (la CEH) contenga todos los casos de los otros. En esta situación, la cantidad total de asesinados sería igual al número reportado por la más grande, la CEH (405+24,505=24,910). La cantidad de víctimas únicas sumadas, de las tres bases de datos, cae entre estos límites, es decir, entre 24,910 y 54,643. El análisis para estimar la cantidad de asesinatos documentados es para reducir este rango.
  12. También resulta que muchos asesinatos nunca fueron reportados a ningún proyecto. En la sección de abajo, se expone una estimación de la cantidad de asesinatos6 no considerados por la CEH, el CIIDH, ni el REMHI. La estimación de este análisis es que ocurrieron entre 119,300 – 145,000 asesinatos, siendo la máxima probabilidad de 132,000. La distribución de probabilidades alrededor de la estimación de 132,000 se presenta en la Figura 1. Esta cifra se justifica en las siguientes secciones.
  13.  

    Figura 1: Probabilidad de que la cifra real caiga dentro del intervalo

     

    METODOLOGÍA INTERMUESTRA II: SUMAR VÍCTIMAS DE ASESINATO SOBRE TRES BASES DE DATOS INDEPENDIENTES

    Análisis de "traslape"

  14. La información contenida en las tres bases de datos representa víctimas identificadas o enumeradas por los testigos; algunas (pero no todas) las víctimas fueron identificadas por nombre.7 La cantidad de asesinados en cada base está identificada por la notación expuesta abajo.
  15. MCEH = la cantidad de víctimas en la base de datos de la CEH

    MCIIDH = la cantidad de víctimas en la base de datos del CIIDH

    MREMHI = la cantidad de víctimas en la base de datos de la REMHI

  16. Ninguna de las bases de datos estimó, en forma directa, cuántos asesinados ocurrieron en total en todo el país. Cada base es un listado de las víctimas de matanza que fueron reportadas directamente al proyecto y verificado según la metodología del mismo proyecto. Como ya fue mencionado, muchas víctimas no fueron reportadas a ninguno de los tres proyectos. El total de las víctimas asesinadas en Guatemala puede estar representado en las ocho categorías expuestas abajo.
  17. N000 = víctimas que no fueron reportados a ninguna de las tres: la CEH, el CIIDH, ni el REMHI

    N111 = víctimas que fueron reportados a todas (los tres proyectos)

    N110 = víctimas reportadas a la CEH y al CIIDH, pero no al REMHI

    N101 = víctimas reportadas a la CEH y al REMHI, pero no al CIIDH

    N011 = víctimas reportadas al CIIDH y al REMHI, C pero no a la CEH

    N100 = víctimas reportadas solamente a la CEH, y no al CIIDH ni al REMHI

    N010 = víctimas reportadas solamente al CIIDH, y no a la CEH ni al REMHI

    N001 = víctimas reportadas solamente al REMHI, y no a la CEH ni al CIIDH

  18. El total de víctimas de asesinato en Guatemala, N, es la suma de estas ocho categorías. El total de víctimas reportadas a uno, dos o tres proyectos, Nk, es la suma de las siete categorías que son calculables directamente de las bases de datos, es decir, N111 a N001. Veáse la ecuación 1.

  1. Para contabilizar la cantidad de víctimas reportadas a uno o más proyectos, hay que estimar el número de víctimas reportado a todos los proyectos (N111, concordado tres veces) y entre cada pareja de proyectos (N110, N101, y N011). El complemento de cada proyecto (N100, N010, and N001) determina las cifras requeridas para Nk.
  2. Concordancia

  3. Es muy difícil encontrar la misma víctima en dos bases de datos con un programa de computadora. Las víctimas son reportadas a los tres proyectos, con información que varía en cada reporte. Los nombres y apellidos de las mismas personas son deletreados de distinta forma, por ejemplo, por ser traducido de idiomas mayas a español en formas inconsistente, los reportes de fechas de nacimiento y de defunción pueden estar equivocados.
  4. No es práctico ni preciso concordar bases en forma automatizada, con programas de computadora. Para encontrar a una persona de una base de datos (la fuente) en otra de las bases (el objeto), un analista tiene que comparar la persona de la fuente contra todos los registros en el objeto. Este proceso se llama concordar a las bases.8
  5. Concordar las bases es tedioso y requiere mucho tiempo. A cambio de intentar de concordar todos los registros de cada base de datos contra las otras, se tomaron muestras aleatorias de las víctimas identificadas por nombre de cada una de las tres bases de datos.9 El número de registros tomado en cada muestra está denotada por la letra m (mCEH, mCIIDH, mREMHI). Incluyendo todas las Regiones, la cantidad de registros seleccionados de los tres proyectos fue de 1,412, 1,351, y 1,122, respectivamente (Tabla 2).10
  6. Cada persona, en la muestra de cada base, fue comparada con todos los registros en las demás bases. Cuando la misma persona fue encontrada en una de las demás bases, fue anotada como concordada doble; cuando la misma persona fue encontrada en las tres bases, fue anotada como concordada triple.
  7. Se tomaron cuatro cuatro grupos de muestras de las tres bases; un analista trató tres grupos, y el otro trató uno. Solamente se encontraron diferencias muy pequeñas entre las tasas de concordancia que resultaron del trabajo de los dos analistas; la implicación es que el error que resultó de factores fuera del proceso de tomar la muestra fueron mínimos.11 Los números de personas concordadas, tomando todas las Regiones, se presentan en la Tabla 2.
  8. Tabla 2: Cantidad de concordados encontrados entre las tres bases

    CEH

    CIIDH

    REMHI

    m111

    21

    73

    19

    m110

    48

    153

    m101

    210

    226

    m011

    121

    27

    m100

    1,133

    m010

    1,004

    m001

    850

    Muestra total

    1,412

    1,351

    1,122

  9. La Tabla 2 indica que en la muestra de 1,412 víctimas seleccionadas de la base de datos de la CEH, 21 fueron encontradas en la base de datos del CIIDH y también en la base de datos de REMHI; esos 21 son triples. También, se encontraron 48 registros de la CEH en la base de datos del CIIDH pero no en REMHI, y 210 más de la CEH fueron encontrados en la base de datos del REMHI pero no en la del CIIDH; 1,133 de los registros seleccionados de la base de datos de la CEH no fueron encontrados en ninguna de los otras dos.
  10. Al dividir cada mxyz (Tabla 2), por el total de la muestra de cada base, los números en Tabla 2 se convierten a tasas. Las tasas de concordancia se presentan en la Tabla 3.
  11. Tabla 3: Tasas de concordancia para las tres bases de datos

    CEH

    CIIDH

    REMHI

    r111

    1.5%

    5.4%

    1.7%

    r110

    3.4%

    11.3%

    r101

    14.9%

    20.1%

    r011

    9.0%

    2.4%

    r100

    80.2%

    r010

    74.3%

    r001

    75.8%

  12. En la segunda línea r110 indica que 3.4% de las víctimas en la base de datos de la CEH están también en la base de datos del CIIDH. Pero la base de datos del CIIDH es más pequeña que la base de la CEH, y por eso, la misma estimación, desde el punto de vista del CIIDH, es que 11.3% de las víctimas registradas en la base de datos del CIIDH están en la base de datos de la CEH.
  13. Nótese que las diferencias en las estimaciones de las tasas no están exactamente en proporción a las diferencias de tamaño entre las bases. Estas diferencias entran por la variación que resultó del proceso de tomar la muestra aleatoria, y por el error del proceso de concordar las bases, y está tratada en la sección de análisis de error (abajo).
  14. Estimación de totales de víctimas reportadas

    Como se ha mencionado en la sección de Análisis, el número de asesinatos se estima por la suma de los siete términos de "traslape", como se presenta en la Ecuación 1.

  15. Si se aplican las tasas a la Tabla 3, arriba, a la última línea de la Tabla 1 (total de víctimas 1978-1996), se saca una estimación de los componentes de Nk basada en la información de las tres bases de datos. Veáse el resultado en Tabla 4.
  16.  

    Tabla 4: Cantidad de asesinatos, estimados por categoría y proyecto

    CEH

    CIIDH

    REMHI

    N111

    364

    459

    357

    N110

    833

    963

    N101

    3,645

    4,242

    N011

    761

    507

    N100

    19,663

    N010

    6,317

    N001

    15,955

     

  17. Sin embargo, para estimar un Nk en común entre las tres bases de datos, hay que reconciliar las varias estimaciones del número de registros que concuerdan entre las bases de datos (N111, N110, N101, and N011). Se toma el promedio de los valores en cada fila en la Tabla 4, en que hay más de una estimación, y así se estima la suma en Tabla 5.

Tabla 5: Número estimado de asesinados en las tres bases de datos (CEH, CIIDH, REMHI)

promedio

N111

393

N110

898

N101

3,943

N011

634

N100

19,663

N010

6317

N001

15,955

Nk

47,803

Así, el número estimado de asesinados reportados a los tres proyectos sin duplicación es aproximadamente 47,803. Pero como será mostrado abajo, este número está sujeto a algunos sesgos que se pueden controlar.

Teoría demográfica y la estimación de N000

En el apartado anterior se explica cómo estimar el número de asesinatos documentados. Todavía está pendiente una estimación del número de asesinatos no documentados, N000 en la notación definida. Abajo, en las Figuras 2a, 2b, y 2c, se presentan tres posibilidades de cómo están relacionados los proyectos.

 

Figura 2a: Distribución de proyectos en el universo de violaciones (ninguna relación).

Figura 2b: Distribución de proyectos en el universo de violaciones (equivalencia completa).

 

Figura 2c: Distribución de proyectos en el universo de violaciones (duplicación parcial).

 

 

En la Figura 2a, los proyectos no comparten ninguna violación. En Figura 2b, todas las violaciones estan contenidas en el proyecto más grande. En Figura 2c, alguunas violaciones están compartidas. Del apartado anterior, se infiere que Figura 2c representa la realidad de los tres proyectos.

Presumamos, por el momento, que los proyectos son independientes, es decir, que la probabilidad de que un testimonio a un proyecto tiene correlación cero con la probabilidad de que el mismo declarante dé el testimonio a otros proyectos. ¿Qué implicación sobre el universo tiene cada figura? En Figura 2a, la implicación es que el universo es inmenso en relación a los proyectos porque trabajando independientamente, los proyectos se distribuyeron en las violaciones sin encontrarse con otros proyectos. En Figura 2b, la implicación es a la inversa, que el universo es muy reducido, y los proyectos son equivalentes. Pero en la Figura 2c, se ve que los niveles de "traslape" son parciales. Con los niveles de "traslape", se puede inferir la escala del universo.

 

Considerar el caso con dos proyectos, A y B, que tiene un "traslape" M en un universo de violaciones N.12 Nótese que la probabilidad que cualquier asesinato sea seleccionada por A es es decir que y la probabilidad de que cualquier asesinato sea seleccionada por B es Pr(B) = B/N. La probabilidad de un asesinato contenido en las dos bases de datos, Pr(M), es igual a Pr(M) = M/N, y por la definición de un evento compuesto de dos eventos independientes, Pr(M) = Pr(A|B) = Pr(A) * Pr(B).

Intercambiando los términos, , que reduce a

Dada la primera relacion con el resultado anterior nos da , y entonces . Para estimar solamente los asesinatos que fueron excluidos de los dos proyectos, , o en la notación de los tres proyectos,

Con la misma lógica, se puede derivar un estimador para n000: la medida del número de asesinatos que no fueron documentados por ninguno de los tres proyectos.13 Este estimador está presentado en la Ecuación 3.


Medir error del estimador y de la muestra
14

  1. Los estimadores de n000 y el número total de asesinatosdependen de los niveles de "traslape" entre las tres bases de datos. Estos niveles (como los presentados en Tabla 3, arriba) se multiplican por el total de violaciones en cada base, para sacar estimaciones para las categorías n111, n110, …, n001 que suman a Nk. Con la Ecuación 3, se estima n000; sumando, se puede estimar . No obstante, se requiere otro método que se llama el método de "jackknife" para lograr dos objetivos: a) quitar el sesgo de razón que resulta de la Ecuación 3; y b) para determinar la variación de los tres estimadores necesarios para este análisis (Nk, n000, y ). En la explicación general del método (abajo), el estimador representa a cada uno de los tres en los cálculos. Por ejemplo, Nk en la Tabla 5 (arriba), 47,803, es para Nk tomada a nivel nacional.
  2. El método empieza por dividir aleatoriamente la muestra de los registros concordados (que tiene un total de n registros) a k grupos, conteniendo cada cual m registros: n = mk. está calculada de la misma manera como pero con una muestra reducida de tamaño m(k-1) obtenida por omitir el grupo

. Definir

 

  1. La Ecuación 4 nos da un vector de tamaño k de calculado de las muestras reducidas por omitir los grupos; el promedio de vector de es (véase Ecuación 5), se llama el "estimador de Quenouille", que quita varios sesgos que afectan a . Este estimador es lo que se presenta en la Tabla 7 (Resultados, en la Parte III).
  2. El otro resultado beneficioso del método de "jackknife" es si los valores de

están distribuidos normalmente.15 El error estándard del estimador (la raíz cuadrada de la variación) se estima con la Ecuación 6.

  1. Los errores estandares presentados en la Tabla 7 fueron calculados según la Ecuación 6.
  2. Cobertura en tiempo y espacio y su efecto en n000

    Fue anotado en la discusión de la Tabla 1 que ninguno de los proyectos cubrieron bien las violaciones del período 1960-1977, y por eso ninguna estimación para este período es posible con los datos disponibles. La complicación más importante para la estimación de n000 es que los proyectos no cubrieron todas las Regiones con la misma intensidad. Si no se tratan aparte las Regiones con niveles de cobertura distintas, se puede sesgar la estimación.

    Considerar la Región IV, en que la CEH encontró más de 1,300 asesinatos, mientras los otros dos proyectos reportaron solamente algunas docenas. Por supuesto, los niveles de traslape son bajos, pero estos niveles no se pueden utilizar en una estimación de n000 porque el concepto de traslape requiere que los proyectos hubieran trabajado en las mismas áreas. Así que la estimación de n000 tuvo que basarse solamente en aquellos proyectos que realmente lograron trabajar en cada región. Los proyectos que contribuyeron a la estimación de n000 están en la Tabla 6.

    Tabla 6: Proyectos utilizados para estimar n000, por región

    Región

    Proyectos con cobertura adecuada

    Ecuación para n000

    Región 0 (otro)

    Los tres

    Ecuación 3

    Región I (área Ixil)

    Los tres

    Ecuación 3

    Región II (Cahabón)

    Los tres

    Ecuación 3

    Región III (Rabinal)

    Los tres

    Ecaución 3

    Región IV (San Martín Jilotepeque)

    Solamente CEH

    No se puede estimar n000

    Región V (Norte de Huehuetenango)

    CEH & REMHI

    Ecuación 2

    Región VI (área Zacualpa)

    Los tres

    Ecuación 3

    Región VII (Guatemala)

    CEH & REMHI

    Ecuación 2

    Región VIII (área Panzós)

    CEH & REMHI

    Ecuación 2

    Región IX (Ixcán)

    CEH & REMHI

    Ecuación 2

    Región X (área Costa Sur)

    Los tres

    Ecaución 3

     

     

     

    METODOLOGÍA INTERMUESTRA III: RESULTADOS Y ALGUNAS LIMITACIONES DE LA INTERPRETACIÓN

    Ahora se pueden presentar resultados por categoría y región.

    Tabla 7: Totales de asesinatos en Guatemala 1978-1996, por categoría de estimación y región

    Región

    Categoría

    0

    I

    II

    III

    IV

    V

    VI

    VII

    VIII

    IX

    X

    Total

    N111

    67

    141

    15

    146

    0

    0

    17

    2

    0

    2

    2

    391

    N110

    378

    406

    8

    98

    5

    0

    67

    3

    0

    16

    2

    983

    N101

    1,358

    1,010

    204

    170

    13

    206

    336

    24

    43

    681

    13

    4059

    N011

    133

    419

    16

    122

    0

    0

    0

    0

    0

    0

    0

    690

    N100

    8,260

    3,187

    221

    1,028

    1,325

    1,597

    1,642

    226

    156

    1,720

    182

    19,545

    N010

    2,256

    2,708

    85

    836

    16

    1

    195

    15

    41

    30

    91

    6,274

    N001

    5,228

    3,999

    295

    926

    59

    765

    1,166

    77

    1,099

    2,054

    106

    15,773

    Nk (sin duplicación)

    17,679

    11,870

    844

    3,328

    1,418

    2,569

    3,416

    347

    1,339

    4,501

    396

    47,706

    SE (Nk)

    110

    135

    24

    79

    11

    44

    76

    9

    26

    77

    5

    228

    N000

    38,856

    17,397

    466

    6,467

    0

    5,548

    5,836

    561

    2,265

    5,052

    2,019

    84,468

    SE (N000)

    3,809

    2045

    105

    1,152

    0

    1,826

    1,890

    350

    3,062

    995

    1,840

    6,388

    56,535

    29,267

    1,310

    9,795

    1,418

    8,117

    9,252

    908

    3,604

    9,553

    2,415

    132,174

    3,918

    2175

    127

    1,218

    11

    1,870

    1,964

    357

    3,087

    1,072

    1,844

    6,568

  3. En la Tabla 7 se ve que en la Región 0 fueron documentados Nk = 17679 asesinatos entre los tres proyectos. Sobre todas las Regiones, fueron documentados únicamente 47706 asesinatos, siendo ésta la suma de las estimaciones Regionales.16 El error estandar SE(Nk) no es la suma simple de las Regiones, sino es raíz cuadrada de la suma de los valores Regionales (i=0, I, …, X) al cuadrado:
  4. Igualmente, los valores para N000 y N son los valores Regionales sumados, y el error estandar para N000 y es la raíz cuadrada de la suma de los valores Regionales al cuadrado. Así que se estima que fueron aproximadamente 84,468 asesinatos que no fueron reportados en la CEH, el CIIDH, ni en el proyecto REMHI. Sumando Nk y n000 a , el análisis llega a la estimación final, que hubo 132,174 asesinatos en Guatemala entre 1978-1996, con un error estándar de 6,568.
  5. Correcciones posibles y limitaciones en la interpretación de la Tabla 7

  6. Hay cinco fuentes de error que no se puede cuantificar en este análisis, por falta de tiempo, recursos o de datos adecuados. En algunas investigaciones preliminares, el efecto global de estas correcciones es conservador, o mejor dicho, tiende a reducir la estimación de . La conclusión del apartado es que el efecto acumulado de estos sesgos no es significativo.
  7. Correlación entre fuentes

  8. La estimación de n000 depende de la presunción de independencia entre las fuentes, es decir que la probabilidad de que cada declarante dé su testimonio a un proyecto tiene correlación cero con la probabilidad que el mismo declarante dé su testimonio a otros proyectos. Es cierto que esta correlación no es cero, sino positiva, mayor que cero, por dos razones.
  9. Primero, porque investigaciones realizadas por psicólogos han mostrado que sobrevivientes de violaciones de derechos humanos que pueden dar testimonios, en condiciones que afirman su humanidad, mejoran su estado psicológico. Es probable entonces que personas que dan testimonios en estas condiciones busquen más oportunidades para darlo, incremetando así el nivel de "traslape".
  10. Segundo, es conocido que varias organizaciones sociales organizaron sus bases para presentar testimonios a los tres proyectos. Así, los miembros de estas organizaciones, que tienen mayor probabilidad de dar su testimonio más de una vez, también aumentan el nivel de "traslape". Los dos efectos -que son ciertos- tienen el efecto de sesgar la estimación de n000 para abajo.
  11. Errores en concordancia

  12. Si los analistas que hicieron la concordancia no encontraron víctimas en común, por casualidad o por datos inadecuados en las fuentes originales, estas omisiones tendrían el efecto de bajar el nivel de traslape estimado y, en consecuencia, sesgar la estimación de n000 para arriba. En investigaciones superficiales (lo único que fue posible con los datos actuales) se encuentran efectos mínimos de este tipo, por lo que se tendría una escala de no más que 12% de la estimación final de n000, implicando 8% a . Considerando las demás fuentes de sesgo listadas en este apartado, y reconociendo que los datos para el análisis de este error fueron muy reducidos, se decidió no incluir la cuantificación de este error en el análisis final.
  13. Duplicación interna

  14. Todos los proyectos que reciben información de fuentes primarias tienen el problema de duplicación, que es el resultado de reportes múltiples del mismo hecho.17 La duplicación interna tiene la tendencia a aumentar artificialmente la estadística de cuántos asesinados estan representados en una base de datos. Los tres proyectos tomaron muchas medidas para depurar las duplicaciones internas, pero todavía quedaron algunas. En un análisis preliminar, no aparecen suficientes víctimas duplicadas para requerir una cuantificación.
  15. Tasas de traslape entre clases de víctimas

  16. La medida de "traslape" entre las tres bases de datos fue tomada sobre víctimas identificadas por un nombre y un apellido. Sin embargo, muchas víctimas no son identificadas con nombre, como consecuencia de violencia masiva que sobrecargó la capacidad de los testigos para recordar a todas las víctimas. Es posible que los niveles de "traslape" entre víctimas no identificadas por nombre, sea mayor o menor que los niveles de "traslape" medidos entre las víctimas identificadas. Dada la dificultad para detectar "traslape" entre víctimas no identificadas, no es posible cuantificar la diferencia entre niveles de "traslape".
  17. Áreas geograficas excluidas por todos los proyectos

  18. En la Tabla 7 fue anotado que en la Región IV, no hubo datos adecuados para hacer una estimación de n000. Dada la experiencia de otras Regiones en que la razón entre Nk y n000 varía entre 0.5 y 2, con un modo y promedio cercana a 0.5, es probable que el valor de n000 para la Región IV sea aproximadamente de 2500. Dado que en otras Regiones Nk ésta compuesto por lo menos por dos proyectos, y lo recogido en la Región IV corresponde a la CEH solamente, es posible que la razón entre Nk y n000 para la Región IV sea 0.25 o menos, aumentando la estimación por un factor de dos o más. La falta de certeza sobre este número no es verificable por otros métodos, y por eso, no se incluye en la estimación final.
  19. La Región IV es un ejemplo de un problema mucho más fundamental: que esta metodología solamente sirve para las áreas cubiertas por lo menos por dos de los tres proyectos, aunque sólo sea parcialmente. En áreas trabajadas por uno o ninguno de los tres proyectos, no hay una base para hacer una proyección al total de víctimas excluidas (n000); en cambio, en estas situaciones solamente Nk entra a la estimación. Dado el enfoque común de los tres proyectos en áreas de Guatemala, en que las violaciones en gran escala fueron conocidas por fuentes periodísticas o por organizaciones que trabajaban en dichas áreas, no es muy probable que las áreas excluidas dejaran muchas violaciones afuera del análisis. Sin embargo, cada área que fue excluida de las tres proyectos -pero en las que se cometieron asesinatos- aumentaría la estimación.
  20.  

    METODOLOGÍA INTERMUESTRA IV: ESTIMACIÓN DE TASAS DE ASESINATOS, POR GRUPO ÉTNICO Y REGIÓN

  21. La tasa de asesinatos es la proporción de personas de un grupo definido que son asesinadas, es decir, es igual al número de asesinados dividido por el número en total del grupo. La CEH está interesada en las cifras relativas (proporciones) de personas asesinadas, comparadas entre grupos étnicos, durante el período 1981-1983.
  22. Seis Regiones fueron identificadas como aquellas en que, según las fuentes secundarias y evidencia anecdotal, la violencia del Estado fue especialmente concentrada contra gente indígena. Las Regiones de interés están en el listado de la Tabla 8, con la población según el censo de 1981, por grupo étnico.
  23.  

    Tabla 8: Población en seis Regiones por grupo étnico, 1981

    Indígena

    No- indígena

    Región I: área Ixil

    38,902

    5,882

    Región II: Cahabón

    20,706

    868

    Región III: Rabinal

    18,610

    4,120

    Región IV: San Martín Jilotepeque

    31,690

    4,876

    Región V: norte de Huehuetenango

    53,556

    11,123

    Región VI: Chiché, Zacualpa, Joyabaj

    51,105

    10,997

  24. Para calcular la tasa de matanza, hay que estimar el número de víctimas; este procedimiento se hace dos veces (obtendremos dos cifras), primero el total de víctimas documentadas por las tres bases de datos, y segundo la cantidad proyectada según la metodología descrita en Parte II. Se requieren los siguientes pasos:

    1. El número de asesinados que ocurrieron entre 1981-1983, menos los atribuidos a la URNG, fueron calculados por grupo étnico (indígena, no indígena, etnia desconocida) para cada una de las seis Regiones en las tres bases de datos. Este paso es, como en la Tabla 1, arriba, limitada al período 1981-1983 y desagregada por étnia de la víctima.
    2. Las cantidades de concordados y tasas de "traslape" fueron calculadas para cada una de las seis Regiones (lógicamente parecida a lasTablas 2 y 3).18
    3. El número de víctimas fue estimado por grupo étnico de las tasas de "traslape" Regiónal y el número de víctimas en cada una de las bases (semejante a laTabla 4).
    4. Se toma el promedio del número de víctimas estimadas entre las tres bases de datos (semejante a la Tabla 5) produciendo así, estimaciones de los totales para cada región.
    5. El método "jackknife" fue aplicado a cada grupo definido por etnia y región, siguiendo con las ecuaciones 4, 5, y 6, para estimar Nk y (y sus errores estandar) para cada etnia en cada región. Los valores de Nk se presentan en la Tablas 9a y 9b, y los de en la Tablas 11a y 11b.

 

Tabla 9a: Número de asesinatos documentados (Nk) en las tres bases de datos, 1981-1983

Región I

Región II

Región III

Región IV

Región V

Región VI

Indígena

Nk

1388

340

1071

1012

1020

1126

SE(Nk)

25.5

13.12

33.71

0.67

17.11

16.7

No-Indígena

Nk

32

2

13

16

8

6

SE(Nk)

0.49

0.07

0.33

0.14

0.12

0.13

Sin etnia conocida

Nk

4339

186

1669

10

752

1208

SE(Nk)

62.87

9.02

47.75

0.64

31.95

46.79

 

  1. Tomando de la Tabla 9a las víctimas con etnia conocida, las víctimas sin etnia conocida fueron proporcionadas a las categoría "indígena" o la categoría "no-indígena" según las proporciones en Tabla 10 a la Tabla 9b.
  2.  

    Tabla 9b: Número de asesinatos documentados (Nk) en las tres bases de datos, por grupo étnico incluyendo víctimas sin identificar, 1981-1983

    Región I

    Región II

    Región III

    Región IV

    Región V

    Región VI

    Indígena

    Nk

    5,632

    525

    2,720

    1,022

    1,767

    2,327

    SE(Nk)

    66.56

    15.90

    57.98

    0.92

    36.05

    49.42

    No-Indígena

    Nk

    127

    3

    33

    16

    13

    13

    SE(Nk)

    0.49

    0.07

    0.33

    0.14

    0.12

    0.13

     

     

    Tabla 10: Proporción indígena de víctimas en laTabla 9a con etnia conocida

    Región I

    Región II

    Región III

    Región IV

    Región V

    Región VI

    Proporción indígena

    97.8%

    99.6%

    98.8%

    98.5%

    99.3%

    99.4%

    Proporción de víctimas con etnia conocida

    24.7%

    64.7%

    39.4%

    99.1%

    57.7%

    48.4%

     

     

  3. Con la información de Tablas 8, 9 y 10, se saca la proporción de cada etnia con su error estándar para cada región. Los datos, presentados abajo en la Figura 3, explican inter alia que según los datos documentados por la CEH, el CIIDH, y el REMHI, más del 14% de la población indígena del área Ixil, de 1981, fue asesinado entre 1981-1983, mientras en el mismo período y área, fue asesinado el 2% de la población no-indígena.
  4. Figura 3: Proporción de la población víctima de asesinato documentado, cometidos por fuerzas estatales en Guatemala 1981-1983, por región y grupo étnico, con rango de confianza de 95%.19

  5. Nótese que los datos presentados para la Region VI (área Zacualpa) en la Figura 3 no corresponde exactamente a la cifra presentada en el apartado de genocidio porque la definición de la Región IV empleada aqui incluye los municipios de Chiche, Joyabaj y Zacualpa. En el apartado de genocidio se incluye únicamente el municipio de Zacualpa. Por lo que la cifras en Figura 3 y el apartado de genocidio para Región VI fueron calculados sobre bases diferentes aunque con la misma metodología.
  6. Los totales proyectados (

) de cada etnia en cada Región fueron calculados por las mismas metodologías descritas en las ecuaciones 2-6, y con los mismos datos que son la base de la Tabla 10. Las cifras se presentan en la Tabla 11, y resumidas en forma per capita en la Figura 4.

 

Tabla 11a: Número de asesinatos proyectados () en las tres bases de datos, por grupo étnico, 1981-1983

Región I

Región II

Región III

Región IV

Región V

Región VI

Indígena

2578

443

2983

1012

1020

2723

SE()

190.28

39.13

587.58

0.67

17.11

386.43

No-Indígena

63

2

13

15.7

7.5

6

SE()

5.4

0.07

0.33

0.14

0.12

0.13

Sin etnia conocida

14014.6

394

4791

10

752

1208

SE()

1841.44

151.12

874.1

0.64

31.95

46.79

 

Tabla 11b: Número de asesinatos proyectados () en las tres bases de datos, por grupo étnico incluyendo víctimas sin identificar, 1981-1983

Región I

Región II

Región III

Región IV

Región V

Región VI

Indígena

16,284

835

7,717

1,022

1,767

3,924

SE()

1,811.0

155.5

1,044.5

0.9

36.1

389.2

No-Indígena

371

4

70

16

13

13

SE()

40.9

0.6

10.5

0.1

0.3

0.3

 

 

Figura 4: Proporción proyectada de la población víctima de asesinatos cometidos por fuerzas estatales en Guatemala 1981-1983, por región y grupo étnico, con rango de confianza de 95%

 

  1. Nótese que las figuras 3 y 4 tienen dos interpretaciones fundamentales.20 Primera: las Regiones I y III fueron las más afectadas por la violencia estatal. En los dos Regiones hay señales claras de que, en términos cuantitativos, la matanza fue tan masiva que llega a ser genocidio. Segunda: en todas las Regiones las víctimas son, desproporcionalmente, personas indígenas. En las barras por Región de la Figura 4, en la I, se estima que más del 40% de la población indígena fue asesinada mientras 8% de la población no-indígena sufrió lo mismo; la diferencia entre las dos etnias representa un factor de 5, lo que indica que algo, en la estructura de la violencia cometida por el Estado guatemalteco, variaba cualitativamente entre las dos etnias.
  2.  

    METODOLOGÍA INTERMUESTRA V: COMPARACIONES ENTRE LAS BASES DE DATOS

  3. En el análisis de bases de datos múltiples, se puede comparar las bases para determinar los niveles de acuerdo intermuestra en términos temporales, geográficos, y de responsabilidad atribuida a los hechores. Esta parte profundiza la consideración de tendencias y cifras en común entre los tres proyectos.
  4. En la Tabla 1, es claro que el nivel de acuerdo geográfico es intermedio. En unas Regiones los tres proyectos encontraron muchas violaciones, como en Regiones 0, I, y III, mientras en otras Regiones solamente dos proyectos las cubrieron a fondo (por ejemplo, Regiones V, VI, IX), mientras en la Región IV unicamente la CEH realizó una investigación intensa.
  5. Aunque los proyectos cubrieron áreas distintas, el segundo apartado de esta parte muestra que las tres bases de datos todavía coinciden en la identificación de los meses en que ocurrieron los picos de violencia en el pais. El tercer apartado profundiza el análisis de los resultados de los tres proyectos sobre las cifras de responsabilidad para los hechos.
  6. Coincidencia en tiempo

  7. Si se ordena los datos mensuales del total de asesinatos en cada una de las tres bases de datos, se encuentra un nivel de acuerdo muy alto. En la Tabla 12 los meses fueron ordenados por cantidad de asesinatos contenidos en cada base, presentandose con los porcentajes del total de asesinatos, de los diez meses más violentos en el período 1979-1984.
  8.  

    Tabla 12: Los diez meses más violentos en tres bases de datos, 1979-198421

    CEH

    CIIDH

    REMHI

    Rango

    Mes

    Total

    Pctje.

    Mes

    Total

    Pctje.

    Mes

    Total

    Pctje.

    1

    82-01

    2,256

    9%

    82-02

    610

    12%

    82-03

    1,330

    12%

    2

    82-03

    2,253

    9%

    81-06

    390

    7%

    82-02

    807

    7%

    3

    82-02

    1,880

    8%

    83-03

    297

    6%

    82-07

    792

    7%

    4

    82-08

    1,819

    8%

    82-06

    279

    5%

    82-05

    657

    6%

    5

    82-07

    1,719

    7%

    82-07

    234

    4%

    81-09

    629

    6%

    6

    81-01

    1,423

    6%

    82-01

    233

    4%

    82-01

    470

    4%

    7

    82-06

    1,146

    5%

    82-04

    222

    4%

    82-04

    428

    4%

    8

    82-04

    937

    4%

    82-05

    210

    4%

    81-07

    397

    4%

    9

    82-05

    895

    4%

    83-08

    180

    3%

    80-02

    364

    3%

    10

    81-09

    754

    3%

    81-02

    174

    3%

    82-10

    360

    3%

    Total de 10 meses

    15,082

    63%

    2,829

    54%

    6,234

    56%

    Total de 1979-1984

    23,890

    100%

    5,275

    100%

    11,065

    100%

  9. Los cinco meses en sombra y negrilla son los que coinciden en las tres bases, es decir que entre los peores diez meses, están de acuerdo en cinco meses. Cabe mencionar que incluyen enero, febrero, abril, y mayo del año 1982; otros meses del mencionado año (marzo y junio) coinciden en dos de las tres bases.
  10. En los peores diez meses de la guerra, las bases coinciden en que sucedieron un poco más de la mitad de los asesinatos documentados (63%, 54%, y 56%). La concentración de más de la mitad de las violaciones en esos diez meses está en acuerdo con la Ley de Pareto (en que 80% del fenómeno pasará en 20% de las categorías). Lo que llama la atención es la cercanía de los meses en tiempo: que los meses que caen en todas las bases ocurrieron en el primer semestre de 1982. Esta concentración es una fuerte evidencia de que lo más intenso de la violencia política en Guatemala sucedió en el mencionado momento. También el nivel de acuerdo entre las bases implica que aunque no investigaron en exactamente las mismas Regiones, han encontrando la misma tendencia temporal.
  11. Coincidencia en la atribución de responsibilidad

  12. Las tres fuentes estan fundamentalmente de acuerdo sobre las tasas de responsibilidad atribuidas a las Partes: las tres atribuyen más de 94% de las violaciones con hechores al Estado, y menos de 6% a la guerrilla.
  13.  

    Tabla 13: Total de asesinatos con hechor identificado, por la entidad responsable22

    CEH

    CIIDH

    REMHI

    Estado

    24121

    2916

    19177

    Guerrilla

    1263

    61

    1184

  14. En el análisis de proporciones de responsibilidad derivadas de muestras que se tomaron no probabilísticamente, como se muestra en Tabla 13 arriba, existe la posibilidad que los proyectos se enfocaran más en los hechos de una de las partes que a la otra. Este especie de "sobre-enfoque" se puede sesgar las proporciones.
  15. Por ejemplo, si los proyectos se dedicaron a buscar violaciones cometidas por la guerrilla, mientras empleaban menos recursos a la busqueda para violaciones atribuidas al Estado, este proceso produciría un nivel inflado de responsbilidad atribuida a la guerrilla. En una muestra aleatoria, se evitaría este sesgo al aceptar testimonios seleccionados al azar. Ninguno de los tres proyectos buscó testimonios con un diseño probabilístico en la mencionada forma. Así que hay una cuestión de desproporcionalidad de enfoque en los proyectos que debe ser considerada.
  16. Los tres proyectos y las medidas de "traslape" explicadas en las Partes II y III, se puede probar la hipotesis que existe sobre-enfoque en uno de los proyectos. Se toman todas las estimaciones de los componentes del total sin duplicación (Nk), y se distingue entre los asesinatos atribuidos a la guerrilla y los atribuidos a otras instancias (casi todos, al Estado). Se suman los componentes que "indican" traslape (N111+N110+N101+N011) y se dividen por Nk; esta cifra da el porcentaje de traslape por grupo de responsables. Los resultados de este cálculo estan abajo en Figura 5.23
  17. Figura 5: Tasa de "traslape" de víctimas de asesinato documentado por la CEH, el CIIDH, y el REMHI, por violaciones cometidas por el Estado y por la guerrilla (con barra del rango de confianza 95%).

  18. Con los resultados de la Figura 4, se puede descartar la hipótesis de que existía una gran diferencia en el nivel de cobertura entre violaciones cometidas por la guerrilla y las cometidas por otras instancias. Aunque hubiera una diferencia pequeña entre el nivel de "traslape" de violaciones sin la presencia de la guerrilla (12.4%) y el de violaciones con la presencia de la guerrilla (8.8%), el error estándar cierre las diferencias a un nivel no interpretable.24
  19. La implicación de la Figura 4 es que las violaciones de la guerrilla y las violaciones cometidas por las instancias estatales fueron investigadas con aproximadamente el mismo nivel de cobertura o intensidad, y no existía una desproporcionalidad sistemática en intensidad de investigación sobre las partes suficiente como para cambiar la intepretación de proporciones cuantitativas de responsibilidad.25

 

Anexo

Definiciones de Regiones, por municipio

Las áreas fuera de estas definiciones están clasificados como Región 0. Note que la definición de Región VI en este estudio no es igual a la definición utilizada en el informe de la CEH: este estudio incluyó dos municipios que no se incluyen en el apartado sobre genocidio.

REGIÓN

Depto

Municipio

Región I

Quiché

Chajul

Región I

Quiché

San Juan Cotzal

Región I

Quiché

Nebaj

Región II

Alta Verapaz

Cahabón

Región III

Baja Verapaz

Rabinal

Región IV

Chimaltenango

San Martín Jilotepeque

Región V

Huehuetenango

Nenton

Región V

Huehuetenango

San Mateo Ixtatán

Región V

Huehuetenango

Barillas

Región VI

Quiché

Chiche

Región VI

Quiché

Zacualpa

Región VI

Quiché

Joyabaj

Región VII

Guatemala

Guatemala

Región VII

Guatemala

Mixco

Región VIII

Alta Verapaz

Panzós

Región VIII

Alta Verapaz

San Pedro Carchá

Región IX

Quiché

Ixcán

Región X

Santa Rosa

Cuilapa

Región X

Santa Rosa

Barberena

Región X

Santa Rosa

Casillas

Región X

Santa Rosa

Santa Rosa De Lima

Región X

Santa Rosa

Oratorio

Región X

Santa Rosa

San Rafael Las Flores

Región X

Santa Rosa

Santa Maria Ixhuatan

Región X

Santa Rosa

Taxisco

Región X

Santa Rosa

Chiquimulilla

Región X

Santa Rosa

San Juan Tecuaco

Región X

Santa Rosa

Guazacapán

Región X

Santa Rosa

Naranjo

Región X

Santa Rosa

Pueblo Nuevo Las Viñas

Región X

Santa Rosa

Nueva Santa Rosa

Región X

Escuintla

Escuintla

Región X

Escuintla

Santa Lucía Cotzumalguapa

Región X

Escuintla

La Democracia

Región X

Escuintla

Siquinalá

Región X

Escuintla

Masagua

Región X

Escuintla

Tiquisate

Región X

Escuintla

La Gomera

Región X

Escuintla

Guanagazapa

Región X

Escuintla

San José

Región X

Escuintla

Iztapa

Región X

Escuintla

Palín

Región X

Escuintla

San Vicente Pacaya

Región X

Escuintla

Nueva Concepción

Región X

Retalhuleu

Retalhuleu

Región X

Retalhuleu

San Sebastián

Región X

Retalhuleu

Santa Cruz Mulua

Región X

Retalhuleu

San Martín Zapotitlán

Región X

Retalhuleu

San Felipe

Región X

Retalhuleu

San Andrés Villa Seca

Región X

Retalhuleu

Champerico

Región X

Retalhuleu

Nuevo San Carlos

Región X

Retalhuleu

El Asintal

Región X

San Marcos

Nuevo Progreso

Región X

San Marcos

El Tumbador

Región X

San Marcos

Malacatán

Región X

San Marcos

Catarina

Región X

San Marcos

Ayutla

Región X

San Marcos

Ocos

Región X

San Marcos

Pajapita

 

 

Notas

1. A solicitud de la CEH, este análisis fue conducido por el Dr. Patrick Ball, Subdirector del Programa en Ciencia y Derechos Humanos de la Asociación Norteamericana para el Avance de la Ciencia (AAAS), con la asesoria de Dr. Herbert Spirer ("Adjunct Professor", Columbia University y Consultor de la AAAS), Dr. Frederick Scheuren ("Senior Fellow", The Urban Institute, y "Adjunct Professor", George Washington University), y William Seltzer ("Senior Research Fellow", Fordham University).

2. Se excluyen de la Tabla 1 las víctimas cuando la fecha de violación no estuviese identificada con precisión hasta el año y aquellas sin un lugar de la violación identificada con precisión hasta el municipio.

3. Aunque el CIIDH también recogió información de fuentes periodísticas y de fuentes documentales, en este análisis únicamente se incluyó la información derivada de fuentes directas, y con la firma del declarante.
4. Cabe mencionar que la definición de Región VI (área Zacualpa) incluye los municipios de Chiche y Joyabaj, y no corresponde exactamente con con la definición de la región Zacualpa en el apartado del informe que trata genocidio que incluye solamente el municipio de Zacualpa.
5. Las Regiones fueron definidas para aislar áreas en que existían grandes diferencias en el nivel de cobertura entre los proyectos.

6. Note que no se trata de desapariciones forzadas (las que son contibilizadas aparte). No hubo tiempo ni recursos para extender este análisis a desaparecidos.

7. Nótese que este análisis trata víctimas, no violaciones, pero para la violación de asesinato, las dos medidas son iguales porque cada víctima puede sufrir asesinato sólamente una vez. Veáse a Who Did What to Whom? Designing and Implementing a Large-Scale Human Rights Data Project, Patrick Ball (Washington: AAAS), 1996.

8. Además, muchas víctimas no están identificadas por nombre en las bases de datos. Los testigos originales mencionaron un grupo de personas. Testigos distintos con frecuencia estiman números desiguales en hechos que involucran a muchas personas, no es posible concordar víctimas no identificadas. Este análisis presume que las tasas de concordancia entre las víctimas no identificadas son iguales a las tasas entre las identificadas.

9. Las muestras fueron estratificadas proporcionalmente por región para asegurar la cobertura a todas.

10. De los registros mencionados en el texto, unos 498 registros más fueron seleccionados y concordados una segunda vez. Nos referimos a estos registros en el análisis de la calidad de la concordancia.
11. En el análisis de concordancia, lo que nos preocupa es que los registros que realmente son concordados se escapen a los analistas. Los 498 registros concordados dos veces no fueron al azar, sino fueron seleccionados para representar registros ya concordados para dar una prueba de la eficacia y consistencia del proceso. Comparando los 171 registros, tratados por los dos analistas, que fueron clasificados por uno o los dos como un registro concordado, 88% fueron codificados iguales.
12. Esta explicación está tomada de Population Growth Estimation: a Handbook of Vital Statistics Measurement, por Eli S. Marks, William Seltzer, y Karol J. Krótki (New York: The Population Council), 1974, pg. 13-17.

13. Véase ecuación 7.188 Marks, Seltzer y Krótki, pg. 406.

14. Tomado de Kirk M. Wolter, Introduction to Variance Estimation (New York: Springer-Verlag), 1985, pg. 154-155.

15. Los "pseudovalores" deben ser aproximadamente independientes y distribuidos idénticamente. Esta presunción fue probada con un gráfico de probabilidad normal para cada vector de pseudovalores, y en cada caso fueron bien distribuidos.

16. La estimación de Nk que fue de 47,706 asesinatos documentados en el proyecto, junto con su error estandar 228, tiene un rango de confianza de 95% 47,559 – 48,152. Note que este rango de confianza incluye el valor estimado en la Tabla 5, 47,803. La cercanía del valor de la Tabla 5 con el valor estimado por la suma de las Regiones por el método "jackknife" implica que no hubiese tanto sesgo en la estimación simple. No obstante, el sesgo preocupante que requirió la desagregación a Regiones y el uso del método de "jackknife" no afectaba a Nk, sino que afectaría mucho a n000, y entonces fue todavía necesario.

17. Veánse, en ese contexto, el Informe del Proyecto REMHI, Guatemala: Nunca Más Tomo IV, Víctimas del Conflicto (Guatemala: Oficina de Derechos Humanos del Arzobispado de Guatemala) 1998, pg. XXXI-XXXII; y Patrick Ball, Paul Kobrak, y Herbert F. Spirer, Violencia Institucional en Guatemala, 1960 a 1996: una Reflexión Cuantitativa (Washington DC: AAAS), 1999, pg. 62, nota 12.

18. Las tasas de traslape no fueron calculadas por grupo étnico. En cambio, las tasas Regiónales para los concordados del período 1981-1983 fueron aplicados a los tres grupos étnicos en cada Región. Esta aplicación presume que las tasas de "traslape" no varían (en términos significativos) entre grupos étnicos.
19. Fuente de la gráfica: censo de 1981; testimonios recibidos por la CEH, fuentes directas al CIIDH, y testimonios recibidos por el REMHI.

20. También cabe mencionar que, en términos absolutos y relativos, el error estandar de cada cifra en la Figura 3 es mucho más que el error estándar en Figura 2. Esta diferencia es correcta, dada que las proyecciónes en Figura la 3 incorporan más incertidumbre que las estimaciones en la Figura 2. Los tamaños de las muestras en que están basadas las estimaciones de los totales sin duplicación (Nk) son adecuados para estimaciones de Nk sin mucho errror. La proyección todavía tiene más incertidumbre que la estimación de Nk, reflejada en el error más alto.

21. En la Tabla 12, solamente se incluyen los asesinatos que son identificados por fecha con precisión hasta el mes.

22. Se incluye solamente aquellas violaciones con responsable identificado y con la fecha de la violación con precisión hasta el año. Otra vez cabe subrayar que este estudio contabiliza asesinatos, no solamente ejecuciones extrajudiciales.

23. La tabla en que está basada la Figura 5 (corresponde a Tabla 5, dividida por entidad responsable) se muestra a continuación.

Categoria

Estado

Guerrilla

N111

299

3

N110

617

N101

3769

200

N011

388

N100

19,173

1,087

N010

2,165

61

N001

14,430

949

Nk

40,842

2,301

Tasa de traslape

12.4%

8.8%

SE (Nk)

0.5%

1.9%

El error estandar está calculado por el método convencional para proporciones derivadas por muestras, , y el rango de confianza +/- 1.96*SE.

24. La diferencia entre la tasa de "traslape" para asesinatos cometidos por el Estado y por la guerrilla no es significativo, ni en términos puramente técnicos, no es significativo en términos análiticos. Para el análisis del efecto en las proporciones estimadas, veáse la nota 25, abajo. La prueba técnica es la siguiente:

, = 0.0193, que se da un rango de confianza +/- 3.8%. La diferencia entre las dos tasas es 12.4% - 8.8% = 3.6%; el rango de confianza es más que la diferencia, que implica que no se puede descartar la hipótesis que la diferencia es igual a cero. Este cálculo confirma lo que es claro en términos intuitivos en Figura 5.

25. Hay dos maneras de considerar el efecto de las tasas de traslape en la proporción de responsabilidad atribuidas al Estado y a la guerrilla. La proporciones de responsabilidad atribuidas a las dos partes como resultado de los Nk estimados en nota 23, arriba, están presentadas abajo; nótese que son un promedio de las proporciones de las tres bases de datos, como las implicadas en Tabla 13 en el texto.

Estimación

Estado

Guerrilla

Nk

41,147

1,860

Proporción del total Nk

95.7%

4.3%

n000

73,622

3,706

114,769

5,567

Proporción del total

95.4%

4.6%

Para ver el efecto de la pequeña desproporcionalidad en cobertura, se calculó n000 (se usa la Ecuación 3 para el Estado, pero se usa la Ecuación 2 para la guerrilla porque hubiera datos de solamente dos proyectos). La estimación de n000 incluye la información sobre tasas de "traslape", y por eso n000 controla el efecto de la desproporcionalidad en cobertura. Nótese que las proporciones calculadas por resultan iguales a las calculadas con Nk. La conclusión es que la desproporcionalidad en cobertura sobre los hechos de las Partes no cambiaron el análisis final de su responsibilidad.

  ../../cap2/vol1/Anterior
../../cap2/vol1/Siguiente

../../cap2/vol1/VerdadEste reporte fue producido por la Comisión para el Esclaracimiento Histórico (CEH). Este website esta mantenido por el Programa de Ciencia y Derechos Humanos de la Asociación Americana del Avance de la Ciencia.

Por favor notifique a webmaster@hrdata.aaas.org si encuentra problemas técnicas en estas paginas.
Preguntas o comentario sobre el contenido deben ser dirigidas a pball@aaas.org.

AAAS Ciencia y Derechos Humanos Centro de Datos

../../cap2/vol1/CEH%20Web%20Page