../../cap2/vol1/Indice%20general%20del%20informe
../../cap2/vol1/Anterior
../../cap2/vol1/Siguiente

Anexo III

Instrumentes legales y operativos para el funcionamiento de la CEH

  • Acuerdo de Oslo
  • Estatuto Juridico de la CEH
  • Ley de Reconciliación Nacional. Decreto numero 145-96 del Congreso de la República
  • Punto Resolutivo número 6-98 del Congreso de la República

Selección de correspondencia entre la CEH y las instituciones de la República de Guatemala

Colaboración de organizaciones e instituciones nacionales e internacionales

Instrumentos estadisticos

Metodolgía intermuestra. Documento elaborado por la Asociación Americana para el Avance de la Ciencia -AAAS-

Anexo III

DOCUMENTO ELABORADO POR LA AAAS1

METODOLOGÍA INTERMUESTRA I: INTRODUCCIÓN Y RESUMEN

El objetivo y el problema

  1. ¿Cuántas personas fueron asesinadas en Guatemala durante el período del mandato de la CEH, 1960-1996? Tomando en cuenta la información de las tres bases de datos sobre violaciones de Derechos Humanos (CEH, CIIDH, REMHI), recogida por medio de entrevistas con testigos directos y víctimas, surgen algunas preguntas: a) ¿cuántos asesinatos fueron documentados por los tres proyectos? y b) ¿cuántos asesinatos se estiman que ocurrieron -en total- durante el conflicto armado?
  2. Este análisis trata los dos temas. En la parte I, se establece la información recogida por los tres proyectos y los objetivos del análisis. En la parte II se explican los métodos científicos utilizados para estimar cifras que responden las preguntas empíricas mencionadas. En la parte III se presentan los resultados con interpretaciones. La parte IV, se enfoca en cuatro Regiones en las que, posiblemente, ocurrió genocidio en el período 1981-1983 y se presenta los resultados desagregados según la etnia de las víctimas. Finalmente, en la parte V se presentan las diversas formas en que los tres proyectos concuerdan en términos estadísticos, sobre los patrones y tendencias de violencia en Guatemala.
  3. La información recogida

  4. Las tres bases de datos que han sido elaboradas con información recogida en entrevistas con testigos y víctimas, contienen listas de víctimas de asesinato obtenidas de cada proyecto. No obstante, no tenian definiciones precisas en común. La medida en este estudio es muertos, y no la categoria mas juridicamente precisa de "ejecución extrajudicial" utilizada en el informe de la CEH. Las tres proyectos tenian definiciones distinctas de asesinato, y para juntalos, fue necesario usar la definición del fenómeno más amplio. Las cifras de la CEH en este estudio deben ser comparados con los de totales de muertos en el informe.
  5. Muchos asesinatos no fueron reportados a ningún proyecto y, por eso, la cantidad expuesta en la Tabla 1 es menor que el total de víctimas que ocurrieron en la realidad. El total, en cada una de las tres bases se presenta, por Región y por época, en la última fila de al Tabla 1.
  6. Tabla 1. 2Cantidad de asesinatos documentados (víctimas con y sin nombres), por época, región, y proyecto

    Región

    CEH

    CIIDH3

    REMHI

    1960-1977

    1978-1996

    1960-1977

    1978-1996

    1960-1977

    1978-1996

    Región 0 (otros)

    271

    9,916

    18

    2,586

    84

    6,888

    Región I (área Ixil)

    14

    4,609

    0

    4,028

    9

    5,423

    Región II (Cahabón)

    1

    532

    0

    135

    7

    453

    Región III (Rabinal)

    0

    1,379

    0

    1,297

    0

    1,354

    Región IV (San Martín Jilo.)

    0

    1,347

    1

    20

    0

    68

    Región V (Nte. De Huehue)

    0

    1,746

    0

    1

    0

    1,032

    Región VI (área Zacualpa)4

    0

    1,951

    0

    238

    1

    1,674

    Región VII (Guatemala)

    91

    245

    1

    15

    10

    111

    Región VIII (área Panzós)

    0

    169

    11

    41

    1

    1,167

    Región IX (Ixcán)

    3

    2,421

    0

    48

    5

    2,751

    Región X (área Costa Sur)

    25

    190

    2

    91

    23

    139

    Total

    405

    24,505

    33

    8,500

    140

    21,060

     

  7. Nótese que los tres proyectos no cubrieron todas las Regiones: los tres realizaron investigaciones en el área Ixil sobre violaciones en la época 1978-1996, pero solamente la CEH recogió información adecuada en San Martín Jilotepeque.5 También es claro que ninguno de los tres proyectos cubrió bien la época 1960-1977, que incluye las matanzas de los años 1968-1973. Cualquier estimación tiene que tomar en cuenta estas limitaciones.
  8. Si no hubiese víctimas reportadas en más de un proyecto, el total de víctimas documentadas sería la suma de las tres bases de datos, es decir, la suma de la última línea de la tabla, 405+24,505+33+8,500+140+21,060 = 54,643. Sin embargo, muchas víctimas fueron reportadas en dos o los tres proyectos, por eso, no se puede presumir que el total de víctimas documentadas sea igual a la suma simple. Los totales de cada proyecto no se pueden sumar para estimar el total de asesinados reportados.
  9. Los proyectos fueron manejados independientemente: por eso la misma víctima puede estar reportada en más de un proyecto. Por ejemplo, imagine que Juan Pérez fue asesinado. La esposa de Juan Pérez pudo haber reportado su asesinato al CIIDH en 1994; el hijo del mismo Señor Pérez pudo dar su testimonio a REMHI en 1996; y el vecino del Señor Pérez pudo relatar el mismo hecho a la CEH en 1997. Si se sumaran las tres bases de datos, la violación que pasó a Juan Pérez sería contabilizada tres veces.
  10. El reportaje duplicado de violaciones en más de una base de datos es la causa del fenómeno de "traslape" entre bases de datos. Para estimar el número total de víctimas, los traslapes entre las bases de datos tienen que ser estimados y las sumas finales reducidas en esa cantidad.
  11. Hay dos posibilidades que muestran los límites del problema de traslape. Como sugerimos antes, si no hubiese ninguna víctima que aparezca en más de una base de datos, la suma lógica y correcta de las tres sería igual a la suma aritmética de las tres (54,643); éste se llama el límite superior. El otro límite, el inferior, representa la posibilidad de que la mayor de las tres bases (la CEH) contenga todos los casos de los otros. En esta situación, la cantidad total de asesinados sería igual al número reportado por la más grande, la CEH (405+24,505=24,910). La cantidad de víctimas únicas sumadas, de las tres bases de datos, cae entre estos límites, es decir, entre 24,910 y 54,643. El análisis para estimar la cantidad de asesinatos documentados es para reducir este rango.
  12. También resulta que muchos asesinatos nunca fueron reportados a ningún proyecto. En la sección de abajo, se expone una estimación de la cantidad de asesinatos6 no considerados por la CEH, el CIIDH, ni el REMHI. La estimación de este análisis es que ocurrieron entre 119,300 – 145,000 asesinatos, siendo la máxima probabilidad de 132,000. La distribución de probabilidades alrededor de la estimación de 132,000 se presenta en la Figura 1. Esta cifra se justifica en las siguientes secciones.
  13.  

    Figura 1: Probabilidad de que la cifra real caiga dentro del intervalo

     

    METODOLOGÍA INTERMUESTRA II: SUMAR VÍCTIMAS DE ASESINATO SOBRE TRES BASES DE DATOS INDEPENDIENTES

    Análisis de "traslape"

  14. La información contenida en las tres bases de datos representa víctimas identificadas o enumeradas por los testigos; algunas (pero no todas) las víctimas fueron identificadas por nombre.7 La cantidad de asesinados en cada base está identificada por la notación expuesta abajo.
  15. MCEH = la cantidad de víctimas en la base de datos de la CEH

    MCIIDH = la cantidad de víctimas en la base de datos del CIIDH

    MREMHI = la cantidad de víctimas en la base de datos de la REMHI

  16. Ninguna de las bases de datos estimó, en forma directa, cuántos asesinados ocurrieron en total en todo el país. Cada base es un listado de las víctimas de matanza que fueron reportadas directamente al proyecto y verificado según la metodología del mismo proyecto. Como ya fue mencionado, muchas víctimas no fueron reportadas a ninguno de los tres proyectos. El total de las víctimas asesinadas en Guatemala puede estar representado en las ocho categorías expuestas abajo.
  17. N000 = víctimas que no fueron reportados a ninguna de las tres: la CEH, el CIIDH, ni el REMHI

    N111 = víctimas que fueron reportados a todas (los tres proyectos)

    N110 = víctimas reportadas a la CEH y al CIIDH, pero no al REMHI

    N101 = víctimas reportadas a la CEH y al REMHI, pero no al CIIDH

    N011 = víctimas reportadas al CIIDH y al REMHI, C pero no a la CEH

    N100 = víctimas reportadas solamente a la CEH, y no al CIIDH ni al REMHI

    N010 = víctimas reportadas solamente al CIIDH, y no a la CEH ni al REMHI

    N001 = víctimas reportadas solamente al REMHI, y no a la CEH ni al CIIDH

  18. El total de víctimas de asesinato en Guatemala, N, es la suma de estas ocho categorías. El total de víctimas reportadas a uno, dos o tres proyectos, Nk, es la suma de las siete categorías que son calculables directamente de las bases de datos, es decir, N111 a N001. Veáse la ecuación 1.

  1. Para contabilizar la cantidad de víctimas reportadas a uno o más proyectos, hay que estimar el número de víctimas reportado a todos los proyectos (N111, concordado tres veces) y entre cada pareja de proyectos (N110, N101, y N011). El complemento de cada proyecto (N100, N010, and N001) determina las cifras requeridas para Nk.
  2. Concordancia

  3. Es muy difícil encontrar la misma víctima en dos bases de datos con un programa de computadora. Las víctimas son reportadas a los tres proyectos, con información que varía en cada reporte. Los nombres y apellidos de las mismas personas son deletreados de distinta forma, por ejemplo, por ser traducido de idiomas mayas a español en formas inconsistente, los reportes de fechas de nacimiento y de defunción pueden estar equivocados.
  4. No es práctico ni preciso concordar bases en forma automatizada, con programas de computadora. Para encontrar a una persona de una base de datos (la fuente) en otra de las bases (el objeto), un analista tiene que comparar la persona de la fuente contra todos los registros en el objeto. Este proceso se llama concordar a las bases.8
  5. Concordar las bases es tedioso y requiere mucho tiempo. A cambio de intentar de concordar todos los registros de cada base de datos contra las otras, se tomaron muestras aleatorias de las víctimas identificadas por nombre de cada una de las tres bases de datos.9 El número de registros tomado en cada muestra está denotada por la letra m (mCEH, mCIIDH, mREMHI). Incluyendo todas las Regiones, la cantidad de registros seleccionados de los tres proyectos fue de 1,412, 1,351, y 1,122, respectivamente (Tabla 2).10
  6. Cada persona, en la muestra de cada base, fue comparada con todos los registros en las demás bases. Cuando la misma persona fue encontrada en una de las demás bases, fue anotada como concordada doble; cuando la misma persona fue encontrada en las tres bases, fue anotada como concordada triple.
  7. Se tomaron cuatro cuatro grupos de muestras de las tres bases; un analista trató tres grupos, y el otro trató uno. Solamente se encontraron diferencias muy pequeñas entre las tasas de concordancia que resultaron del trabajo de los dos analistas; la implicación es que el error que resultó de factores fuera del proceso de tomar la muestra fueron mínimos.11 Los números de personas concordadas, tomando todas las Regiones, se presentan en la Tabla 2.
  8. Tabla 2: Cantidad de concordados encontrados entre las tres bases

    CEH

    CIIDH

    REMHI

    m111

    21

    73

    19

    m110

    48

    153

    m101

    210

    226

    m011

    121

    27

    m100

    1,133

    m010

    1,004

    m001

    850

    Muestra total

    1,412

    1,351

    1,122

  9. La Tabla 2 indica que en la muestra de 1,412 víctimas seleccionadas de la base de datos de la CEH, 21 fueron encontradas en la base de datos del CIIDH y también en la base de datos de REMHI; esos 21 son triples. También, se encontraron 48 registros de la CEH en la base de datos del CIIDH pero no en REMHI, y 210 más de la CEH fueron encontrados en la base de datos del REMHI pero no en la del CIIDH; 1,133 de los registros seleccionados de la base de datos de la CEH no fueron encontrados en ninguna de los otras dos.
  10. Al dividir cada mxyz (Tabla 2), por el total de la muestra de cada base, los números en Tabla 2 se convierten a tasas. Las tasas de concordancia se presentan en la Tabla 3.
  11. Tabla 3: Tasas de concordancia para las tres bases de datos

    CEH

    CIIDH

    REMHI

    r111

    1.5%

    5.4%

    1.7%

    r110

    3.4%

    11.3%

    r101

    14.9%

    20.1%

    r011

    9.0%

    2.4%

    r100

    80.2%

    r010

    74.3%

    r001

    75.8%

  12. En la segunda línea r110 indica que 3.4% de las víctimas en la base de datos de la CEH están también en la base de datos del CIIDH. Pero la base de datos del CIIDH es más pequeña que la base de la CEH, y por eso, la misma estimación, desde el punto de vista del CIIDH, es que 11.3% de las víctimas registradas en la base de datos del CIIDH están en la base de datos de la CEH.
  13. Nótese que las diferencias en las estimaciones de las tasas no están exactamente en proporción a las diferencias de tamaño entre las bases. Estas diferencias entran por la variación que resultó del proceso de tomar la muestra aleatoria, y por el error del proceso de concordar las bases, y está tratada en la sección de análisis de error (abajo).
  14. Estimación de totales de víctimas reportadas

    Como se ha mencionado en la sección de Análisis, el número de asesinatos se estima por la suma de los siete términos de "traslape", como se presenta en la Ecuación 1.

  15. Si se aplican las tasas a la Tabla 3, arriba, a la última línea de la Tabla 1 (total de víctimas 1978-1996), se saca una estimación de los componentes de Nk basada en la información de las tres bases de datos. Veáse el resultado en Tabla 4.
  16.  

    Tabla 4: Cantidad de asesinatos, estimados por categoría y proyecto

    CEH

    CIIDH

    REMHI

    N111

    364

    459

    357

    N110

    833

    963

    N101

    3,645

    4,242

    N011

    761

    507

    N100

    19,663

    N010

    6,317

    N001

    15,955

     

  17. Sin embargo, para estimar un Nk en común entre las tres bases de datos, hay que reconciliar las varias estimaciones del número de registros que concuerdan entre las bases de datos (N111, N110, N101, and N011). Se toma el promedio de los valores en cada fila en la Tabla 4, en que hay más de una estimación, y así se estima la suma en Tabla 5.

Tabla 5: Número estimado de asesinados en las tres bases de datos (CEH, CIIDH, REMHI)

promedio

N111

393

N110

898

N101

3,943

N011

634

N100

19,663

N010

6317

N001

15,955

Nk

47,803

Así, el número estimado de asesinados reportados a los tres proyectos sin duplicación es aproximadamente 47,803. Pero como será mostrado abajo, este número está sujeto a algunos sesgos que se pueden controlar.

Teoría demográfica y la estimación de N000

En el apartado anterior se explica cómo estimar el número de asesinatos documentados. Todavía está pendiente una estimación del número de asesinatos no documentados, N000 en la notación definida. Abajo, en las Figuras 2a, 2b, y 2c, se presentan tres posibilidades de cómo están relacionados los proyectos.

 

Figura 2a: Distribución de proyectos en el universo de violaciones (ninguna relación).

Figura 2b: Distribución de proyectos en el universo de violaciones (equivalencia completa).

 

Figura 2c: Distribución de proyectos en el universo de violaciones (duplicación parcial).

 

 

En la Figura 2a, los proyectos no comparten ninguna violación. En Figura 2b, todas las violaciones estan contenidas en el proyecto más grande. En Figura 2c, alguunas violaciones están compartidas. Del apartado anterior, se infiere que Figura 2c representa la realidad de los tres proyectos.

Presumamos, por el momento, que los proyectos son independientes, es decir, que la probabilidad de que un testimonio a un proyecto tiene correlación cero con la probabilidad de que el mismo declarante dé el testimonio a otros proyectos. ¿Qué implicación sobre el universo tiene cada figura? En Figura 2a, la implicación es que el universo es inmenso en relación a los proyectos porque trabajando independientamente, los proyectos se distribuyeron en las violaciones sin encontrarse con otros proyectos. En Figura 2b, la implicación es a la inversa, que el universo es muy reducido, y los proyectos son equivalentes. Pero en la Figura 2c, se ve que los niveles de "traslape" son parciales. Con los niveles de "traslape", se puede inferir la escala del universo.

 

Considerar el caso con dos proyectos, A y B, que tiene un "traslape" M en un universo de violaciones N.12 Nótese que la probabilidad que cualquier asesinato sea seleccionada por A es es decir que y la probabilidad de que cualquier asesinato sea seleccionada por B es Pr(B) = B/N. La probabilidad de un asesinato contenido en las dos bases de datos, Pr(M), es igual a Pr(M) = M/N, y por la definición de un evento compuesto de dos eventos independientes, Pr(M) = Pr(A|B) = Pr(A) * Pr(B).

Intercambiando los términos, , que reduce a

Dada la primera relacion con el resultado anterior nos da , y entonces . Para estimar solamente los asesinatos que fueron excluidos de los dos proyectos, , o en la notación de los tres proyectos,

Con la misma lógica, se puede derivar un estimador para n000: la medida del número de asesinatos que no fueron documentados por ninguno de los tres proyectos.13 Este estimador está presentado en la Ecuación 3.


Medir error del estimador y de la muestra
14

  1. Los estimadores de n000 y el número total de asesinatosdependen de los niveles de "traslape" entre las tres bases de datos. Estos niveles (como los presentados en Tabla 3, arriba) se multiplican por el total de violaciones en cada base, para sacar estimaciones para las categorías n111, n110, …, n001 que suman a Nk. Con la Ecuación 3, se estima n000; sumando, se puede estimar . No obstante, se requiere otro método que se llama el método de "jackknife" para lograr dos objetivos: a) quitar el sesgo de razón que resulta de la Ecuación 3; y b) para determinar la variación de los tres estimadores necesarios para este análisis (Nk, n000, y ). En la explicación general del método (abajo), el estimador representa a cada uno de los tres en los cálculos. Por ejemplo, Nk en la Tabla 5 (arriba), 47,803, es para Nk tomada a nivel nacional.
  2. El método empieza por dividir aleatoriamente la muestra de los registros concordados (que tiene un total de n registros) a k grupos, conteniendo cada cual m registros: n = mk. está calculada de la misma manera como pero con una muestra reducida de tamaño m(k-1) obtenida por omitir el grupo

. Definir

 

  1. La Ecuación 4 nos da un vector de tamaño k de calculado de las muestras reducidas por omitir los grupos; el promedio de vector de es (véase Ecuación 5), se llama el "estimador de Quenouille", que quita varios sesgos que afectan a . Este estimador es lo que se presenta en la Tabla 7 (Resultados, en la Parte III).
  2. El otro resultado beneficioso del método de "jackknife" es si los valores de

están distribuidos normalmente.15 El error estándard del estimador (la raíz cuadrada de la variación) se estima con la Ecuación 6.

  1. Los errores estandares presentados en la Tabla 7 fueron calculados según la Ecuación 6.
  2. Cobertura en tiempo y espacio y su efecto en n000

    Fue anotado en la discusión de la Tabla 1 que ninguno de los proyectos cubrieron bien las violaciones del período 1960-1977, y por eso ninguna estimación para este período es posible con los datos disponibles. La complicación más importante para la estimación de n000 es que los proyectos no cubrieron todas las Regiones con la misma intensidad. Si no se tratan aparte las Regiones con niveles de cobertura distintas, se puede sesgar la estimación.

    Considerar la Región IV, en que la CEH encontró más de 1,300 asesinatos, mientras los otros dos proyectos reportaron solamente algunas docenas. Por supuesto, los niveles de traslape son bajos, pero estos niveles no se pueden utilizar en una estimación de n000 porque el concepto de traslape requiere que los proyectos hubieran trabajado en las mismas áreas. Así que la estimación de n000 tuvo que basarse solamente en aquellos proyectos que realmente lograron trabajar en cada región. Los proyectos que contribuyeron a la estimación de n000 están en la Tabla 6.

    Tabla 6: Proyectos utilizados para estimar n000, por región

    Región

    Proyectos con cobertura adecuada

    Ecuación para n000

    Región 0 (otro)

    Los tres

    Ecuación 3

    Región I (área Ixil)

    Los tres

    Ecuación 3

    Región II (Cahabón)

    Los tres

    Ecuación 3

    Región III (Rabinal)

    Los tres

    Ecaución 3

    Región IV (San Martín Jilotepeque)

    Solamente CEH

    No se puede estimar n000

    Región V (Norte de Huehuetenango)

    CEH & REMHI

    Ecuación 2

    Región VI (área Zacualpa)

    Los tres

    Ecuación 3

    Región VII (Guatemala)

    CEH & REMHI

    Ecuación 2

    Región VIII (área Panzós)

    CEH & REMHI

    Ecuación 2

    Región IX (Ixcán)

    CEH & REMHI

    Ecuación 2

    Región X (área Costa Sur)

    Los tres

    Ecaución 3

     

     

     

    METODOLOGÍA INTERMUESTRA III: RESULTADOS Y ALGUNAS LIMITACIONES DE LA INTERPRETACIÓN

    Ahora se pueden presentar resultados por categoría y región.

    Tabla 7: Totales de asesinatos en Guatemala 1978-1996, por categoría de estimación y región

    Región

    Categoría

    0

    I

    II

    III

    IV

    V

    VI

    VII

    VIII

    IX

    X

    Total

    N111

    67

    141

    15

    146

    0

    0

    17

    2

    0

    2

    2

    391

    N110

    378

    406

    8

    98

    5

    0

    67

    3

    0

    16

    2

    983

    N101

    1,358

    1,010

    204

    170

    13

    206

    336

    24

    43

    681

    13

    4059

    N011

    133

    419

    16

    122

    0

    0

    0

    0

    0

    0

    0

    690

    N100

    8,260

    3,187

    221

    1,028

    1,325

    1,597

    1,642

    226

    156

    1,720

    182

    19,545

    N010

    2,256

    2,708

    85

    836

    16

    1

    195

    15

    41

    30

    91

    6,274

    N001

    5,228

    3,999

    295

    926

    59

    765

    1,166

    77

    1,099

    2,054

    106

    15,773

    Nk (sin duplicación)

    17,679

    11,870

    844

    3,328

    1,418

    2,569

    3,416

    347

    1,339

    4,501

    396

    47,706

    SE (Nk)

    110

    135

    24

    79

    11

    44

    76

    9

    26

    77

    5

    228

    N000

    38,856

    17,397

    466

    6,467

    0

    5,548

    5,836

    561

    2,265

    5,052

    2,019

    84,468

    SE (N000)

    3,809

    2045

    105

    1,152

    0

    1,826

    1,890

    350

    3,062

    995

    1,840

    6,388

    56,535

    29,267

    1,310

    9,795

    1,418

    8,117

    9,252

    908

    3,604

    9,553

    2,415

    132,174

    3,918

    2175

    127

    1,218

    11

    1,870

    1,964

    357

    3,087

    1,072

    1,844

    6,568

  3. En la Tabla 7 se ve que en la Región 0 fueron documentados Nk = 17679 asesinatos entre los tres proyectos. Sobre todas las Regiones, fueron documentados únicamente 47706 asesinatos, siendo ésta la suma de las estimaciones Regionales.16 El error estandar SE(Nk) no es la suma simple de las Regiones, sino es raíz cuadrada de la suma de los valores Regionales (i=0, I, …, X) al cuadrado:
  4. Igualmente, los valores para N000 y N son los valores Regionales sumados, y el error estandar para N000 y es la raíz cuadrada de la suma de los valores Regionales al cuadrado. Así que se estima que fueron aproximadamente 84,468 asesinatos que no fueron reportados en la CEH, el CIIDH, ni en el proyecto REMHI. Sumando Nk y n000 a , el análisis llega a la estimación final, que hubo 132,174 asesinatos en Guatemala entre 1978-1996, con un error estándar de 6,568.
  5. Correcciones posibles y limitaciones en la interpretación de la Tabla 7

  6. Hay cinco fuentes de error que no se puede cuantificar en este análisis, por falta de tiempo, recursos o de datos adecuados. En algunas investigaciones preliminares, el efecto global de estas correcciones es conservador, o mejor dicho, tiende a reducir la estimación de . La conclusión del apartado es que el efecto acumulado de estos sesgos no es significativo.
  7. Correlación entre fuentes

  8. La estimación de n000 depende de la presunción de independencia entre las fuentes, es decir que la probabilidad de que cada declarante dé su testimonio a un proyecto tiene correlación cero con la probabilidad que el mismo declarante dé su testimonio a otros proyectos. Es cierto que esta correlación no es cero, sino positiva, mayor que cero, por dos razones.
  9. Primero, porque investigaciones realizadas por psicólogos han mostrado que sobrevivientes de violaciones de derechos humanos que pueden dar testimonios, en condiciones que afirman su humanidad, mejoran su estado psicológico. Es probable entonces que personas que dan testimonios en estas condiciones busquen más oportunidades para darlo, incremetando así el nivel de "traslape".
  10. Segundo, es conocido que varias organizaciones sociales organizaron sus bases para presentar testimonios a los tres proyectos. Así, los miembros de estas organizaciones, que tienen mayor probabilidad de dar su testimonio más de una vez, también aumentan el nivel de "traslape". Los dos efectos -que son ciertos- tienen el efecto de sesgar la estimación de n000 para abajo.
  11. Errores en concordancia

  12. Si los analistas que hicieron la concordancia no encontraron víctimas en común, por casualidad o por datos inadecuados en las fuentes originales, estas omisiones tendrían el efecto de bajar el nivel de traslape estimado y, en consecuencia, sesgar la estimación de n000 para arriba. En investigaciones superficiales (lo único que fue posible con los datos actuales) se encuentran efectos mínimos de este tipo, por lo que se tendría una escala de no más que 12% de la estimación final de n000, implicando 8% a . Considerando las demás fuentes de sesgo listadas en este apartado, y reconociendo que los datos para el análisis de este error fueron muy reducidos, se decidió no incluir la cuantificación de este error en el análisis final.
  13. Duplicación interna

  14. Todos los proyectos que reciben información de fuentes primarias tienen el problema de duplicación, que es el resultado de reportes múltiples del mismo hecho.17 La duplicación interna tiene la tendencia a aumentar artificialmente la estadística de cuántos asesinados estan representados en una base de datos. Los tres proyectos tomaron muchas medidas para depurar las duplicaciones internas, pero todavía quedaron algunas. En un análisis preliminar, no aparecen suficientes víctimas duplicadas para requerir una cuantificación.
  15. Tasas de traslape entre clases de víctimas

  16. La medida de "traslape" entre las tres bases de datos fue tomada sobre víctimas identificadas por un nombre y un apellido. Sin embargo, muchas víctimas no son identificadas con nombre, como consecuencia de violencia masiva que sobrecargó la capacidad de los testigos para recordar a todas las víctimas. Es posible que los niveles de "traslape" entre víctimas no identificadas por nombre, sea mayor o menor que los niveles de "traslape" medidos entre las víctimas identificadas. Dada la dificultad para detectar "traslape" entre víctimas no identificadas, no es posible cuantificar la diferencia entre niveles de "traslape".
  17. Áreas geograficas excluidas por todos los proyectos

  18. En la Tabla 7 fue anotado que en la Región IV, no hubo datos adecuados para hacer una estimación de n000. Dada la experiencia de otras Regiones en que la razón entre Nk y n000 varía entre 0.5 y 2, con un modo y promedio cercana a 0.5, es probable que el valor de n000 para la Región IV sea aproximadamente de 2500. Dado que en otras Regiones Nk ésta compuesto por lo menos por dos proyectos, y lo recogido en la Región IV corresponde a la CEH solamente, es posible que la razón entre Nk y n000 para la Región IV sea 0.25 o menos, aumentando la estimación por un factor de dos o más. La falta de certeza sobre este número no es verificable por otros métodos, y por eso, no se incluye en la estimación final.
  19. La Región IV es un ejemplo de un problema mucho más fundamental: que esta metodología solamente sirve para las áreas cubiertas por lo menos por dos de los tres proyectos, aunque sólo sea parcialmente. En áreas trabajadas por uno o ninguno de los tres proyectos, no hay una base para hacer una proyección al total de víctimas excluidas (n000); en cambio, en estas situaciones solamente Nk entra a la estimación. Dado el enfoque común de los tres proyectos en áreas de Guatemala, en que las violaciones en gran escala fueron conocidas por fuentes periodísticas o por organizaciones que trabajaban en dichas áreas, no es muy probable que las áreas excluidas dejaran muchas violaciones afuera del análisis. Sin embargo, cada área que fue excluida de las tres proyectos -pero en las que se cometieron asesinatos- aumentaría la estimación.
  20.  

    METODOLOGÍA INTERMUESTRA IV: ESTIMACIÓN DE TASAS DE ASESINATOS, POR GRUPO ÉTNICO Y REGIÓN

  21. La tasa de asesinatos es la proporción de personas de un grupo definido que son asesinadas, es decir, es igual al número de asesinados dividido por el número en total del grupo. La CEH está interesada en las cifras relativas (proporciones) de personas asesinadas, comparadas entre grupos étnicos, durante el período 1981-1983.
  22. Seis Regiones fueron identificadas como aquellas en que, según las fuentes secundarias y evidencia anecdotal, la violencia del Estado fue especialmente concentrada contra gente indígena. Las Regiones de interés están en el listado de la Tabla 8, con la población según el censo de 1981, por grupo étnico.
  23.  

    Tabla 8: Población en seis Regiones por grupo étnico, 1981

    Indígena

    No- indígena

    Región I: área Ixil

    38,902

    5,882

    Región II: Cahabón

    20,706

    868

    Región III: Rabinal

    18,610

    4,120

    Región IV: San Martín Jilotepeque

    31,690

    4,876

    Región V: norte de Huehuetenango

    53,556

    11,123