Detección de la mentira

Problema

¿Cómo decidir si un texto miente o no? Ante todo debemos saber que:

No existe un indicio verbal único asociado con la mentira, similar a a la nariz de Pinocho. Sin embargo, algunos indicios verbales pueden considerarse sutiles indicadores a la hora de diagnosticar la mentira (Vrij: 2010, 1039).

Muchos trabajos sobre la detección de la mentira mediante el análisis corporal, pero pocos y menos autorizados para la detección de la mentira en un texto escrito. No obstante, en los últimos años,  se han utilizado análisis textuales recientes para predecir una serie de medidas indiciarias de mentira o de verdad en varios ámbitos, incluyendo declaraciones judiciales (Berry, Pennebaker, Mueller y Hiller, 1997), análisis sicológicos de personalidad (Pennebaker & King, 1999), cambio de personalidad (Pennebaker & Lay, en prensa), perfiles psicológicos (Rude, Gortner y Pennebaker, 2001) y test de salud (Pennebaker, Mayne y Francis, 1997).

Bibliog.: Ángela Almela et al. “Detectando la mentira en lenguaje escrito”, Procesamiento de lenguaje natural, 48 (2012), 65-72

Premisas

Este problema, sobre todo, ha preocupado a los sicólogos y, desde la sicología, a los lingüistas que se ocupan de analizar los textos relacionados con el mundo forense. A partir de múltiples estudios académicos de campo, se ha llegado a establecer una serie de premisas:

  • Los mentirosos tienden a disociarse de los hecho, por eso pocas referencias así mismo (pronombres personales de primera persona);
  • Los testimonios con falsedades usan más palabras de media;
  • El vocabulario relacionado con el entendimiento (pensar, saber, etc.) está siempre más relacionado con la verdad;
  • Es indicio de falsedad la frecuencia anómala de pronombre de tercera o de segunda persona alejando información del yo;
  • Las palabras que indican certeza sin dudas (nunca, siempre, jamás, etc.) dominan en los testimonios falsos;
  • Lo mismo ocurre con la frecuencia anómala de  conectores como peroahora bienexceptosin embargo,  lo que sicólogos y lingüistas  asocian al deseo de proyectar ambigüedad sobre los temas objeto de información;
  • Los testimonios falaces tienden al uso de palabras que remiten a procesos de emoción negativa (sentido de culpa anexo a la mentira y deseo de despertar compasión) y  abundancia de términos espaciales y de movimiento (alejar al oyente de sí mismos);
  • Las personas mienten con mayor frecuencia acerca de sus sentimientos, sus preferencias, y sus actitudes y opiniones. Mienten menos sobre  sus acciones, planes y paradero. Mentiras sobre los logros y los fracasos también son un lugar común. [. . . ];
  • El discurso de mentirosos será menos complejo que el discurso de los que dicen la verdad:

1. Newman et al. (2003: 667): Menos palabras exclusivas. (“Personas que usan una mayor cantidad de palabras” exclusivas ” [. . . ] son generalmente más saludables que aquellos que no lo hacen “);
2. Newman et al. (2003: 667): “Cuando las personas intentan construir una falsa historia, argumentan con  las acciones simples y concretas y más fáciles de encadenar juntos que las evaluaciones falsas”;

  • Son indicios de mentira el uso de términos vagos y clichés como usted sabebien,  realmente quiero decir.

Corpus: Además de los textos objeto de nuestro análisis deberemos contar con un corpus de referencia con el que confrontar las cifras resultantes de nuestras operaciones.

Proceso

Primer paso: análisis de los textos
Existen dos vías:

  1. Lectura de los textos objeto de análisis desde la tabla Reality Monitoring, o las estrategias de análisis de la fiabilidad (CBCA(Análisis de Contenido basado en Criterios)  y validez de la declaración (S.V.A (Análisis de Validez de la Declaración). El Análisis de Contenido Basado en Criterios (CBCA) es el componente principal del SVA. Analiza el contenido de testimonio, credibilidad y validez, conforme a 5 cinco categorías principales y 19 criterios individuales (STELLER y KOEHNKEN, 1989): Criterio 1. Estructura lógica: consistencia lógica y/o hcoherencia contextual); Criterio 2. Elaboración inestructurada + Contenidos específicos; Criterio 3. Cantidad de detalles; Criterio 4. Engranaje contextual;  Criterio 5. Descripción de interacciones; Criterio 6. Reproducción de la conversación; Criterio 7. Complicaciones inesperadas durante el incidente y Peculiaridades del contenido; Criterio 8. Detalles inusuales; Criterio 9. Detalles superfluos;  Criterio 10. Incomprensión de detalles relatados con precisión; Criterio 11. Asociaciones externas relacionadas; Criterio 12. Relatos del estado mental subjetivo; Criterio 13. Atribución del estado mental del autor del delito y Contenidos referentes a la motivación; Criterio 14. Correcciones espontáneas; Criterio 15. De memoria; Criterio 16. Plantear dudas sobre el propio testimonio; Criterio 17. Auto – desaprobación; Criterio 18. Perdón al autor del delito; Criterio 19. Detalles característicos de la ofensa.
  2. Todos estos criterios se han construido a partir de innumerables pruebas y por lo tanto debemos otorgarles una alta fiabilidad, pero el problema reside en el hecho de que la evaluación al final depende del evaluador, por eso existe la necesidad de objetivación que los análisis cuantitativos de texto nos pueden proporcionar para cada uno de los anteriores criterios:  Someter el texto a análisis, con atención muy especial a aquellas categorías que la literatura académica autorizada ha reconocido como indiciarios de falsedad o de veracidad: pronombres de primera/segunda o tercera persona; léxico de emociones negativas; uso de palabras exclusivas; extensión de las frase; verbos de movimiento o términos de referencia espacial, calificadores de tipo absoluto (realmenteabsolutamente, etc.). En este paso podemos servirnos de varios analizadores lingüísticos (TaPORLinguakit, etc.), pero recomiendo LIWC, porque nos ofrece resultados conjuntos para todas las categorías verbales que nos interesa controlar..

Segundo paso:  tabulación de los resultados  y confrontación con otros corpus de referencia

  1. Tabla en Excel de frecuencias observadas para las categorías utilizadas en el análisis a partir de lo que sabemos sobre indicios de falsedad en textos escritos.
  2. Cálculo de la desviación de estas frecuencia respecto a las medias de frecuencias esperadas  en nuestro corpus de referencia.

EJEMPLO: