Determinación de autoría

Consideraciones terminológicas previas

Antes de proceder a exponer el problema, se hace preciso distinguir entre determinación de autoría, verificación de autoría y atribución de autoría.
Por verificación de autoría entiendo la argumentación orientada a confirmar la autoría de un texto dado. La verificación nos exige confrontar el texto dubitado con otros textos indubitados del mismo autor. El proceso de verificación de autoría se hace necesario cuando existen dudas sobre la autoría oficialmente aceptada para un texto. La verificación de autoría es muy frecuente en el mundo real, por ejemplo en casos de falsificaciones. En literatura española, se me ocurre, por ejemplo, el caso de la cervantina Epístola a Mateo Vázquez, cuya autenticidad siempre fue puesta en duda. Otro ejemplo, al acto primero de La Celestina sobre el que siempre existieron dudas de que fuera Rojas su autor.

Por atribución de autoría entiendo la argumentación orientada a elevar una propuesta de autor para un texto dubitado que ha llegado a nosotros anónimo o bajo pseudónimo. Es el caso, por ejemplo, de lo que ocurre con el Quijote de un supuesto Alonso Fernández de Avellaneda, que nunca existió.

Por determinación de autoría entiendo la argumentación orientada a seleccionar uno entre dos o más candidatos a la autoría de un texto. Para la determinación de autoría habremos de confrontar el texto dubitado con otros textos indubitados de los distintos candidatos a la autoría. El proceso de determinación de autoría se justifica cuando existe un debate entre dos o más candidatos a la autoría de un texto, y no existen dudas de que uno u otros de los candidatos contemplados hubo de ser necesariamente su autor.  Un ejemplo de determinación de autoría lo ofrecen diferentes trabajos (entre ellos el mío) para decidir sobre la Historia verdadera de Nuevo México, que firma Bernal Díaz del Castillo, pero que recientemente ha sido atribuida a Hernán Cortés.

Por determinación de autoría entiendo la argumentación orientada a seleccionar uno entre dos o más candidatos a la autoría de un texto. Para la determinación de autoría habremos de confrontar el texto dubitado con otros textos indubitados de los distintos candidatos a la autoría. El proceso de determinación de autoría se justifica cuando existe un debate entre dos o más candidatos a la autoría de un texto, y no existen dudas de que uno u otros de los candidatos contemplados hubo de ser necesariamente su autor.  Un ejemplo de determinación de autoría lo ofrecen diferentes trabajos (entre ellos el mío) para decidir sobre la Historia verdadera de Nuevo México, que firma Bernal Díaz del Castillo, pero que recientemente ha sido atribuida a Hernán Cortés.

Problema

Las dudas que un antropólogo francés proyectó recientemente sobre la autoría real de la Historia verdadera de nuevo México,  convierte esta obra en texto dubitado abriendo una interesante interrogación sobre la autoría del mismo: habremos de determinar si su autor fue realmente Bernal Díaz del Castillo, como aparece en la primera edición de la obra, o si la misma fue obra de Hernán Cortés como recientemente se ha propuesto.

Proceso

ADVERTENCIA:  ¡limito el siguiente proceso a un análisis orientado a  juzgar exclusivamente hechos del lenguaje, dejando a un lado otras consideraciones, de contenido o de historia literaria!
El proceso de análisis que vamos a seguir toma como modelo mi propio trabajo sobre Bernal Díaz del Castillo:

A) ANALISIS CUANTITATIVO CON ‘stylo’

  1. Establecimiento del corpus de análisis, que nos obliga a la recensio de todos aquellos textos que indubitadamente conozcamos que fueron escritos por uno u otro de los candidatos a la autoría.
  2. Preparación de un corpus de referencia ajeno a los autores en debate. Podemos crear nuestro propio corpus de referencia o trabajar con herramientas como el CORDE o como el CORPUSDELESPAÑOL.
  3. Canonicalización de los textos dubitados e indubitados y fragmentación de los mismos (para facilitar la validación cruzada)  en muestras de un tamaño aproximadamente idéntico.
  4. Análisis del CORPUS (texto dubitado + textos indubitados, incluidos aquí la totalidad de los textos que elegimos para formar nuestro corpus de referencia)   con stylo a fin de comprobar las asociaciones de los diferentes fragmentos o muestras de los textos dubitados. Entre las pruebas que stylo nos permite hacer con este corpus recomiendo no olvidar la función stylo.network por su convincente  plasticidad, o  la función imposters(), también con ‘stylo’. (véase en repositorio CLASIFICACIÓN_DETERMINACIÓN_AUTORIA_IMPOSTERS)

B) ANALISIS CUALITATIVO a partir de índices de frecuencia

  1. Establecimiento del perfil verbal del texto dubitado para  l iIdentificación de voces, construcciones, formulismos, frases hechas… distintivos en el texto dubitado para comprobar si los mismos se producen, o no, en cada uno de los candidatos.  Localización de los principales casos de verbatim en el texto dubitado (yo  en ocasiones me he servido para ello de AntConc, pero también Textalyser puede servirnos para localizar los casos más reseñables de verbatim).
  2. Ver, a partir del CORDE  o el CORPUSDEL ESPAÑOL, en qué autores  de la misma época se pueden observar el uso de idénticos verbatim.

CONCLUSIONES

  1. Establecer las oportunas conclusiones. Interpretación de los dendrogramas resultantes.

Herramientas

  1. Nos serviremos de stylo para  ver si el análisis de las MFW empareja el texto dubitado con uno u otro candidato a la autoría.. Este primer pso nos servirá de referencia y posiblemente nos dará pistas sobre  aquellos fragmento o muestras indubitadas a las que se aproxima más el texto dubitado.
  2. Para completar el perfil verbal recurriremos a LIWC.
  3. Para identificar los casos de verbatim, frases hechas, modismos, conectores recurriremos por ejmaplo a AntConc y Textalyser.
  4. Para el carácter exclusivo de los casos de verbatim detectados nos serviremos del CORDE  o del CORPUSDELESPAÑOL.