Autoría compartida

Problema

Tenemos un texto en el que sabemos que ha sido escrito en colaboración entre varios autores y nos planteamos un doble objetivo:

Determinar el porcentaje de participación de cada autor.
Distinguir en qué partes del libro predomina la intervención de uno sobre otro.

La escritura compartida es mucho más frecuente de lo que aparentemente podría parecer. Se me ocurre ahora, por ejemplo, el caso de los hermanos Machado en La Lola se va a los puertos; el de los Martínez Sierra en múltiples títulos; el de la extensa colaboración entre Borges y Bioy Casares; y, en el mismo tipo entraría, por ejemplo, el fenómeno del escritor anónimo que trabaja a sueldo del escritor oficial.

Proceso

El proceso de análisis que vamos a seguir toma como modelo el trabajo de Jockers para la Libro del Mormón.

En primer lugar, debemos recolectar el máximo número de textos de los autores que participan en escritura del texto objeto de nuestro análisis. Estos textos conformarán la parte indubitada de nuestro corpus, para que nos sirvan de punto de partida y referencia en la determineción del idiolecto de cada uno de ellos.
Seleccionamos, junto a los textos de los autores implicados en la colaboración, otros textos de autores próximos a ellos, que nos sirvan de control.
Respecto al texto dubitado, puesto que se trata de un texto de autoría múltiple, no podemos investigarlo como si se tratara de un solo texto unificado escrito por un único autor, sino que debemos dividirlo en muestras significativas empleando stylo (ello garantiza que el investigador no impone subjetivamente ningún sesgo).
Aplicamos la misma división en fragmentos de los textos indubitados, tanto los de control como los realmente implicados en la autoría.

A partir de aquí vamos a seguir dos métodos diferentes:

Cuando los autores implicados son más de uno:

dividimos aleatoriamente las muestras de autoría conocida en dos conjuntos: un ‘conjunto de entrenamiento’, que contiene textos indubitados de los autores candidatos (conviene poner dos textos alejados de candidatos imposibles para ver número de errores), y un ‘conjunto de prueba’, que contiene fragmentos o muestras del texto que se supone escrito en colaboración.
Realizamos la función classify (ya sea con delta o con NSC).
Calculamos la fracción de error a partir del número de muestras de conjuntos de prueba mal clasificadas viendo cuántos fragmentos del texto dubitado se han adscrito a los fragmentos de muestra.
Distribuimos en una tabla los capítulos que se asignan a cada autor en primer y segundo lugar a partir de las varias propuestas de elección calculamos el número de fragmentos de textos que se atribuyen a cada autor.
Calculamos la fracción de error del número de muestras de conjuntos de prueba mal clasificadas. (ver abajo Tabla 1)
Sumamos las posibilidades porcentuales de cada autor y las trasladamos en una tabla a Excel para obtener los correspondientes gráficos

Cuando los autores son sólo dos:

Dividimos también nuestro corpus en tres conjuntos: un primary_set con los textos indubitados de uno de los autores; un secondary_set, con los textos indubitados del otro autor; y un test_set, con las muestras del texto dubitado.
Ponemos en marcha la función “oppose” en stylo, que nos devolverá una gráfica con la colocación de las muestra indubitadas en dos de los cuadrantes de la gráfica, y los textos dubitados más o menos en área de influencia de uno u otro autor (ver Tabla 2).

Nombre de la cookie	Dominio	Descripción/Finalidad	Tipo	Caducidad
wordpress_test_cookie	www.estilometria.com	se utiliza para que el gestor de contenidos WordPress compruebe si el navegador tiene las cookies activadas	Técnica	Únicamente la sesión
wp-settings-time-4 wp-settings-4	www.estilometria.com	Utilizadas por WordPress para personalizar la Interfaz de Usuario	Técnica y de Sesión	1 año
moove_gdpr_popup	www.estilometria.com	Utilizada por el plugin gestor de gookies GDPR Cookie Compliance	Técnica	1 año

Atribución de autoría

Autoría compartida

Problema

Proceso