El siguiente paso: los índices

Con esta entrada termina mi presentación del proyecto Andrés de Poza para el Día de las Humanidades Digitales, porque enlaza con lo que estamos trabajando en estos momentos, y también con lo que presentaremos José Ramón Carriazo y yo mismo en el Congreso de la Asociación Humanidades Digitales Hispánicas en A Coruña.

Y en lo que estamos trabajando ahora mismo es en la creación de índices de diverso tipo que faciliten al usuario el acceso al texto y a la información que contiene.

Es esta una posibilidad que venimos desarrollando desde prácticamente el inicio del proyecto Andrés de Poza. Así, hemos implementado ya, en los textos publicados en Andrés de Poza, los siguientes tipos de índices:

1.- Glosarios multilingües con y sin contexto

Este, por ejemplo, pertenece al Romulo de Malvezzi, en sus versiones italiana y portuguesa:

glosario con contexto

2.- Índices de antropónimos y topónimos

Este índice de antropónimos pertenece a la edición de la Philotea de Francisco de Sales.

Antropónimos Philotea

Por su parte, este índice de topónimos está extraído de La libra de Malvezzi; nótese que se han introducido diversas variantes gráficas de los topónimos (“Alsacia” y “Alsace”, por ejemplo) para facilitar su búsqueda.

Toponimos Libra

En ambos casos (en el índice de antropónimos y de topónimos), pinchando en el término deseado se llega a una lista con todas las apariciones del término, con contexto.

3.- Índice de contenidos

En el caso de las Cartas Puebla de Vizcaya, que son el objeto del proyecto Foru Ondarea, se ofrece al usuario un índice por contenidos, un tipo de índice favorecido por la estructura jurídica común a estos documentos.

indice conceptos cartas puebla

¿Y ahora?

Ahora, lo que queremos es crear índices conceptuales jerárquicos y multilingües, que respondan a la estructura del campo semántico y que permitan el acceso a los textos a partir de los conceptos. Estamos, en este momento, trabajando en una prueba piloto referente al léxico político y empleando etiquetado TEI, que presentaremos en La Coruña en el Congreso de la asociación Humanidades Digitales Hispánicas. Por ahora, es todo lo que podemos revelar…

¿Y todo esto para qué? Un ejemplo de reutilización

La edición de textos inéditos, o que carecen de ediciones modernas fiables y filológicamente cuidadas (como sucede con muchos de los incluidos en el Portal Andrés de Poza) es un valor en sí mismo; sin embargo, creemos que el hacer ediciones alineadas de textos múltiples añade otros valores a las propias ediciones.

Así, las ediciones del Portal Andrés de Poza pueden ofrecer informaciones útiles para campos como los estudios de traducción, la historia de las ideas y de los conceptos, la historia literaria o la historia cultural.

Un ejemplo de este tipo de reutilizaciones puede ser la edición de la Historia de la literatura española de Simonde de Sismondi, en edición bilingüe: la edición francesa de 1837, y la traducción española realizada por José Lorenzo Figueroa y José Amador de los Ríos en 1841-2. Esta obra, fundamental en la historiografía literaria española, no ha vuelto a ser editada desde su publicación original en la primera mitad del siglo XIX, por lo que el primer objetivo de esta edición digital es ponerla a disposición de los lectores potenciales. Pero además, contrastar el original con su traducción española permite estudiar otros aspectos igualmente interesantes.

Por ejemplo, podemos ver los casos (poco numerosos, es cierto) de párrafos del original que han sido omitidos en la traducción. Es el caso de estos párrafos del capítulo inicial, en que Sismondi alaba la libertad política y religiosa de los españoles (una idea poco acorde con la visión romántica de España como país católico por antonomasia):

sismondi omisión

O también permite visualizar claramente los párrafos añadidos por los traductores, estos sí muy numerosos, fundamentalmente en forma de notas al final de las lecciones originales:sismondi adición

O permite, también, observar las modificaciones, no siempre menores, que los traductores se permiten en aquellos párrafos que se mantienen más o menos intactos del original. En el ejemplo siguiente, es evidente el interés del traductor en acentuar la peculiaridad del carácter nacional y de la literatura española, así como vincular su historia con una teleología providencialista extraña al original francés:

sismondi modificaciones

Estas omisiones, adiciones y modificaciones son singularmente interesantes, porque permiten establecer la distancia (cronológica, pero también estética e ideológica) existente entre el texto original del crítico ginebrino, publicado en 1813, de influencia romántica aunque todavía atravesado por resabios neoclasicistas y una cierta hispanofobia; y la traducción de 1841-2, más decididamente influida por los postulados románticos de los hermanos Schlegel, y claramente nacionalista en su defensa a ultranza de España y sus escritores frente a los ataques extranjeros.

El acceso a los textos

Después de los tres pasos anteriores (edición, etiquetado, alineamiento), los textos están ya preparados para su visualización alineada. A través del catálogo de la página web andresdepoza.com, el usuario puede acceder a los textos de varias maneras:

1.- Acceder a la cabecera del texto

La cabecera, en los archivos formatados de acuerdo con el estándar TEI, contiene la información referente al documento original (localización, descripción, fecha, autor, etc.) y respecto a la edición digital (responsables, características técnicas, criterios de edición, etc.). El usuario puede acceder a esos datos pinchando en la palabra “Cabecera” que acompaña a cada una de las versiones del texto.

menu romulo cabecera

cabecera romulo

2.- Acceder únicamente a uno de los textos

Si se pulsa en el título de una de las versiones, se accede al texto completo de esa única versión.

menu romuloromulo malvezzi solo

3.- Acceder a varios textos alineados

La tercera opción, y la más específica del portal Andrés de Poza, consiste en la visualización de varias versiones alineadas. El usuario puede escoger qué versiones quiere comparar (hasta un máximo de 5, por razones de visibilidad), y estas se mostrarán en columnas paralelas alineadas.

Menú de acceso a El Romulo, sleeccioando para cotejar cuatro textos

Menú de acceso a El Romulo, sleeccioando para cotejar cuatro textos

cuatro romulos

Como se puede ver en este última imagen (en la esquina superior derecha), el usuario tiene además la opción de ver el texto con o sin enmiendas editoriales.

 

Un intermedio: el proyecto Foru Ondarea

Una colaboradora del proyecto, Belén Llana, ha creado un blog sobre un subproyecto asociado a Andrés de Poza: el proyecto Foru Ondarea.

Foru ondarea

Podéis acceder a su blog aquí, y aquí al propio proyecto de edición de cartas puebla de Vizcaya.

Como podréis ver, se trata de un proyecto que tiene similitudes con el resto de ediciones incluidas en el Portal Andrés de Poza (de cada una de las cartas puebla se ofrece una edición crítica y una paleográfica, y además existe la posibilidad de ver las cartas puebla agrupadas por familias), pero también algunas peculiaridades. Por ejemplo, el acceso a los textos puede hacerse de diversas formas: a través del mapa de la página inicial; a través del catálogo de textos y a través del índice de contenidos.

De estos y otros índices hablaré en otra entrada más adelante.

Cómo hacemos lo que hacemos. Paso 3: El alineamiento

Después del descanso para comer, seguimos adelante con el proceso de edición de nuestros textos para llegar al resultado final: la edición multiversión alineada. Hasta ahora hemos visto los dos primeros pasos: la edición de los textos, y su etiquetado. En esta entrada vamos a hablar del siguiente proceso: el alineamiento de los textos.

Para alinear de forma semi-automática las diversas versiones de un mismo texto, empleamos el programa Déjà Vu, un software de creación de memorias de traducción, que también nos ha servido para este fin.

pantallazo dejavu

Respecto a la unidad de alineamiento, un tema siempre problemático, hemos optado por ser eclécticos, o mejor, pragmáticos, y adoptar la unidad que mejor se adaptaba a cada texto o tipo de texto.

  • Para las traducciones y las tradiciones textuales literarias hemos optado por el párrafo como unidad de alineamiento, ya que las unidades inferiores al párrafo no resultaban operativas.
  • Para los textos notariales o jurídicos, como el Fuero de Alcalá o las cartas puebla de Vizcaya, la propia estructura del texto sugería un alineamiento por cláusulas o unidades textuales.
  • En otros casos, como en el el Romulo o el Tarquinio de Malvezzi usamos un criterio mixto: aunque el párrafo es en general la unidad de alineamiento, en los apartados argumentativos se ha preferido respetar la estructura de la prosa membratim de Malvezzi también en el alineamiento.

Una vez establecido el alineamiento a través del programa Déjà Vu, los archivos resultantes son transformados en archivos .xml por la empresa Bitext, de forma que ya están listos para ser visualizados por el usuario.

Naturalmente, el alineamiento no siempre es sencillo ni libre de problemas. Una cuestión especialmente difícil de resolver, a la que se enfrentan todos los que hacen ediciones alineadas, es la de aquellos casos en que una traducción o versión está en orden diferente al original: el párrafo segundo aparece en cuarto lugar, el párrafo cuarto aparece en último lugar, etc. Nosotros hemos optado por mantener el orden de cada uno de los textos y no “reordenar” las versiones a partir del original, aunque con esto, claro, se pierden algunas de las relaciones entre el original y las versiones…

Una reflexión para la hora del almuerzo: la valoración académica de las HD

Hago aquí una pausa en la descripción de nuestro proyecto, para plantear una reflexión que preocupa a muchos, si no a todos, los que trabajamos en el campo de las Humanidades Digitales, al menos en España. Se trata de la valoración académica de los productos digitales -entre ellos las ediciones-, algo que es fundamental para los investigadores.

Nos refereimos, específicamente, a la consideración de autorías colectivas y sobre todo de nuevos tipos de edición que no encajan exactamente en los moldes tradicionales y asentados en el mundo impreso, y que por ello mismo no son baremados ni valorados del mismo modo pese a exigir el mismo rigor y el mismo trabajo (o en ocasiones, más incluso).

Esta discrepancia en la valoración puede ser muy perjudicial para los investigadores que trabajan (que trabajamos) en la edición digital, que podemos encontrarnos en desventaja en comparación con otros colegas que hayan optado por hacer ediciones de tipo más tradicional y en papel.

Es uno de los temas de interés que se debatirán en el congreso de Humanidades Digitales de A Coruña, en julio.

Cómo hacemos lo que hacemos. Paso 2: el etiquetado

En realidad, aunque para mayor claridad estén divididos en dos entradas, la edición y el etiquetado son dos procesos complementarios y muchas veces simultáneos: al mismo tiempo que se establece el texto, se añaden también una serie de etiquetas referentes, por ejemplo, a erratas, deterioros del original, cambios de lengua, etc.

Más adelante, en otras fases del tratamiento del texto de que hablaremos en las entradas siguientes, se añaden todavía nuevas capas de etiquetado: las referentes al alineamiento, y a la creación de índices léxicos, de topónimos o antropónimos, o conceptuales.

Para la introducción de estos etiquetados seguimos el estándar de la Text Encoding Initiative (TEI) en su versión P5. El estándar TEI tiene obviamente sus detractores y sus limitaciones, pero es sin duda el estándar más extendido a nivel internacional en el etiquetado de textos, lo que facilita que los documentos puedan ser reconocidos, reutilizados y compartidos.

Y este es un ejemplo de una errata simplemente marcada con la etiqueta sic:

Es maior el peligro que nos amenaza <sic>el</sic> silencio

Este es un ejemplo de etiquetado para marcar una errata corregida (donde el original dice “parte” debería decir “aparte”):

<choice> <sic>parte</sic><corr>aparte</corr> </choice>

Cómo hacemos lo que hacemos. Paso 1: la edición

En esta entrada y las siguientes voy a hablar de cómo llegaos a la visualización que se veía en el apartado anterior, a partir de ejemplares originales como este:

Tarquinio Soberbio

Portada del Tarquinio Soberbio de Malvezzi, en traducción de Antinoro Pedrosa (Milán, 1633)

En primer lugar, hay que aclarar que por razones eminentemente prácticas, en general hemos editado siempre un testimonio: no hemos acometido la tarea (titánica) de hacer ediciones críticas de todas y cada unas de las versiones editadas. Esto habría exigido, en primer lugar, una enorme cantidad de tiempo y de mano de obra; y en segundo lugar, unos conocimientos avanzados de historia de la lengua y de la edición aplicada a cada una de las lenguas y tradiciones en cuestión.

En general, y salvo en aquellos casos en que estaba justificado, hemos editado la primera edición de cada obra o traducción. Hay algunas excepciones: por ejemplo, en el caso de la Historia de la literatura española de Simonde de Sismondi, de la que me encargué yo mismo, decidí emplear la edición de Bruselas de 1837 (en vez de la original de París de 1813) porque los traductores de la versión española dicen expresamente tener delante la edición de 1837.

En otros casos, la elección de un testimonio u otro para la edición ofrece problemas de difícil solución. Es el caso de la Philotea de Francisco de Sales, que presenta variantes entre las traducciones a distintas lenguas que hacen sospechar que unos traductores usaron como fuente la edición de 1609, y otros la de 1619.

Las ediciones de los textos son, en su mayoría, muy conservadoras, tanto en ortografía como en puntuación. En cualquier caso, cada texto incluye sus propios “criterios de edición” (aquí, un ejemplo), en que se especifica exactamente qué alteraciones se han realizado con respecto al original.

Qué hacemos

Andrés de Poza es, en pocas palabras, un portal especializado en la edición de textos con versiones múltiples (o “textos multiversión”). ¿Y cuáles son estos textos? Pues fundamentalmente, trabajamos con dos categorías:

En el proyecto Andrés de Poza ofrecemos una edición digital múltiple alineada dinámicamente; es decir, que las diversas versiones de un texto se alinean en función de las opciones escogidas por el usuario.

Así, por ejemplo, un usuario interesado en acceder al texto de Il Romulo encontrará un menú como el siguiente:

menu romuloEl lector puede entonces seleccionar las versiones que quiere cotejar, hasta un máximo de cinco. Los textos, entonces, se presentan en columnas y alineados:

alineamiento romulo

En las próximas entradas intentaré explicar cómo llegamos a esta visualización, paso a paso.

Quiénes somos, dónde estamos

Mi nombre es Santiago (o mejor, Santi) Pérez Isasi, y soy investigador post-doctoral en el Centro de Estudos Comparatistas de la Universidade de Lisboa. O sea, trabajo aquí:

Campus universitario - Facultad de Letras web      Campus universitario - Facultad de letras - edificio nuevo web

Sin embargo, el proyecto Andrés de Poza nació y tiene su sede en la Universidad de Deusto de Bilbao, bajo la dirección de Carmen Isasi, del grupo de Investigación Seminario Alfonso Irigoien.

universidad de deusto

(La Universidad de Deusto, para quien no tenga el placer de conocer BIlbao, queda enfrente del Museo Guggenheim)

Guggenheim

En todo caso, más que en un espacio físico, Andrés de Poza se sitúa en un espacio virtual: la página http://andresdepoza.com

andresdepoza