Catalonian flagCatalàUnited States flagEnglishSpanish flagEspañolGalician flagGalegoPortuguese flagPortuguês

Philobiblon page header


Historia

Las Bibliografías

PhiloBiblon está basado en y deriva de BOOST (Bibliography of Old Spanish Texts), rebautizado como BETA (Bibliografía Española de Textos Antiguos) en 1992 para la edición del proyecto ADMYTE (Archivo Digital de Manuscritos y Textos Españoles) en CD-ROM. Para BETA y el Dictionary of the Old Spanish Language de la Universidad de Wisconsin (Madison), proyecto este último del que BETA deriva, véase por favor la página principal de BETA. La primera edición impresa de BOOST se publicó en 1975, la segunda en 1977 y la tercera en 1984. La primera edición de la Bibliography of Old Catalan Texts (BOOCT), exactamente en el mismo formato que BOOST3, vio la luz en 1985. En 1988 comenzó a rodar lo que originalmente iba a llamarse la Bibliography of Old Portuguese Texts (BOOPT). Ambos proyectos, BOOCT y BOOPT, cambiaron de nombre (a BITECA y BITAGAP) en 1992 para el CD-ROM de ADMYTE. Finalmente, en 1997 el proyecto BIPA extendió la proyección global del proyecto hasta los textos de los siglos XVI y XVII.

La colaboración con colegas en España, sobre todo con Francisco Marcos Marín (entonces en la Universidad Autónoma de Madrid, actualmente en la Universidad de Texas, San Antonio), permitió a BETA, BITAGAP y BITECA, así como al sistema gestor de la base de datos, formar parte del citado ADMYTE (Archivo Digital de Manuscritos y Textos Españoles), uno de los proyectos financiado por la Sociedad Estatal del Quinto Centenario para conmemorar el aniversario del primer viaje de Colón. Las tres bibliografías fueron publicadas en CD-ROM como parte del disco 0 de ADMYTE, editado por Micronet, S.A. (Madrid). Una edición revisada y ampliada de PhiloBiblon, que incluyó las mismas bibliografías, fue publicado en CD-ROM por la Bancroft Library en el año 1999.

En 1997, gracias a la financiación del NEH (National Endowment for Humanities de EE.UU.) suplementada por las ayudas concedidas por los Programas de Estudios Catalanes Gaspar de Portolà y de Estudios Portugueses (Universidad de California, Berkeley) y por los Centros de Estudios Portugueses y Gallegos de la Universidad de California, Santa Bárbara, se pudo realizar la página web de PhiloBiblon, lo que hizo posible el acceso en la red a las descripciones detalladas de manuscritos y tempranos impresos y de los textos que contienen. Las actualizaciones de la páginas web se hicieron aproximadamente de forma trimestral, según los distintos equipos de investigación fueron añadiendo cada vez más datos a sus respectivas bibliografías.

En el año 2001 se completó la migración de la base de datos BETA desde el sistema operativo MS-DOS hasta la versión de Windows (véase más adelante). Desde entonces, no fue posible actualizar la versión en la red de BETA, puesto que el software para cargar los datos a Internet estaba construido sobre la versión en MS-DOS. Sí fue posible actualizar con regularidad BITAGAP y BITECA, puesto que la migración de ambas al sistema operativo Windows no tuvo lugar hasta el otoño de 2008. Así, sólo a través de esta nueva página web todas las bibliografías han podido reunirse por fin con el mismo nivel de desarrollo.

Historica técnica

La primera edición de BOOST (1975) contenía 966 registros, realizados a través de un sistema gestor de base de datos de fichero plano llamado FAMULUS. Este sistema estuvo alojado en un ordenador modelo Univac 1110, en el Centro de Computación Académica de la Universidad de Wisconsin en Madison. FAMULUS fue originariamente escrito en Berkeley en 1967 para la Estación Experimental de Bosques y Montes del Pacífico Sudoeste (Departamento de Agricultura de los Estados Unidos). El programa, diseñado para el control de bibliografías personales, utiliza ficheros con el código ASCII creado por cualquier editor de textos electrónico, para que luego cada ficha bibliográfica sea indexada en hilera. Las limitaciones que tal sistema opera en la organización de materiales más complejos son realmente severas: sólo están permitidos un máximo de diez campos, de extensión variable, con un máximo de 4000 caracteres por ficha. Para compensar estas limitaciones, algunos datos relacionados pero realmente disimilares fueron agrupados en un único campo en la primera versión de BOOST. Así, en el campo AUTH (autor) no sólo estaba incluido el nombre del autor, sino también los de editores, traductores y demás.

FAMULUS proporciona la visualización de cualquiera de los campos en cualquier orden y permite crear índices de cualquier campo, aunque los términos de indexación están limitados a un máximo de cuarenta caracteres. El orden de los campos dentro de una ficha y de las fichas dentro de la base de datos puede ser cambiado a voluntad del usuario, con lo cual la base de datos completa podía cambiar su visualización y ser de nuevo indexada en base a este nuevo orden. La versión impresa de BOOST del año 1975 consistió en la presentación de todas las fichas ordenadas jerárquicamente por orden de la obra (autor / título / fecha / ubicación actual) y seguidas de los índices de cada uno de los campos, más los índices por palabra de los campos relativos a autores y títulos. La versión fue impresa mediante fotocomposición mecánica de imágenes (photo-offset) en formato de impresora de ordenador, todo en mayúscula.

La segunda edición (1977) mantuvo el mismo número de campos y las mismas limitaciones en la indexación, pero la presentación era algo más elegante: a doble columna, con una atractiva fuente del tipo serif, pero todavía con toda la impresión en letra mayúscula.

Cuando el control editorial de BOOST pasó en el año 1981 a un nuevo equipo de investigación, el Seminario del Medievo Español de Madison continuó siendo el proveedor del soporte técnico del proyecto. Se volvió a rescribir FAMULUS para adaptarlo a las necesidades del proyecto, sin las limitaciones que éste presentaba en cuanto a número de campos, su extensión o el número de caracteres en los términos de indexación. Por ello, la tercera edición de BOOST (1984) contenía catorce campos por cada ficha y permitió imprimir términos de indexación de hasta 159 caracteres.

La introducción de un cambio técnico en la tercera edición de BOOST, como fue la ordenación topográfica de la base de datos (ciudad / biblioteca/ signatura / orden de foliación) requirió la presencia de dos nuevos campos:

(1) CSEQ, es decir, la secuencia topográfico del manuscrito o impreso dentro de cada biblioteca, ya que las signaturas de muchos de ellos no son estrictamente alfanúmericas en ciertas bibliotecas, verbigracia, la del monasterio de El Escorial.
(2) FSEQ, orden secuencial de un texto concreto dentro del manuscrito que lo contiene, de acuerdo con la foliación.

Otros cambios en la estructura de las fichas reflejaron las necesidades de información percibidas por el nuevo comité editorial del proyecto.

Por ejemplo, las fórmulas para fechar los registros en los antiguos campos OPDT (Original PRoduction DaTe=Fecha original de producción) y SPDT (Specific Production DaTe= Fecha específica de producción) como "mediados del siglo XV", o "finales del siglo XV", no sólo eran muy ambiguas, sino que además estaban ordenadas más bien alfanuméricamente que de forma cronológica. Para evitar este problema, todos las fechas se cambiaron a valores numéricos absolutos: por ejemplo, "1440-1460" sustituyó a la antigua designación de "mediados del siglo XV".

Con el cambio en el orden jerárquico, es decir, con el paso del orden autor / título a un orden topográfico (ciudad / biblioteca / signatura), surgió la dificultad de controlar la relación entre las fichas de BOOST2 y BOOST3. Para ello, el número de control (Control NUMber, CNUM) de cada ficha, que había permanecido constante entre las dos ediciones, comenzó a ser usado como el elemento de enlace del programa.

Otros dos cambios estuvieron relacionados con la restructuración de varios campos en uno. Así, toda la información bibliográfica de los campos BIBS y NOTE de BOOST2 (que habían sido usados para diferenciar, respectivamente, fuentes bibliográficas citadas directamente de aquellas otras citadas de forma indirecta), fue agrupada en una ficha única, BIBL, con el objetivo básico de crear un único y unificado índice bibliográfico. Desafortunadamente, esto hizo realmente difícil controlar a partir de entonces el uso de la bibliografía secundaria. El uso posterior del programa demostró que esta fusión había sido un error, como también lo fue la unión de los campos GTIT (General or normalized TITle=Título General o Normalizado) y STIT (Specific or variant TITle=Título Variante o Específico), error debido, como en el caso anterior, al deseo de crear un único índice para estos campos.

Sin embargo, en otros ámbitos del programa se crearon campos nuevos para reflejar las diferencias intrínsecas de los datos que contienen. Por ejemplo, los traductores fueron puestos en el campo TRAN (Translator=traductor), apartándolos del campo AUTH, reservado para los autores. De igual forma, los impresores fueron trasladados desde el campo SPRL (Specific PRoduction Location=Lugar específico de producción) hasta uno nuevo: PRSC (PRinter SCribe=Impresor Escribano). Ambos cambios se revelaron como muy acertados, tanto táctica como estratégicamente.

Con esta última estructura fueron editados los repertorios de BOOST3 (1984) y BOOCT (1985).

En términos de los procedimientos utilizados, los datos seguían siendo tecleados en Madison en base a la información proporcionada por el nuevo equipo editorial. La base de datos se ordenaba de nuevo, se imprimía y esta nueva versión se mandaba a los editores para su corrección. El proceso era enojosa, más aún por el fichero plano de FAMULUS, que exigía que cada ficha contuviera todos los datos. Así, por ejemplo, si un manuscrito contenía veinte textos, la descripción externa completa del manuscrito debió repetirse en las veinte fichas distintas. Si nuevas investigaciones revelaran que la fecha del manuscrita estaba equivocada, habría que cambiar esa fecha en todas las veinte fichas.

Las limitaciones de tal sistema fueron puestas en relieve cada vez más por la existencia de otros sistemas más sofisticados. El siguiente cambio tecnológico sucedió en 1985, con la migración de BOOST y BOOCT desde el viejo sistema de Madison a un nuevo sistema en la Universidad de California en Berkeley: SPIRES (Stanford Public Information Retrieval System = Sistema Stanford de Recuperación de Información Pública): se trataba de un programa interactivo, orientado a los datos textuales, que permitía la repetición de campos sin necesidad de limitarlos a un número de caracteres fijo. Operaciones como la ordenación de datos, las búsquedas y la generación de informes se hacían de manera bastante simple. No obstante, la entrada de datos y la corrección de éstos una vez introducidos se realizaban de forma mucho más compleja que en el sistema antiguo.

Finalmente en 1987, y gracias a la financiación de IBM, ambas bibliografías fueron transportadas al sistema Revelation (más tarde bautizado como Advanced Revelation, de Revelation Technologies), una base de datos relacional que operaba bajo MS-DOS y que, como novedad más importante, presentaba la posibilidad de que campos de extensión variable y repetida pudieran ser enlazados dentro de estructuras también repetidas, además de no contar con limitaciones en cuanto al número de fichas y de campos. Tan sólo existía un límite en el tamaño de la ficha, que no podía exceder de 64K, limitación que también operaba en lo relativo a la longitud de cada campo individual.

Una consideración primordial en la selección de un sistema relaciónal fue el anhelo de poseer una base de datos mucho más sencilla de mantener y de actualizar, al permitir que un cambio realizado en uno de las fichas se efectuase también de forma automática en todas aquellas fichas enlazadas a la que había sido modificada. Gracias a ello, quedó desterrada de una vez por todas la vieja operación consistente en tener que hacer el mismo cambio en múltiples fichas.

Así pues, desde 1987 todos los datos de las cuatro bibliografías han sido distribuidos y manejados por diferentes versiones de este mismo sistema gestor de base de datos, realizado y desarrollado año tras año por Revelation Technologies.

Y es que el diseño original de aquel año, debido al trabajo conjunto de Charles Faulhaber y el programador John May, se ha beneficiado para su desarrollo de nueve ayudas de financiación concedidas por NEH, además de todo un amplio abanico de otros estipendios más pequeños pero no por ello menos significativos. Con todo, han sido los constantes informes, apoyos y suministros de datos efectuado por los miembros de todos los grupos de investigación lo que ha acabado de perfilar el programa actual. Téngase en cuenta que, hacia el año 2001, la estructura de la base de datos de PhiloBiblon consistía en 650 campos de datos.

El transporte de datos a la página web de PhiloBiblon se realizó en el año 1997, tomando como base las fichas de MS_ED (descripciones de MSS e impresos) y volcando todo su contenido en archivos de texto con el código ASCII. Los programadores de la biblioteca de la Universidad de Berkeley diseñaron un "guión PERL" para convertir los datos de cada manuscrito o impreso de las tres bibliografías constitutivas (BETA, BITECA y BITAGAP) en lenguaje HTML. Estas fichas fueron indexadas utilizando un sencillo programa de dominio público (SWISH). De igual forma, una simple interfaz de protocolo de búsqueda (CGI=Common Gateway Interface) permitió realizar en Internet búsquedas por autor, por título o por palabras claves.

En el año 2001 otra ayuda financiera de NEH hizo posible la migración de datos desde un sistema basado en MS-DOS a un nuevo programa diseñado por Advanced Revelation sobre soporte Windows. En el proceso de migración, la estructura de las fichas se hizo de forma más racional, al tiempo que otros campos de datos fueron añadidos hasta llegar al número actual de 987 campos en diez tablas interrelacionadas.

Como en las versiones anteriores, unos códigos únicos de identificación se utilizan para identificar textos (texid), copias de textos (cnum), manuscritos o impresos (manid), ejemplares de los impresos (copid), y personas (bioid). Estos códigos, diferentes en cada bibliografía, son de enorme utilidad para diferenciar, por ejemplo, entre obras diferentes pero con títulos idénticos o personas homónimas. Por esta razón estos códigos han sido retenidos en la versión web.

The Bancroft Library | Library home | Search | Contact webmaster