Chrono-geographical dating of Spanish medieval documents
Abstract
This paper presents a new process for surmising dates and locations of medieval Spanish documents, while dealing with the diachronic and geographic linguistic variation simultaneously. The dating is carried out based on a correlation coefficient calculated by examining the coincidence between the texts in the linguistic characteristics. The date in which a document was issued is inferred by a weighted average of dates from the k (≥ 1) documents showing the strongest correlation. Through this method, more than 60 % of the documents were successfully dated within the margin of error of ±20 years. On the other hand, with respect to the region where the document was issued, a predictability of 60 % was achieved.
Keywords
Dating, History of the Spanish language, Archival documents, Corpus linguistics, StatisticsReferences
ALVAR, Manuel (1996): Manual de dialectología hispánica: el español de España. Barcelona: Editorial Planeta.
AZOFRA, María Elena (2009): Morfosintaxis histórica del español: de la teoría a la práctica. Madrid: Universidad Nacional de Educación a Distancia.
CHARTA = SÁNCHEZ-PRIETO BORJA, Pedro (coord.) (2010-): Corpus Hispánico y Americano en la Red: Textos Antiguos. http://www.bibliateca.es/charta/index.html [Consulta: 17/04/2014].
CODEA = SÁNCHEZ-PRIETO BORJA, Pedro (dir.) (2010-): Corpus de Documentos Españoles Anteriores a 1700. http://demos.bitext.com/codea [Consulta: 17/04/2014].
DEEDS = Documents of Early England Data Set. http://deeds.library.utoronto.ca/ [Consulta: 17/04/2014].
DÍAZ MORENO, Rocío, Rocío MARTÍNEZ SÁNCHEZ, José Luis RAMÍREZ LUENGO y Pedro SÁNCHEZ-PRIETO BORJA (en prensa): «Hacia una cronología evolutiva del español», en Actas del IX Congreso Internacional de Historia de la Lengua Española (Cádiz, 10-14 de septiembre de 2012).
ENRIQUE-ARIAS, Andrés (2012): «Dos problemas en el uso de corpus diacrónicos del español: perspectiva y comparabilidad», Scriptum Digital, 1, pp. 85-106.
FEUERVERGER, Andrey, Peter HALL, Gelila TILAHUN y Michael GERVERS (2005): «Distance measures and smoothing methodology for imputing features of documents», Journal of Computational and Graphical Statistics, 14, 2, pp. 255-262.
FEUERVERGER, Andrey, Peter HALL, Gelila TILAHUN y Michael GERVERS (2008): «Using statistical smoothing to date medieval manuscripts», en Balakrishnan N., Pena E. y Silvapulle M. J. (eds.), Beyond parametrics in interdisciplinary research: Festshrift in honor of professor Pranab K. Sen, vol. 1, pp.321-331.
FIALLOS, Rodolfo (1997): «Procedure for dating undated documents using a relational database», en Brown J. y Stoneman W. P. (eds.), A distinct voice: medieval studies in honor of Leonard E. Boyle. Notre Dame, Indiana: University of Notre Dame Press, pp. 480-504.
FIALLOS, Rodolfo (2000): «An overview of the process of dating undated medieval charters: latest results and future developments», en Michael Gervers (ed.), Dating undated medieval documents. Suffolk: Boydell & Brewer, pp. 37-48.
GERVERS, Michael (1997): «The dating of medieval English private charters of the twelfth and thirteenth centuries», en Brown J. y Stoneman W. P. (eds.), A distinct voice: medieval studies in honor of Leonard E. Boyle. Notre Dame, Indiana: University of Notre Dame Press, pp. 455-480.
GERVERS, Michael (2000a): Dating undated medieval charters. Suffolk: Boydell & Brewer.
GERVERS, Michael (2000b): «The DEEDS project and the development of a computerised methodology for dating undated English private charters of the twelfth and thirteenth centuries», en Michael Gervers (ed.), Dating undated medieval charters. Suffolk: Boydell & Brewer, pp. 13-35.
JIN, Mingzhe (2009): Tekisuto-deeta no toukei-kagaku nyuumon (Introducción al análisis estadístico de los textos). Tokio: Iwanami shoten (en japonés).
KAWASAKI, Yoshifumi (2013a): «Apuntes para la datación de documentos dialectales: los casos de -nt~-nd, -t~-d final», Hispánica (Asociación Japonesa de Hispanistas), 57, pp. 111-117.
KAWASAKI, Yoshifumi (2013b): «Variación crono-geográfica de fórmulas en español medieval», Comunicación oral en el LIX Congreso de la Asociación Japonesa de Hispanistas (Tokio, 12-13 de octubre de 2013).
KAWASAKI, Yoshifumi (en prensa a): «Datación de documentos castellanos medievales» en Actas del IX Congreso Internacional de Historia de la Lengua Española (Cádiz, 10-14 de septiembre de 2012).
KAWASAKI, Yoshifumi (en prensa b): «Datación de documentos medievales castellanos según la ‘coocurrencia’ de parámetros», Studia Romanica (SOCIETAS JAPONICA STUDIORUM ROMANICORUM), 46.
KAWASAKI, Yoshifumi (en prensa c): «Datación por coeficientes de asociación», en Actas del Congreso Internacional sobre el Español y la Cultura Hispánica en Japón (ALFALito), (Instituto Cervantes, Tokio, 3 de octubre de 2014).
KAWASAKI, Yoshifumi (en prensa d): «La determinación cronológica de cambios gráfico-fonéticos y la datación de documentos no fechados en el CODEA», en Actas del II Congreso Internacional Tradición e Innovación: nuevas perspectivas para la edición y el estudio de documentos antiguos (Neuchâtel, Suiza, 7-9 de septiembre de 2011).
MENÉNDEZ PIDAL, Ramón (1999): Manual de gramática histórica española (vigésima tercera ed.). Madrid: Espasa-Calpe.
MORENO BERNAL, Jesús y Bautista HORCAJADA (1997): «Sobre no y non en español medieval», Revista de Filología Románica, 14, I, pp. 345-361.
MURAKAMI, Masakatsu (1994): Shingan no kagaku: Keiryoo-bunkengaku nyuumon (Detectar falsificación: Introducción a la estilometría). Tokio: Asakura shoten (en japonés).
MURAKAMI, Masakatsu (2002): Bunka wo hakaru: bunka-keiryoogaku zyosetsu (Introducción a la culturametría). Tokio: Asakura shoten (en japonés).
MURAKAMI, Masakatsu (2006): Bunka-zyoohoogaku nyuumon (Culture and information science). Tokio: Bensei shuppan (en japonés).
PENNY, Ralph (2002): A History of the Spanish Languge (Second Edition). Cambridge: Cambridge University Press.
SÁNCHEZ GONZÁLEZ DE HERRERO, María Nieves (dir.): Documentación de cancillería castellana del siglo XIII. http://campus.usal.es/~gedhytas/ [Consulta: 17/04/2014].
SÁNCHEZ-PRIETO BORJA, Pedro (1998): Cómo editar los textos medievales: criterios para su presentación gráfica. Madrid: Arco/Libros.
SÁNCHEZ-PRIETO BORJA, Pedro (2008): «La variación lingüística en los documentos de la catedral de Toledo (siglos XII y XIII)», en Javier Elvira, Inés Fernández-Ordóñez, Javier García y Ana Serradilla (eds.), Lenguas, reinos y dialectos en la Edad Media ibérica. Frankfurt/Madrid: Verfuert/Iberoamericana, pp. 233-256.
SÁNCHEZ-PRIETO BORJA, Pedro (2012): «Desarrollo y explotación del Corpus de Documentos Españoles Anteriores a 1700 (CODEA)», Scriptum Digital, 1, pp. 5-35.
SÁNCHEZ-PRIETO BORJA, Pedro, Rocío DÍAZ MORENO, Rocío MARTÍNEZ SÁNCHEZ y Delfina VÁZQUEZ BALONGA (2012): «El CODEA, un corpus primario de fuentes documentales del español peninsular», en Actas del XVI Congreso Internacional de la ALFAL, pp. 2629-2638.
TILAHUN, Gelila (2011): Statistical methods for dating collections of historical documents. Tesis de doctorado, Universidad de Toronto. Inédita.
TILAHUN, Gelila, Andrey FEUERVERGER y Michael GERVERS (2012): «Dating medieval English charters», The Annals of applied statistics, 6, 4, pp. 1615-1640.
TORRENS ÁLVAREZ, María Jesús (1995): «La paleografía como instrumento de datación. La escritura denominada ‘littera textualis’», Cahiers de linguistique hispanique médiévale, 20, pp. 345-380.
UEDA, Hiroto (2013): «Pautas y frecuencias grafotácticas de formas abreviadas: Su utilización para la datación de los documentos notariales del siglo XIII al XVII», Comunicación oral en el III Congreso Internacional Tradición e Innovación: nuevas perspectivas para la edición, la investigación y el estudio de documentos antiguos (5-7 de junio de 2013, Salamanca).
UEDA, Hiroto (en prensa): «Frecuencia contrastiva, frecuencia ponderada y método de concentración −Aplicación al estudio de las dos formas prepositivas del español medieval “por” y “para”−» en Actas del IX Congreso Internacional de Historia de la Lengua Española (Cádiz, 10-14 de septiembre de 2012).
UEDA, Hiroto NUMEROS.xlsm (programa informático para análisis de datos numéricos). http://lecture.ecc.u-tokyo.ac.jp/~cueda/gengo/index.html [Consulta: 17/04/2014].
ZAMORA VICENTE, Alonso (1967): Dialectología española (segunda edición muy aumentada). Madrid: Gredos.
Published
Downloads
Copyright (c) 2014 Yoshifumi Kawasaki
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.