Two problems in the use of Spanish diachronic corpora: perspective and comparability
Abstract
This paper addresses a number of methodological problems related to corpus-based research in language variation. It is shown through a number of case studies using data from Biblia medieval (a parallel corpus of Old Spanish bible translations) how this kind of research can profit from parallel texts. To begin with, the perspective afforded by parallel corpus methodology is more open as it is possible to analyze all the forms used to express contents in the source language. Likewise, parallel texts offer direct comparability of concrete examples across different historical periods, as translation equivalents are likely to be inserted in the same or very similar syntactic, semantic and pragmatic contexts of occurrence. Finally, in a parallel corpus it is possible to analyze stylistic variation in a more controlled manner by examining how the same translator selects different linguistic options depending on the genre of each text.
Keywords
Corpus linguistics, Medieval Spanish, Parallel corpora, Old Spanish Bible translationsReferences
BM = ENRIQUE-ARIAS, Andrés (dir.) (2009-): Biblia Medieval. http://bibliamedieval.es.
BYBEE, Joan L. (2007): Frequency of use and the organization of language. Oxford: OUP.
CE = DAVIES, Mark (2002-): Corpus del Español. http://www.corpusdelespanol.org.
CODEA = SÁNCHEZ-PRIETO BORJA, Pedro (dir.) (2010-): Corpus de Textos Españoles Anteriores a 1700. http://www.textoshispanicos.es.
CORDE = REAL ACADEMIA ESPAÑOLA (1998-): Corpus Diacrónico del Español. http://www.rae.es.
COROMINAS, Joan y José A. PASCUAL (1980-1991): Diccionario crítico etimológico castellano e hispánico. Madrid: Gredos.
DAVIES, Mark (2009): «Creating useful historical corpora: A comparison of CORDE, the Corpus del español, and the Corpus do português», en Andrés Enrique-Arias (ed.), Diacronía de las lenguas iberorrománicas: nuevas aportaciones desde la lingüística de corpus. Frankfurt/Madrid: Vervuert/Iberoamericana, pp. 137-166.
DE VRIES, Lourens (2007): «Some remarks on the use of Bible translations as parallel texts in linguistic research», en Michael Cysow y Bernhard Wälchli (eds.), Parallel Texts: Using translational equivalents in linguistic typology. Número especial de Sprachtypologie und Universalienforschung (STUF), 60, pp. 95-99.
ENRIQUE-ARIAS, Andrés (2005): «When clitics become affixes, where do they come to rest? A case from Spanish», en Wolfgang Dressler, Dieter Kastovsky, Oskar Pfeiffer y Franz Rainer (eds.), Morphology and its demarcations. Filadelfia/Amsterdam: John Benjamins, pp. 67-79.
ENRIQUE-ARIAS, Andrés (2008): «Biblias romanceadas e historia de la lengua», en Concepción Company y José Moreno de Alba (eds.), Actas del VII Congreso Internacional de Historia de la Lengua Española, vol. II. Madrid: Arco/Libros, pp. 1781-1794.
ENRIQUE-ARIAS, Andrés (ed.) (2009a): Diacronía de las lenguas iberorrománicas: nuevas aportaciones desde la lingüística de corpus. Frankfurt/Madrid: Vervuert/Iberoamericana.
ENRIQUE-ARIAS, Andrés (2009b): «Lingüística de corpus y diacronía de las lenguas iberorromances», en Andrés Enrique-Arias (ed.), Diacronía de las lenguas iberorrománicas: nuevas aportaciones desde la lingüística de corpus. Frankfurt/Madrid: Vervuert/Iberoamericana, pp. 11-21.
ENRIQUE-ARIAS, Andrés (2009c): «Ventajas e inconvenientes del uso de Biblia medieval (un corpus paralelo y alineado de textos bíblicos) para la investigación en lingüística histórica del español», en Andrés Enrique-Arias (ed.), Diacronía de las lenguas iberorrománicas: nuevas aportaciones desde la lingüística de corpus. Frankfurt/Madrid: Vervuert/Iberoamericana, pp. 269-283.
ENRIQUE-ARIAS, Andrés (2012): «On the usefulness of using parallel texts in diachronic investigations: insights from a parallel corpus of Spanish medieval Bible translations», en Paul Bennett, Martin Durrell, Silke Scheible y Richard J. Whitt (eds.), New Methods in Historical Corpus Linguistics. Tubinga: Gunter Narr (Corpus linguistics and Interdisciplinary perspectives on language, vol. 3).
ENRIQUE-ARIAS, Andrés y Miriam BOUZOUITA (en prensa): «La frecuencia textual en la evolución histórica de los clíticos pronominales en español», Iberoromania.
ENRIQUE-ARIAS, Andrés y Joan BURGUERA (2010): «Variación y cambio en la formalización de la interrogación retórica en la historia del español». Comunicación leída en el XXVI Congreso Internacional de Lingüística y Filología Románicas (Universidad de Valencia, 6-11 de septiembre 2010).
ENRIQUE-ARIAS, Andrés y Laura CAMARGO (en prensa): «Problemas en torno a la caracterización de un marcador del discurso en español medieval: el caso de he», en Amalia Rodríguez Somolinos, Margarita Borreguero Zuloaga y Sonia Gómez-Jordana Ferary (eds.), Marqueurs discursifs dans les langues romaines. Limoges: Lambert Lucas.
ENRIQUE-ARIAS, Andrés y Cristina MATUTE MARTÍNEZ (2010): «El estudio morfosintáctico de la lengua de la Biblia de Alba: un acercamiento a la variación discursiva y dialectal del español del siglo XV», en Maria Iliescu, Heidi M. Siller-Runggaldier, Paul Danler (eds.), Actes du XXV Congrès International de Linguistique et de Philologie Romanes (Innsbruck, 3-8 septiembre 2007), vol. VI. Berlin: Walter de Gruyter, pp. 115-123.
FERNÁNDEZ-ORDÓÑEZ, INÉS (2011): La lengua de Castilla y la formación del español. Discurso leído el 13 de febrero de 2011 en su recepción pública por la Excma. Sra. D.ª Inés Fernández-Ordóñez y contestación del Excmo. Sr. D. José Antonio Pascual. Madrid.
GOYENS, Michèle y Willy van HOECKE (1992): «La traduction comme témoin de l’évolution linguistique», en Ramón Lorenzo (ed.), Actas do XIX Congreso Internacional de Lingüística e Filoloxía Románicas, vol. V. A Coruña: Fundación Barrié de la Maza, pp. 13-32.
JOSEPH, Brian (2008): «Historical linguistics in 2008. The state of the art», en Piet van Sterkenburg (ed.), Unity and diversity of languages. Amsterdam/Filadelfia: John Benjamins, pp. 175-188.
KAISER, Georg A. (2005): «Bibelübersetzungen als Grundlage für empirische Sprachwandeluntersuchungen», en Claus D. Pusch, Johannes Kabatek y Wolfgang Raible (eds.), Romance Corpus Linguistics II. Corpora and Diachronic Linguistics. Tübingen: Gunter Narr Verlag, pp. 71-83.
LAPESA, Rafael (2000 [1971]): «Sobre el artículo ante posesivo en castellano antiguo», en Rafael Cano y M. Teresa Echenique (eds.), Estudios de morfosintaxis histórica del español. Madrid: Gredos, pp. 413-435.
MATUTE MARTÍNEZ, Cristina y Enrique PATO (2010): «Morfología y sintaxis en el códice Escorial I.I.6», en Andrés Enrique-Arias (ed.), La Biblia Escorial I.I.6. Transcripción y estudios. Logroño: Centro Internacional de Investigación de la Lengua Española (Cilengua), pp. 45-65.
MENÉNDEZ PIDAL, Ramón (1911): Cantar de Mio Cid. Texto, gramática y vocabulario. Madrid: Bailly/Ballière.
MCENERY, Tony y Zhonghua XIAO (2007): «Parallel and comparable corpora: The state of play», en Yuji Kawaguchi, Toshihiro Takagaki, Nobuo Tomimori y Yoichiro Tsuruga (eds.): Corpus-Based Perspectives in Linguistics. Amsterdam: John Benjamins, pp. 131-145.
RANSON, Diana L. (2005): «Variation of the Spanish demonstratives aqueste and este», en Roger Wright y Peter Ricketts (eds.), Studies on Ibero-Romance linguistics dedicated to Ralph Penny. Newark: Juan de la Cuesta, pp. 187-214.
RESNIK, Philip, Mari B. OLSEN y Mona DIAB (1999): «The Bible as a Parallel Corpus: Annotating the ‘Book of 2000 Tongues’», Computers and the Humanities, 33, 1-2, pp. 129-153.
SÁNCHEZ LÓPEZ, Cristina (en prensa): «Preposiciones, conjunciones y adverbios derivados de participios», en Concepción Company (ed.), Sintaxis histórica de la lengua española. Tercera parte. México: Fondo de Cultura Económica.
WANNER, Dieter (2005): «The corpus as a key to diachronic explanation», en Johannes Kabatek, Claus D. Pusch y Wolfgang Raible (eds.), Romance Corpus Linguistics II: Corpora and Diachronic Linguistics. Tübingen: Gunther Narr, pp. 31-44.
Published
Downloads
Copyright (c) 2012 Andrés Enrique-Arias
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.