Diachronic corpora as an instrument for the study of the origin and distribution of object agreement in Spanish

Authors

  • Marcos García Salido UAB
  • Victoria Vázquez Rozas UAB

Abstract

The article is based on previous research on the genesis and diffusion of object agreement in Spanish, which highlights the advantages of a corpus-driven approach as contrasted with other lines of analysis. We take into account the Spanish historical corpora available and discuss the feasibility of retrieving the necessary data for this type of study. Furthermore, we put forward some proposals about what kind of information (tagging, parsing, etc.) could make the task easier. Lastly, in the light of corpus data, we can see to what extent certain syntactic functions favour particular coding devices and information status, and consider if the various discourse genres registered in the history of the Spanish language are equally representative of these preferences.

Keywords

Diachrony, Corpus annotation, Object agreement

References

Amadís = FONDOW, Steven R. (ed.) (1999): The Electronic Text and Concordances of the «Amadís de Gaula», 1539 Seville Edition. Madison: HSMS.

ANCORA = Corpus AnCora. http://clic.ub.edu/corpus/ancora.

BDS = Base de datos sintácticos. http://www.bds.usc.es.

BM = Enrique-Arias, Andrés (dir.) (2008): Biblia Medieval. http://www.bibliamedieval.es.

BNC = The British National Corpus. http://www.natcorp.ox.ac.uk/.

CE = DAVIES, Mark (2003): Corpus del español. http://www.corpusdelespanol.org/.

Celestina = CORFIS, Ivy A. y John O'NEILL (eds.) (1997): Early «Celestina» Electronic Texts and Concordances. Madison: HSMS.

Cid = ANÓNIMO (2000 [1195-1207]): Cantar de Mio Cid. Barcelona: Crítica [Edición de Alberto Montaner].

CL = DON JUAN MANUEL (1983 [1335]): Conde Lucanor. Madrid: Gredos [Edición de José Manuel Blecua].

Conversaciones = BRIZ, Antonio y Grupo VAL.ES.CO (2002): Corpus de conversaciones coloquiales. Madrid: Arco/Libros.

Corbacho = MARTÍNEZ DE TOLEDO, Alfonso (1901 [1438]): Arcipreste de Talavera o Corbacho. Madrid: Sociedad de Bibliófilos Españoles [Edición electrónica (2004), Alicante: Biblioteca virtual Miguel de Cervantes].

CORDE = Real Academia española: Corpus diacrónico del español. http://corpus.rae.es/cordenet. html.

CREA = Real Academia española: Corpus de referencia del español actual. http://corpus.rae.es/ creanet.html.

DA = KAUFFELD, Cynthia (ed.) (1999): Electronic texts and concordances of Andalusian documents (1324-1500) selected from the collection of The Hispanic Society of America. Madison: HSMS.

Dorotea = VEGA, Lope de (1968 [1632]): La Dorotea. Madrid: Castalia [Edición de Edwin S. Morby].

Lazarillo = ANÓNIMO (2004 [1554]): Vida de Lazarillo de Tormes y sus fortunas y adversidades. Alicante: Biblioteca Virtual Miguel de Cervantes.

Moradas = SANTA TERESA DE JESÚS (2000 [1577]): Las Moradas. Alicante: Biblioteca Virtual Miguel de Cervantes.

NE = CASTILLO SOLÓRZANO, Alonso de (1906 [1632]): Teresa de Manzanares o La niña de los embustes. Madrid: Viuda de Rico.

PCG = ALFONSO X (1979 [1289]): Primera Crónica General. Madrid: Gredos [Edición de Ramón Menéndez Pidal].

Quijote = CERVANTES, Miguel de (1998 [1615]): Segunda parte del ingenioso hidalgo don Quijote de la Mancha. Barcelona: Instituto Cervantes/Crítica [Edición de Francisco Rico].

ALBA-SALAS, Josep (2009): «Las estructuras tipo meter miedo en diacronía: más detalles sobre la evolución histórica de las colocaciones causativas», en Andrés Enrique-Arias (ed.), Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus. Madrid/Frankfurt am Main: Iberoamericana/Vervuert, pp. 343-364.

ARIEL, Mira (1990): Accessing Noun-Phrase Antecedents. Londres: Routledge.

ARIEL, Mira (2000): «The Development of Person Agreement Markers: from Pronouns to Higher Accessibility Markers», en Michael Barlow y Suzanne Kemmer (eds.), Usage-based Models of Language. Stanford: CSLI, pp. 197-260.

BLAKE, Robert y Gina LEE (2009): «MOCA: análisis de corpus en línea en un contexto histórico», en Andrés Enrique-Arias (ed.), Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus. Madrid/Frankfurt am Main: Iberoamericana/Vervuert, pp. 327-341.

BLOCKLEY, Mary (2001): Aspects of Old English Poetic Syntax. Where Clauses Begin. Urbana: University of Illinois Press.

BOSSONG, Georg (1980): «Aktantenfunktionen in Romanischen Verbalsystem», Zeitschrift für romanische Philologie, 96, pp. 1-22.

BYBEE, Joan L (1985): «Diagrammatic Iconicity in Stem - Inflection Relations», en John Haiman (ed.), Iconicity in syntax. Amsterdam: John Benjamins, pp. 11-47.

DAVIES, Mark (2009): «Creating Useful Historical Corpora: A Comparison of CORDE, the Corpus del español, and the Corpus do Português», en Andrés Enrique-Arias (ed.), Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus. Madrid/Frankfurt am Main: Iberoamericana/Vervuert, pp. 137-166.

DU BOIS, John W., Lorraine E. KUMPF y William J. ASHBY (eds.) (2003): Preferred Argument Structure. Grammar as Architecture for Function. Amsterdam: John Benjamins.

ENRIQUE-ARIAS, Andrés (ed.) (2009a): Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus. Madrid/Frankfurt am Main: Iberoamericana/Vervuert.

ENRIQUE-ARIAS, Andrés (2009b): «Introducción», en Andrés Enrique-Arias (ed.), Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus. Madrid/Frankfurt am Main: Iberoamericana/Vervuert, pp. 11-21.

ENRIQUE-ARIAS, Andrés (2009c): «Ventajas e inconvenientes del uso de Biblia medieval (un corpus paralelo y alineado de textos bíblicos) para la investigación en lingüística histórica del español», en Andrés Enrique-Arias (ed.), Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus. Madrid/Frankfurt am Main: Iberoamericana/Vervuert, pp. 269-283.

FERNÁNDEZ-ORDÓÑEZ, Inés (1993): «Leísmo, laísmo y loísmo: estado de la cuestión», en Olga Fernández Soriano (ed.), Los pronombres átonos. Madrid: Taurus, pp. 63-96.

FERNÁNDEZ-ORDÓÑEZ, Inés (2006): «La historiografía medieval como fuente de datos lingüísticos. Tradiciones consolidadas y rupturas necesarias», en José Jesús Bustos Tovar y José Luis Girón Alconchel (eds.), Actas del VI Congreso Internacional de Historia de la Lengua Española, vol II. Madrid: Arco/Libros, pp. 1779-1807.

FRANCO, Jon (2000): «Agreement as a Continuum: The Case of Spanish Pronominal Clitics», en Frits Beukema y Den Dikken (eds.), Clitic Phenomena in European Languages. Amsterdam: John Benjamins, pp. 147-190.

GARCÍA-MIGUEL, José María (1991): «La duplicación de complemento directo e indirecto como concordancia», Verba, 18, pp. 375-410.

GIVÓN, Talmy (1976): «Topic, Pronoun and Gramatical Agreement», en Charles N. Li (ed.), Subject and Topic. New York: Academic Press, pp. 149-188.

GIVÓN, Talmy (1983): «Topic Continuity in Discourse: an Introduction», en Talmy Givón (ed.), Topic Continuity in Discourse. A Quantitative Cross-language Study. Amsterdam: John Benjamins, pp. 5-41.

HIDALGO DOWNING, Raquel (2003): La tematización en el español hablado. Madrid: Gredos.

KABATEK, Johannes (2004): «Tradiciones discursivas jurídicas y elaboración lingüística en la España medieval», Cahiers de Linguistique Hispanique Médiévale, 28, pp. 249-261.

KOHNEN, Thomas (2007): «Text Types and the Methodology of Diachronic Speech Act Analysis», en Susan Fitzmaurice e Irma Taavitsainen (eds.), Methodological Issues in Historical Pragmatics. Berlin: Mouton de Gruyter, pp. 139-166.

NIEUWENHUIJSEN, Dorien (2009): «El rastreo del desarrollo de algunos pronombres personales en español: (im)posibilidades de los corpus diacrónicos digitales», en Andrés Enrique-Arias (ed.), Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus. Madrid/Frankfurt am Main: Iberoamericana/Vervuert, pp. 365-384.

LLORENTE, Antonio y José MONDÉJAR (1972): «La conjugación objetiva en las lenguas románicas», Prohemio, 3, 1, pp. 5-27.

PATO, Enrique (2009): «Notas aclaratorias sobre la historia del indefinido alguien: una aplicación directa del uso de corpus diacrónicos», en Andrés Enrique-Arias (ed.), Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus. Madrid/Frankfurt am Main: Iberoamericana/Vervuert, pp. 401-416.

RIIHO, Timo (1988a): «Sobre el carácter fortuito de la redundancia pronominal en el español antiguo», en Manuel Ariza, Álvaro Salvador y Antonio Viudas (eds.), Actas del I Congreso Internacional de Historia de la Lengua, vol. I. Madrid: Arco/Libros, pp. 583-591.

RIIHO, Timo (1988b): La redundancia pronominal en el iberorromance medieval. Tübingen: Niemeyer.

RINI, Joel (1990): «Dating the Grammaticalization of the Spanish Clitic Pronoun», Zeitschrift für romanische Philologie, 106, pp. 354-370.

RINI, Joel (1991): «The Redundant Indirect Object Constructions in Spanish: A New Perspective», Romance Philology, 45, 2, pp. 269-286.

ROJO, Guillermo (2010a): «Aguja de navegar corpus», en Víctor M. Castel y Liliana Cubo de Severino (eds.), La renovación de la palabra en el bicentenario de la Argentina. Los colores de la mirada lingüística. Mendoza: Editorial FFyL, UNCuyo, pp. 1151-1163.

ROJO, Guillermo (2010b): «Sobre codificación y explotación de corpus textuales: Otra comparación del Corpus del Español con el CORDE y el CREA», Lingüística, 24, pp. 11-50.

SCHULTE, Kim (2009): «Using non-annotated diachronic corpora: benefits, methods and limitations», en Andrés Enrique-Arias (ed.), Diacronía de las lenguas iberorrománicas. Nuevas aportaciones desde la lingüística de corpus. Madrid/Frankfurt am Main: Iberoamericana/Vervuert, pp. 167-182.

SILVA-CORVALÁN, Carmen (1984): «Semantic and Pragmatic Factors in Syntactic Change», en Jacek Fisiak (ed.), Historical Syntax. Berlin: Mouton, pp. 555-573.

SMITH, Nicholas, Sebastian HOFFMANN y Paul RAYSON (2008): «Corpus Tools and Methods, Today and Tomorrow: Incorporating Linguists’ Manual Annotations», Literary and Linguistic Computing, 23, 2, pp. 163-180.

TAAVITSAINEN, Irma y Susan FITZMAURICE (2007): «Historical pragmatics: What it is and How to Do it», en Susan M. Fitzmaurice e Irma Taavitsainen (eds.), Methodological Issues in Historical Pragmatics. Berlin: Mouton de Gruyter, pp. 11-36.

TAAVITSAINEN, Irma y Andreas H. JUCKER (2007): «Speech Act Verbs and Speech Acts in the History of English», en Susan M. Fitzmaurice e Irma Taavitsainen (eds.), Methodological Issues in Historical Pragmatics. Berlin: Mouton de Gruyter, pp. 107-138.

TOTTIE, Gunnel y Sebastian HOFFMANN (2006): «Tag Questions in British and American English», Journal of English Linguistics, 34, 4, pp. 883-311.

TRAUGOTT, Elizabeth Closs y Susan PINTZUK (2008): «Coding the York-Toronto-Helsinki Parsed Corpus of Old English Prose to investigate the Syntax-Pragmatics Interface», en Susan M. Fitzmaurice y Donka Minkova (eds.), Studies in the History of the English Language IV. Empirical and Analytical Advances in the Study of English Language Change. Berlin/New York: Mouton de Gruyter, pp. 61-80.

VÁZQUEZ ROZAS, Victoria y Marcos GARCÍA SALIDO (2012): «A Discourse-Based Analysis of Object Clitic Doubling in Spanish», en Tine Breban, Lieselotte Brems, Kristin Davidse y Tanja Mortelmans (eds.), Grammaticalization and Language Change: New Reflections. Amsterdam: John Benjamins, pp. 269-296.

Published

15-10-2012

Downloads

Download data is not yet available.