Etiquetado gramatical y lematización en el corpus histórico judeoespañol (CORHIJE): problemas, soluciones y resoluciones

Autors/ores

  • Aitor García Moreno ILC-CSIC / IUMP
  • Francisco Javier Pueyo Mena College of the Holy Cross (USA)

Resum

Tras un breve repaso de las características más sobresalientes del Corpus Histórico Judeoespañol - CORHIJE —a modo de recordatorio, pues ya fue presentado en la III edición del Congreso de Corpus Diacrónicos en lenguas Iberorrománicas (CODILI) en 2014 en Zurich—, mostraremos el proceso de lematización y etiquetado gramatical que se está llevando a cabo sobre el mismo, pasando revista a los distintos problemas detectados y a las soluciones aplicadas durante el mismo que, en algunos casos, nos han obligado a tomar resoluciones, relativamente arbitrarias, en función de los objetivos de descripción y análisis perseguidos: problemas, soluciones y resoluciones que amplifican el título de nuestra presentación.

Paraules clau

diseño de corpus electrónicos, corpus lingüísticos, judeoespañol, diacronía

Referències

GARCÍA MORENO, Aitor, dir. (2008-2017): Diccionario Histórico del Judeoespañol (DHJE). http://www.esefardic.es/dhje.

GARCÍA MORENO, Aitor y F. Javier PUEYO MENA (2013-2017): Corpus Histórico Judeoespañol (CORHIJE). http://www.esefardic.es/corhije.

HASSÁN, Iacob (1978): «Transcripción normalizada de textos judeoespañoles», Estudios Sefardíes, 1, pp. 147-150.

PADRÓ, Lluís (2011): «Analizadores Multilingües en FreeLing», Linguamatica, 3:2, pp. 13-20.

SÁNCHEZ-MARCO, Cristina, Gemma BOLEDA y Lluís PADRÓ (2001): «Extending the Tool, or How to Annotate Historical Language Varieties», en Proceedings of the 5th ACL-HLT Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities, pp. 1-9.

Publicades

15-10-2017

Descàrregues

Les dades de descàrrega encara no estan disponibles.