Etiquetado gramatical y lematización en el corpus histórico judeoespañol (CORHIJE): problemas, soluciones y resoluciones
Resum
Tras un breve repaso de las características más sobresalientes del Corpus Histórico Judeoespañol - CORHIJE —a modo de recordatorio, pues ya fue presentado en la III edición del Congreso de Corpus Diacrónicos en lenguas Iberorrománicas (CODILI) en 2014 en Zurich—, mostraremos el proceso de lematización y etiquetado gramatical que se está llevando a cabo sobre el mismo, pasando revista a los distintos problemas detectados y a las soluciones aplicadas durante el mismo que, en algunos casos, nos han obligado a tomar resoluciones, relativamente arbitrarias, en función de los objetivos de descripción y análisis perseguidos: problemas, soluciones y resoluciones que amplifican el título de nuestra presentación.
Paraules clau
diseño de corpus electrónicos, corpus lingüísticos, judeoespañol, diacroníaReferències
GARCÍA MORENO, Aitor, dir. (2008-2017): Diccionario Histórico del Judeoespañol (DHJE). http://www.esefardic.es/dhje.
GARCÍA MORENO, Aitor y F. Javier PUEYO MENA (2013-2017): Corpus Histórico Judeoespañol (CORHIJE). http://www.esefardic.es/corhije.
HASSÁN, Iacob (1978): «Transcripción normalizada de textos judeoespañoles», Estudios Sefardíes, 1, pp. 147-150.
PADRÓ, Lluís (2011): «Analizadores Multilingües en FreeLing», Linguamatica, 3:2, pp. 13-20.
SÁNCHEZ-MARCO, Cristina, Gemma BOLEDA y Lluís PADRÓ (2001): «Extending the Tool, or How to Annotate Historical Language Varieties», en Proceedings of the 5th ACL-HLT Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities, pp. 1-9.
Publicades
Descàrregues
Drets d'autor (c) 2017 Aitor García Moreno, Francisco Javier Pueyo Mena
Aquesta obra està sota una llicència internacional Creative Commons Reconeixement-CompartirIgual 4.0.