Etiquetado gramatical y lematización en el corpus histórico judeoespañol (CORHIJE): problemas, soluciones y resoluciones
Resumo
Tras un breve repaso de las características más sobresalientes del Corpus Histórico Judeoespañol - CORHIJE —a modo de recordatorio, pues ya fue presentado en la III edición del Congreso de Corpus Diacrónicos en lenguas Iberorrománicas (CODILI) en 2014 en Zurich—, mostraremos el proceso de lematización y etiquetado gramatical que se está llevando a cabo sobre el mismo, pasando revista a los distintos problemas detectados y a las soluciones aplicadas durante el mismo que, en algunos casos, nos han obligado a tomar resoluciones, relativamente arbitrarias, en función de los objetivos de descripción y análisis perseguidos: problemas, soluciones y resoluciones que amplifican el título de nuestra presentación.
Palavras-chave
diseño de corpus electrónicos, corpus lingüísticos, judeoespañol, diacroníaReferências
GARCÍA MORENO, Aitor, dir. (2008-2017): Diccionario Histórico del Judeoespañol (DHJE). http://www.esefardic.es/dhje.
GARCÍA MORENO, Aitor y F. Javier PUEYO MENA (2013-2017): Corpus Histórico Judeoespañol (CORHIJE). http://www.esefardic.es/corhije.
HASSÁN, Iacob (1978): «Transcripción normalizada de textos judeoespañoles», Estudios Sefardíes, 1, pp. 147-150.
PADRÓ, Lluís (2011): «Analizadores Multilingües en FreeLing», Linguamatica, 3:2, pp. 13-20.
SÁNCHEZ-MARCO, Cristina, Gemma BOLEDA y Lluís PADRÓ (2001): «Extending the Tool, or How to Annotate Historical Language Varieties», en Proceedings of the 5th ACL-HLT Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities, pp. 1-9.
Publicado
Downloads
Direitos de Autor (c) 2017 Aitor García Moreno, Francisco Javier Pueyo Mena
Este trabalho encontra-se publicado com a Licença Internacional Creative Commons Atribuição-CompartilhaIgual 4.0.