Etiquetado gramatical y lematización en el corpus histórico judeoespañol (CORHIJE): problemas, soluciones y resoluciones

Autores

  • Aitor García Moreno ILC-CSIC / IUMP
  • Francisco Javier Pueyo Mena College of the Holy Cross (USA)

Resumo

Tras un breve repaso de las características más sobresalientes del Corpus Histórico Judeoespañol - CORHIJE —a modo de recordatorio, pues ya fue presentado en la III edición del Congreso de Corpus Diacrónicos en lenguas Iberorrománicas (CODILI) en 2014 en Zurich—, mostraremos el proceso de lematización y etiquetado gramatical que se está llevando a cabo sobre el mismo, pasando revista a los distintos problemas detectados y a las soluciones aplicadas durante el mismo que, en algunos casos, nos han obligado a tomar resoluciones, relativamente arbitrarias, en función de los objetivos de descripción y análisis perseguidos: problemas, soluciones y resoluciones que amplifican el título de nuestra presentación.

Palavras-chave

diseño de corpus electrónicos, corpus lingüísticos, judeoespañol, diacronía

Referências

GARCÍA MORENO, Aitor, dir. (2008-2017): Diccionario Histórico del Judeoespañol (DHJE). http://www.esefardic.es/dhje.

GARCÍA MORENO, Aitor y F. Javier PUEYO MENA (2013-2017): Corpus Histórico Judeoespañol (CORHIJE). http://www.esefardic.es/corhije.

HASSÁN, Iacob (1978): «Transcripción normalizada de textos judeoespañoles», Estudios Sefardíes, 1, pp. 147-150.

PADRÓ, Lluís (2011): «Analizadores Multilingües en FreeLing», Linguamatica, 3:2, pp. 13-20.

SÁNCHEZ-MARCO, Cristina, Gemma BOLEDA y Lluís PADRÓ (2001): «Extending the Tool, or How to Annotate Historical Language Varieties», en Proceedings of the 5th ACL-HLT Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities, pp. 1-9.

Publicado

2017-10-15

Downloads

Não há dados estatísticos.