Mostrar el registro sencillo del ítem

dc.date.available
2025-03-18T13:09:02Z  
dc.identifier.citation
Stricker, Vanesa; Cotik, Viviana Erica; (2025): Trigger set para NegEx en español. Consejo Nacional de Investigaciones Científicas y Técnicas. (dataset). http://hdl.handle.net/11336/256470  
dc.identifier.uri
http://hdl.handle.net/11336/256470  
dc.description.abstract
Publicamos el conjunto de triggers utilizado en nuestro artículo de BioNLP 2016 para el algoritmo NegEx [Chapman et al], con el fin de detectar automáticamente negaciones y especulaciones en textos clínicos en español. Fue generado como parte de la Tesis de Grado de Vanesa Stricker, dirigida por mí (Viviana Cotik). A continuación, explicamos brevemente la creación del conjunto de datos, los cambios que deben aplicarse a NegEx para utilizar este conjunto de datos y compartimos los enlaces para descargar nuestros conjuntos de disparadores. También compartimos las publicaciones donde describimos nuestro trabajo con más detalle.  
dc.rights
info:eu-repo/semantics/openAccess  
dc.rights.uri
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/  
dc.title
Trigger set para NegEx en español  
dc.type
dataset  
dc.date.updated
2025-02-26T09:24:06Z  
dc.description.fil
Fil: Stricker, Vanesa. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Computación; Argentina  
dc.description.fil
Fil: Cotik, Viviana Erica. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Computación; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina  
dc.datacite.PublicationYear
2025  
dc.datacite.Creator
Stricker, Vanesa  
dc.datacite.Creator
Cotik, Viviana Erica  
dc.datacite.affiliation
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Computación  
dc.datacite.affiliation
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Computación  
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas  
dc.datacite.publisher
Consejo Nacional de Investigaciones Científicas y Técnicas  
dc.datacite.subject
Ciencias de la Computación  
dc.datacite.subject
Ciencias de la Computación e Información  
dc.datacite.subject
CIENCIAS NATURALES Y EXACTAS  
dc.datacite.date
12/2019-12/2020  
dc.datacite.DateType
Recolectado  
dc.datacite.language
spa  
dc.datacite.version
1.0  
dc.datacite.description
El conjunto de triggers fue creado por una hablante nativa de español, basada en una traducción al español de la versión en inglés de un conjunto de disparadores multilingüe de NegEx [Context: https://code.google.com/archive/p/negex/downloads]. Las transformaciones se describen en la siguiente tesis de Licenciatura de Vanesa Stricker (en español -https://gestion.dc.uba.ar/media/academic/grade/thesis/stricker.pdf- ) y, con menos detalle, en la siguiente de doctorado de Viviana Cotik (en inglés -https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n6477_Cotik.pdf -). A continuación, se presenta un resumen de los pasos realizados para obtener el conjunto de triggers en español: .Traducción de los términos de ConText [corpus multilingue] al español utilizando Google Translate. .Revisión y corrección de los términos traducidos. .Adición de nuevos términos en español, basados en términos existentes. .Dado que el inglés carece de género gramatical, mientras que el español tiene dos (masculino y femenino), se generaron instancias adicionales de disparadores debido a las propiedades flexivas (por ejemplo, "no" se tradujo como "ningún" y "ninguna"). .Adición de términos de uso frecuente proporcionados por un médico especialista en el dominio de la radiología. .Las etiquetas NEGEX [Chapman et al] fueron revisadas y corregidas. Se incluyó un disparador para expresar negaciones coordinadas (ni -nor-) con la etiqueta CONJN. Todo el proceso fue realizado por dos científicos de la computación que trabajan en Procesamiento del Lenguaje Natural, ambos hablantes nativos de español. Se obtuvieron dos conjuntos de disparadores: uno extendido y otro reducido. Las etiquetas NEGEX [Chapman et al] se proporcionan con cada término.  
dc.datacite.DescriptionType
Información Técnica  
dc.relationtype.isSourceOf
https://www.aclweb.org/anthology/W/W16/W16-2921.pdf  
dc.subject.keyword
Negex  
dc.subject.keyword
informes médicos en español  
dc.subject.keyword
deetección de negaciones y especulaciones  
dc.datacite.resourceTypeGeneral
dataset  
dc.conicet.datoinvestigacionid
25100  
dc.datacite.geolocation
Argentina  
dc.conicet.tieneObs
true  
dc.datacite.formatedDate
2019-2020