Mostrar el registro sencillo del ítem
dc.date.available
2025-03-18T13:09:02Z
dc.identifier.citation
Stricker, Vanesa; Cotik, Viviana Erica; (2025): Trigger set para NegEx en español. Consejo Nacional de Investigaciones Científicas y Técnicas. (dataset). http://hdl.handle.net/11336/256470
dc.identifier.uri
http://hdl.handle.net/11336/256470
dc.description.abstract
Publicamos el conjunto de triggers utilizado en nuestro artículo de BioNLP 2016 para el algoritmo NegEx [Chapman et al], con el fin de detectar automáticamente negaciones y especulaciones en textos clínicos en español. Fue generado como parte de la Tesis de Grado de Vanesa Stricker, dirigida por mí (Viviana Cotik). A continuación, explicamos brevemente la creación del conjunto de datos, los cambios que deben aplicarse a NegEx para utilizar este conjunto de datos y compartimos los enlaces para descargar nuestros conjuntos de disparadores. También compartimos las publicaciones donde describimos nuestro trabajo con más detalle.
dc.rights
info:eu-repo/semantics/openAccess
dc.rights.uri
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.title
Trigger set para NegEx en español
dc.type
dataset
dc.date.updated
2025-02-26T09:24:06Z
dc.description.fil
Fil: Stricker, Vanesa. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Computación; Argentina
dc.description.fil
Fil: Cotik, Viviana Erica. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Computación; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina
dc.datacite.PublicationYear
2025
dc.datacite.Creator
Stricker, Vanesa
dc.datacite.Creator
Cotik, Viviana Erica

dc.datacite.affiliation
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Computación

dc.datacite.affiliation
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Departamento de Computación

dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas

dc.datacite.publisher
Consejo Nacional de Investigaciones Científicas y Técnicas
dc.datacite.subject
Ciencias de la Computación

dc.datacite.subject
Ciencias de la Computación e Información

dc.datacite.subject
CIENCIAS NATURALES Y EXACTAS

dc.datacite.date
12/2019-12/2020
dc.datacite.DateType
Recolectado

dc.datacite.language
spa
dc.datacite.version
1.0
dc.datacite.description
El conjunto de triggers fue creado por una hablante nativa de español, basada en una traducción al español de la versión en inglés de un conjunto de disparadores multilingüe de NegEx [Context: https://code.google.com/archive/p/negex/downloads]. Las transformaciones se describen en la siguiente tesis de Licenciatura de Vanesa Stricker (en español -https://gestion.dc.uba.ar/media/academic/grade/thesis/stricker.pdf- ) y, con menos detalle, en la siguiente de doctorado de Viviana Cotik (en inglés -https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n6477_Cotik.pdf -). A continuación, se presenta un resumen de los pasos realizados para obtener el conjunto de triggers en español: .Traducción de los términos de ConText [corpus multilingue] al español utilizando Google Translate. .Revisión y corrección de los términos traducidos. .Adición de nuevos términos en español, basados en términos existentes. .Dado que el inglés carece de género gramatical, mientras que el español tiene dos (masculino y femenino), se generaron instancias adicionales de disparadores debido a las propiedades flexivas (por ejemplo, "no" se tradujo como "ningún" y "ninguna"). .Adición de términos de uso frecuente proporcionados por un médico especialista en el dominio de la radiología. .Las etiquetas NEGEX [Chapman et al] fueron revisadas y corregidas. Se incluyó un disparador para expresar negaciones coordinadas (ni -nor-) con la etiqueta CONJN. Todo el proceso fue realizado por dos científicos de la computación que trabajan en Procesamiento del Lenguaje Natural, ambos hablantes nativos de español. Se obtuvieron dos conjuntos de disparadores: uno extendido y otro reducido. Las etiquetas NEGEX [Chapman et al] se proporcionan con cada término.
dc.datacite.DescriptionType
Información Técnica

dc.relationtype.isSourceOf
https://www.aclweb.org/anthology/W/W16/W16-2921.pdf
dc.subject.keyword
Negex
dc.subject.keyword
informes médicos en español
dc.subject.keyword
deetección de negaciones y especulaciones
dc.datacite.resourceTypeGeneral
dataset
dc.conicet.datoinvestigacionid
25100
dc.datacite.geolocation
Argentina
dc.conicet.tieneObs
true
dc.datacite.formatedDate
2019-2020
Archivos del conjunto de datos
Archivo
Notas de uso
Tamaño