Repositorio Institucional
Repositorio Institucional
CONICET Digital
Datos de
Investigación
  • EXPLORAR
    • AUTORES
    • DISCIPLINAS
    • COMUNIDADES
    • TODO
  • Ayuda
    • Qué son y qué no son los Datos de Investigación
    • Cómo obtener un DOI/Handle
    • Cómo reutilizar y citar los Datos de Investigación
    • Preguntas frecuentes | FAQs
    • Contacto
  • Novedades
    • Noticias
    • Boletines
  • Acerca de
JavaScript is disabled for your browser. Some features of this site may not work without it.
  • METADATOS
  • CONDICIONES DE USO
  • ARCHIVOS
  • ITEMS RELACIONADOS
  • ESTADISTICAS
 
 
Datos de investigación

Trigger set para NegEx en español

Autores: Stricker, Vanesa; Cotik, Viviana EricaIcon
Publicador: Consejo Nacional de Investigaciones Científicas y Técnicas
Fecha de depósito: 18/03/2025
Fecha de recolección: 12/2019-12/2020
Clasificación temática:
Ciencias de la Computación

Resumen

Publicamos el conjunto de triggers utilizado en nuestro artículo de BioNLP 2016 para el algoritmo NegEx [Chapman et al], con el fin de detectar automáticamente negaciones y especulaciones en textos clínicos en español. Fue generado como parte de la Tesis de Grado de Vanesa Stricker, dirigida por mí (Viviana Cotik). A continuación, explicamos brevemente la creación del conjunto de datos, los cambios que deben aplicarse a NegEx para utilizar este conjunto de datos y compartimos los enlaces para descargar nuestros conjuntos de disparadores. También compartimos las publicaciones donde describimos nuestro trabajo con más detalle.

Información Técnica

El conjunto de triggers fue creado por una hablante nativa de español, basada en una traducción al español de la versión en inglés de un conjunto de disparadores multilingüe de NegEx [Context: https://code.google.com/archive/p/negex/downloads]. Las transformaciones se describen en la siguiente tesis de Licenciatura de Vanesa Stricker (en español -https://gestion.dc.uba.ar/media/academic/grade/thesis/stricker.pdf- ) y, con menos detalle, en la siguiente de doctorado de Viviana Cotik (en inglés -https://bibliotecadigital.exactas.uba.ar/download/tesis/tesis_n6477_Cotik.pdf -). A continuación, se presenta un resumen de los pasos realizados para obtener el conjunto de triggers en español: .Traducción de los términos de ConText [corpus multilingue] al español utilizando Google Translate. .Revisión y corrección de los términos traducidos. .Adición de nuevos términos en español, basados en términos existentes. .Dado que el inglés carece de género gramatical, mientras que el español tiene dos (masculino y femenino), se generaron instancias adicionales de disparadores debido a las propiedades flexivas (por ejemplo, "no" se tradujo como "ningún" y "ninguna"). .Adición de términos de uso frecuente proporcionados por un médico especialista en el dominio de la radiología. .Las etiquetas NEGEX [Chapman et al] fueron revisadas y corregidas. Se incluyó un disparador para expresar negaciones coordinadas (ni -nor-) con la etiqueta CONJN. Todo el proceso fue realizado por dos científicos de la computación que trabajan en Procesamiento del Lenguaje Natural, ambos hablantes nativos de español. Se obtuvieron dos conjuntos de disparadores: uno extendido y otro reducido. Las etiquetas NEGEX [Chapman et al] se proporcionan con cada término.
Palabras clave: Negex, informes médicos en español, deetección de negaciones y especulaciones
Alcance geográfico
.

Alcance geográfico

.
Identificador del recurso
URI: http://hdl.handle.net/11336/256470
Colecciones
Datos de Investigación(OCA CIUDAD UNIVERSITARIA)
Datos de Investigación de OFICINA DE COORDINACION ADMINISTRATIVA CIUDAD UNIVERSITARIA
Citación
Stricker, Vanesa; Cotik, Viviana Erica; (2025): Trigger set para NegEx en español. Consejo Nacional de Investigaciones Científicas y Técnicas. (dataset). http://hdl.handle.net/11336/256470
Condiciones de uso
Las buenas prácticas científicas esperan que se otorgue el crédito adecuado mediante una citación. Utilice un formato de citación y aplique estas normas de reutilización.
info:eu-repo/semantics/openAccess
Excepto donde se diga explícitamente, este item se publica bajo la siguiente descripción: Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Unported (CC BY-NC-SA 2.5)
Compartir
Archivos del conjunto de datos
Archivo
Notas de uso
Tamaño
 
NEGEX.zip
  Más
84.55Kb
  Descarga
NEXEG_extended_Trigger_Set_-_Hoja_1.csv
  Más
8.409Kb
  Descarga
NEGEX_reduced_trigger_set_-_Hoja_1.csv
  Más
235bytes
  Descarga
 
 
Descargar todo
  Descargar solo metadatos (JSON)   Descargar solo metadatos (XML)
 
Preparando la descarga
 

Ver el registro completo

Publicaciones relacionadas

  • Syntactic methods for negation detection in radiology reports in Spanish

Enviar por e-mail
Separar cada destinatario (hasta 5) con punto y coma.
  • Facebook
  • X Conicet Digital
  • Instagram
  • YouTube
  • Sound Cloud
  • LinkedIn

Los contenidos del CONICET están licenciados bajo Creative Commons Reconocimiento 2.5 Argentina License

https://www.conicet.gov.ar/ - CONICET

Explorar

  • Autores
  • Disciplinas
  • Comunidades
  • Todo

Ayuda

  • Qué son y qué no son los Datos de Investigación
  • Cómo obtener un DOI/Handle
  • Cómo reutilizar y citar los Datos de Investigación
  • Preguntas frecuentes | FAQs
  • Contacto

Novedades

  • Noticias
  • Boletines

Acerca de

Godoy Cruz 2290 (C1425FQB) CABA – República Argentina – Tel: +5411 4899-5400 repositorio@conicet.gov.ar
TÉRMINOS Y CONDICIONES