Mostrar el registro sencillo del ítem

dc.date.available
2024-05-16T12:56:29Z  
dc.identifier.citation
Pérez, Juan Manuel; Cotik, Viviana Erica; Luque, Franco Martín; Moro, Agustín; Serrati, Pablo Santiago; Miguel, Paula Gabriela; Debandi, Natalia; Gravano, Agustin; (2024): Contextualized Hate Speech. Consejo Nacional de Investigaciones Científicas y Técnicas. (dataset). http://hdl.handle.net/11336/235509  
dc.identifier.uri
http://hdl.handle.net/11336/235509  
dc.description.abstract
Resultados de un estudio sobre detección del discurso de odio en redes sociales, desde una perspectiva interdisciplinaria, abordando el discurso de odio tanto cuantitativa como cualitativamente, durante el marco temporal de la pandemia de COVID-19. Se construyó un corpus original en la variante "rioplatense" del español centrado en el discurso de odio asociado a la pandemia de COVID-19. Una muestra de este corpus fue anotada manualmente utilizando pautas cuidadosamente diseñadas. Los experimentos de clasificación realizados, utilizando técnicas de aprendizaje automático basadas en transformadores de última generación muestran evidencia de que agregar información contextual mejora el rendimiento de la detección del discurso de odio para dos tareas propuestas: predicción binaria y de múltiples etiquetas, aumentando su Macro F1 en 4,2 y 5,5. puntos, respectivamente. Estos resultados resaltan la importancia del uso de información contextual en la detección del discurso de odio, en este caso las noticias que dieron lugar a los comantarios en la red social Twitter. Código, modelos y corpus están disponibles para futuras investigaciones.  
dc.rights
info:eu-repo/semantics/openAccess  
dc.rights.uri
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/  
dc.title
Contextualized Hate Speech  
dc.type
dataset  
dc.date.updated
2024-05-16T12:49:55Z  
dc.description.fil
Fil: Pérez, Juan Manuel. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Investigación en Ciencias de la Computación. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Investigación en Ciencias de la Computación; Argentina  
dc.description.fil
Fil: Cotik, Viviana Erica. Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Investigación en Ciencias de la Computación. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Investigación en Ciencias de la Computación; Argentina  
dc.description.fil
Fil: Luque, Franco Martín. Universidad Nacional de Córdoba; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina  
dc.description.fil
Fil: Moro, Agustín. Universidad Nacional del Centro de la Provincia de Buenos Aires; Argentina  
dc.description.fil
Fil: Serrati, Pablo Santiago. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina. Universidad de Buenos Aires; Argentina  
dc.description.fil
Fil: Miguel, Paula Gabriela. Universidad de Buenos Aires; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina  
dc.description.fil
Fil: Debandi, Natalia. Universidad Nacional de Río Negro; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina  
dc.description.fil
Fil: Gravano, Agustin. Universidad Torcuato Di Tella; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina  
dc.datacite.PublicationYear
2024  
dc.datacite.Creator
Pérez, Juan Manuel  
dc.datacite.Creator
Cotik, Viviana Erica  
dc.datacite.Creator
Luque, Franco Martín  
dc.datacite.Creator
Moro, Agustín  
dc.datacite.Creator
Serrati, Pablo Santiago  
dc.datacite.Creator
Miguel, Paula Gabriela  
dc.datacite.Creator
Debandi, Natalia  
dc.datacite.Creator
Gravano, Agustin  
dc.datacite.Creator
Zayat, Demian  
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Investigación en Ciencias de la Computación. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Investigación en Ciencias de la Computación  
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Oficina de Coordinación Administrativa Ciudad Universitaria. Instituto de Investigación en Ciencias de la Computación. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Investigación en Ciencias de la Computación  
dc.datacite.affiliation
Universidad Nacional de Córdoba  
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas  
dc.datacite.affiliation
Universidad Nacional del Centro de la Provincia de Buenos Aires  
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas  
dc.datacite.affiliation
Universidad de Buenos Aires  
dc.datacite.affiliation
Universidad de Buenos Aires  
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas  
dc.datacite.affiliation
Universidad Nacional de Río Negro  
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas  
dc.datacite.affiliation
Universidad Torcuato Di Tella  
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas  
dc.datacite.affiliation
Universidad de Buenos Aires  
dc.datacite.publisher
Consejo Nacional de Investigaciones Científicas y Técnicas  
dc.datacite.subject
Ciencias de la Computación  
dc.datacite.date
01/03/2020-31/05/2021  
dc.datacite.DateType
Recolectado  
dc.datacite.language
spa  
dc.datacite.AlternateIdentifierType
info:eu-repo/semantics/altIdentifier/url/https://huggingface.co/piuba-bigdata  
dc.datacite.version
1.0  
dc.datacite.description
Este conjunto de datos es una colección de tweets que se publicaron en respuesta a artículos de cinco medios de comunicación argentinos específicos: Clarín, Infobae, La Nación, Perfil y Crónica, durante 2020-2021. Los comentarios fueron analizados en busca de discurso de odio contra ocho grupos o características diferentes: contra las mujeres, contenido racista, odio de clase, contra personas LGBTQ+, contra la apariencia física, contra personas con discapacidad, contra delincuentes y por razones políticas. Todos los datos están en catellano rioplatense. Cada comentario está etiquetado con las siguientes variables. Descripción de la etiqueta HATEFUL ¿Contiene discurso de odio (HS)? WOMEN ¿Esto va en contra de las mujeres? LGBTI ¿Esto va en contra de las personas LGBTI? RACISM ¿Es este un mensaje racista? CLASS ¿Es este un mensaje clasista? POLITICS ¿Este HS se debe a ideología política? DISABLED ¿Este HS está dirigido a personas discapacitadas? APPEARANCE ¿Este HS va contra las personas por su apariencia? (por ejemplo, avergonzar a la grasa) CRIMINAL ¿Este HS es contra delincuentes o personas en conflicto con la ley? Hay una etiqueta adicional CALLS, que representa si un comentario es un llamado a la acción violenta o no. Si el mensaje es odioso, ¿este mensaje llama a la acción (posiblemente violenta)? Las etiquetas HATEFUL y CALLS se binarizan por mayoría simple; las variables de característica o categoría se ponen en 1 si al menos un anotador las marcó como tal.  
dc.datacite.DescriptionType
Información Técnica  
dc.datacite.FundingReference
PIUBA_2020_3  
dc.datacite.FundingReference
PIUBA_2022_04_02  
dc.datacite.FunderName
Universidad de Buenos Aires  
dc.datacite.FunderName
Universidad de Buenos Aires  
dc.relationtype.isSourceOf
https://ri.conicet.gov.ar/handle/11336/219319  
dc.relationtype.isSourceOf
https://openreview.net/group?id=EMNLP/2020/Workshop/NLP-COVID  
dc.subject.keyword
NLP  
dc.subject.keyword
CLASIFICACIÓN DE TEXTO  
dc.subject.keyword
DETECCIÓN DE DISCURSO DE ODIO  
dc.subject.keyword
CORPUS ANOTADO EN ESPAÑOL  
dc.datacite.resourceTypeGeneral
dataset  
dc.conicet.datoinvestigacionid
16350  
dc.datacite.awardTitle
Big Data y marginaciones sociales. Coordinadora: Viviana Cotik  
dc.datacite.awardTitle
Big Data y marginaciones sociales: medios digitales y discursos de odio en redes sociales. Coordinadora: Viviana Cotik / Co-Coordinadora: Paula Miguel  
dc.datacite.geolocation
Argentina  
dc.datacite.formatedDate
2020-2021