Repositorio Institucional
Repositorio Institucional
CONICET Digital
Datos de
Investigación
  • EXPLORAR
    • AUTORES
    • DISCIPLINAS
    • COMUNIDADES
    • TODO
  • Ayuda
    • Qué son y qué no son los Datos de Investigación
    • Cómo obtener un DOI/Handle
    • Cómo reutilizar y citar los Datos de Investigación
    • Preguntas frecuentes | FAQs
    • Contacto
  • Novedades
    • Noticias
    • Boletines
  • Acerca de
JavaScript is disabled for your browser. Some features of this site may not work without it.
  • METADATOS
  • CONDICIONES DE USO
  • ARCHIVOS
  • ITEMS RELACIONADOS
  • ESTADISTICAS
 
 
Datos de investigación

G20 dataset: tweets, queries and relevant phrases

Autores: Soto, Axel JuanIcon ; Delbianco, Fernando AndrésIcon ; Fonseca, Mauro; Maguitman, Ana GabrielaIcon
Publicador: Consejo Nacional de Investigaciones Científicas y Técnicas
Fecha de depósito: 25/01/2023
Fecha de recolección: 01/11/2018-30/03/2021
Clasificación temática:
Ciencias de la Computación; Ciencia Política

Resumen

Multi-year dataset with tweets ids (49,030,053) related to different G20 editions and the posts from and to the main politicians from the participating countries of the G20 summit. We crawled tweets at three main times: late 2018 (November and December), early 2020 and early 2021 (February and March). Each year we filtered tweets that had any of the most frequently used hashtags related to the G20 summit. For instance, in 2018 we used: "#g20'", "#g20summit'' and "#g20argentina". Also, we included the official and personal user handles of all presidents or prime ministers (or the corresponding official channel for the presidency, e.g. "@WhiteHouse") from all countries participating in the G20 summits. We collected tweets posted by those user handles and tweets mentioning any of the monitored accounts. Every year the strategy for filtering stayed the same, except for the list of presidents and prime ministers, which was updated accordingly. Also, the list of hashtags was updated to reflect the hashtags of the corresponding year. The exact list of users and keywords used each year is provided as research data.

Tabla de contenidos

The shared research data include the following files: - G20UsersAndKeywords.txt: list of users and keywords used each year to filter tweets related to different editions of the G20 summit. - FullTextHighlighted.pdf: G20 outcome documents with relevant phrases highlighted by an expert with a background in international politics. The outcome documents are the following: - https://www.gov.za/speech-subjects/g20 - https://www.mofa.go.jp/policy/economy/g20_summit/index.html - https://g20.argentina.gob.ar/en/ministerial-declarations-and-communiques - ExpertPhrasesByTopic.txt: list of expert-selected phrases related to four main G20 recurring topics (government, society, environment & health and economics). - ElastichsearchQueries2018.txt: topic-based queries (with Elasticsearch syntax) generated from expert-selected phrases for year 2018. - ElastichsearchQueries2020.txt: idem for year 2020. - ElastichsearchQueries2021.txt: idem for year 2021. - tweetIds.zip: list of tweet ids corresponding to the 49,030,053 collected tweets related to the G20 discussion.
Palabras clave: TWEETS, G20, INTERNATIONAL POLITICS
Previsualización destacada
Identificador del recurso
URI: http://hdl.handle.net/11336/185534
Colecciones
Datos de Investigación(CCT - BAHIA BLANCA)
Datos de Investigación de CTRO.CIENTIFICO TECNOL.CONICET - BAHIA BLANCA
Datos de Investigación(INMABB)
Datos de Investigación de INST.DE MATEMATICA BAHIA BLANCA (I)
Citación
Soto, Axel Juan; Delbianco, Fernando Andrés; Fonseca, Mauro; Maguitman, Ana Gabriela; (2023): G20 dataset: tweets, queries and relevant phrases. Consejo Nacional de Investigaciones Científicas y Técnicas. (dataset). http://hdl.handle.net/11336/185534
Condiciones de uso
Las buenas prácticas científicas esperan que se otorgue el crédito adecuado mediante una citación. Utilice un formato de citación y aplique estas normas de reutilización.
info:eu-repo/semantics/openAccess
Excepto donde se diga explícitamente, este item se publica bajo la siguiente descripción: Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Unported (CC BY-NC-SA 2.5)
Compartir
Archivos del conjunto de datos
Archivo
Notas de uso
Tamaño
 
assessing-causality-G20-supplementary-material-and-data.zip
  Más
365.9Mb
  Descarga
 
 
Descargar todo
  Descargar solo metadatos (JSON)   Descargar solo metadatos (XML)
 
Preparando la descarga
 

Ver el registro completo

Enviar por e-mail
Separar cada destinatario (hasta 5) con punto y coma.
  • Facebook
  • X Conicet Digital
  • Instagram
  • YouTube
  • Sound Cloud
  • LinkedIn

Los contenidos del CONICET están licenciados bajo Creative Commons Reconocimiento 2.5 Argentina License

https://www.conicet.gov.ar/ - CONICET

Explorar

  • Autores
  • Disciplinas
  • Comunidades
  • Todo

Ayuda

  • Qué son y qué no son los Datos de Investigación
  • Cómo obtener un DOI/Handle
  • Cómo reutilizar y citar los Datos de Investigación
  • Preguntas frecuentes | FAQs
  • Contacto

Novedades

  • Noticias
  • Boletines

Acerca de

Godoy Cruz 2290 (C1425FQB) CABA – República Argentina – Tel: +5411 4899-5400 repositorio@conicet.gov.ar
TÉRMINOS Y CONDICIONES