Mostrar el registro sencillo del ítem
dc.date.available
2023-01-25T14:32:14Z
dc.identifier.citation
Soto, Axel Juan; Delbianco, Fernando Andrés; Fonseca, Mauro; Maguitman, Ana Gabriela; (2023): G20 dataset: tweets, queries and relevant phrases. Consejo Nacional de Investigaciones Científicas y Técnicas. (dataset). http://hdl.handle.net/11336/185534
dc.identifier.uri
http://hdl.handle.net/11336/185534
dc.description.abstract
Multi-year dataset with tweets ids (49,030,053) related to different G20 editions and the posts from and to the main politicians from the participating countries of the G20 summit. We crawled tweets at three main times: late 2018 (November and December), early 2020 and early 2021 (February and March). Each year we filtered tweets that had any of the most frequently used hashtags related to the G20 summit. For instance, in 2018 we used: "#g20'", "#g20summit'' and "#g20argentina". Also, we included the official and personal user handles of all presidents or prime ministers (or the corresponding official channel for the presidency, e.g. "@WhiteHouse") from all countries participating in the G20 summits. We collected tweets posted by those user handles and tweets mentioning any of the monitored accounts. Every year the strategy for filtering stayed the same, except for the list of presidents and prime ministers, which was updated accordingly. Also, the list of hashtags was updated to reflect the hashtags of the corresponding year. The exact list of users and keywords used each year is provided as research data.
dc.rights
info:eu-repo/semantics/openAccess
dc.rights.uri
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.title
G20 dataset: tweets, queries and relevant phrases
dc.type
dataset
dc.date.updated
2023-01-24T20:16:47Z
dc.description.fil
Fil: Soto, Axel Juan. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca; Argentina
dc.description.fil
Fil: Delbianco, Fernando Andrés. Universidad Nacional del Sur. Departamento de Economía; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Matemática Bahía Blanca. Universidad Nacional del Sur. Departamento de Matemática. Instituto de Matemática Bahía Blanca; Argentina
dc.description.fil
Fil: Fonseca, Mauro. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación; Argentina
dc.description.fil
Fil: Maguitman, Ana Gabriela. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca; Argentina
dc.datacite.PublicationYear
2023
dc.datacite.Creator
Soto, Axel Juan
dc.datacite.Creator
Delbianco, Fernando Andrés
dc.datacite.Creator
Fonseca, Mauro
dc.datacite.Creator
Maguitman, Ana Gabriela
dc.datacite.affiliation
Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca
dc.datacite.affiliation
Universidad Nacional del Sur. Departamento de Economía
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Matemática Bahía Blanca. Universidad Nacional del Sur. Departamento de Matemática. Instituto de Matemática Bahía Blanca
dc.datacite.affiliation
Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación
dc.datacite.affiliation
Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca
dc.datacite.publisher
Consejo Nacional de Investigaciones Científicas y Técnicas
dc.datacite.subject
Ciencias de la Computación
dc.datacite.subject
Ciencias de la Computación e Información
dc.datacite.subject
CIENCIAS NATURALES Y EXACTAS
dc.datacite.subject
Ciencia Política
dc.datacite.subject
Ciencia Política
dc.datacite.subject
CIENCIAS SOCIALES
dc.datacite.date
01/11/2018-30/03/2021
dc.datacite.DateType
Recolectado
dc.datacite.language
eng
dc.datacite.version
1.0
dc.datacite.description
The shared research data include the following files: - G20UsersAndKeywords.txt: list of users and keywords used each year to filter tweets related to different editions of the G20 summit. - FullTextHighlighted.pdf: G20 outcome documents with relevant phrases highlighted by an expert with a background in international politics. The outcome documents are the following: - https://www.gov.za/speech-subjects/g20 - https://www.mofa.go.jp/policy/economy/g20_summit/index.html - https://g20.argentina.gob.ar/en/ministerial-declarations-and-communiques - ExpertPhrasesByTopic.txt: list of expert-selected phrases related to four main G20 recurring topics (government, society, environment & health and economics). - ElastichsearchQueries2018.txt: topic-based queries (with Elasticsearch syntax) generated from expert-selected phrases for year 2018. - ElastichsearchQueries2020.txt: idem for year 2020. - ElastichsearchQueries2021.txt: idem for year 2021. - tweetIds.zip: list of tweet ids corresponding to the 49,030,053 collected tweets related to the G20 discussion.
dc.datacite.DescriptionType
Tabla de contenidos
dc.subject.keyword
TWEETS
dc.subject.keyword
G20
dc.subject.keyword
INTERNATIONAL POLITICS
dc.datacite.resourceTypeGeneral
dataset
dc.conicet.datoinvestigacionid
2301
dc.conicet.justificacion
Tweets relevant to G20 without geolocation filtering.
dc.datacite.formatedDate
2018-2021
Archivos del conjunto de datos
Archivo
Notas de uso
Tamaño