Mostrar el registro sencillo del ítem
dc.date.available
2022-08-04T19:59:43Z
dc.identifier.citation
Martínez, María Jimena; Sabando, María Virginia; Soto, Axel Juan; Roca Magadán, Carlos; Requena Triguero, Carlos; Campillo Martín, Nuria Eugenia; Páez, Juan A.; Ponzoni, Ignacio; (2022): Ames Mutagenicity Dataset. Consejo Nacional de Investigaciones Científicas y Técnicas. (dataset). http://hdl.handle.net/11336/164306
dc.identifier.uri
http://hdl.handle.net/11336/164306
dc.description.abstract
El dataset contiene 5536 compuestos moleculares representados por su código SMILES y 1360 descriptores moleculares calculados con Mordred. Además, contiene las respectivas etiquetas para cada compuesto (1: mutagénico / 0: no mutagénico) para cada una de las cinco cepas (TA98, TA100, TA102, TA1535, TA1537) y una etiqueta general (Overall) que corresponde a la etiqueta de consenso utilizada para evaluar la predicción final del test de Ames. Los compuestos fueron compilados originalmente por el Istituto Superiore di Sanita’ (https://www.iss.it/isstox) y son el resultado de una etapa de preprocesamiento exhaustiva, que consta de diferentes pasos de filtrado, limpieza y canonicalización.
dc.rights
info:eu-repo/semantics/openAccess
dc.rights.uri
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/
dc.title
Ames Mutagenicity Dataset
dc.type
dataset
dc.date.updated
2022-08-04T19:40:33Z
dc.description.fil
Fil: Martínez, María Jimena. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Instituto Superior de Ingeniería del Software. Universidad Nacional del Centro de la Provincia de Buenos Aires. Instituto Superior de Ingeniería del Software; Argentina
dc.description.fil
Fil: Sabando, María Virginia. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; Argentina
dc.description.fil
Fil: Soto, Axel Juan. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; Argentina
dc.description.fil
Fil: Roca Magadán, Carlos. Consejo Superior de Investigaciones Científicas. Centro de Investigaciones Biológicas Margarita Salas; España
dc.description.fil
Fil: Requena Triguero, Carlos. Consejo Superior de Investigaciones Científicas. Centro de Investigaciones Biológicas Margarita Salas; España
dc.description.fil
Fil: Campillo Martín, Nuria Eugenia. Consejo Superior de Investigaciones Científicas. Centro de Investigaciones Biológicas Margarita Salas; España
dc.description.fil
Fil: Páez, Juan A.. Consejo Superior de Investigaciones Científicas. Instituto de Química Médica; España
dc.description.fil
Fil: Ponzoni, Ignacio. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación; Argentina
dc.datacite.PublicationYear
2022
dc.datacite.Creator
Martínez, María Jimena
dc.datacite.Creator
Sabando, María Virginia
dc.datacite.Creator
Soto, Axel Juan
dc.datacite.Creator
Roca Magadán, Carlos
dc.datacite.Creator
Requena Triguero, Carlos
dc.datacite.Creator
Campillo Martín, Nuria Eugenia
dc.datacite.Creator
Páez, Juan A.
dc.datacite.Creator
Ponzoni, Ignacio
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Tandil. Instituto Superior de Ingeniería del Software. Universidad Nacional del Centro de la Provincia de Buenos Aires. Instituto Superior de Ingeniería del Software
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación
dc.datacite.affiliation
Consejo Superior de Investigaciones Científicas. Centro de Investigaciones Biológicas Margarita Salas
dc.datacite.affiliation
Consejo Superior de Investigaciones Científicas. Centro de Investigaciones Biológicas Margarita Salas
dc.datacite.affiliation
Consejo Superior de Investigaciones Científicas. Centro de Investigaciones Biológicas Margarita Salas
dc.datacite.affiliation
Consejo Superior de Investigaciones Científicas. Instituto de Química Médica
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Bahía Blanca. Instituto de Ciencias e Ingeniería de la Computación. Universidad Nacional del Sur. Departamento de Ciencias e Ingeniería de la Computación. Instituto de Ciencias e Ingeniería de la Computación
dc.datacite.publisher
Consejo Nacional de Investigaciones Científicas y Técnicas
dc.datacite.subject
Ciencias de la Información y Bioinformática
dc.datacite.date
2020
dc.datacite.DateType
Creado
dc.datacite.language
zxx
dc.datacite.AlternateIdentifierType
info:eu-repo/semantics/altIdentifier/doi/https://doi.org/10.17632/ktc6gbfsbh.1
dc.datacite.version
1.0
dc.datacite.description
El archivo .csv contiene la información necesaria para ser utilizado para tareas de modelado predictivo. Las columnas "TA98", "TA100", "TA102", "TA1535", "TA1537" corresponden a las etiquetas calculadas para cada cepa, mientras que la columna "Overall" corresponde a la etiqueta de consenso utilizada para evaluar la predicción final de mutagenicidad. La columna "Partition" muestra tres valores: "Train", "Internal" and "External", que permite identificar la partición de datos a la que cada compuesto fue asignado durante la experimentación. Todas las columnas restantes corresponden a los descriptores moleculares calculados usando Mordred.
Para más información ver el archivo "README.txt".
dc.datacite.DescriptionType
Información Técnica
dc.subject.keyword
AMES MUTAGENICITY
dc.subject.keyword
MULTI-TASK LEARNING
dc.subject.keyword
DEEP LEARNING
dc.subject.keyword
QSAR MODELING
dc.datacite.resourceTypeGeneral
dataset
dc.conicet.datoinvestigacionid
2039
dc.datacite.geolocation
Istituto Superiore di Sanità
dc.datacite.formatedDate
2020
Archivos del conjunto de datos
Archivo
Notas de uso
Tamaño