Mostrar el registro sencillo del ítem

dc.date.available
2024-09-09T12:29:45Z  
dc.identifier.citation
Alberca, Lucas Nicolás; Bellera, Carolina Leticia; Prada Gori, Denis Nihuel; Llanos, Manuel; Talevi, Alan; (2024): Datasets used in the benchmarking exercise by SOMOC and iRAPCA. Consejo Nacional de Investigaciones Científicas y Técnicas. (dataset). http://hdl.handle.net/11336/243803  
dc.identifier.uri
http://hdl.handle.net/11336/243803  
dc.description.abstract
Two open-source in-house methodologies for clustering of small molecules are presented: iterative Random subspace Principal Component Analysis clustering (iRaPCA), an iterative approach based on feature bagging, dimensionality reduction, and K-means optimization; and Silhouette Optimized Molecular Clustering (SOMoC), which combines molecular fingerprints with the Uniform Manifold Approximation and Projection (UMAP) and Gaussian Mixture Model algorithm (GMM). In a benchmarking exercise, the performance of both clustering methods has been examined across 29 datasets containing between 100 and 5000 small molecules, comparing these results with those given by two other well-known clustering methods, Ward and Butina. iRaPCA and SOMoC consistently showed the best performance across these 29 datasets, both in terms of within-cluster and between-cluster distances.  
dc.rights
info:eu-repo/semantics/openAccess  
dc.rights.uri
https://creativecommons.org/licenses/by-nc-sa/2.5/ar/  
dc.title
Datasets used in the benchmarking exercise by SOMOC and iRAPCA  
dc.type
dataset  
dc.date.updated
2024-09-09T11:06:47Z  
dc.description.fil
Fil: Alberca, Lucas Nicolás. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata; Argentina. Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos; Argentina  
dc.description.fil
Fil: Bellera, Carolina Leticia. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata; Argentina. Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos; Argentina  
dc.description.fil
Fil: Prada Gori, Denis Nihuel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata; Argentina. Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos; Argentina  
dc.description.fil
Fil: Llanos, Manuel. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata; Argentina. Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos; Argentina  
dc.description.fil
Fil: Talevi, Alan. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata; Argentina. Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos; Argentina  
dc.datacite.PublicationYear
2024  
dc.datacite.Creator
Alberca, Lucas Nicolás  
dc.datacite.Creator
Bellera, Carolina Leticia  
dc.datacite.Creator
Prada Gori, Denis Nihuel  
dc.datacite.Creator
Llanos, Manuel  
dc.datacite.Creator
Talevi, Alan  
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata  
dc.datacite.affiliation
Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos  
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata  
dc.datacite.affiliation
Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos  
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata  
dc.datacite.affiliation
Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos  
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata  
dc.datacite.affiliation
Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos  
dc.datacite.affiliation
Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - La Plata  
dc.datacite.affiliation
Universidad Nacional de La Plata. Facultad de Ciencas Exactas. Laboratorio de Investigación y Desarrollo de Bioactivos  
dc.datacite.publisher
Consejo Nacional de Investigaciones Científicas y Técnicas  
dc.datacite.subject
Otras Ciencias Químicas  
dc.datacite.subject
Ciencias Químicas  
dc.datacite.subject
CIENCIAS NATURALES Y EXACTAS  
dc.datacite.date
01/03/2021-31/07/2021  
dc.datacite.DateType
Recolectado  
dc.datacite.language
eng  
dc.datacite.version
1.0  
dc.datacite.description
The datasets were compiled from various repositories, are represented in SMILES notation and have been curated and standardized.  
dc.datacite.DescriptionType
Métodos  
dc.datacite.FundingReference
PICT-CATI-2021-00073  
dc.datacite.FundingReference
00984-2019-PICT  
dc.datacite.FunderName
Ministerio de Ciencia, Tecnología e Innovación Productiva. Agencia Nacional de Promoción Científica y Tecnológica. Fondo para la Investigación Científica y Tecnológica  
dc.datacite.FunderName
Ministerio de Ciencia, Tecnología e Innovación Productiva. Agencia Nacional de Promoción Científica y Tecnológica. Fondo para la Investigación Científica y Tecnológica  
dc.relationtype.isSourceOf
11336/223388  
dc.subject.keyword
CLUSTERING  
dc.subject.keyword
SMALL MOLECULES  
dc.subject.keyword
BENCHMARKING  
dc.subject.keyword
DATASETS  
dc.subject.keyword
CHEMINFORMATICS  
dc.subject.keyword
MEDICINAL CHEMISTRY  
dc.datacite.resourceTypeGeneral
dataset  
dc.conicet.datoinvestigacionid
20151  
dc.datacite.awardTitle
Reposicionamiento de fármacos dirigido contra la N-miristoil transferasa de Toxoplasma gondii, un nuevo blanco terapéutico contra la toxoplasmosis humana  
dc.datacite.awardTitle
Cribado fenotípico in silico aplicado a la búsqueda de alternativas terapéuticas para la enfermedad de Chagas, validación in vitro y caracterización in vivo.  
dc.datacite.geolocation
La Plata  
dc.datacite.formatedDate
2021