Repositorio Institucional
Repositorio Institucional
CONICET Digital
Datos de
Investigación
  • EXPLORAR
    • AUTORES
    • DISCIPLINAS
    • COMUNIDADES
    • TODO
  • Ayuda
    • Qué son y qué no son los Datos de Investigación
    • Cómo obtener un DOI/Handle
    • Cómo reutilizar y citar los Datos de Investigación
    • Preguntas frecuentes | FAQs
    • Contacto
  • Novedades
    • Noticias
    • Boletines
  • Acerca de
JavaScript is disabled for your browser. Some features of this site may not work without it.
  • METADATOS
  • CONDICIONES DE USO
  • ARCHIVOS
  • ITEMS RELACIONADOS
  • ESTADISTICAS
 
 
Datos de investigación

Corpus de estímulos para prueba perceptual de identificación de consonantes

Autores: Torres, Humberto MaximilianoIcon ; Güemes, María MercedesIcon ; Gurlekian, Jorge AlbertoIcon
Publicador: Consejo Nacional de Investigaciones Científicas y Técnicas
Fecha de depósito: 01/07/2025
Fecha de creación: 01/03/2023-30/06/2025
Clasificación temática:
Otras Ingenierías y Tecnologías

Resumen

Este corpus de datos se construyó con el objetivo de realizar pruebas perceptuales de identificación de consonantes. Los estímulos consistentes en logatomos vocal-consonante-vocal (VCV), presentados bajo diversas condiciones experimentales, incluyendo contaminación de señales acústicas y alteración de propiedades temporales. Las señales de audio de los estímulos se extrajeron del corpus utilizado en Torres et al. (2021), que consiste en un conjunto de oraciones especialmente construidas para el estudio de perturbaciones del contorno de F0 asociadas a las realizaciones de las consonantes. Los estímulos consisten en secuencias VCV que presentan el fono [a] como contexto vocálico y consonantes variables, incluyendo [β, ð, ɤ, ʧ, ʓ, f, k, p, s, t, x]. Cada logatomo VCV se integró originalmente en un contexto SVCVS, donde S es uno de los fonemas [a, e, i, o, u, j, \omega, m, n, l], para garantizar la continuidad del contorno de F0. Además, se requirieron tres contextos de acentuación léxica con respecto a la sílaba que contiene la consonante (C): átona; tónica; y sílaba siguiente a la tónica, para lograr tres pendientes en el contorno F0: plana; ascendente; y descendente, respectivamente. Para cada uno de los tres patrones, se extrajeron tres muestras de las oraciones del corpus, lo que produjo nueve muestras para cada consonante (C). Los bordes de los segmentos de audio extraídos se refinaron utilizando una media ventana de Hamming de 30 ms para garantizar transiciones más suaves. Las oraciones portadoras de estímulos se procesaron para generar estímulos sin perturbaciones del contorno F0 antes de la extracción del segmento de audio. Se estimó el contorno F0 de las oraciones originales y, posteriormente, se utilizó el algoritmo descrito en Torres et al. (2021) para generar un nuevo contorno F0 sin las perturbaciones. Finalmente, se utilizó el programa Praat con valores de opción predeterminados para reemplazar el contorno F0 mediante resíntesis. Para mitigar los posibles efectos de este proceso, también se resintetizaron las oraciones originales. Se generaron dos subconjuntos adicionales a partir del conjunto de estímulos inicial para considerar las condiciones perceptuales adversas: enmascaramiento de ruido y alteración acústica del estímulo original. Para generar el primero, se añadió ruido de habla modulado (MSSN) con tres niveles de relación señal-ruido (SNR): 0 dB (MSSN 0 dB), 5 dB (MSSN 5 dB) y 10 dB (MSSN 10 dB), siguiendo el algoritmo descrito en Gurlekian et al. (2008). Para generar el segundo conjunto de estímulos en condiciones desfavorables, se incrementó la velocidad del habla en un 10 % (Vel. x 10), un 30 % (Vel. x 30) y un 50 % (Vel. x 50) en comparación con el original. Para este último, se utilizó el programa Praat. El corpus de estímulos generado consta de 1386 elementos: 11 consonantes, cada una representada por 3 muestras, con 2 condiciones de perturbación de contorno F0 y 3 condiciones de pendiente de contorno F0, considerando el valor original de 1, los niveles de ruido de la relación señal-ruido de 3 y la velocidad de habla de 3. El software y las instrucciones para ejecutar estas pruebas de escucha están disponibles a través de los autores. Gurlekian, J. A., Babnik, E., & Torres, H. M. (2008). Desarrollo de una prueba de inteligibilidad de habla en ambientes ruidosos para niños en edad escolar. Rev. Logop. Foniatr. Audiol., 28(3), 138–148, https://doi.org/10.1016/S0214-4603(08)70052-4 Torres, H. M., Güemes, M., Gurlekian, J. A., & Evin, D. A. (2021). F0 perturbation due to articulatory movements: Filtering, characterization and applications. IEEE ACM Trans. Audio Speech Lang. Process., 29, 1977–1986, https://doi.org/10.1109/TASLP.2021.3082671

Otro

El corpus consiste en de archivos de audio de logatomos vocal-consonante-vocal (VCV), presentados bajo diversas condiciones experimentales, incluyendo contaminación de señales acústicas y alteración de propiedades temporales, con las grabaciones con y sin las perturbaciones del contorno de F0 filtradas.
Palabras clave: CORPUS DE HABLA, IDENTIFICACIÓN PERCEPTUAL DE CONSONANTES, PERTURBACIONES DEL CONTORNO DE F0, PHONÉTICA
Alcance geográfico
.

Alcance geográfico

.
Identificador del recurso
URI: http://hdl.handle.net/11336/264880
Colecciones
Datos de Investigación(INIGEM)
Datos de Investigación de INSTITUTO DE INMUNOLOGIA, GENETICA Y METABOLISMO
Datos de Investigación(SEDE CENTRAL)
Datos de Investigación de SEDE CENTRAL
Citación
Torres, Humberto Maximiliano; Güemes, María Mercedes; Gurlekian, Jorge Alberto; (2025): Corpus de estímulos para prueba perceptual de identificación de consonantes. Consejo Nacional de Investigaciones Científicas y Técnicas. (dataset). http://hdl.handle.net/11336/264880
Condiciones de uso
Las buenas prácticas científicas esperan que se otorgue el crédito adecuado mediante una citación. Utilice un formato de citación y aplique estas normas de reutilización.
info:eu-repo/semantics/openAccess
Excepto donde se diga explícitamente, este item se publica bajo la siguiente descripción: Creative Commons Attribution-NonCommercial-ShareAlike 2.5 Unported (CC BY-NC-SA 2.5)
Compartir
Archivos del conjunto de datos
Archivo
Notas de uso
Tamaño
 
Datos.rar
  Más
7.974Mb
  Descarga
 
 
Descargar todo
  Descargar solo metadatos (JSON)   Descargar solo metadatos (XML)
 
Preparando la descarga
 

Ver el registro completo

Enviar por e-mail
Separar cada destinatario (hasta 5) con punto y coma.
  • Facebook
  • X Conicet Digital
  • Instagram
  • YouTube
  • Sound Cloud
  • LinkedIn

Los contenidos del CONICET están licenciados bajo Creative Commons Reconocimiento 2.5 Argentina License

https://www.conicet.gov.ar/ - CONICET

Explorar

  • Autores
  • Disciplinas
  • Comunidades
  • Todo

Ayuda

  • Qué son y qué no son los Datos de Investigación
  • Cómo obtener un DOI/Handle
  • Cómo reutilizar y citar los Datos de Investigación
  • Preguntas frecuentes | FAQs
  • Contacto

Novedades

  • Noticias
  • Boletines

Acerca de

Godoy Cruz 2290 (C1425FQB) CABA – República Argentina – Tel: +5411 4899-5400 repositorio@conicet.gov.ar
TÉRMINOS Y CONDICIONES