Ir al contenido

CORPUS QUECHUA

De Yachaywiki

Corpus Quechua

[editar]

El corpus de YachayWiki es una colección estructurada de textos, audios y expresiones en idioma quechua, recopilados con hablantes nativos de la región Arequipa y zonas andinas del Perú.

¿Qué es un corpus lingüístico?

[editar]

Un corpus es una colección organizada de muestras de lenguaje real — textos escritos, grabaciones orales, diálogos — que sirve como base de datos para el estudio científico de una lengua y para entrenar modelos de inteligencia artificial.

Tipos de contenido en el corpus

[editar]

🎧 Corpus de audio

[editar]

Grabaciones de hablantes nativos disponibles en nuestra Biblioteca de Audio.

→ Escuchar en YouTube Music

📄 Corpus de texto

[editar]
  • Cuentos y relatos tradicionales transcriptos
  • Vocabulario temático (naturaleza, familia, comunidad, tiempo)
  • Expresiones cotidianas y frases de uso común
  • Proverbios y dichos populares en quechua

🌿 Áreas temáticas del corpus

[editar]
Área Ejemplos de contenido
Naturaleza Nombres de plantas, animales, fenómenos climáticos
Familia y comunidad Roles familiares, vida comunitaria, tradiciones
Lenguaje cotidiano Saludos, despedidas, conversaciones del día a día
Narrativa oral Cuentos, leyendas, mitos andinos
Conocimiento ancestral Agricultura, medicina tradicional, calendario andino

Estado del corpus (2025)

[editar]
  • ✅ 5 audios únicos de hablantes nativos (43 minutos)
  • ✅ Textos base validados por comunidades de Arequipa
  • 🔄 En expansión activa con nuevos colaboradores
  • 🔄 Estructuración hacia dataset descargable (Fase 2, 2026)

Cómo se valida el corpus

[editar]

Todo el contenido pasa por un proceso de validación en tres etapas:

  1. Recopilación con hablantes nativos voluntarios
  2. Revisión por docentes de Educación Intercultural Bilingüe (EIB)
  3. Publicación en la wiki con metadatos de origen y contexto

Licenciamiento

[editar]

Para uso del corpus en investigación o desarrollo de IA, contáctanos. YachayWiki trabaja con acuerdos de licencia que reconocen y compensan a las comunidades contribuyentes.