CORPUS QUECHUA
Apariencia
Corpus Quechua
[editar]El corpus de YachayWiki es una colección estructurada de textos, audios y expresiones en idioma quechua, recopilados con hablantes nativos de la región Arequipa y zonas andinas del Perú.
¿Qué es un corpus lingüístico?
[editar]Un corpus es una colección organizada de muestras de lenguaje real — textos escritos, grabaciones orales, diálogos — que sirve como base de datos para el estudio científico de una lengua y para entrenar modelos de inteligencia artificial.
Tipos de contenido en el corpus
[editar]🎧 Corpus de audio
[editar]Grabaciones de hablantes nativos disponibles en nuestra Biblioteca de Audio.
📄 Corpus de texto
[editar]- Cuentos y relatos tradicionales transcriptos
- Vocabulario temático (naturaleza, familia, comunidad, tiempo)
- Expresiones cotidianas y frases de uso común
- Proverbios y dichos populares en quechua
🌿 Áreas temáticas del corpus
[editar]| Área | Ejemplos de contenido |
|---|---|
| Naturaleza | Nombres de plantas, animales, fenómenos climáticos |
| Familia y comunidad | Roles familiares, vida comunitaria, tradiciones |
| Lenguaje cotidiano | Saludos, despedidas, conversaciones del día a día |
| Narrativa oral | Cuentos, leyendas, mitos andinos |
| Conocimiento ancestral | Agricultura, medicina tradicional, calendario andino |
Estado del corpus (2025)
[editar]- ✅ 5 audios únicos de hablantes nativos (43 minutos)
- ✅ Textos base validados por comunidades de Arequipa
- 🔄 En expansión activa con nuevos colaboradores
- 🔄 Estructuración hacia dataset descargable (Fase 2, 2026)
Cómo se valida el corpus
[editar]Todo el contenido pasa por un proceso de validación en tres etapas:
- Recopilación con hablantes nativos voluntarios
- Revisión por docentes de Educación Intercultural Bilingüe (EIB)
- Publicación en la wiki con metadatos de origen y contexto
Licenciamiento
[editar]Para uso del corpus en investigación o desarrollo de IA, contáctanos. YachayWiki trabaja con acuerdos de licencia que reconocen y compensan a las comunidades contribuyentes.