el corpus del español


Los corpus
Nueva interfaz
Tamaño
Comparar con otros corpus
   CORPES (RAE)
   Corpus más grandes
Otros recursos
Investigadores

Problemas (en inglés)
Contactar




Hay varios recursos creados a partir de la antigua versión del Corpus del Español (publicado en 2001), como por ejemplo:

El antiguo Corpus del Español era bastante pequeño (solo 20 millones de palabras para el siglo XX), por lo que muchos de los recursos que hemos creado para el inglés no podían elaborarse para el español hasta que no existiera un corpus mucho mayor. Con el nuevo corpus de dos mil millones de palabras, podemos crear muchos de estos recursos, que incluirán:

  • Datos con textos completos, lo que significa que el usuario tendría acceso a casi dos mil millones de palabras en su equipo

  • Datos actualizados similares a los datos de frecuencias de palabras, colocados, y y n-gramas data (con los primeros 40 000 lemas en español)

  • WordAndPhrase para el español, que permitirá explorar los primeros 40 000 lemas para ver información de frecuencia, definiciones, colocados, concordancias y sinónimos (todos en una misma página). Además, el usuario también podrá introducir sus propios textos y analizarlas con los datos del corpus (disponible en verano de 2017)