el corpus del español


Los corpus
Nueva interfaz
Tamaño
Comparar con otros corpus
   CORPES (RAE)
   Corpus más grandes
Otros recursos
Investigadores

Problemas (en inglés)
Contactar




Nota: esta página se refiere a los corpus de inglés de corpus.byu.edu, pero el Corpus del Español utiliza la misma nueva interfaz, puesta en funcionamiento en 2016.


En mayo de 2016 publicamos una nueva versión de los corpus BYU. A continuación mostramos los cambios más importantes en la interfaz y la arquitectura del corpus. (Algún problema?...)

1. Mejor soporte para dispositivos móviles

La interfaz anterior tenía muchos marcos, que funcionaban bien en los portátiles y los equipos de sobremesa, pero no tanto con los teléfonos móviles y las tabletas. La nueva interfaz está diseñada desde el inicio para funcionar en pantallas de cualquier tamaño. Las siguientes capturas de pantalla de un teléfono móvil son, de izquierda a derecha: la interfaz de búsqueda, la pantalla de resultados, la pantalla de KWIC (Keyword in Context, ‘palabras claves en contexto’) y KWIC expandido. La interfaz funciona aún mejor en pantallas grandes, pero lo más importante es que ahora los corpus se ven bien y funcionan bien sin importar el dispositivo que se utilice. (Nota: la antigua interfaz seguirá en línea también, al menos por ahora.)


2. Una interfaz más sencilla y limpia

El formulario de búsqueda de la interfaz anterior era un poco complejo (abajo a la izquierda). La nueva interfaz es mucho más limpia y fácil de usar (abajo a la derecha). Todas las funcionalidades siguen disponibles (la habilidad de limitar y comparar secciones del corpus, decidir cómo ordenar los datos, etc.), pero ahora estos elementos solo aparecerán cuando se necesiten.

Interfaz antigua

 

Nuevo: vista de lista simple

Nuevo: vista de colocados


3. Más archivos de ayuda útiles

Los archivos de ayuda contextuales aparecen cuando se hace clic en un elemento del formulario (lista, colocados, comparar palabras, secciones, corpus virtuales, etc.). En cada uno de estos archivos hay búsquedas de ejemplo que se pueden modificar libremente.


4. 4. Sintaxis de búsqueda más intuitiva y sencilla

En nuestra opinión, algunos sistemas de sintaxis para las búsquedas son innecesariamente complejos, como el sistema CQP a la izquierda. La antigua sintaxis de búsqueda de BYU era mucho más simple, pero aún había demasiados corchetes, puntos, asteriscos, etc., difíciles de escribir con el teclado de teléfono móvil. Hemos simplificado la sintaxis de búsqueda aún más, como se muestra a la derecha. Los usuarios pueden utilizar cualquier combinación de la antigua y la nueva sintaxis.  (Para más información, incluyendo los nuevos códigos para clases de palabras, haga clic en LIST [LISTA] en el formulario de búsqueda de un corpus y después en Part of Speech [Clase de palabra].)

Tipo de búsqueda Sintaxis CQP Sintaxis de BYU antigua Nueva sintaxis Ejemplo
Palabras [word = "nooks"] nooks nooks nooks and crannies
Lema (formas de las palabras) [lemma = "decide"] [decide] DECIDE DECIDE that it
Clase de palabra [tag = "NN."] [nn*] NOUN fast NOUN
Sinónimos No disponible [=soft] =soft soft, smooth, quiet
Listas de palabras personalizadas No disponible [emailAddress@clothes] @clothes dress, shoe, sock
Combinación de los anteriores [lemma = "end" & pos = "VV."] [end].[v*] END_v end, ends, ended, ending
Combinación de los anteriores [lemma = "eat"] [tag = "NN."] [eat] * [nn*] EAT * NOUN ate the bananas, eat some cake
Combinación de los anteriores Not possible [[emailAddress@clothes]] @CLOTHES dress, dresses, shoe, shoes
Combinación de los anteriores Not possible [[=clean]].[v*] =CLEAN_v cleans, scoured, washing
Combinación de los anteriores Not possible [wear] * [=nice] [email@clothes] WEAR * =nice @CLOTHES wore some good-looking pants


5. Corpus virtuales

A principios de 2015 añadimos la funcionalidad de crear "corpus virtuales" para el corpus de la Wikipedia. En unos segundos, los usuarios pueden crear un corpus virtual con textos relacionados con biología, budismo, inversiones, baloncesto o miles de temas más. Estos corpus pueden ser modificados añadiendo, eliminando o moviendo textos. Se pueden limitar las búsquedas a un corpus virtual particular (p. ej.: colocados de estrés en psicología o ingeniería), y comparar la frecuencia de una palabra o un sintagma en sus diferentes corpus virtuales. Y además, es posible crear listas de palabras claves para cualquier corpus virtual en unos segundos.

Los “corpus virtuales” están ahora disponible para todos los corpus de BYU, lo que permite crear y usar corpus virtuales rápida y fácilmente a partir de cualquier conjunto de textos de estos corpus. Por ejemplo, se puede crear un corpus virtual de textos de revistas como Cosmopolitan o Astronomy (COCA), artículos de prensa relacionados con el New Deal entre 1932 y 1928 (COHA), páginas de un sitio web específico en relación con el criquet en Reino Unido (GloWbE), discursos de Winston Churchill de 1939 a 1945 en los que se menciona Alemania (Hansard) o artículos de periódico de septiembre de 2015 sobre la crisis europea de los refugiados (NOW). Haga clic en VIRTUAL/TEXTS [VIRTUALES/TEXTOS] en cualquiera de los corpus para obtener muchos más detalles y ejemplos de estos corpus virtuales.


Esperamos que estas nuevas características y estos nuevos corpus sean de provecho para la enseñanza, aprendizaje y actividad investigadora de nuestros usuarios.