jueves, 31 de octubre de 2013

Frecuencia de las colocaciones en el DiCE



Hace ya más de un año os anunciábamos mediante una entrada en este blog la nueva aportación del DiCE consistente en indicar la frecuencia de cada una de las bases del diccionario. Pues bien, a lo largo de los últimos meses hemos dado un paso más:  una de las tareas que hemos desarrollado ha sido la búsqueda de las frecuencias de cada una de las colocaciones que incluye el DiCE. Ha resultado una labor ardua que ha requerido mucho tiempo por su minuciosidad y la gran cantidad de búsquedas necesarias para realizar el análisis cuantitativo de cada una de las combinaciones contenidas en el diccionario. Para obtener los datos hemos empleado el sistema de búsqueda en corpus Sketch Engine (Kilgarriff, 2003); en concreto, empleamos uno de los corpus de español incluidos, con más de 2.000 millones de formas. La mayor parte del trabajo ha consistido en una tarea manual llevada a cabo por los lingüistas que conformamos el equipo de trabajo del DiCE pero también hemos contado con un especialista informático a la hora de realizar diversas tareas automatizadas que facilitaron la inclusión de los datos en la interfaz.
El resultado ya es visible en el DiCE puesto que podréis ver una nueva funcionalidad denominada “ordenar por frecuencia” que, dada una lista de colocaciones, clasifica las distintas combinaciones de mayor a menor frecuencia. Por ejemplo, si buscamos las combinaciones a partir de la palabra miedo para transmitir el sentido de ‘causar ~ en alguien’ sabremos que es más frecuente decir dar miedo o meter miedo que sembrar miedo, inspirar miedo o la expresión fusionada amedrentar.
Consideramos que esta nueva funcionalidad del DiCE constituye un gran avance dentro de la dimensión didáctica que pretendemos proporcionar a esta herramienta puesto que facilita a los aprendices de español información para un uso más adecuado de las colocaciones.