¿Qué es la Minería de Datos o Data Mining?

DataMining

M. Berry y G. Linoff exponen al comienzo de su libro Data Mining Techniques el mejor ejemplo de lo que es la Minería de Datos o Data Mining, en donde el dueño de un local que uno de los autores frecuenta conoce sus gustos y es capaz de hacerle buenas recomendaciones.

Imaginemos un pequeño establecimiento llamado Wine Cask dedicado a la venta de vinos y especialidades como quesos, patés y embutidos.

Con el paso del tiempo, Wine Cask consigue mantener fieles a sus clientes a su establecimiento. El personal aprende de los gustos de los clientes y sus rangos de precios, de manera que cuando les preguntan, la respuesta está basada en el conocimiento acumulado de las preferencias y presupuestos de sus clientes así como en su conocimiento de los productos.

Es decir, basado en su experiencia de atender a sus clientes, la gente de Wine Cask es capaz de conocer las preferencias de los mismos tan bien que podría clasificarlos en distintos segmentos. También es capaz de sugerir recomendaciones (predecir qué producto llevar) a cada cliente y ofrecer nuevos productos en base a lo que otros han combinado con buenos resultados (cross selling o venta cruzada).

Otra tienda de vinos podría abrir justo al lado o al cruzar la calle y contratar sumilleres y enólogos con un gran conocimiento, pero alcanzar el mismo nivel de conocimiento de sus clientes les llevaría meses o años.

Muchas empresas que cuentan con miles de clientes no tienen la posibilidad de Wine Cask, aunque no tienen por qué renunciar al uso de una estrategia similar. La diferencia está en el tipo de herramienta usada para conocer las preferencias e inferir recomendaciones. En el caso de Wine Cask, su inteligencia de negocio se basa en el aprendizaje a través del trato directo y cercano con el cliente. En el caso de una gran compañía, su instrumento deberá ser un ordenador.

Una empresa con miles de clientes deberá almacenar su relación con los mismos en una base de datos y deberá usar programas que tengan capacidades inductivas (para encontrar reglas o patrones de comportamiento) y deductivas (para usar estas reglas a fin de hacer recomendaciones).

Este proceso de negocio que utiliza grandes volúmenes de datos almacenados para descubrir patrones y reglas de comportamiento significativos se denomina Minería de Datos o Data Mining.

Dentro de dicho proceso existen diferentes fases (identificación del problema, transformación de datos en información…) y una gran variedad de técnicas (de predicción, de clasificación, de segmentación, etc.) que iremos viendo en otros posts.