Data Preparation for Data Mining

Data Preparation for Data MiningCualquier analista sabe que el 80% del tiempo en minería de datos se consume en la preparación de los datos, mientras que el 20% restante se dedica al modelado. Sin embargo, es bastante más fácil encontrar referencias bibliográficas de apoyo para ese 20% que no para la preparación de datos.

Data Preparation for Data Mining es simplemente genial ya que proporciona las mejores prácticas sobre la esencia de la minería de datos: cómo pasar de variables continuas a discretas y viceversa, tratamiento de valores nulos y vacíos, normalización de variables, reducción de variables, etc.

————————————————–

Any analyst knows that 80% of data mining time is spent in data preparation, nevertheless most authors focus on the remaining 20% : techniques and tools, where the value is more «visible». However, it is easier to find any good book for that 20% time consuming task than for data preparation.

Data Preparation for Data Mining is simply great since it provides the best practices about the essence of data mining: converting continuous variables into discrete variables and vice versa, treatment of null and empty values, normalization, variables reduction, etc.

Deja un comentario