Las empresas siempre han sentido fascinaci?n por los datos y los modelos matem?ticos. Todo proyecto, si viene avalado por docenas de tablas y gr?ficos, es m?s cre?ble y proclive a ser aprobado. No es de extra?ar, por lo tanto, el ?xito que el data mining est? cosechando como disciplina: cuantos m?s datos, mejor identificaremos a nuestros segmentos de consumidores, y por lo tanto m?s venderemos.
Ocurre, sin embargo, que la realidad es mucho m?s compleja, y definir un segmento de consumidores no significa m?s que eso: definir un segmento. Si ese segmento va a comprar o no, si le va a interesar un nuevo producto o funcionalidad de la web, es algo que no podemos predecir bas?ndonos en centenares de variables demogr?ficas. A menudo, llegaremos a conclusiones tanto o m?s fiables conociendo un par de datos: frecuencia de compra, y ?ltima compra realizada, por ejemplo.
Es decir, fijarnos en el comportamiento. El data mining nos puede ayudar a definir nuestro segmento, sus preferencias potenciales, pero es dif?cil que prediga variables a lo largo del tiempo, como por ejemplo cu?ndo ocurrir? la pr?xima compra. Y es que el comportamiento humano responde a variables aleatorias la mayor parte del tiempo, imposibles de capturar estad?sticamente.
Sin embargo, fijarnos en variables de comportamiento puede ayudarnos mucho m?s. Incluso podr?amos decir que la web es el entorno ideal para trabajar con indicadores de comportamiento, puesto que es tan f?cil recolectar datos de comportamiento en una p?gina web. Fijarnos en la frecuencia y horas de compra, realizar agrupaciones de usuarios por consultas y compras de producto similares, … Es decir, segmentar por comportamiento, por acciones, y no por variables demogr?ficas definidas a priori.
?Qu? opin?is vosotros? ?Ten?is alg?n ejemplo de uso de data mining y/o variables de comportamiento? ?Qu? m?todo os parece m?s acertado?
Si os interesa el tema, os recomiendo una entrevista con Peter Fader publicada por CIO Insight.



Marcelo R. Ferreyra – 17 octubre 2007 1:18 pm #
Hola, muy interesante el art?culo de Peter Fader.
Desde mi punto de vista, Data Mining es lo suficientemente amplio como aportar soluciones para muchos casos, incluso para predecir cu?ndo una persona comprar? algo. Y ac? quiero hacer hincapi? en lo siguiente. La predicci?n de lo que har? una persona en particular lleva un margen de error que depende del modelo y del tipo de comportamiento a predecir. Dicho de otro modo, quiz?s un modelo que predice algo sobre un sujeto, tenga un margen de error tan grande que no sea posible darle un uso pr?ctico. Por ejemplo, un modelo podr?a estimar que una persona comprar? un determinado art?culo con una probabilidad del 30%. Enfoc?ndonos en esa persona, el margen de error es muy grande. Quiero decir, si supongo que la persona comprar? el art?culo, me equivocar?a el 70% de las veces! Pero si tomo un grupo de 1000 personas que tienen la misma probabilidad de comprar ese art?culo, entonces no me equivocar?a demasiado si digo que 300 personas de ese grupo comprar?n el art?culo.
O sea, normalmente los modelos se realizan para predecir el comportamiento de un sujeto en particular, pero luego se usan para predecir que har? un grupo de personas que llevan la misma predicci?n.
Por otro lado, es cierto que variables de comportamiento llevan mayor informaci?n que las demogr?ficas. Un modelo de DM podr?a estar basado en una combinaci?n de ambos tipos de variable y podr?a incluso predecir cu?ndo una persona har? algo. Lo ?nico que hay que hacer es definir adecuadamente el objeto de estudio y la variable a predecir. Por ejemplo, si quiero predecir cu?ndo un cliente comprar? o utilizar? un determinado servicio, podr?a centrarme en el producto o servicio y el tiempo que lleva la siguiente venta dado el comportamiento de cualquier cliente. Luego, para predecir cu?ndo un cliente comprar?, uso el comportamiento anterior de ese cliente como datos para el modelo.
Otro tema no menos importante que forma parte del DM es la preparaci?n de variables. No importa el tipo de herramienta de modelado que use, una buena preparaci?n de variables es esencial para lograr buenos resultados. Es m?s, si la preparaci?n de datos fue existosa, es probable que con una simple regresi?n lineal se obtenga un excelente modelo.
Bueno, espero que hayan quedado claro mis puntos de vista respecto del uso de DM.
Saludos
pere rovira – 23 octubre 2007 3:37 am #
hola marcelo,
muchas gracias por tu excelente comentario, es un placer tener lectores tan buenos y con tantas ganas de aportar.
voy a seguir tu blog de cerca.
saludos
pere