Introducción
La minería de datos en enormes conjuntos de datos busca patrones secretos, verdaderos y potencialmente útiles. La minería de datos consiste en encontrar entre los datos relaciones insospechadas/previamente desconocidas. Es una habilidad multidisciplinar que utiliza las tecnologías de aprendizaje automático, estadística, IA y bases de datos.
La información obtenida de la minería de datos puede utilizarse para el marketing, la identificación de fraudes y los descubrimientos científicos. La minería de datos también se denomina descubrimiento de conocimientos, extracción de conocimientos, análisis de datos/patrones, procesamiento de información, etc.
Comprender con un ejemplo
Un banco quiere buscar nuevas formas de aumentar los ingresos de sus operaciones con tarjetas de crédito. Quieren probar que el uso se duplicará si las tarifas se reducen a la mitad. El registro del banco sobre los saldos medios de las tarjetas de crédito, los importes de los pagos, el uso de los límites de crédito y otros parámetros vitales es de varios años.
Crean un modelo para comprobar el efecto de la nueva política empresarial propuesta. Los resultados de los datos indican que la reducción de las tarifas a la mitad para una base de clientes centrada podría aumentar los ingresos.
Ventajas
- La técnica de la minería de datos ayuda a las empresas a obtener información basada en el conocimiento.
- La minería de datos permite a las empresas realizar adaptaciones organizativas y de fabricación con éxito.
- En comparación con otras aplicaciones estadísticas, la minería de datos es una solución rentable y eficaz.
- La minería de datos ayuda a la toma de decisiones.
- Facilita el análisis automático de tendencias y actividades, así como el descubrimiento automatizado de patrones ocultos.
- Puede introducirse tanto en los nuevos sistemas como en las aplicaciones actuales. Es un proceso rápido que hace que el análisis de grandes cantidades de datos en menos tiempo sea conveniente para los usuarios.
Desventajas
- Existe la posibilidad de que las empresas vendan información útil sobre sus clientes a otras empresas a cambio de dinero.
- La mayoría de los programas de análisis de minería de datos son difíciles de ejecutar y requieren una formación especializada para funcionar.
- Las distintas herramientas de minería de datos funcionan de manera diferente, debido a los distintos algoritmos utilizados en su diseño. Elegir el método de extracción de datos adecuado es, por tanto, una tarea difícil.
- Las técnicas de minería de datos no son fiables y pueden provocar graves consecuencias en determinadas condiciones.