Data mining et data warehousing

Anonim

Data mining vs Data Warehousing

L'exploration de données et l'entreposage de données sont des techniques très puissantes et populaires pour analyser les données. Les utilisateurs qui sont enclins aux statistiques utilisent Data Mining. Ils utilisent des modèles statistiques pour rechercher des modèles cachés dans les données. Les mineurs de données sont intéressés à trouver des relations utiles entre les différents éléments de données, ce qui est finalement profitable pour les entreprises. Mais d'autre part, les experts en données qui peuvent analyser les dimensions de l'entreprise ont tendance à utiliser des entrepôts de données.

L'exploration de données est également appelée Knowledge Discovery in Data (KDD). Comme mentionné ci-dessus, c'est un domaine de l'informatique, qui traite de l'extraction d'informations auparavant inconnues et intéressantes à partir de données brutes. En raison de la croissance exponentielle des données, en particulier dans des domaines tels que les entreprises, l'extraction de données est devenue un outil très important pour convertir cette grande quantité de données en intelligence d'affaires. Par exemple, il est actuellement utilisé pour diverses applications telles que l'analyse des réseaux sociaux, la détection des fraudes et le marketing. L'exploration de données traite généralement des quatre tâches suivantes: regroupement, classification, régression et association. Le clustering identifie des groupes similaires à partir de données non structurées. La classification consiste à apprendre des règles qui peuvent être appliquées à de nouvelles données et comprendront généralement les étapes suivantes: prétraitement des données, conception de la modélisation, sélection de l'apprentissage / des caractéristiques et évaluation / validation. La régression consiste à trouver des fonctions avec une erreur minimale pour modéliser les données. Et l'association cherche des relations entre les variables. L'exploration de données est généralement utilisée pour répondre à des questions telles que quels sont les principaux produits qui pourraient aider à obtenir des profits élevés l'année prochaine à Wal-Mart?

Comme mentionné ci-dessus, l'entreposage de données est également utilisé pour l'analyse des données, mais par différents groupes d'utilisateurs et un objectif légèrement différent. Par exemple, en ce qui concerne le commerce de détail, les utilisateurs d'entreposage de données sont plus préoccupés par les types d'achats populaires parmi les clients, de sorte que les résultats de l'analyse peuvent aider le client en améliorant l'expérience client. Mais les data miners conjecturent d'abord une hypothèse telle que les clients achètent un certain type de produit et analysent les données pour tester l'hypothèse. L'entreposage de données pourrait être effectué par un grand détaillant qui stocke ses magasins avec les mêmes tailles de produits pour découvrir plus tard que les magasins de New York vendent des stocks de taille plus petite que dans les magasins de Chicago. Donc, en regardant ce résultat, le détaillant peut stocker le magasin de New York avec des tailles plus petites par rapport aux magasins de Chicago.

Ainsi, comme vous pouvez le voir clairement, ces deux types d'analyse semblent être de la même nature à l'œil nu. Les deux s'inquiètent de l'augmentation des profits basée sur les données historiques. Mais bien sûr, il existe des différences clés. En termes simples, Data Mining et Data Warehousing sont dédiés à la fourniture de différents types d'analyses, mais certainement pour différents types d'utilisateurs. En d'autres termes, Data Mining recherche des corrélations, des patters pour supporter une hypothèse statistique. Mais, Data Warehousing répond à une question plus large et il tranches et dés données à partir de là pour reconnaître les moyens d'amélioration à l'avenir.