Share to: share facebook share twitter share wa share telegram print page

 

Cross Industry Standard Process for Data Mining

Cross Industry Standard Process for Data Mining (CRISP-DM) – metodyka i schemat ilustrujący ogólny proces eksploracji danych[1].

Fazy

CRISP-DM

Zgodnie ze standardem proces eksploracji danych podzielony jest na 6 faz[2]:

1. Zrozumienie uwarunkowań biznesowych

Jest to pierwszy i zarazem kluczowy etap tej metodyki. Najważniejsze jest tutaj jasne sformułowanie celów i wymagań projektu.

2. Zrozumienie danych

Etap ten składa się z dwóch podetapów:

  • zebranie danych,
  • ocena przydatności danych.

3. Przygotowanie danych

Na przygotowanie danych składają się kolejno:

  • wykonanie przekształceń,
  • czyszczenie danych,
  • usunięcie wartości skrajnych.

4. Modelowanie

Kluczowe w tej fazie są:

  • wybór i zastosowanie odpowiedniej techniki modelującej,
  • skalowanie parametrów modelu.

5. Ewaluacja

W ramach ewaluacji wykonywana jest:

  • ocena modeli pod względem jakości i efektywności,
  • ustalenie czy model spełnia wszystkie wymagania.

6. Wdrożenie

Ostatni etap, którego celem jest wykorzystanie stworzonego modelu.

Przypisy

  1. Shearer C.: The CRISP-DM model: the new blueprint for data mining, J Data Warehousing (2000); 5:13–22.
  2. Michał Siemaszkiewicz(2012); CRISP-DM.

Linki zewnętrzne

Information related to Cross Industry Standard Process for Data Mining

Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia

Kembali kehalaman sebelumnya