DEV Community

MustafaLSailor
MustafaLSailor

Posted on

CRİSP-DM

CRISP-DM, yani Cross-Industry Standard Process for Data Mining, veri madenciliği projelerini yönetmek için kullanılan bir metodolojidir. Endüstri genelinde geniş çapta kabul görmüş bir standart olan CRISP-DM, bir proje boyunca izlenmesi gereken aşamaları tanımlar ve her aşamanın neyi içermesi gerektiğine dair önerilerde bulunur.

CRISP-DM metodolojisi altı ana aşamadan oluşur:

İş Anlayışı (Business Understanding): Bu aşama, projenin hedeflerini ve gereksinimlerini belirlemeyi içerir. İş problemlerinin tanımlanması, hedeflerin belirlenmesi ve bir proje planının oluşturulması bu aşamada gerçekleştirilir.

Veri Anlayışı (Data Understanding): Bu aşama, kullanılacak verinin toplanması ve anlaşılmasını içerir. Verinin yapısı, kalitesi ve içeriği hakkında bilgi edinilir. Veri keşfi ve verinin ilk incelemesi bu aşamada yapılır.

Veri Hazırlığı (Data Preparation): Bu aşama, modelleme için verinin hazırlanmasını içerir. Veri temizleme, dönüştürme ve entegrasyonu gibi işlemler bu aşamada gerçekleştirilir.

Modelleme (Modeling): Bu aşama, çeşitli modelleme tekniklerinin seçilmesini ve uygulanmasını içerir. Ayrıca, parametre ayarları gibi teknik gereksinimler de bu aşamada belirlenir.

Değerlendirme (Evaluation): Bu aşama, oluşturulan modelin veya modellerin değerlendirilmesini içerir. Modelin iş hedeflerine ne kadar iyi ulaştığı ve beklenen sonuçları ne kadar iyi tahmin ettiği bu aşamada incelenir.

Dağıtım (Deployment): Bu aşama, modelin iş süreçlerine entegre edilmesini ve sonuçların ilgili paydaşlara sunulmasını içerir.

CRISP-DM, genellikle döngüsel bir süreç olarak düşünülür. Yani, bir projenin sonunda genellikle yeni iş veya veri anlayışı elde edilir ve bu da yeni hedeflere veya daha fazla analize yol açabilir. Bu nedenle, bir proje genellikle bir kez tamamlandığında bile CRISP-DM döngüsüne geri döner.

Top comments (0)