DEV Community

MustafaLSailor
MustafaLSailor

Posted on

dummy variables

Makine öğrenmesinde kukla değişkenler (dummy variables), genellikle kategorik değişkenleri sayısal formata dönüştürmek için kullanılır. Bu, birçok makine öğrenmesi algoritması gibi algoritmaların sadece sayısal girdilerle çalışabilmesi nedeniyle gereklidir.

Kukla değişkenler, bir kategorik değişkenin her bir seviyesini temsil eden yeni özellikler oluşturur. Örneğin, bir 'Renk' özelliğiniz varsa ve bu 'Kırmızı', 'Mavi' ve 'Yeşil' değerlerini alıyorsa, bu tek bir kategorik değişkeni üç kukla değişkene dönüştürebiliriz: 'Renk_Kırmızı', 'Renk_Mavi' ve 'Renk_Yeşil'. Bu kukla değişkenler 0 veya 1 değerini alır - eğer orijinal özellik o seviyedeyse 1, değilse 0.

Python'daki pandas kütüphanesi, get_dummies() fonksiyonu ile kolayca kukla değişkenler oluşturmanızı sağlar. Örneğin:

import pandas as pd

# Kategorik bir veri seti oluşturalım
df = pd.DataFrame({
  'A': ['kırmızı', 'mavi', 'yeşil', 'kırmızı', 'mavi', 'yeşil'],
  'B': ['elma', 'muz', 'elma', 'muz', 'elma', 'muz']
})

# Kukla değişkenler oluşturalım
df_dummies = pd.get_dummies(df, columns=['A', 'B'])

print(df_dummies)
Enter fullscreen mode Exit fullscreen mode

Image description

Bu kod, A ve B sütunları için kukla değişkenler oluşturur ve sonucu yeni bir DataFrame olarak döndürür.

Top comments (0)