DEV Community

MustafaLSailor
MustafaLSailor

Posted on

Correlation(Korelasyon)

Korelasyon, iki değişken arasındaki ilişkinin gücünü ve yönünü ölçen istatistiksel bir kavramdır. Bu kavram, iki değişken arasındaki ilişkinin ne kadar güçlü olduğunu ve bu ilişkinin hangi yönde olduğunu belirlemek için kullanılır.

Korelasyon katsayısı, genellikle Pearson korelasyon katsayısı olarak bilinir, en yaygın kullanılan korelasyon ölçüsüdür. Pearson korelasyon katsayısı, iki sürekli değişken arasındaki doğrusal ilişkiyi ölçer. Değerler arasındaki ilişkinin gücünü ve yönünü -1 ile 1 arasında bir değerle ifade eder.

  • Korelasyon katsayısı 1'e yakınsa, bu pozitif bir korelasyonu gösterir, yani iki değişken arasındaki ilişki doğrusaldır ve birlikte artar.
  • Korelasyon katsayısı -1'e yakınsa, bu negatif bir korelasyonu gösterir, yani iki değişken arasındaki ilişki doğrusaldır ancak bir değişken artarken diğeri azalır.
  • Korelasyon katsayısı 0'a yakınsa, bu iki değişken arasında bir ilişki olmadığını veya doğrusal bir ilişkinin zayıf olduğunu gösterir.

Korelasyon, veri analizi ve istatistiksel modelleme süreçlerinde yaygın olarak kullanılır. İki değişken arasındaki ilişkiyi anlamak, değişkenlerin etkileşimini ölçmek ve modelin doğruluğunu değerlendirmek için önemlidir. Korelasyon analizi, bir veri setindeki değişkenler arasındaki ilişkileri keşfetmek ve bu ilişkileri daha iyi anlamak için kullanılır.

Bir örnek üzerinden korelasyonu açıklayalım. Örneğimizde, bir şirketin çalışanlarının sahip oldukları deneyim ile aldıkları maaş arasındaki ilişkiyi inceleyeceğiz.

Diyelim ki elimizde 10 çalışanın deneyim süreleri (yıl cinsinden) ve aldıkları aylık maaşlar (TL cinsinden) verileri bulunmaktadır:

Çalışan No Deneyim (Yıl) Maaş (TL)
1 2 4000
2 5 6000
3 3 4500
4 7 8000
5 4 5500
6 6 7000
7 2 4200
8 8 8500
9 5 6000
10 4 5000

Bu verilerle, deneyim ve maaş arasındaki ilişkiyi incelemek için Pearson korelasyon katsayısını hesaplayabiliriz.

Öncelikle, verilerimizin korelasyon katsayısını hesaplamadan önceki dağılımını görmek için bir scatter plot (dağılım grafiği) çizebiliriz. Bu, ilişkinin doğrusallığını ve yönünü görsel olarak görmemize yardımcı olacaktır.

import matplotlib.pyplot as plt
import pandas as pd

# Verileri DataFrame'e yükleme
data = {
    'Deneyim (Yıl)': [2, 5, 3, 7, 4, 6, 2, 8, 5, 4],
    'Maaş (TL)': [4000, 6000, 4500, 8000, 5500, 7000, 4200, 8500, 6000, 5000]
}
df = pd.DataFrame(data)

# Scatter plot çizimi
plt.scatter(df['Deneyim (Yıl)'], df['Maaş (TL)'])
plt.xlabel('Deneyim (Yıl)')
plt.ylabel('Maaş (TL)')
plt.title('Deneyim ve Maaş Arasındaki İlişki')
plt.grid(True)
plt.show()
Enter fullscreen mode Exit fullscreen mode

Bu scatter plot'ta, deneyim ile maaş arasında bir doğrusal ilişkinin olduğunu görebiliriz. Yani, deneyim arttıkça maaşın da arttığı bir eğilim söz konusudur.

Şimdi, bu ilişkinin ne kadar güçlü olduğunu ve yönünü belirlemek için Pearson korelasyon katsayısını hesaplayabiliriz.

# Korelasyon katsayısını hesaplama
correlation = df['Deneyim (Yıl)'].corr(df['Maaş (TL)'])
print("Pearson Korelasyon Katsayısı:", correlation)
Enter fullscreen mode Exit fullscreen mode

Sonuç olarak, Pearson korelasyon katsayısı pozitif bir değer olduğundan, deneyim ile maaş arasında pozitif bir ilişki olduğunu gösterir. Yani, deneyim arttıkça maaş da artmaktadır. Örneğimizdeki verilere göre, deneyim ile maaş arasındaki ilişki oldukça güçlüdür.

created by gpt

Top comments (0)