bağıntı

Korelasyon Nedir:

Korelasyon, iki şey, insanlar veya fikirler arasındaki benzerlik veya ilişki anlamına gelir. İki farklı hipotez, durum veya nesne arasında var olan bir benzerlik veya denkliktir.

İstatistik ve matematik alanında, korelasyon iki veya daha fazla değişken arasında bir ölçüttür.

Korelasyon terimi, Latin korelasyonundan kaynaklanan dişil bir isimdir .

Korelasyon kelimesi, örneğin, ilişki, denklem, nexus, yazışma, analoji ve bağlantı gibi eş anlamlılarla değiştirilebilir.

Korelasyon katsayısı

İstatistiklerde, ürün momenti korelasyon katsayısı olarak da adlandırılan Pearson korelasyon katsayısı (r), aynı metrik ölçek içindeki iki değişken arasındaki ilişkiyi ölçer.

Korelasyon katsayısının işlevi, bilinen veri veya bilgi kümeleri arasında var olan ilişkinin yoğunluğunu belirlemektir.

Korelasyon katsayısının değeri -1 ile 1 arasında değişebilir ve elde edilen sonuç korelasyonun negatif mi pozitif mi olduğunu tanımlar.

Katsayıyı yorumlamak için 1'in değişkenler arasındaki korelasyonun mükemmel pozitif, -1'in ise mükemmel negatif olduğu anlamına geldiğini bilmek gerekir. Katsayı 0'a eşitse, değişkenlerin birbirine bağlı olmadığı anlamına gelir.

İstatistiklerde, istatistikçi Charles Spearman onuruna bu ismi taşıyan Spearman korelasyon katsayısı da vardır. Bu katsayının işlevi, iki değişken arasındaki ilişkinin yoğunluğunu, doğrusal olup olmadıklarını ölçmektir.

Spearman korelasyonu, analiz edilen iki değişken arasındaki ilişkinin yoğunluğunun bir monoton fonksiyonla (başlangıç sıra ilişkisini koruyan veya ters çeviren matematiksel fonksiyon) ölçülüp ölçülemeyeceğini değerlendirir.

Pearson korelasyon katsayısının hesaplanması

Yöntem 1) Kovaryans ve standart sapma kullanılarak Pearson korelasyon katsayısının hesaplanması.

nerede

S _XY, kovaryanstır;

S _x ve S _y, sırasıyla x ve y değişkenlerinin standart sapmasını temsil eder.

Bu durumda, hesaplama ilk önce değişkenler arasındaki kovaryansı ve bunların her birinin standart sapmasını bulur. Daha sonra, kovaryans, standart sapmaların çarpımı ile bölünür.

Genellikle, ifade zaten değişkenlerin standart sapmalarını ya da sadece formülü uygulayarak aralarındaki kovaryansı sağlar.

Yöntem 2) Pearson korelasyon katsayısının ham verilerle hesaplanması (kovaryans veya standart sapma olmadan).

Bu yöntemde en doğrudan formül aşağıdaki gibidir:

Örneğin, iki değişkenli n = 6 gözlemi olan verilerimiz olduğunu varsayarsak: glikoz seviyesi (y) ve yaş (x), hesaplama aşağıdaki adımları takip eder:

Adım 1) Tabloyu mevcut verilerle yapılandırın: i, x, y ve xy, x² ve y² için boş sütunlar ekleyin:

Adım 2: "xy" sütununu doldurmak için x ve y ile çarpın. Örneğin, 1. satırda şunları yapacağız: x1y1 = 43 × 99 = 4257.

Adım 3: x sütununun değerlerini yükseltin ve sonuçları x² sütununa kaydedin. Örneğin, ilk satırda x ₁ 2 = 43 x 43 = 1849 olacaktır.

Adım 4: Şimdi y sütununu kullanarak Adım 3'teki gibi yapın ve değerlerin karesini y² sütununa kaydedin. Örneğin, ilk satırda şunları yapacağız: y ₁ 2 = 99 × 99 = 9801.

Adım 5: Tüm sütun numaralarının toplamını alın ve sonucu sütun altbilgisine yerleştirin. Örneğin, Yaş X sütununun toplamı 43 + 21 + 25 + 42 + 57 + 59 = 247'ye eşittir.

Adım 6: Korelasyon katsayısını elde etmek için yukarıdaki formülü kullanın:

Böylece, biz var:

Spearman'ın korelasyon katsayısı

Spearman'ın korelasyon katsayısının hesaplanması biraz farklıdır. Bunun için verilerimizi aşağıdaki tabloda düzenlemeliyiz:

1. 2 çift veriyi duyurduktan sonra, bunları tabloya dahil etmeliyiz. Örneğin:

2. "A Sıralaması" sütununda, "A Tarihi" olan gözlemleri, "1" sütunundaki en düşük değer, en (toplam gözlem sayısı), "A sütununun en yüksek değeri" olan A sınıfına göre sınıflandırırız. ". Örneğimizde bu:

3. "B Sıralaması" sütununu almak için aynısını yapıyoruz, şimdi "Veri B" sütununda bulunan gözlemleri kullanarak:

4. "d" sütununa iki Sıra arasındaki farkı koyarız (A - B). Burada sinyal önemli değil.

5. "d" sütunundaki değerlerin her birini yükseltin ve d² sütununa kaydedin:

6. "d²" sütunundaki tüm verileri ekleyin. Bu değer ²d²'dir. Örneğimizde ²d² = 0 + 1 + 0 + 1 = 2

7. Şimdi Spearman'ın formülünü kullanıyoruz:

Bizim durumumuzda n, 4'e eşittir, çünkü veri satırı sayısına bakarız (gözlem sayısına karşılık gelir).

8. Son olarak, önceki formüldeki verileri değiştiririz:

Doğrusal Regresyon

Doğrusal regresyon, diğer değişkenlerin (x) değerleri bilindiğinde, bir değişkenin (y) olası değerini tahmin etmek için kullanılan bir formüldür. "X" değeri, bağımsız veya açıklayıcı değişkendir ve "y", bağımlı değişken veya cevaptır.

Doğrusal regresyon, "y" değerinin "x" değişkeninin bir işlevi olarak nasıl değişebileceğini doğrulamak için kullanılır. Varyans kontrolünün değerlerini içeren çizgiye doğrusal regresyon çizgisi denir.

Açıklayıcı değişken "x" tek bir değere sahipse, regresyona basit doğrusal regresyon adı verilir.