Lojistik Regresyon Modelini Öğrenme ve Veri Hazırlama

lojistik regresyon

Lojistik regresyon, bağımlı değişken ikili olduğunda yapılması gereken uygun regresyon analizidir. Tüm regresyon analizleri gibi, lojistik regresyon da öngörücü bir analizdir. Verileri tanımlamak ve bir bağımlı ikili değişken ile bir veya daha fazla nominal, sıra, aralık veya oran düzeyinde bağımsız değişkenler arasındaki ilişkiyi açıklamak için lojistik regresyon kullanılır.

Bu analiz yöntemine göre, istatistik alanından makine öğrenmesiyle ödünç alınan başka bir tekniktir. İkili sınıflandırma problemleri için go-to metodudur (iki sınıf değeri olan problemler). Ayrıca farklı alanlarda kullanılabileceği gibi, dış ticaret için de hayati önem taşımaktadır.

Lojistik Regresyon İçin Kullanılan Kavramlar

Bu analiz yönteminde, doğrusal regresyona çok benzeyen, temsil olarak bir denklem kullanır. Giriş değerleri (x), bir çıkış değerini (y) tahmin etmek için ağırlıklar veya katsayı değerleri (Yunanca büyük harf Beta olarak adlandırılır) kullanılarak doğrusal olarak birleştirilir. Doğrusal regresyondan en önemli fark, modellenen çıkış değerinin sayısal bir değerden ziyade ikili bir değer (0 veya 1) olmasıdır.

Lojistik Regresyon Modelini Öğrenme

Lojistik regresyon algoritmasının katsayıları (Beta değerleri b) egzersiz verilerinizden tahmin edilmelidir. Bu, maksimum olabilirlik tahmini kullanılarak yapılır.

En fazla olabilirlik tahmini, çeşitli makine öğrenme algoritmaları tarafından kullanılan ortak bir öğrenme algoritmasıdır, ancak verilerinizin dağıtımı hakkında varsayımlarda bulunur.

En iyi katsayılar, varsayılan sınıf için 1’e (örneğin erkek) çok yakın bir değer ve diğer sınıf için 0’a (örneğin, kadın) çok yakın bir değer öngörecek bir modelle sonuçlanacaktır. Bu analiz yönteminde maksimum olabilirlik sezgisi, bir arama prosedürünün, model tarafından tahmin edilen verilerdeki verilerle tahmin edilen olasılıklardaki hatayı minimize eden katsayılar düşünülmelidir. Lojistik öğrenirken, daha basit gradyan iniş algoritmasını kullanarak sıfırdan kendiniz uygulayabilirsiniz.

Lojistik Regresyon İçin Veri Hazırlama

Lojistik regresyonun verilerinizdeki dağılımı ve ilişkileri hakkında yaptığı varsayımlar, lineer regresyonda yapılan varsayımlarla aynıdır. Bu varsayımları tanımlamak için birçok çalışma yapılmıştır ve kesin olasılık ve istatistik dili kullanılmıştır. Bunları kılavuz ilkeler veya kurallar olarak kullanmak ve farklı veri hazırlama şemalarını denemek gerekir.

Sonunda, öngörülü modelleme makinesi öğrenme projelerinde, sonuçları yorumlamak yerine doğru tahminler yapmaya odaklanırsınız. Bu nedenle, model sağlam olduğu ve iyi çalıştığı sürece bazı varsayımları bozabilirsiniz.

İkili Çıkış Değişkeni: Daha önce de belirttiğimiz gibi açık olabilir, ancak lojistik regresyon ikili sınıflandırma problemleri için düşünülmüştür. 0 veya 1 sınıflamasına girebilecek varsayılan sınıfa ait bir örnek olasılığını öngörecektir.

Gauss Dağılımı: Lojistik regresyon doğrusal bir algoritmadır (çıkışta doğrusal olmayan bir dönüşüm ile). Girdi değişkenleri ile çıktı arasında doğrusal bir ilişki olduğunu varsayar. Bu doğrusal ilişkiyi daha iyi ortaya koyan giriş değişkenlerinizdeki veri dönüşümleri daha doğru bir modelle sonuçlanabilir.

İlişkili Girdileri Kaldırma: Doğrusal regresyon gibi, model çok ilişkili korelasyona sahip girdileriniz varsa üst üste gelebilir. Tüm girişler arasındaki çift yönlü korelasyonları hesaplamayı ve yüksek korelasyonlu girdileri çıkarmayı düşünün.

Kaynakça:

Statistic Solution

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir