Machine learning konusunda ilerlerken ilk olarak kullanılan algoritmalardan bahsedeceğim.
1. Linear Regression (Doğrusal İlkelleme)
Elimizde (x,y) değerlerinden oluşan bir veri listesi olduğunu düşünelim. Bu verileri kullanarak bir model geliştirelim ve bu model ona vereceğimiz yeni x değerine göre bize bir y değeri tahmininde bulunsun. İşte bunu linear regression algoritması ile yapabiliriz.
Bu algoritmada elimizdeki tüm veriler, ilk yazımda bahsettiğim train kısmında kullanılır ve test kısmı bu algoritma için bulunmaz. Aşağıdaki resimde siyah noktalar elimizdeki veri listesidir. Model tüm noktalara en yakın olacak şekilde bir doğru çizer(estimated veya regression line) ve doğru denklemi y=ax+b şeklindedir. Tahmin etmesini istediğimiz yeni x değeri ise aşağıdaki resimdeki turuncu noktadır. Modelimiz bu nokta için regression line üzerindeki y değerini tahmin eder. Ancak gerçekte bu turuncu noktanın y değeri daha yüksektir. Aradaki fark ise error'umuzdur(hata).
Peki linear regression line'ı nasıl çizeriz?
Elimizdeki verilerin mavi noktalar olduğunu düşünelim. Burada bizim için errorların toplamının en küçük olduğu line bizim regression line'ımızdır. Bu line'ın denklemi ise y=ax+b aşağıdaki gibidir.
Hiç yorum yok:
Yorum Gönder