Excel'de doğrusal regresyon analizi

  • Bunu Paylaş
Michael Brown

Bu eğitim, regresyon analizinin temellerini açıklamakta ve Excel'de doğrusal regresyon yapmanın birkaç farklı yolunu göstermektedir.

Şunu hayal edin: Size bir sürü farklı veri sunuluyor ve şirketinizin gelecek yılki satış rakamlarını tahmin etmeniz isteniyor. Rakamları etkileyebilecek düzinelerce, hatta belki yüzlerce faktör keşfettiniz. Peki hangilerinin gerçekten önemli olduğunu nasıl bileceksiniz? Excel'de regresyon analizi çalıştırın. Size bu ve daha birçok sorunun cevabını verecektir: Hangi faktörlerBu faktörler birbirleriyle ne kadar yakından ilişkilidir ve tahminler konusunda ne kadar emin olabilirsiniz?

    Excel'de regresyon analizi - temel bilgiler

    İstatistiksel modellemede, regresyon analizi iki veya daha fazla değişken arasındaki ilişkileri tahmin etmek için kullanılır:

    Bağımlı değişken (diğer adıyla KRİTER değişkeni) anlamaya ve tahmin etmeye çalıştığınız ana faktördür.

    Bağımsız değişkenler (diğer adıyla açıklayıcı değişkenleri veya tahmin ediciler ) bağımlı değişkeni etkileyebilecek faktörlerdir.

    Regresyon analizi, bağımsız değişkenlerden biri değiştiğinde bağımlı değişkenin nasıl değiştiğini anlamanıza yardımcı olur ve bu değişkenlerden hangisinin gerçekten bir etkiye sahip olduğunu matematiksel olarak belirlemenizi sağlar.

    Teknik olarak, bir regresyon analizi modeli aşağıdakilere dayanır kareler toplamı Bu, veri noktalarının dağılımını bulmanın matematiksel bir yoludur. Bir modelin amacı, mümkün olan en küçük kareler toplamını elde etmek ve verilere en yakın olan bir çizgi çizmektir.

    İstatistikte, basit ve çoklu doğrusal regresyon arasında ayrım yapılır. Basit doğrusal regresyon bir bağımlı değişken ile bir bağımsız değişken arasındaki ilişkiyi doğrusal bir fonksiyon kullanarak modeller. Bağımlı değişkeni tahmin etmek için iki veya daha fazla açıklayıcı değişken kullanırsanız çoklu doğrusal regresyon Veri ilişkileri düz bir çizgi izlemediği için bağımlı değişken doğrusal olmayan bir fonksiyon olarak modelleniyorsa doğrusal olmayan regresyon Bu eğitimin odak noktası basit bir doğrusal regresyon olacaktır.

    Örnek olarak, son 24 ay için şemsiye satış rakamlarını alalım ve aynı dönem için ortalama aylık yağış miktarını bulalım. Bu bilgileri bir grafik üzerine yerleştirin ve regresyon çizgisi bağımsız değişken (yağış) ile bağımlı değişken (şemsiye satışları) arasındaki ilişkiyi gösterecektir:

    Doğrusal regresyon denklemi

    Matematiksel olarak, doğrusal bir regresyon bu denklemle tanımlanır:

    y = bx + a + ε

    Nerede?

    • x bağımsız bir değişkendir.
    • y bağımlı bir değişkendir.
    • a bu Y-kesişimi 'nin beklenen ortalama değeri olan y tüm x Bir regresyon grafiğinde, doğrunun Y eksenini kestiği noktadır.
    • b ise eğim için değişim oranı olan bir regresyon doğrusunun y olarak x değişiklikler.
    • ε bağımlı değişkenin gerçek değeri ile tahmin edilen değeri arasındaki fark olan rastgele hata terimidir.

    Doğrusal regresyon denkleminde her zaman bir hata terimi vardır, çünkü gerçek hayatta tahmin ediciler hiçbir zaman tam olarak kesin değildir. Ancak, Excel de dahil olmak üzere bazı programlar hata terimi hesaplamasını perde arkasında yapar. Bu nedenle, Excel'de doğrusal regresyonu en küçük kareler yöntemi ve katsayıları aramak a ve b öyle ki:

    y = bx + a

    Örneğimiz için, doğrusal regresyon denklemi aşağıdaki şekli alır:

    Satılan şemsiyeler = b * yağış + a

    Bulmak için birkaç farklı yol var a ve b Excel'de doğrusal regresyon analizi yapmak için üç ana yöntem vardır:

    • Analysis ToolPak ile birlikte verilen regresyon aracı
    • Eğilim çizgisi içeren dağılım grafiği
    • Doğrusal regresyon formülü

    Aşağıda her bir yöntemin kullanımına ilişkin ayrıntılı talimatları bulacaksınız.

    Analysis ToolPak ile Excel'de doğrusal regresyon nasıl yapılır

    Bu örnekte, Analysis ToolPak eklentisiyle birlikte gelen özel bir araç kullanılarak Excel'de regresyonun nasıl çalıştırılacağı gösterilmektedir.

    Analysis ToolPak eklentisini etkinleştirin

    Analysis ToolPak, Excel 365'ten 2003'e kadar tüm sürümlerde mevcuttur, ancak varsayılan olarak etkin değildir. Bu nedenle, manuel olarak açmanız gerekir. İşte nasıl yapılacağı:

    1. Excel'inizde, tıklayın Dosya > Seçenekler .
    2. İçinde Excel Seçenekleri iletişim kutusunu seçin, ardından Eklentiler sol kenar çubuğunda, emin olun Excel Eklentileri içinde seçilir Yönetmek kutusunu seçin ve Git .
    3. İçinde Eklentiler iletişim kutusunu işaretleyin Analiz Araç Paketi ve tıklayın TAMAM. :

    Bu ekleyecektir Veri Analizi araçlarına Veri sekmesine tıklayın.

    Regresyon analizini çalıştırın

    Bu örnekte, Excel'de basit bir doğrusal regresyon yapacağız. Elimizdeki liste, bağımsız değişkenimiz (tahmin edici) olan B sütununda son 24 ay için ortalama aylık yağış miktarı ve bağımlı değişken olan C sütununda satılan şemsiye sayısıdır. Elbette, satışları etkileyebilecek başka birçok faktör var, ancak şimdilik sadece bu iki değişkene odaklanıyoruz:

    Analiz Araç Paketi eklendiğinde, Excel'de regresyon analizi gerçekleştirmek için aşağıdaki adımları uygulayın:

    1. Üzerinde Veri sekmesinde Analiz grubuna girmek için Veri Analizi Düğme.
    2. Seçiniz Regresyon ve tıklayın TAMAM. .
    3. İçinde Regresyon iletişim kutusunda, aşağıdaki ayarları yapılandırın:
      • Seçiniz Giriş Y Aralığı ki bu senin bağımlı değişken Bizim durumumuzda bu, şemsiye satışlarıdır (C1:C25).
      • Seçiniz Giriş X Aralığı yani senin bağımsız değişken Bu örnekte, aylık ortalama yağış miktarıdır (B1:B25).

      Bir çoklu regresyon modeli oluşturuyorsanız, farklı bağımsız değişkenlere sahip iki veya daha fazla bitişik sütun seçin.

      • Kontrol edin Etiket kutusu X ve Y aralıklarınızın en üstünde başlıklar varsa.
      • Tercihinizi seçin Çıkış seçeneği, bizim durumumuzda yeni bir çalışma sayfası.
      • İsteğe bağlı olarak Kalıntılar Tahmin edilen ve gerçek değerler arasındaki farkı almak için onay kutusu.
    4. Tıklayın TAMAM. ve Excel tarafından oluşturulan regresyon analizi çıktısını gözlemleyin.

    Regresyon analizi çıktısını yorumlama

    Az önce gördüğünüz gibi, Excel'de regresyon çalıştırmak kolaydır çünkü tüm hesaplamalar otomatik olarak önceden yapılır. Sonuçların yorumlanması biraz daha zordur çünkü her sayının arkasında ne olduğunu bilmeniz gerekir. Aşağıda regresyon analizi çıktısının 4 ana bölümünün bir dökümünü bulacaksınız.

    Regresyon analizi çıktısı: Özet Çıktı

    Bu bölüm, hesaplanan doğrusal regresyon denkleminin kaynak verilerinize ne kadar iyi uyduğunu gösterir.

    İşte her bir bilginin ne anlama geldiği:

    Çoklu R Bu C orelasyon Katsayısı İki değişken arasındaki doğrusal ilişkinin gücünü ölçer. Korelasyon katsayısı -1 ile 1 arasında herhangi bir değer olabilir ve mutlak değeri ilişkinin gücünü gösterir. Mutlak değer ne kadar büyükse, ilişki o kadar güçlüdür:

    • 1 güçlü bir pozitif ilişki anlamına gelir
    • -1 güçlü bir negatif ilişki anlamına gelir
    • 0 hiç ilişki olmadığı anlamına gelir

    R Kare . Bu Belirleme Katsayısı Uyum iyiliğinin bir göstergesi olarak kullanılan R2 değeri, regresyon doğrusu üzerinde kaç nokta olduğunu gösterir. R2 değeri, toplam kareler toplamından hesaplanır, daha doğrusu orijinal verilerin ortalamadan karesel sapmalarının toplamıdır.

    Örneğimizde R2 0,91'dir (2 haneye yuvarlanmıştır) ve bu oldukça iyidir. Bu, değerlerimizin %91'inin regresyon analizi modeline uyduğu anlamına gelir. Başka bir deyişle, bağımlı değişkenlerin (y değerleri) %91'i bağımsız değişkenler (x değerleri) tarafından açıklanmaktadır. Genel olarak, %95 veya daha fazla R Karesi iyi bir uyum olarak kabul edilir.

    Düzeltilmiş R Kare . Bu R kare modeldeki bağımsız değişken sayısına göre ayarlanmıştır. R kare çoklu regresyon analizi için.

    Standart Hata Regresyon analizinizin kesinliğini gösteren bir başka uyum iyiliği ölçüsüdür - sayı ne kadar küçükse regresyon denkleminiz hakkında o kadar emin olabilirsiniz. R2 model tarafından açıklanan bağımlı değişken varyansının yüzdesini temsil ederken, Standart Hata veri noktalarının regresyondan ortalama uzaklığını gösteren mutlak bir ölçüdürHat.

    Gözlemler Bu sadece modelinizdeki gözlemlerin sayısıdır.

    Regresyon analizi çıktısı: ANOVA

    Çıktının ikinci kısmı Varyans Analizidir (ANOVA):

    Temel olarak, kareler toplamını regresyon modelinizdeki değişkenlik düzeyleri hakkında bilgi veren ayrı bileşenlere ayırır:

    • df varyans kaynakları ile ilişkili serbestlik derecelerinin sayısıdır.
    • SS Toplam SS ile karşılaştırıldığında Kalan SS ne kadar küçükse, modeliniz verilere o kadar iyi uyuyor demektir.
    • MS ortalama karedir.
    • F F istatistiği veya boş hipotez için F-testidir. Modelin genel anlamlılığını test etmek için kullanılır.
    • Anlamlılık F F'nin P-değeridir.

    ANOVA kısmı Excel'de basit bir doğrusal regresyon analizi için nadiren kullanılır, ancak son bileşene kesinlikle yakından bakmalısınız. Anlamlılık F değeri, sonuçlarınızın ne kadar güvenilir (istatistiksel olarak anlamlı) olduğuna dair bir fikir verir. F Anlamlılığı 0,05'ten (%5) küçükse, modelinizde sorun yoktur. 0,05'ten büyükse, muhtemelen başka bir bağımsız değişken seçmeniz daha iyi olacaktır.

    Regresyon analizi çıktısı: katsayılar

    Bu bölüm, analizinizin bileşenleri hakkında özel bilgiler sağlar:

    Bu bölümdeki en kullanışlı bileşen Katsayılar Excel'de doğrusal bir regresyon denklemi oluşturmanızı sağlar:

    y = bx + a

    Veri setimiz için, burada y satılan şemsiye sayısı ve x ortalama aylık yağış miktarı olmak üzere doğrusal regresyon formülümüz aşağıdaki gibidir:

    Y = Yağış Katsayısı * x + Kesişim

    Üç ondalık basamağa yuvarlanmış a ve b değerleri ile donatıldığında şu hale dönüşür:

    Y=0.45*x-19.074

    Örneğin, ortalama aylık yağış miktarı 82 mm olduğunda, şemsiye satışları yaklaşık 17,8 olacaktır:

    0.45*82-19.074=17.8

    Benzer şekilde, belirlediğiniz herhangi bir aylık yağış miktarı (x değişkeni) ile kaç adet şemsiye satılacağını öğrenebilirsiniz.

    Regresyon analizi çıktısı: artıklar

    Aylık 82 mm yağışa karşılık gelen tahmini ve gerçek satılan şemsiye sayılarını karşılaştırırsanız, bu rakamların biraz farklı olduğunu göreceksiniz:

    • Tahmini: 17,8 (yukarıda hesaplanmıştır)
    • Gerçekleşen: 15 (kaynak verilerin 2. satırı)

    Çünkü bağımsız değişkenler hiçbir zaman bağımlı değişkenlerin mükemmel tahmin edicileri değildir. Ve artıklar, gerçek değerlerin tahmin edilen değerlerden ne kadar uzak olduğunu anlamanıza yardımcı olabilir:

    İlk veri noktası (82 mm yağış) için artık yaklaşık -2,8'dir. Bu sayıyı tahmin edilen değere ekleriz ve gerçek değeri elde ederiz: 17,8 - 2,8 = 15.

    Excel'de doğrusal regresyon grafiği nasıl oluşturulur

    İki değişken arasındaki ilişkiyi hızlı bir şekilde görselleştirmeniz gerekiyorsa, doğrusal regresyon grafiği çizin. Bu çok kolay! İşte nasıl yapılacağı:

    1. Başlıklar da dahil olmak üzere verilerinizin bulunduğu iki sütunu seçin.
    2. Üzerinde Giriş sekmesinde Sohbetler grubuna girmek için Dağılım grafiği simgesini seçin ve Dağılım küçük resim (ilki):

      Bu, çalışma sayfanıza buna benzeyen bir dağılım grafiği ekleyecektir:

    3. Şimdi, en küçük kareler regresyon doğrusunu çizmemiz gerekiyor. Bunu yapmak için, herhangi bir noktaya sağ tıklayın ve Trend Çizgisi Ekle... bağlam menüsünden.
    4. Sağ bölmede, şu öğeyi seçin Doğrusal eğilim çizgisi şeklini ve isteğe bağlı olarak Grafik Üzerinde Denklem Görüntüleme regresyon formülünüzü elde etmek için:

      Fark edebileceğiniz gibi, Excel'in bizim için oluşturduğu regresyon denklemi, Katsayılar çıktısına dayalı olarak oluşturduğumuz doğrusal regresyon formülü ile aynıdır.

    5. Şuraya geç Dolgu & Çizgi sekmesine gidin ve çizgiyi istediğiniz gibi özelleştirin. Örneğin, farklı bir çizgi rengi seçebilir ve kesikli çizgi yerine düz çizgi kullanabilirsiniz (Kesintisiz çizgi Çizgi tipi kutusu):

    Bu noktada, grafiğiniz zaten iyi bir regresyon grafiği gibi görünüyor:

    Yine de birkaç iyileştirme daha yapmak isteyebilirsiniz:

    • Denklemi uygun gördüğünüz yere sürükleyin.
    • Eksen başlıkları ekleyin ( Grafik Öğeleri düğme> Eksen Başlıkları ).
    • Veri noktalarınız bu örnekte olduğu gibi yatay ve/veya dikey eksenin ortasında başlıyorsa, aşırı beyaz alandan kurtulmak isteyebilirsiniz. Aşağıdaki ipucu bunun nasıl yapılacağını açıklamaktadır: Beyaz alanı azaltmak için grafik eksenlerini ölçeklendirin.

      Ve geliştirilmiş regresyon grafiğimiz bu şekilde görünüyor:

      Önemli not! Regresyon grafiğinde, bağımsız değişken her zaman X ekseninde ve bağımlı değişken Y ekseninde olmalıdır. Grafiğiniz ters sırada çizilmişse, çalışma sayfanızdaki sütunları değiştirin ve ardından grafiği yeniden çizin. Kaynak verileri yeniden düzenlemenize izin verilmiyorsa, X ve Y eksenlerini doğrudan bir grafikte değiştirebilirsiniz.

    Formüller kullanarak Excel'de regresyon nasıl yapılır

    Microsoft Excel, LINEST, SLOPE, INTERCEPT ve CORREL gibi doğrusal regresyon analizi yapmanıza yardımcı olabilecek birkaç istatistiksel işleve sahiptir.

    LINEST fonksiyonu, değişkenleriniz arasındaki ilişkiyi en iyi açıklayan düz bir çizgi hesaplamak için en küçük kareler regresyon yöntemini kullanır ve bu çizgiyi tanımlayan bir dizi döndürür. Fonksiyonun sözdiziminin ayrıntılı açıklamasını bu eğitimde bulabilirsiniz. Şimdilik, örnek veri kümemiz için bir formül oluşturalım:

    =LINEST(C2:C25, B2:B25)

    LINEST işlevi bir değerler dizisi döndürdüğünden, bunu bir dizi formülü olarak girmeniz gerekir. Aynı satırda iki bitişik hücre seçin (bizim durumumuzda E2:F2), formülü yazın ve tamamlamak için Ctrl + Shift + Enter tuşlarına basın.

    Formül şu değerleri döndürür b katsayısı (E1) ve a zaten bilinen doğrusal regresyon denklemi için sabit (F1):

    y = bx + a

    Çalışma sayfalarınızda dizi formülleri kullanmaktan kaçınıyorsanız a ve b düzenli formüller ile ayrı ayrı:

    Y-kesişimini (a) alın:

    =INTERCEPT(C2:C25, B2:B25)

    Eğimi (b) alın:

    = EĞIM(C2:C25, B2:B25)

    Ek olarak, şu adresi de bulabilirsiniz korelasyon katsayısı ( Çoklu R regresyon analizi özet çıktısında) iki değişkenin birbiriyle ne kadar güçlü ilişkili olduğunu gösterir:

    =CORREL(B2:B25,C2:C25)

    Aşağıdaki ekran görüntüsü tüm bu Excel regresyon formüllerini iş başında göstermektedir:

    İpucu: Regresyon analiziniz için ek istatistikler elde etmek isterseniz, LINEST fonksiyonunu s Dövmeler parametresi bu örnekte gösterildiği gibi TRUE olarak ayarlanmıştır.

    Excel'de doğrusal regresyonu bu şekilde yapabilirsiniz. Bununla birlikte, Microsoft Excel'in bir istatistik programı olmadığını lütfen unutmayın. Profesyonel düzeyde regresyon analizi yapmanız gerekiyorsa, XLSTAT, RegressIt vb. gibi hedeflenen yazılımları kullanmak isteyebilirsiniz.

    Doğrusal regresyon formüllerimize ve bu eğitimde ele alınan diğer tekniklere daha yakından bakmak için aşağıdaki örnek çalışma kitabımızı indirebilirsiniz. Okuduğunuz için teşekkür ederiz!

    Alıştırma çalışma kitabı

    Excel'de Regresyon Analizi - örnekler (.xlsx dosyası)

    Michael Brown, yazılım araçlarını kullanarak karmaşık süreçleri basitleştirme tutkusuna sahip, kendini adamış bir teknoloji meraklısıdır. Teknoloji endüstrisinde on yılı aşkın deneyimiyle Microsoft Excel ve Outlook'un yanı sıra Google E-Tablolar ve Dokümanlar'daki becerilerini geliştirdi. Michael'ın blogu, bilgisini ve uzmanlığını başkalarıyla paylaşmaya, üretkenliği ve verimliliği artırmaya yönelik takip etmesi kolay ipuçları ve eğitimler sağlamaya adamıştır. İster deneyimli bir profesyonel, ister yeni başlayan olun, Michael'ın blogu, bu temel yazılım araçlarından en iyi şekilde yararlanmak için değerli bilgiler ve pratik tavsiyeler sunar.