Mundarija
O'quv qo'llanma regressiya tahlilining asoslarini tushuntiradi va Excelda chiziqli regressiyani amalga oshirishning bir necha xil usullarini ko'rsatadi.
Tasavvur qiling: sizga juda ko'p turli xil ma'lumotlar va kompaniyangiz uchun kelgusi yilgi savdo raqamlarini bashorat qilish so'raladi. Siz raqamlarga ta'sir qilishi mumkin bo'lgan o'nlab, ehtimol yuzlab omillarni topdingiz. Ammo qaysi biri haqiqatan ham muhimligini qanday bilasiz? Excelda regressiya tahlilini bajaring. U sizga bu va boshqa ko'plab savollarga javob beradi: Qaysi omillar muhim va qaysi birini e'tiborsiz qoldirish mumkin? Bu omillar bir-biri bilan qanchalik chambarchas bog'liq? Va bashoratlarga qanchalik ishonchingiz komil bo'lishi mumkin?
Excelda regressiya tahlili - asoslar
Statistik modellashtirishda regressiya tahlili ikki yoki undan ortiq oʻzgaruvchilar oʻrtasidagi munosabatlarni baholang:
Bogʻliq oʻzgaruvchi (aka kriteriya oʻzgaruvchisi) siz tushunishga va bashorat qilishga urinayotgan asosiy omildir.
Mustaqil o'zgaruvchilar (aka tushuntiruvchi o'zgaruvchilar yoki prediktorlar ) bog'liq o'zgaruvchiga ta'sir qilishi mumkin bo'lgan omillardir.
Regressiya tahlili sizga yordam beradi. mustaqil o'zgaruvchilardan biri o'zgarganda bog'liq o'zgaruvchining qanday o'zgarishini tushuning va bu o'zgaruvchilardan qaysi biri haqiqatan ham ta'sir ko'rsatishini matematik tarzda aniqlash imkonini beradi.
Texnik jihatdan regressiya tahlili modeli yig'indisiga asoslanadi.
Hozirgi vaqtda sizning diagrammangiz allaqachon munosib regressiya grafigiga o'xshaydi:
Shunday bo'lsa-da, yana bir nechta yaxshilanishlarni xohlashingiz mumkin:
- Tenglamani o'zingizga mos keladigan joyga torting.
- O'qlar sarlavhalarini qo'shing ( Chart elementlari tugmasi > O'q sarlavhalari ).
- Agar ma'lumotlar nuqtalari ushbu misoldagi kabi gorizontal va/yoki vertikal o'qning o'rtasidan boshlanadi, siz ortiqcha oq bo'shliqdan xalos bo'lishni xohlashingiz mumkin. Quyidagi maslahat buni qanday qilishni tushuntiradi: Oq bo'shliqni kamaytirish uchun diagramma o'qlarini masshtablang.
Bizning yaxshilangan regressiya grafigimiz shunday ko'rinadi:
Muhim eslatma! Regressiya grafigida mustaqil o'zgaruvchi har doim X o'qida va qaram o'zgaruvchi Y o'qida bo'lishi kerak. Grafikingiz teskari tartibda chizilgan bo'lsa, ish varag'ingizdagi ustunlarni almashtiring va keyin diagrammani yangidan chizing. Agar siz manba ma'lumotlarini qayta tartibga solishga ruxsat berilmasa, X va Y o'qlarini to'g'ridan-to'g'ri diagrammada almashtirishingiz mumkin.
Formulalar yordamida Excelda regressiyani qanday qilish kerak
Microsoft Excel-da LINEST, SLOPE, INTERCEPT va CORREL kabi chiziqli regressiya tahlilini amalga oshirishda yordam beradigan bir nechta statistik funksiyalar mavjud.
LINEST funktsiyasi to'g'ri chiziqni hisoblash uchun eng kichik kvadratlar regressiya usulidan foydalanadi. o'zgaruvchilaringiz orasidagi munosabatni eng yaxshi tushuntiradigan va ushbu qatorni tavsiflovchi qatorni qaytaradigan qator. ning batafsil tavsifini topishingiz mumkinushbu qo'llanmada funksiya sintaksisi. Hozircha, keling, namunaviy ma’lumotlar to‘plamimiz uchun formula tuzamiz:
=LINEST(C2:C25, B2:B25)
LIQ funksiyasi qiymatlar massivini qaytargani uchun uni massiv formulasi sifatida kiritishingiz kerak. Xuddi shu qatordagi ikkita qo'shni katakchani tanlang, bizning holatda E2:F2, formulani kiriting va uni yakunlash uchun Ctrl + Shift + Enter tugmalarini bosing.
Formula b koeffitsientini qaytaradi ( E1) va allaqachon tanish chiziqli regressiya tenglamasi uchun a konstantasi (F1):
y = bx + a
Agar siz ish varaqlarida massiv formulalaridan foydalanmasangiz,
Y-kesishmasini (a) oling:
=INTERCEPT(C2:C25, B2:B25)
Qiyalikni oling (b):
=SLOPE(C2:C25, B2:B25)
Qo'shimcha ravishda, siz korrelyatsiya koeffitsientini (regressiya tahlili xulosasida Ko'p R ) topishingiz mumkin. ikki oʻzgaruvchi bir-biri bilan kuchli bogʻliq:
=CORREL(B2:B25,C2:C25)
Quyidagi skrinshotda barcha Excel regressiya formulalari amalda koʻrsatilgan:
Maslahat. Agar siz regressiya tahlili uchun qoʻshimcha statistik maʼlumotlarni olishni istasangiz, ushbu misolda koʻrsatilganidek, s tats parametri TRUE ga oʻrnatilgan LINEST funksiyasidan foydalaning.
Shunday qilib chiziqli regressiyani bajarasiz. Excelda. Shuni yodda tutingki, Microsoft Excel statistik dastur emas. Agar siz professional darajada regressiya tahlilini o'tkazishingiz kerak bo'lsa, maqsadli foydalanishni xohlashingiz mumkinXLSTAT, RegressIt va boshqalar kabi dasturiy ta'minot.
Ushbu qo'llanmada ko'rib chiqilgan chiziqli regressiya formulalarimiz va boshqa texnikamiz bilan yaqindan tanishish uchun quyidagi namunaviy ish kitobimizni yuklab olishingiz mumkin. O'qiganingiz uchun rahmat!
Mashq ish kitobi
Excelda regressiya tahlili - misollar (.xlsx fayli)
kvadratlar, bu ma'lumotlar nuqtalarining dispersiyasini topishning matematik usuli. Modelning maqsadi kvadratlarning mumkin bo'lgan eng kichik yig'indisini olish va ma'lumotlarga eng yaqin keladigan chiziqni chizishdir.Statistikada ular oddiy va ko'p chiziqli regressiyani farqlaydi. Oddiy chiziqli regressiya chiziqli funksiya yordamida qaram o‘zgaruvchi va bitta mustaqil o‘zgaruvchi o‘rtasidagi munosabatni modellashtiradi. Agar siz qaram o'zgaruvchini bashorat qilish uchun ikki yoki undan ortiq tushuntirish o'zgaruvchilardan foydalansangiz, siz ko'p chiziqli regressiya bilan shug'ullanasiz. Agar bog'liq o'zgaruvchi chiziqli bo'lmagan funktsiya sifatida modellashtirilgan bo'lsa, chunki ma'lumotlar munosabatlari to'g'ri chiziqqa amal qilmasa, uning o'rniga nochiziqli regressiya dan foydalaning. Ushbu qoʻllanmada asosiy eʼtibor oddiy chiziqli regressiyaga qaratiladi.
Misol sifatida, soʻnggi 24 oydagi soyabonlarning sotilgan raqamlarini olaylik va shu davr uchun oʻrtacha oylik yogʻingarchilik miqdorini bilib olaylik. Ushbu ma'lumotni diagrammada tuzing va regressiya chizig'i mustaqil o'zgaruvchi (yomg'ir) va qaram o'zgaruvchi (soyabon savdosi) o'rtasidagi munosabatni ko'rsatadi:
Chiziqli regressiya tenglamasi
Matematik jihatdan chiziqli regressiya bu tenglama bilan aniqlanadi:
y = bx + a + eBu yerda:
- x mustaqil o'zgaruvchi.
- y - bog'liq o'zgaruvchi.
- a Y-kesishma , ya'ni kutilgan o'rtacha qiymatiBarcha x o'zgaruvchilar 0 ga teng bo'lganda y . Regressiya grafigida bu chiziq Y o'qini kesib o'tgan nuqtadir.
- b - regressiya chizig'ining qiyaligi , bu y uchun x o'zgarishi bilan o'zgarish tezligi.
- e tasodifiy xato Termin, ya'ni qaram o'zgaruvchining haqiqiy qiymati va uning bashorat qilingan qiymati o'rtasidagi farq.
Chiziqli regressiya tenglamasi har doim xato terminiga ega, chunki real hayotda bashorat qiluvchilar hech qachon to'liq aniq bo'lmaydi. Biroq, ba'zi dasturlar, shu jumladan Excel, sahna ortida xato muddatini hisoblashni amalga oshiradi. Shunday qilib, Excelda siz eng kichik kvadratlar usuli yordamida chiziqli regressiya qilasiz va a va b koeffitsientlarini qidirasiz, shunday qilib:
y = bx + aBizning misolimiz uchun chiziqli regressiya tenglamasi quyidagi shaklni oladi:
Umbrellas sold = b * rainfall + a
a va b
- Regressiya vositasi Analysis ToolPak-ga kiritilgan
- Trend chizig'i bilan tarqalish diagrammasi
- Chiziqli regressiya formulasi
Quyida har bir usuldan foydalanish boʻyicha batafsil koʻrsatmalarni topasiz.
Excelda Analysis ToolPak yordamida chiziqli regressiyani qanday amalga oshirish mumkin
Ushbu misol Excelda regressiyani qanday bajarishni koʻrsatadi. Analysis ToolPak plaginiga kiritilgan maxsus vosita yordamida.
Analisis ToolPak plaginini yoqishin
Analysis ToolPak Excel 365-2003-ning barcha versiyalarida mavjud, lekin sukut bo'yicha yoqilmagan. Shunday qilib, siz uni qo'lda yoqishingiz kerak. Mana shunday:
- Excel-da Fayl > Options -ni bosing.
- Excel Options -da dialog oynasida chap yon panelda Qo'shimchalar -ni tanlang, Boshqarish oynasida Excel qo'shimchalari tanlanganligiga ishonch hosil qiling va O'tish
. - Qo'shimchalar muloqot oynasida Tahlil asboblar to'plami belgisini qo'ying va OK tugmasini bosing:
Bu Ma'lumotlarni tahlil qilish vositalarini Excel lentasining Ma'lumotlar yorlig'iga qo'shadi.
Regressiya tahlilini ishga tushirish
In Ushbu misolda biz Excelda oddiy chiziqli regressiya qilamiz. Bizning mustaqil o'zgaruvchimiz (bashoratchi) bo'lgan B ustunida so'nggi 24 oy uchun o'rtacha oylik yog'ingarchilik ro'yxati va qaram o'zgaruvchi bo'lgan C ustunida sotilgan soyabonlar soni mavjud. Albatta, savdoga ta'sir qiluvchi boshqa omillar ham ko'p, ammo hozircha biz faqat ushbu ikkita o'zgaruvchiga e'tibor qaratamiz:
Tahlil asboblar to'plami yoqilgan bo'lsa, Excelda regressiya tahlilini amalga oshirish uchun quyidagi amallarni bajaring:
- Ma'lumotlar yorlig'ida Tahlil guruhida Ma'lumotlarni tahlil qilish tugmasini bosing.
- Regressiya -ni tanlang va OK tugmasini bosing.
- Regressiya dialog oynasida quyidagi sozlamalarni sozlang:
- Kirish-ni tanlang.Y diapazoni , bu sizning qaram o'zgaruvchingiz . Bizning holatda, bu soyabon savdosi (C1:C25).
- Kirish X diapazoni ni, ya'ni mustaqil o'zgaruvchini tanlang. Bu misolda bu oʻrtacha oylik yogʻingarchilik (B1:B25).
Agar siz koʻp regressiya modelini qurayotgan boʻlsangiz, turli mustaqil oʻzgaruvchilarga ega ikki yoki undan ortiq qoʻshni ustunlarni tanlang.
- Agar X va Y diapazonlaringiz tepasida sarlavhalar bo'lsa, Yorliqlar katagiga belgi qo'ying.
- O'zingiz yoqtirgan Chiqish variantini, yangi ish varag'ini tanlang.
- Ixtiyoriy ravishda bashorat qilingan va haqiqiy qiymatlar orasidagi farqni olish uchun Qoldiqlar katagiga belgi qo'ying.
- OK tugmasini bosing va Excel tomonidan yaratilgan regressiya tahlili natijasini kuzating.
Regressiya tahlili natijasini sharhlash
Ko'rib turganingizdek, Excelda regressiyani amalga oshirish oson, chunki barcha hisob-kitoblar avtomatik tarzda amalga oshiriladi. Natijalarni talqin qilish biroz qiyinroq, chunki har bir raqamning orqasida nima borligini bilishingiz kerak. Quyida siz regressiya tahlili natijasining 4 ta asosiy qismining taqsimotini topasiz.
Regressiya tahlilining natijasi: Xulosa chiqishi
Ushbu qism sizga hisoblangan chiziqli regressiya tenglamasi manba maʼlumotlaringizga qanchalik mos kelishini koʻrsatadi.
Har bir ma'lumot nimani anglatadi:
Ko'p R . Bu C orrelyatsiya koeffitsienti ning kuchini o'lchaydiikki o'zgaruvchi o'rtasidagi chiziqli munosabat. Korrelyatsiya koeffitsienti -1 dan 1 gacha bo'lgan har qanday qiymat bo'lishi mumkin va uning mutlaq qiymati munosabatlarning kuchini ko'rsatadi. Mutlaq qiymat qanchalik katta bo'lsa, munosabatlar shunchalik kuchli bo'ladi:
- 1 kuchli ijobiy munosabatlarni bildiradi
- -1 kuchli salbiy munosabatlarni bildiradi
- 0 hammasi
R kvadrat . Bu Determinatsiya koeffitsienti bo'lib, moslik yaxshiligining ko'rsatkichi sifatida ishlatiladi. Bu regressiya chizig'iga qancha nuqta tushishini ko'rsatadi. R2 qiymati kvadratlarning umumiy yig'indisidan hisoblanadi, aniqrog'i, bu dastlabki ma'lumotlarning o'rtacha qiymatdan kvadratik og'ishlarining yig'indisidir.
Bizning misolimizda R2 0,91 ga teng (2 raqamga yaxlitlangan) , bu juda yaxshi. Bu bizning qadriyatlarimizning 91% regressiya tahlili modeliga mos kelishini anglatadi. Boshqacha qilib aytganda, bog'liq o'zgaruvchilarning (y-qiymatlari) 91% mustaqil o'zgaruvchilar (x-qiymatlari) bilan izohlanadi. Odatda, 95% yoki undan ortiq R kvadrati yaxshi mos deb hisoblanadi.
Tuzatilgan R kvadrat . Bu modeldagi mustaqil o'zgaruvchilar soniga moslashtirilgan R kvadrat . Ko'p regressiya tahlili uchun R kvadrat o'rniga ushbu qiymatdan foydalanmoqchisiz.
Standart xato . Bu sizning regressiya tahlilingizning aniqligini ko'rsatadigan yana bir moslik o'lchovidir - bu raqam qanchalik kichik bo'lsa, shunchalik ishonchli bo'lishingiz mumkin.sizning regressiya tenglamangiz. R2 bog'liq o'zgaruvchilar dispersiyasining model tomonidan izohlangan foizini ifodalasa, standart xato ma'lumotlar nuqtalari regressiya chizig'idan tushadigan o'rtacha masofani ko'rsatadigan mutlaq o'lchovdir.
Kuzatuvlar . Bu shunchaki modelingizdagi kuzatuvlar soni.
Regressiya tahlili natijasi: ANOVA
Chiqishning ikkinchi qismi - Variant tahlili (ANOVA):
Asosan, u kvadratlar yig'indisini regressiya modelingizdagi o'zgaruvchanlik darajalari haqida ma'lumot beruvchi individual komponentlarga ajratadi:
- df - manbalar bilan bog'liq erkinlik darajalari soni. dispersiya.
- SS - kvadratlar yig'indisi. Umumiy SS bilan solishtirganda qoldiq SS qanchalik kichik bo'lsa, modelingiz ma'lumotlarga shunchalik yaxshi mos keladi.
- MS - o'rtacha kvadrat.
- F F statistikasi yoki nol gipoteza uchun F-testi. U modelning umumiy ahamiyatini tekshirish uchun ishlatiladi.
- Ahamiyat F F ning P-qiymati.
ANOVA qismi kamdan-kam hollarda qo'llaniladi. Excelda oddiy chiziqli regressiya tahlili, lekin siz oxirgi komponentni albatta diqqat bilan ko'rib chiqishingiz kerak. Ahamiyat F qiymati natijalaringiz qanchalik ishonchli (statistik jihatdan muhim) ekanligi haqida fikr beradi. Agar muhimlik F 0,05 (5%) dan kam bo'lsa, modelingiz yaxshi. Agar u 0,05 dan katta bo'lsa, sizEhtimol, boshqa mustaqil o'zgaruvchini tanlagan ma'qul.
Regressiya tahlilining natijasi: koeffitsientlar
Ushbu bo'lim tahlilingiz komponentlari haqida aniq ma'lumot beradi:
Ushbu bo'limdagi eng foydali komponent: Koeffitsientlar . Bu sizga Excelda chiziqli regressiya tenglamasini yaratish imkonini beradi:
y = bx + aBizning ma'lumotlar to'plamimiz uchun, bu erda y - sotilgan soyabonlar soni va x - o'rtacha oylik yog'ingarchilik, Bizning chiziqli regressiya formulamiz quyidagicha bo'ladi:
Y = Rainfall Coefficient * x + Intercept
Uch kasrgacha yaxlitlangan a va b qiymatlari bilan jihozlangan bo'lib, u quyidagicha aylanadi:
Y=0.45*x-19.074
Misol uchun, o'rtacha oylik yog'ingarchilik 82 mm ga teng bo'lsa, soyabon savdosi taxminan 17,8 ni tashkil qiladi:
0.45*82-19.074=17.8
Shunga o'xshab, qancha soyabon bo'lishini bilib olishingiz mumkin. siz koʻrsatgan boshqa har qanday oylik yogʻingarchilik (x oʻzgaruvchisi) bilan sotiladi.
Regression tahlil natijasi: qoldiqlar
Agar oylik yogʻingarchilik miqdori 82 mm boʻlgan sotilgan soyabonlarning taxminiy va haqiqiy sonini solishtirsangiz, bu raqamlar biroz boshqacha ekanligini ko'rasiz:
- Taxminiy: 17,8 (yuqorida hisoblangan)
- Haqiqiy: 15 (manba ma'lumotlarining 2-qatori)
Nega farq bor? Chunki mustaqil o'zgaruvchilar hech qachon qaram o'zgaruvchilarning mukammal bashoratchisi bo'la olmaydi. Va qoldiqlar haqiqiy qiymatlar prognoz qilingan qiymatlardan qanchalik uzoqda ekanligini tushunishga yordam beradi:
uchunbirinchi ma'lumot nuqtasi (yomg'ir 82 mm), qoldiq taxminan -2,8. Shunday qilib, biz ushbu raqamni taxmin qilingan qiymatga qo'shamiz va haqiqiy qiymatni olamiz: 17,8 - 2,8 = 15.
Excelda chiziqli regressiya grafigini qanday qilish kerak
Agar siz tezda vizualizatsiya qilishingiz kerak bo'lsa. ikki o'zgaruvchi o'rtasidagi munosabat, chiziqli regressiya diagrammasini tuzing. Bu juda oson! Mana shunday:
- Maʼlumotlaringiz bilan ikkita ustunni, jumladan sarlavhalarni tanlang.
- Inset yorligʻida, Chatlar guruhida , Scatter chart belgisini bosing va Scatter eskizini (birinchi rasm) tanlang:
Bu sizning ishchi varaqingizga shunga o'xshash tarqalish grafigini kiritadi. biri:
- Endi biz eng kichik kvadratlarning regressiya chizig'ini chizishimiz kerak. Buni amalga oshirish uchun istalgan nuqtani o'ng tugmasini bosing va kontekst menyusidan Trend chizig'ini qo'shish... -ni tanlang.
- O'ng panelda Chiziqli trend chizig'i shaklini tanlang va ixtiyoriy ravishda regressiya formulasini olish uchun Diagrammada tenglamani ko'rsatish-ni belgilang:
E'tibor berganingizdek, Excel biz uchun yaratgan regressiya tenglamasi biz koeffitsientlar chiqishi asosida tuzgan chiziqli regressiya formulasi bilan bir xil.
- Toʻldirish & Chiziq yorlig'iga o'ting va chiziqni o'zingizning xohishingizga ko'ra sozlang. Masalan, siz boshqa chiziq rangini tanlashingiz va kesilgan chiziq o‘rniga qattiq chiziqdan foydalanishingiz mumkin ( Tire turi oynasida Qattiq chiziqni tanlang):