Excel дээрх шугаман регрессийн шинжилгээ

  • Үүнийг Хуваалц
Michael Brown

Заавар нь регрессийн шинжилгээний үндсийг тайлбарлаж, Excel-д шугаман регресс хийх хэд хэдэн аргыг харуулж байна.

Та төсөөлөөд үз дээ: танд маш олон өөр өөр өгөгдөл, мэдээлэл өгсөн байна. Танай компанийн ирэх жилийн борлуулалтын тоог урьдчилан таамаглахыг хүсч байна. Та тоонд нөлөөлж болох хэдэн арван, магадгүй хэдэн зуун хүчин зүйлийг олж мэдсэн. Гэхдээ аль нь үнэхээр чухал болохыг та яаж мэдэх вэ? Регрессийн шинжилгээг Excel дээр ажиллуул. Энэ нь танд энэ болон бусад олон асуултын хариуг өгөх болно: Аль хүчин зүйл чухал, алийг нь үл тоомсорлож болох вэ? Эдгээр хүчин зүйлүүд хоорондоо хэр нягт холбоотой вэ? Мөн та таамаглалд хэр итгэлтэй байж чадах вэ?

    Excel дээрх регрессийн шинжилгээ - үндсэн ойлголтууд

    Статистик загварчлалд регрессийн шинжилгээ -ийг дараах зорилгоор ашигладаг. хоёр ба түүнээс дээш хувьсагчийн хоорондын хамаарлыг тооцоолох:

    Хамаарах хувьсагч ( шалгуур хувьсагч) нь таны ойлгож, таамаглахыг оролдож буй гол хүчин зүйл юм.

    Бие даасан хувьсагчид ( тайлбар хувьсагч эсвэл урьдчилан таамаглагчид ) нь хамааралтай хувьсагчдад нөлөөлж болох хүчин зүйлүүд юм.

    Регрессийн шинжилгээ нь танд тусална. бие даасан хувьсагчийн аль нэг нь өөрчлөгдөхөд хамааралтай хувьсагч хэрхэн өөрчлөгдөхийг ойлгож, тэдгээр хувьсагчийн аль нь үнэхээр нөлөөлж байгааг математикийн аргаар тодорхойлох боломжийг олгодог.

    Техникийн хувьд регрессийн шинжилгээний загвар нь нийлбэр дээр суурилдаг.

    Энэ үед таны диаграм аль хэдийн зохистой регрессийн график шиг харагдаж байна:

    Гэсэн хэдий ч та хэд хэдэн сайжруулалт хиймээр байна:

    • Тэгшитгэлийг тохирох газар болгон чирнэ үү.
    • Тэнхлэгийн гарчиг нэмнэ үү ( Графикийн элементүүд товчлуур > Тэнхлэгийн гарчиг ).
    • Хэрэв таны Өгөгдлийн цэгүүд энэ жишээн дээрх шиг хэвтээ ба/эсвэл босоо тэнхлэгийн дундаас эхэлдэг тул та хэт их хоосон зайг арилгахыг хүсч болно. Дараах зөвлөгөө нь үүнийг хэрхэн хийхийг тайлбарласан болно: Хоосон зайг багасгахын тулд диаграмын тэнхлэгүүдийг масштаблана.

      Бидний сайжруулсан регрессийн график дараах байдалтай байна:

      Анхаарах зүйл! Регрессийн графикт бие даасан хувьсагч үргэлж X тэнхлэгт, хамааралтай хувьсагч нь Y тэнхлэгт байх ёстой. Хэрэв таны график урвуу дарааллаар зурсан бол ажлын хуудасны баганыг сольж, дараа нь диаграмыг шинээр зурна уу. Хэрэв та эх өгөгдлийг дахин цэгцлэхийг зөвшөөрөөгүй бол X ба Y тэнхлэгийг диаграммд шууд сольж болно.

    Томьёог ашиглан Excel дээр регрессийг хэрхэн хийх вэ

    Microsoft Excel нь LINEST, SLOPE, INTERCEPT, CORREL гэх мэт шугаман регрессийн шинжилгээ хийхэд туслах хэд хэдэн статистик функцтэй.

    ШУГАР функц нь шулууныг тооцоолохдоо хамгийн бага квадратын регрессийн аргыг ашигладаг. Таны хувьсагчдын хоорондын хамаарлыг хамгийн сайн тайлбарлаж, тухайн мөрийг дүрсэлсэн массивыг буцаадаг мөр. Та дэлгэрэнгүй тайлбарыг олж болноЭнэ зааварт функцийн синтакс. Одоохондоо жишээ өгөгдлийн багцдаа томьёо хийцгээе:

    =LINEST(C2:C25, B2:B25)

    ШУГРАН функц нь массив утгыг буцаадаг тул та үүнийг массивын томьёо болгон оруулах ёстой. Манай тохиолдолд E2:F2 гэсэн нэг мөрөнд зэргэлдээх хоёр нүдийг сонгоод томьёог бичээд Ctrl + Shift + Enter дарж дуусгана уу.

    Томьёо нь b коэффициентийг буцаана ( E1) болон аль хэдийн мэддэг шугаман регрессийн тэгшитгэлийн a тогтмол (F1):

    y = bx + a

    Хэрэв та ажлын хуудсандаа массивын томьёог ашиглахаас зайлсхийвэл <тооцоолж болно. 1>a болон b -г тус тусад нь энгийн томъёогоор:

    Y-н огтлолцол (a):

    =INTERCEPT(C2:C25, B2:B25)

    Налууг ол. (б):

    =SLOPE(C2:C25, B2:B25)

    Үүнээс гадна та корреляцийн коэффициент -ийг (регрессийн шинжилгээний хураангуй гаралтаас Олон R ) олж болно. хоёр хувьсагч нь хоорондоо хүчтэй холбоотой:

    =CORREL(B2:B25,C2:C25)

    Дараах дэлгэцийн агшинд эдгээр Excel-ийн регрессийн бүх томьёо ажиллаж байгаа нь харагдаж байна:

    Зөвлөгөө. Хэрэв та регрессийн шинжилгээний нэмэлт статистик мэдээлэл авахыг хүсвэл энэ жишээнд үзүүлсэн шиг s tats параметрийг ҮНЭН гэж тохируулсан LINEST функцийг ашиглана уу.

    Ингэж шугаман регрессийг хийдэг. Excel дээр. Microsoft Excel нь статистикийн програм биш гэдгийг санаарай. Хэрэв та мэргэжлийн түвшинд регрессийн шинжилгээ хийх шаардлагатай бол зорилтот аргыг ашиглаж болноXLSTAT, RegressIt гэх мэт программ хангамжууд.

    Энэ зааварт авч үзсэн шугаман регрессийн томьёо болон бусад аргуудыг нарийвчлан судлахын тулд та доорх жишээн дээрх ажлын номыг татаж авах боломжтой. Уншсанд баярлалаа!

    Дадлага хийх ажлын ном

    Excel дэх регрессийн шинжилгээ - жишээнүүд (.xlsx файл)

    квадратуудбөгөөд энэ нь өгөгдлийн цэгүүдийн тархалтыг олох математик арга юм. Загварын зорилго нь квадратуудын боломжит хамгийн бага нийлбэрийг гаргаж, өгөгдөлд хамгийн ойр байгаа шугамыг зурах явдал юм.

    Статистикт энгийн ба олон шугаман регрессийг ялгадаг. Энгийн шугаман регресс шугаман функц ашиглан хамааралтай хувьсагч ба нэг бие даасан хувьсагчийн хоорондын хамаарлыг загварчилна. Хэрэв та хамааралтай хувьсагчийг таамаглахад хоёр ба түүнээс дээш тайлбарлагч хувьсагч ашигладаг бол олон шугаман регресс -тэй харьцана. Хэрэв өгөгдлийн хамаарал нь шулуун шугамыг дагаж мөрддөггүй тул хамааралтай хувьсагчийг шугаман бус функцээр загварчилсан бол оронд нь шугаман бус регресс -г ашиглана. Энэ хичээлийн гол сэдэв нь энгийн шугаман регресс дээр байх болно.

    Жишээ нь сүүлийн 24 сарын шүхрийн борлуулалтын тоог авч, мөн үеийн сарын дундаж хур тунадасыг олж мэдье. Энэ мэдээллийг график дээр зурвал регрессийн шугам нь бие даасан хувьсагч (хур тунадас) ба хамааралтай хувьсагч (шүхэр борлуулалт) хоорондын хамаарлыг харуулах болно:

    Шугаман регрессийн тэгшитгэл

    Математикийн хувьд шугаман регресс нь энэ тэгшитгэлээр тодорхойлогддог:

    y = bx + a + ε

    Энд:

    • x нь бие даасан хувьсагч.
    • y нь хамааралтай хувьсагч юм.
    • a нь Y- огтлолцол бөгөөд энэ нь хүлээгдэж буй дундаж утга юм.Бүх x хувьсагч 0-тэй тэнцүү байх үед y . Регрессийн график дээр энэ нь шугамын Y тэнхлэгийг огтолж буй цэг юм.
    • b нь регрессийн шугамын налуу бөгөөд энэ нь y -ийн x өөрчлөлтийн үед өөрчлөгдөх хурд юм.
    • ε нь санамсаргүй алдаа юм. нэр томъёо бөгөөд энэ нь хамааралтай хувьсагчийн бодит утга ба түүний таамагласан утгын зөрүү юм.

    Бодит амьдрал дээр таамаглагчид хэзээ ч төгс нарийвчлалтай байдаггүй учраас шугаман регрессийн тэгшитгэл үргэлж алдаатай байдаг. Гэсэн хэдий ч, Excel зэрэг зарим програмууд хөшигний ард алдааны хугацааны тооцооллыг хийдэг. Excel дээр та хамгийн бага квадратын аргыг ашиглан шугаман регрессийг хийж a ба b коэффициентүүдийг хайж олохын тулд:

    y = bx + a

    Бидний жишээнд шугаман регрессийн тэгшитгэл нь дараах хэлбэртэй байна:

    Umbrellas sold = b * rainfall + a

    a ба b<-г олох олон янзын арга байдаг. 2>. Excel дээр шугаман регрессийн шинжилгээ хийх үндсэн гурван арга нь:

    • Шинжилгээний хэрэгсэлд багтсан регрессийн хэрэгсэл
    • Тренд шугам бүхий тараах диаграм
    • Шугаман регрессийн томъёо

    Арга тус бүрийг ашиглах дэлгэрэнгүй зааврыг доороос үзнэ үү.

    Шинжилгээний хэрэгсэл ашиглан Excel дээр шугаман регрессийг хэрхэн хийх талаар

    Энэ жишээ нь Excel дээр регрессийг хэрхэн ажиллуулахыг харуулж байна. Analysis ToolPak нэмэлт хэрэгсэлд багтсан тусгай хэрэгслийг ашиглан.

    Шинжилгээний хэрэгслийн багцыг идэвхжүүлнэ.in

    Analysis ToolPak нь Excel 365-аас 2003 хүртэлх бүх хувилбарт боломжтой боловч анхдагчаар идэвхжээгүй. Тиймээс та үүнийг гараар асаах хэрэгтэй. Үүнд:

    1. Excel дээрээ Файл > Сонголтууд дээр дарна уу.
    2. Excel-ийн сонголтууд харилцах цонхонд зүүн талын самбараас Нэмэлтүүд -г сонгоод Удирдах талбарт Excel Нэмэлтүүд сонгогдсон эсэхийг шалгаад Явах<дээр дарна уу. 2>.
    3. Нэмэлтүүд харилцах цонхны Шинжилгээний хэрэгсэл -г сонгоод OK дээр дарна уу:

    Энэ нь таны Excel туузны Өгөгдөл таб дээр Өгөгдлийн шинжилгээ хэрэгслийг нэмнэ.

    Регрессийн шинжилгээг ажиллуулах

    Дэлгэрэнгүй Энэ жишээн дээр бид Excel дээр энгийн шугаман регресс хийх гэж байна. Бидэнд байгаа зүйл бол бидний бие даасан хувьсагч (урьдчилан таамаглагч) болох В баганад сүүлийн 24 сарын сарын дундаж хур тунадасны жагсаалт, хамааралтай хувьсагч болох С баганад зарагдсан шүхрийн тоо юм. Мэдээжийн хэрэг, борлуулалтад нөлөөлж болох өөр олон хүчин зүйлүүд байгаа ч одоогоор бид зөвхөн эдгээр хоёр хувьсагч дээр анхаарлаа хандуулж байна:

    Шинжилгээний хэрэглүүрийг идэвхжүүлсэн үед Excel дээр регрессийн шинжилгээ хийхдээ дараах алхмуудыг хийгээрэй:

    1. Өгөгдөл табын Шинжилгээ бүлгийн Өгөгдлийн шинжилгээ товчийг дарна уу.
    2. Регресс -г сонгоод ОК дарна уу.
    3. Регресс харилцах цонхонд дараах тохиргоог хийнэ үү:
      • Оролтыг сонгоно уу.Y Range , энэ нь таны хамааралтай хувьсагч . Манай тохиолдолд энэ нь шүхэр борлуулалт (C1:C25) юм.
      • Input X Range , өөрөөр хэлбэл өөрийн бие даасан хувьсагч -ийг сонго. Энэ жишээнд энэ нь сарын дундаж хур тунадасны хэмжээ юм (B1:B25).

      Хэрэв та олон регрессийн загвар барьж байгаа бол өөр өөр бие даасан хувьсагчтай хоёр буюу түүнээс дээш зэргэлдээ баганыг сонгоно уу.

      • Хэрвээ X ба Y мужуудын дээд хэсэгт толгой гарчиг байгаа бол Шошгоны хайрцгийг шалгана уу.
      • Таны дуртай Гаралтын сонголтыг, манай хуудаснаас шинэ ажлын хуудсыг сонгоно уу. тохиолдол.
      • Заавал таамагласан болон бодит утгын зөрүүг авахын тулд Үлдэгдэл хайрцгийг сонго.
    4. OK дээр дарж Excel-ийн үүсгэсэн регрессийн шинжилгээний гаралтыг ажигла.

    Регрессийн шинжилгээний гаралтыг тайлбарлах

    Таны харж байгаачлан Excel дээр регресс хийх нь хялбар байдаг, учир нь бүх тооцоо автоматаар хийгдсэн байдаг. Үр дүнгийн тайлбар нь арай төвөгтэй байдаг, учир нь та тоо бүрийн ард юу байгааг мэдэх хэрэгтэй. Доор та регрессийн шинжилгээний гаралтын үндсэн 4 хэсгийн задаргааг үзнэ үү.

    Регрессийн шинжилгээний гаралт: Хураангуй гаралт

    Энэ хэсэг нь тооцоолсон шугаман регрессийн тэгшитгэл таны эх өгөгдөлд хэр нийцэж байгааг хэлж өгнө.

    Мэдээлэл бүр юу гэсэн үг вэ:

    Олон R . Энэ нь C орреляцийн коэффициент -ийн хүчийг хэмждэгхоёр хувьсагчийн хоорондох шугаман хамаарал. Корреляцийн коэффициент нь -1-ээс 1-ийн хооронд ямар ч утга байж болох бөгөөд түүний үнэмлэхүй утга нь харилцааны бат бөх чанарыг илэрхийлдэг. Үнэмлэхүй утга их байх тусам харилцаа илүү хүчтэй болно:

    • 1 нь хүчтэй эерэг харилцааг илэрхийлнэ
    • -1 нь хүчтэй сөрөг харилцааг илэрхийлнэ
    • 0 нь бүгд

    R талбай . Энэ нь Тодорхойлолтын коэффицент бөгөөд тохирох байдлын үзүүлэлт болгон ашигладаг. Энэ нь регрессийн шугам дээр хэдэн оноо унасныг харуулдаг. R2 утгыг квадратуудын нийт нийлбэрээс тооцоолно, илүү нарийвчлалтай бол энэ нь дундажаас анхны өгөгдлийн квадрат хазайлтын нийлбэр юм.

    Бидний жишээнд R2 нь 0.91 (2 оронтой болгон дугуйрсан) байна. , энэ нь сайн үлгэр юм. Энэ нь манай утгуудын 91% нь регрессийн шинжилгээний загварт нийцэж байна гэсэн үг. Өөрөөр хэлбэл, хамааралтай хувьсагчдын (y-утга) 91% нь бие даасан хувьсагчид (х-утгууд) тайлбарлагдана. Ерөнхийдөө R квадрат нь 95% ба түүнээс дээш байвал тохиромжтой гэж үздэг.

    Тохируулсан R квадрат . Энэ нь загвар дахь бие даасан хувьсагчийн тоонд тохируулсан R квадрат юм. Та олон регрессийн шинжилгээнд R квадрат -ын оронд энэ утгыг ашиглахыг хүсэх болно.

    Стандарт алдаа . Энэ нь таны регрессийн шинжилгээний нарийвчлалыг харуулдаг өөр нэг сайн чанарын хэмжүүр юм - тоо бага байх тусам та илүү итгэлтэй байж чадна.таны регрессийн тэгшитгэл. R2 нь загвараар тайлбарласан хамааралтай хувьсагчдын дисперсийн хувийг илэрхийлдэг бол Стандарт алдаа нь өгөгдлийн цэгүүдийн регрессийн шугамаас унах дундаж зайг харуулсан үнэмлэхүй хэмжигдэхүүн юм.

    Ажиглалт . Энэ нь зүгээр л таны загвар дахь ажиглалтын тоо юм.

    Регрессийн шинжилгээний гаралт: ANOVA

    Гаралтын хоёр дахь хэсэг нь Variance Analysis (ANOVA):

    Үндсэндээ, энэ нь квадратуудын нийлбэрийг таны регрессийн загвар дахь хувьсах түвшний тухай мэдээлэл өгөх бие даасан бүрэлдэхүүн хэсгүүдэд хуваадаг:

    • df нь эх сурвалжтай холбоотой эрх чөлөөний зэрэглэлийн тоо юм. дисперсийн.
    • SS нь квадратуудын нийлбэр юм. Үлдэгдэл SS нь Нийт SS-тэй харьцуулахад бага байх тусам таны загвар өгөгдөлд илүү сайн нийцдэг.
    • MS нь дундаж квадрат юм.
    • F нь F статистик буюу тэг таамаглалын F-тест юм. Энэ нь загварын ерөнхий ач холбогдлыг шалгахад хэрэглэгддэг.
    • Ач холбогдол F нь F-ийн P-утга юм.

    ANOVA хэсгийг ашиглах нь ховор. Excel дээрх энгийн шугаман регрессийн шинжилгээ, гэхдээ та хамгийн сүүлийн бүрэлдэхүүн хэсгийг сайтар судалж үзэх хэрэгтэй. Ач холбогдол F утга нь таны үр дүн хэр найдвартай (статистикийн хувьд ач холбогдолтой) болохыг харуулж байна. Хэрэв ач холбогдол F нь 0.05 (5%)-аас бага бол таны загвар хэвийн байна. Хэрэв энэ нь 0.05-аас их бол та үүнийг хийх болноӨөр бие даасан хувьсагчийг сонгох нь дээр байх.

    Регрессийн шинжилгээний үр дүн: коэффициентүүд

    Энэ хэсэгт таны шинжилгээний бүрэлдэхүүн хэсгүүдийн талаар тодорхой мэдээлэл өгнө:

    Энэ хэсгийн хамгийн хэрэгтэй бүрэлдэхүүн хэсэг нь Итгэлцүүр . Энэ нь Excel-д шугаман регрессийн тэгшитгэлийг бүтээх боломжийг танд олгоно:

    y = bx + a

    Манай өгөгдлийн багцын хувьд y нь борлуулсан шүхрийн тоо, x нь сарын дундаж хур тунадас, Манай шугаман регрессийн томьёо дараах байдалтай байна:

    Y = Rainfall Coefficient * x + Intercept

    А ба b утгуудаар аравтын гурван орон хүртэл бөөрөнхийлсөн бол энэ нь:

    Y=0.45*x-19.074

    болж хувирна. Жишээлбэл, сард дунджаар 82 мм хур тунадас ороход шүхрийн борлуулалт ойролцоогоор 17.8 болно:

    0.45*82-19.074=17.8

    Үүнтэй адилаар та хэдэн шүхэр орохыг мэдэж болно. таны тодорхойлсон бусад хур тунадас (x хувьсагч)-тай хамт зарагдсан.

    Регрессийн шинжилгээний гаралт: үлдэгдэл

    Хэрэв та сард орох 82 мм хур тунадастай харгалзах зарагдсан шүхрийн тооцоолсон болон бодит тоог харьцуулж үзвэл, эдгээр тоонууд арай өөр байгааг та харах болно:

    • Тооцоолсон: 17.8 (дээр тооцсон)
    • Бодит: 15 (эх өгөгдлийн 2-р эгнээ)

    Яагаад ялгаа байна вэ? Учир нь бие даасан хувьсагчид хэзээ ч хамааралтай хувьсагчдыг төгс таамаглаж чаддаггүй. Үлдэгдэл нь бодит утгууд таамагласан утгуудаас хэр хол байгааг ойлгоход тусална:

    эхний өгөгдлийн цэг (82 мм хур тунадас), үлдэгдэл нь ойролцоогоор -2.8 байна. Тиймээс бид энэ тоог таамагласан утга дээр нэмээд бодит утгыг авна: 17.8 - 2.8 = 15.

    Excel дээр шугаман регрессийн графикийг хэрхэн хийх вэ

    Хэрэв та хурдан дүрслэх шаардлагатай бол хоёр хувьсагчийн хоорондын хамаарлыг шугаман регрессийн график зур. Энэ их амархан! Үүнд:

    1. Өөрийн өгөгдөл бүхий хоёр баганыг толгой хэсгийг оруулаад сонгоно уу.
    2. Оруулах табын Чат бүлэгт , Тараах диаграм дүрс дээр товшоод Тараах өнгөц зургийг сонгоно уу (эхнийх нь):

      Энэ нь таны ажлын хуудсанд үүнтэй төстэй тараах график оруулах болно. нэг:

    3. Одоо бид хамгийн бага квадратын регрессийн шугамыг зурах хэрэгтэй. Үүнийг хийхийн тулд дурын цэг дээр хулганы баруун товчийг дараад контекст цэснээс Тренд шугам нэмэх... командыг сонгоно уу.
    4. Баруун талд байгаа Шугаман чиг хандлагын хэлбэрийг сонгоод График дээрх тэгшитгэлийг харуулах -г сонгоод регрессийн томъёогоо авна уу:

      Excel-ийн бидэнд зориулан бүтээсэн регрессийн тэгшитгэл нь Коэффициентийн гаралт дээр тулгуурлан бүтээсэн шугаман регрессийн томъёотой ижил байгааг та анзаарсан байх.

    5. Дүүргэх & Line таб болон шугамыг өөрийн үзэмжээр тохируулна уу. Жишээлбэл, та өөр шугамын өнгийг сонгож, тасархай шугамын оронд хатуу шугамыг ашиглаж болно ( Зураасны төрөл нүдэн дэх Хатуу шугамыг сонгоно уу):

    Майкл Браун бол програм хангамжийн хэрэгслийг ашиглан нарийн төвөгтэй процессуудыг хялбаршуулах хүсэл эрмэлзэлтэй, технологид дуртай хүн юм. Технологийн салбарт арав гаруй жил ажилласан туршлагатай тэрээр Microsoft Excel, Outlook, мөн Google Sheets болон Docs дээр ур чадвараа дээшлүүлсэн. Майклын блог нь өөрийн мэдлэг, туршлагаа бусадтай хуваалцах, бүтээмж, үр ашгийг дээшлүүлэхэд хялбар зөвлөмж, зааварчилгаа өгөх зорилготой юм. Та туршлагатай мэргэжилтэн эсвэл анхлан суралцаж байгаа эсэхээс үл хамааран Майклын блог нь эдгээр чухал програм хангамжийн хэрэгслээс хамгийн их ашиг хүртэх талаар үнэ цэнэтэй ойлголт, практик зөвлөгөөг санал болгодог.