Агуулгын хүснэгт
Энэ заавар нь LINEST функцийн синтаксийг тайлбарлаж, Excel дээр шугаман регрессийн шинжилгээ хийхэд үүнийг хэрхэн ашиглахыг харуулж байна.
Microsoft Excel нь статистикийн програм биш боловч статистикийн хэд хэдэн функцтэй. Ийм функцүүдийн нэг нь шугаман регрессийн шинжилгээ хийх, холбогдох статистикийг буцаахад зориулагдсан LINEST юм. Эхлэгчдэд зориулсан энэхүү зааварт бид онол болон үндсэн тооцооны талаар бага зэрэг ярих болно. Бидний гол зорилго нь танд энгийн бөгөөд таны өгөгдөлд хялбархан тохируулах боломжтой томъёогоор хангах болно.
Excel-ийн LINEST функц - синтакс ба үндсэн хэрэглээ
LINEST функц нь бие даасан хувьсагч болон нэг буюу хэд хэдэн хамааралтай хувьсагчийн хоорондын хамаарлыг тайлбарласан шулуун шугамын статистикийг тооцоолж, мөрийг дүрсэлсэн массивыг буцаана. Энэ функц нь таны өгөгдөлд хамгийн сайн тохирохыг олохын тулд хамгийн бага квадратууд аргыг ашигладаг. Шугамын тэгшитгэл нь дараах байдалтай байна.
Энгийн шугаман регрессийн тэгшитгэл:
y = bx + aОлон регрессийн тэгшитгэл:
y = b 1x 1+ b 2x 2+ … + b nx n+ aХаана:
- y - таны таамаглах гэж буй хамааралтай хувьсагч.
- x - таны таамаглахад ашиглаж буй бие даасан хувьсагч y .
- a - огтлолцол (шугам Y тэнхлэгийг хаана огтлохыг заана).
- b - налуучухал ач холбогдолтой.
Эрх чөлөөний зэрэг (df). Excel-ийн LINEST функц нь эрх чөлөөний үлдэгдэл зэрэг -ийг буцаадаг бөгөөд энэ нь нийт df -ийг хассан регресс df юм. Та эрх чөлөөний зэрэглэлийг ашиглан статистикийн хүснэгтэд F-эгзэгтэй утгыг авч, дараа нь F-эгзэгтэй утгыг F статистиктай харьцуулж өөрийн загварын итгэлийн түвшинг тодорхойлж болно.
Регрессийн нийлбэр. квадратуудын ( тайлбарласан квадратуудын нийлбэр эсвэл квадратуудын загварын нийлбэр ). Энэ нь таамагласан y-утгууд болон y-ийн дундаж хоорондын квадрат зөрүүний нийлбэр бөгөөд дараах томъёогоор тооцоолно: =∑(ŷ - ȳ)2. Энэ нь таны регрессийн загвар хамааралтай хувьсагчийн өөрчлөлтийн хэр ихийг тайлбарлаж байгааг харуулж байна.
Үлдсэн квадратуудын нийлбэр . Энэ нь бодит y-утгууд болон таамагласан y-утгуудын квадрат зөрүүний нийлбэр юм. Энэ нь таны загварт хамааралтай хувьсагчийн өөрчлөлтийн хэр ихийг тайлбарлаагүй байгааг харуулж байна. Квадратуудын үлдэгдэл нийлбэр нь нийт квадратуудын нийлбэртэй харьцуулахад бага байх тусмаа таны регрессийн загвар таны өгөгдөлд илүү сайн тохирно.
МӨНГӨ функцийн талаар таны мэдэх ёстой 5 зүйл
ДОЛБООР томьёог үр ашигтай ашиглахын тулд Таны ажлын хуудаснаас та функцийн "дотоод механик"-ын талаар бага зэрэг илүү ихийг мэдэхийг хүсч магадгүй юм:
- Мэдэгдэж байгаа_y-ийн ба мэдэгдэж байгаа_x-ийн . Зөвхөн нэг багц x хувьсагчтай энгийн шугаман регрессийн загварт мэддэг_y-ийн ба мэдэгдэж байгаа_x-ийн нь ижил тооны мөр, баганатай бол ямар ч хэлбэрийн муж байж болно. Хэрэв та нэгээс олон бие даасан x хувьсагчтай олон регрессийн шинжилгээ хийвэл мэдэгдэж байгаа_y-ийн нь вектор, өөрөөр хэлбэл нэг мөр эсвэл нэг баганын муж байх ёстой.
- Тогтмолыг тэг болгох . const аргумент ҮНЭН эсвэл орхигдуулсан тохиолдолд a тогтмол (таслал)-ыг тооцоолж, тэгшитгэлд оруулна: y=bx + a. Хэрэв const -г ХУДАЛ гэж тохируулсан бол огтлолцлыг 0-тэй тэнцүү гэж үзэж, регрессийн тэгшитгэлээс хасагдана: y=bx.
Статистикийн хувьд огтлолцлын тогтмолыг 0 болгох нь утга учиртай эсэх талаар олон арван жилийн турш маргаж ирсэн. Регрессийн шинжилгээний олон итгэмжит мэргэжилтнүүд хэрвээ огтлолтыг тэг (const=FALSE) болгох нь ашигтай юм шиг санагдвал шугаман регресс нь өөрөө өгөгдлийн багцын буруу загвар гэж үздэг. Бусад нь тодорхой нөхцөл байдалд, жишээлбэл, регрессийн тасалдлын дизайны нөхцөлд тогтмолыг тэглэх боломжтой гэж үздэг. Ерөнхийдөө ихэнх тохиолдолд анхдагч const=TRUE буюу орхигдуулсан утгаар явахыг зөвлөж байна.
- Нарийвчлал . LINEST функцээр тооцсон регрессийн тэгшитгэлийн нарийвчлал нь таны өгөгдлийн цэгүүдийн тархалтаас хамаарна. Өгөгдөл шугаман байх тусам ШУГАНЫ томьёоны үр дүн илүү нарийвчлалтай болно.
- Илүүдэл x утгууд . Зарим тохиолдолд,нэг буюу хэд хэдэн бие даасан x хувьсагчид нэмэлт таамаглах утгагүй байж болох ба регрессийн загвараас ийм хувьсагчдыг хасах нь таамагласан y утгын нарийвчлалд нөлөөлөхгүй. Энэ үзэгдлийг "холбоо" гэж нэрлэдэг. Excel-ийн LINEST функц нь уялдаа холбоог шалгаж, загвараас тодорхойлсон илүүдэл x хувьсагчдыг орхигдуулдаг. Орхигдсон x хувьсагчдыг 0 коэффициент, 0 стандарт алдааны утгуудаар таньж болно.
- LINEST ба SLOPE ба INTERCEPT . LINEST функцийн үндсэн алгоритм нь SLOPE болон INTERCEPT функцэд ашигладаг алгоритмаас ялгаатай. Тиймээс, эх өгөгдөл нь тодорхойгүй эсвэл хоорондоо уялдаатай байвал эдгээр функцууд өөр үр дүнг гаргаж болно.
Excel-ийн LINEST функц ажиллахгүй байна
Хэрэв таны LINEST томьёо алдаа гаргах эсвэл буруу гаралт гаргавал , магадлал нь дараах шалтгаануудын аль нэгтэй холбоотой байх магадлалтай:
- Хэрэв LINEST функц нь зөвхөн нэг тоог буцаадаг (налуугийн коэффициент) бол та үүнийг массивын томьёо биш ердийн томьёо болгон оруулсан байх магадлалтай. Томьёог зөв бөглөхийн тулд Ctrl + Shift + Enter дарахаа мартуузай. Үүнийг хийснээр томьёо нь томьёоны мөрөнд харагдах {буржгар хаалтанд} хаагдана.
- #REF! алдаа. Хэрэв мэдэгдэж байгаа_x-ийн болон мэдэгдэж байгаа_y-ийн мужууд өөр өөр хэмжээстэй бол тохиолддог.
- #VALUE! алдаа. Хэрэв мэдэгдэж байгаа_x-ийн эсвэл байвал тохиолддог мэдэгдэж байгаа_y-ийн нь Excel-ийн тоон утга гэж хүлээн зөвшөөрдөггүй хамгийн багадаа нэг хоосон нүд, текстийн утга эсвэл текстийн дүрслэлийг агуулна. Мөн const эсвэл stats аргументыг ҮНЭН эсвэл ХУДАЛ гэж үнэлэх боломжгүй тохиолдолд #VALUE алдаа гарна.
Та Excel-д LINEST-г ийм байдлаар ашигладаг. энгийн ба олон шугаман регрессийн шинжилгээ. Энэхүү гарын авлагад дурдсан томьёог нарийвчлан үзэхийн тулд та доорх жишээн дээрх ажлын номыг татаж авахыг урьж байна. Уншиж байгаад баярлалаа, дараа долоо хоногт манай блог дээр уулзана гэж найдаж байна!
Татаж авах дасгалын ном
Excel LINEST функцын жишээнүүд (.xlsx файл)
(регрессийн шугамын эгц байдлыг, өөрөөр хэлбэл х өөрчлөгдөхөд y-ийн өөрчлөлтийн хурдыг заана).
Үндсэн хэлбэрээрээ LINEST функц нь огтлолцол (a) ба налууг (b) буцаана. регрессийн тэгшитгэлийн хувьд. Сонголтоор, энэ жишээнд үзүүлсэн шиг регрессийн шинжилгээний нэмэлт статистикийг буцаах боломжтой.
LINEST функцын синтакс
Excel-ийн LINEST функцийн синтакс дараах байдалтай байна:
Үүнд:
- мэддэг_y-ийн (шаардлагатай) нь хамааралтай y муж юм. -регрессийн тэгшитгэл дэх утгууд. Ихэвчлэн энэ нь нэг багана эсвэл нэг мөр байна.
- мэддэг_x-ийн (заавал биш) нь бие даасан x утгуудын муж юм. Хэрэв орхигдуулсан бол энэ нь мэдэгдэж байгаа_y-ийн хэмжээтэй ижил хэмжээтэй {1,2,3,...} массив гэж тооцогдоно.
- const (заавал биш) - огтлолтыг (тогтмол а ) хэрхэн авч үзэхийг тодорхойлдог логик утга:
- Хэрэв ҮНЭН эсвэл орхигдуулсан бол a тогтмолыг ердийн байдлаар тооцно.
- ХЭРэв ХУДАЛ бол a тогтмолыг 0 болгож, налууг ( b коэффициент) y=bx-д нийцүүлэн тооцно.
- стат (заавал биш) нь нэмэлт статистик гаргах эсэхийг тодорхойлох логик утга юм:
- Хэрэв ҮНЭН бол LINEST функц нь нэмэлт регрессийн статистик бүхий массивыг буцаана.
- Хэрэв ХУДАЛ эсвэл орхигдуулсан бол LINEST нь зөвхөн огтлолын тогтмол ба налууг буцаана.коэффициент(үүд).
Тайлбар. LINEST нь массив утгыг буцаадаг тул Ctrl + Shift + Enter товчлолыг дарж массивын томьёо болгон оруулах ёстой. Хэрэв үүнийг ердийн томъёогоор оруулсан бол зөвхөн эхний налуугийн коэффициентийг буцаана.
LINEST-н буцаасан нэмэлт статистик
stats аргументыг ҮНЭН гэж тохируулсан нь LINEST функцэд таны регрессийн шинжилгээнд дараах статистикийг буцаахыг заадаг:
Статистик | Тодорхойлолт |
Налуугийн коэффициент | b утга y = bx + a |
Тасалгааны тогтмол | а утга y = bx + a |
Налуугийн стандарт алдаа | Стандарт алдааны утга(ууд) b коэффициент(үүд). |
Тасалгааны стандарт алдаа | Тогтмол a -ийн стандарт алдааны утга. |
Детерминацын коэффициент (R2) | Регрессийн тэгшитгэл нь хувьсагчдын хоорондын хамаарлыг хэр сайн тайлбарлаж байгааг харуулдаг. |
Ү үнэлгээний стандарт алдаа | Регрессийн шинжилгээний нарийвчлалыг харуулдаг. |
F статистик буюу F-ажиглагдсан утга | Энэ нь F-туршилтыг хийхэд хэрэглэгддэг. Загварын тохирлын ерөнхий сайн байдлыг тодорхойлох тэг таамаглал. |
fr-ийн зэрэг. edom (df) | Эрх чөлөөний зэрэглэлийн тоо. |
Квадратуудын регрессийн нийлбэр | Чөлөөт байдлын зэрэглэлийн тоо.хамааралтай хувьсагчийг загвараар тайлбарлав. |
Квадратуудын үлдэгдэл нийлбэр | Таны регрессийн загвараар тайлбарлагдаагүй хамааралтай хувьсагчийн дисперсийн хэмжээг хэмждэг. |
Доорх газрын зураг нь LINEST нь статистикийн массивыг буцаадаг дарааллыг харуулж байна:
Сүүлийн гурван мөрөнд Өгөгдлийг бөглөөгүй гурав дахь болон дараагийн баганад #Үгүй алдаа гарч ирнэ. Энэ нь LINEST функцийн өгөгдмөл үйлдэл боловч хэрэв та алдааны тэмдэглэгээг нуухыг хүсвэл энэ жишээнд үзүүлсэн шиг ШУГАНЫ томьёогоо IFERROR руу оруулаарай.
Excel дээр LINEST-ийг хэрхэн ашиглах вэ - томъёоны жишээ
МӨГӨН функцийг ялангуяа шинэхэн хүмүүст ашиглахад төвөгтэй байж магадгүй, учир нь та зөвхөн томьёог зөв зохиохоос гадна түүний гаралтыг зөв тайлбарлах хэрэгтэй. Доор та онолын мэдлэгийг шингээхэд тусална гэж найдаж буй Excel программ дээр LINEST томьёо ашиглах цөөн хэдэн жишээг олох болно :)
Энгийн шугаман регресс: налуу ба огтлолцлыг тооцоолох
Таслалыг авахын тулд болон регрессийн шугамын налууг харвал та LINEST функцийг хамгийн энгийн хэлбэрээр ашиглана: мэдэгдэж буй_y-ийн аргументийн хамааралтай утгуудын муж болон мэдэгдэж буй_x-ийн<2-ын хамааралгүй утгуудын мужийг өгнө> аргумент. Сүүлийн хоёр аргументыг ҮНЭН гэж тохируулж эсвэл орхигдуулж болно.
Жишээ нь, y утгууд (борлуулалтын тоо) C2:C13 болон x утгуудтай(сурталчилгааны зардал) B2:B13 дээрх шугаман регрессийн томьёо нь дараах байдалтай байна:
=LINEST(C2:C13,B2:B13)
Үүнийг ажлын хуудсандаа зөв оруулахын тулд нэг эгнээний хоёр зэргэлдээ нүдийг E2 сонгоно уу: Энэ жишээний F2, томьёог бичээд Ctrl + Shift + Enter дарж дуусгана.
Томьёо нь эхний нүдэнд налуугийн коэффициент (E2), хоёр дахь нүдэнд (F2) огтлолцох тогтмолыг буцаана. ):
налуу нь ойролцоогоор 0.52 (аравтын хоёр орон хүртэл дугуйрсан) байна. Энэ нь x 1-ээр нэмэгдэхэд y 0.52-оор нэмэгдэнэ гэсэн үг.
Y-н огтлолцол сөрөг -4.99 байна. Энэ нь x=0 үед y -ийн хүлээгдэж буй утга юм. График дээр зурсан бол энэ нь регрессийн шугам у тэнхлэгийг огтолж буй утга юм.
Дээрх утгуудыг энгийн шугаман регрессийн тэгшитгэлд оруулбал борлуулалтын тоог таамаглах дараах томъёог авна. зар сурталчилгааны зардалд тулгуурлан:
y = 0.52*x - 4.99
Жишээ нь, хэрэв та сурталчилгаанд 50 доллар зарцуулсан бол 21 шүхэр зарах төлөвтэй байна:
0.52*50 - 4.99 = 21.01
Налуу ба огтлолын утгыг мөн харгалзах функцийг ашиглан эсвэл LINEST томьёог INDEX:
Налуу
=SLOPE(C2:C13,B2:B13)
-д оруулах замаар тусад нь авч болно. =INDEX(LINEST(C2:C13,B2:B13),1)
Intercept
=INTERCEPT(C2:C13,B2:B13)
=INDEX(LINEST(C2:C13,B2:B13),2)
Доорх дэлгэцийн агшинд үзүүлсэнчлэн гурван томьёо бүгд ижил үр дүнг өгч байна:
Олон шугаман регресс: налуу ба огтлолцол
Хэрэв танд байгаа болхоёр ба түүнээс дээш бие даасан хувьсагч байгаа бол тэдгээрийг зэргэлдээ баганад оруулахаа мартуузай, мөн энэ мужийг бүхэл бүтэн мэдэгдэж байгаа_x-ийн аргумент руу оруулна уу.
Жишээ нь, борлуулалтын дугаартай ( y<2)> утгууд) D2:D13, зар сурталчилгааны зардал (х утгын нэг багц) B2:B13, сарын дундаж хур тунадас (өөр нэг багц x утгууд) C2:C13-д дараах томъёог ашиглана:
=LINEST(D2:D13,B2:C13)
Томъёо нь 3 утгын массивыг (налуугийн 2 коэффициент ба огтлолын тогтмол) буцаах гэж байгаа тул бид нэг эгнээний гурван зэргэлдээ нүдийг сонгоод томьёог оруулаад Ctrl + товчийг дарна уу. Shift + Enter товчлол.
Олон регрессийн томъёо нь бие даасан хувьсагчдын урвуу дарааллаар (баруунаас зүүн тийш) налуугийн коэффициентийг буцаадаг гэдгийг анхаарна уу. нь b n , b n-1 , …, b 2 , b 1 :
Борлуулалтын тоог таамаглахын тулд бид LINEST томьёогоор буцаасан утгуудыг олон регрессийн тэгшитгэлд нийлүүлнэ:
y = 0.3*x 2 + 0.19*x 1 - 10.74
Жишээ нь Зар сурталчилгаанд 50 доллар зарцуулж, сард дунджаар 100 мм хур тунадас ордог тул та ойролцоогоор 23 шүхэр зарах төлөвтэй байна:
0.3*50 + 0.19*100 - 10.74 = 23.26
Энгийн шугаман регресс: хамааралтай хувьсагчийг таамаглах
Excel LINEST функц нь регрессийн тэгшитгэлийн a ба b утгуудыг тооцоолохоос гадна мэдэгдэж буй бие даасан дээр үндэслэн хамааралтай хувьсагчийг (y) тооцоолж болно.хувьсагч (x). Үүний тулд та LINEST-ийг SUM эсвэл SUMPRODUCT функцтэй хослуулан ашигладаг.
Жишээ нь, өмнөх саруудын борлуулалт болон 10-р сарын борлуулалтын борлуулалтын тоог дараах байдлаар тооцоолох боломжтой. Аравдугаар сарын зар сурталчилгааны төсөв $50:
=SUM(LINEST(C2:C10, B2:B10)*{50,1})
Томьёоны x утгыг хатуу кодлохын оронд та үүнийг дараах байдлаар өгч болно. эсийн лавлагаа. Энэ тохиолдолд та массивын тогтмол дахь лавлагаа болон утгуудыг холих боломжгүй тул зарим нүдэнд 1 тогтмолыг оруулах шаардлагатай.
E2 дахь x утга, тогтмол 1-тэй. F2, доорх томъёоны аль нэг нь ажиллах болно:
Энгийн томъёо (Enter дээр дарж оруулна):
=SUMPRODUCT(LINEST(C2:C10, B2:B10)*(E2:F2))
Масивын томъёо (Ctrl + Shift + дарж оруулна. Оруулна уу ):
=SUM(LINEST(C2:C10, B2:B10)*(E2:F2))
Үр дүнг баталгаажуулахын тулд та ижил өгөгдлийн огтлолцол ба налууг авч, шугаман регрессийн томъёог ашиглана. y тооцоо:
=E2*G2+F2
Э2 нь налуу, G2 нь x утга, F2 нь огтлолцол:
Олон регресс: хамааралтай хувьсагчийг таамаглах
Хэрэв та хэд хэдэн таамаглагчид, өөрөөр хэлбэл x утгуудын хэд хэдэн багцтай харьцаж байгаа бол эдгээрийг бүгдийг нь оруулаарай. массивын тогтмол дахь таамаглагчид. Жишээлбэл, зар сурталчилгааны төсөв $50 (x 2 ), сард дунджаар 100 мм (x 1 ) хур тунадас ордог бол томъёо нь дараах байдалтай байна.дараах:
=SUM(LINEST(D2:D10, B2:C10)*{50,100,1})
Үүнд D2:D10 нь мэдэгдэж байгаа y утгууд ба B2:C10 нь x утгын хоёр багц юм:
Масивын тогтмол дахь x утгуудын дарааллыг анхаарна уу. Өмнө дурьдсанчлан, Excel-ийн LINEST функцийг олон регресс хийхэд ашигладаг бол налуугийн коэффициентийг баруунаас зүүн тийш буцаана. Бидний жишээнд эхлээд Зар сурталчилгааны коэффициент, дараа нь Бороо коэффициентийг буцаана. Урьдчилан таамагласан борлуулалтын тоог зөв тооцоолохын тулд та коэффициентүүдийг харгалзах x утгуудаар үржүүлэх шаардлагатай тул массивын тогтмолын элементүүдийг дараах дарааллаар оруулна: {50,100,1}. Сүүлчийн элемент нь 1, учир нь LINEST-ийн буцаасан сүүлчийн утга нь өөрчлөх ёсгүй огтлолцол тул та үүнийг зүгээр л 1-ээр үржүүлнэ.
Масивын тогтмолыг ашиглахын оронд та бүх x хувьсагчийг оруулж болно. Өмнөх жишээн дээрх шиг зарим нүдэнд томьёоныхоо тэдгээр нүднүүдийг лавлана уу.
Энгийн томъёо:
=SUMPRODUCT(LINEST(D2:D10, B2:C10)*(F2:H2))
Масивын томъёо:
=SUM(LINEST(D2:D10, B2:C10)*(F2:H2))
Энд F2 ба G2 нь x утгууд, H2 нь 1:
ШУГРАН томьёо: нэмэлт регрессийн статистик
Таны санаж байгаачлан регрессийн шинжилгээнд илүү их статистик мэдээлэл авахын тулд LINEST функцийн сүүлийн аргумент дээр ҮНЭН гэж оруулсан. Манай түүвэр өгөгдөлд хэрэглэсэн томъёо нь дараах хэлбэртэй байна:
=LINEST(D2:D13, B2:C13, TRUE, TRUE)
Бидэнд 2 бие даасан байнаB ба C баганад байгаа хувьсагчдыг бид 3 мөр (хоёр х утга + таслах) ба 5 баганаас бүрдэх уур хилэнг сонгоод дээрх томьёог оруулаад Ctrl + Shift + Enter дарж дараах үр дүнг авна:
#N/A алдааг арилгахын тулд та LINEST-г IFERROR-д дараах байдлаар байрлуулж болно:
=IFERROR(LINEST(D2:D13, B2:C13, TRUE, TRUE), "")
Доорх дэлгэцийн зураг нь үр дүнг харуулж, юу болохыг тайлбарлав. тоо тус бүр нь:
Налуугийн коэффициентүүд болон Ү огтлолцлын талаар өмнөх жишээнүүдэд тайлбарласан тул бусад статистикийг хурдан харцгаая.
Тодорхойлох коэффициент (R2). R2-ийн утга нь квадратуудын регрессийн нийлбэрийг квадратуудын нийт нийлбэрт хуваасны үр дүн юм. Энэ нь хэдэн y утгыг x хувьсагчаар тайлбарлаж байгааг хэлж өгнө. Энэ нь 0-ээс 1 хүртэлх тоо байж болно, өөрөөр хэлбэл 0% -аас 100% хүртэл. Энэ жишээнд R2 нь ойролцоогоор 0.97 байна, энэ нь бидний хамааралтай хувьсагчдын 97% (шүхэр борлуулалт) нь бие даасан хувьсагчаар (зар сурталчилгаа + сарын дундаж хур тунадас) тайлбарлагдана гэсэн үг бөгөөд энэ нь маш сайн тохирно!
Стандарт алдаа . Ерөнхийдөө эдгээр утгууд нь регрессийн шинжилгээний нарийвчлалыг харуулдаг. Тоонууд бага байх тусам регрессийн загварынхаа талаар илүү итгэлтэй байх болно.
F статистик . Та тэг таамаглалыг дэмжих эсвэл үгүйсгэхийн тулд F статистикийг ашигладаг. Нийт үр дүн гарах эсэхийг шийдэхдээ F статистикийг P утгатай хослуулан хэрэглэхийг зөвлөж байна