Функција Excel LINEST со примери на формула

  • Споделете Го Ова
Michael Brown

Овој туторијал ја објаснува синтаксата на функцијата LINEST и покажува како да се користи за да се направи анализа на линеарна регресија во Excel.

Microsoft Excel не е статистичка програма, сепак, тоа го прави имаат голем број статистички функции. Една од таквите функции е LINEST, која е дизајнирана да врши линеарна регресивна анализа и статистика поврзана со враќање. Во ова упатство за почетници, ќе ја допреме само лесно теоријата и основните пресметки. Нашиот главен фокус ќе биде да ви обезбедиме формула која едноставно работи и може лесно да се прилагоди за вашите податоци.

    Excel LINEST функција - синтакса и основни употреби

    The Функцијата LINEST ја пресметува статистиката за права линија која ја објаснува врската помеѓу независната променлива и една или повеќе зависни променливи и враќа низа што ја опишува линијата. Функцијата го користи методот најмали квадрати за да го најде најдоброто соодветно за вашите податоци. Равенката за правата е следна.

    Едноставна линеарна регресивна равенка:

    y = bx + a

    Равенка на повеќекратна регресија:

    y = b 1x 1+ b 2x 2+ … + b nx n+ a

    Каде:

    • y - зависната променлива што се обидувате да ја предвидите.
    • x - независната променлива што ја користите за предвидување y .
    • a - пресекот (означува каде линијата ја пресекува оската Y).
    • b - наклонотзначајно.

      Степени на слобода (df). Функцијата LINEST во Excel ги враќа преостанатите степени на слобода , што е вкупниот df минус регресијата df . Можете да ги користите степените на слобода за да добиете F-критични вредности во статистичка табела, а потоа да ги споредите критичните вредности F со статистиката F за да одредите ниво на доверба за вашиот модел.

      Регресивен збир од квадрати (наречена објаснета сума на квадрати , или модел збир на квадрати ). Тоа е збир од квадратните разлики помеѓу предвидените y-вредности и средната вредност на y, пресметан со оваа формула: =∑(ŷ - ȳ)2. Тоа покажува колку од варијацијата во зависната променлива објаснува вашиот регресивен модел.

      Преостаната сума на квадрати . Тоа е збир од квадратните разлики помеѓу вистинските y-вредности и предвидените y-вредности. Тоа покажува колку од варијациите во зависната променлива вашиот модел не објаснува. Колку е помал преостанатиот збир на квадрати во споредба со вкупниот збир на квадрати, толку подобро вашиот регресивен модел одговара на вашите податоци.

      5 работи што треба да ги знаете за функцијата LINEST

      За ефикасно користење на формулите LINEST во вашите работни листови, можеби ќе сакате да дознаете малку повеќе за „внатрешната механика“ на функцијата:

      1. Known_y's и known_x's . Во едноставен линеарен регресивен модел со само едно множество од x променливи, познати_y's и known_x's може да бидат опсези од која било форма се додека имаат ист број на редови и колони. Ако правите повеќекратна регресивна анализа со повеќе од еден сет на независни x променливи, known_y's мора да биде вектор, т.е. опсег од еден ред или една колона.
      2. Присилување на константата на нула . Кога аргументот const е ТОЧЕН или е испуштен, константата a (пресек) се пресметува и се вклучува во равенката: y=bx + a. Ако const е поставено на FALSE, пресекот се смета за еднаков на 0 и изоставен од равенката на регресија: y=bx.

        Во статистиката, со децении се дебатира дали има смисла да се принуди константата на пресретнување на 0 или не. Многу веродостојни практичари за анализа на регресија веруваат дека ако поставувањето на пресекот на нула (const=FALSE) се чини дека е корисно, тогаш самата линеарна регресија е погрешен модел за множеството податоци. Други претпоставуваат дека константата може да биде принудена на нула во одредени ситуации, на пример, во контекст на дизајни на регресивен дисконтинуитет. Општо земено, се препорачува да се оди со стандардното const=TRUE или испуштено во повеќето случаи.

      3. Прецизност . Точноста на равенката за регресија пресметана со функцијата LINEST зависи од дисперзијата на вашите точки на податоци. Колку се полинеарни податоците, толку се попрецизни резултатите од формулата LINEST.
      4. Непотребни x вредности . Во некои ситуации,една или повеќе независни x променливи може да немаат дополнителна предвидлива вредност, а отстранувањето на таквите променливи од регресиониот модел не влијае на точноста на предвидените y вредности. Овој феномен е познат како „колинеарност“. Функцијата Excel LINEST проверува за колинеарност и ги испушта сите непотребни x променливи што ги идентификува од моделот. Испуштените x променливи може да се препознаат по 0 коефициенти и 0 стандардни вредности на грешка.
      5. LINEST наспроти SLOPE и INTERCEPT . Основниот алгоритам на функцијата LINEST се разликува од алгоритмот што се користи во функциите SLOPE и INTERCEPT. Затоа, кога изворните податоци се неодредени или колинеарни, овие функции може да вратат различни резултати.

      Функцијата Excel LINEST не работи

      Ако вашата формула LINEST направи грешка или произведе погрешен излез , голема е веројатноста дека тоа е поради една од следниве причини:

      1. Ако функцијата LINEST врати само еден број (коефициент на наклон), најверојатно сте го внеле како редовна формула, а не како формула за низа. Не заборавајте да притиснете Ctrl + Shift + Enter за правилно да ја комплетирате формулата. Кога ќе го направите ова, формулата се затвора во {кадравите загради} што се видливи во лентата со формули.
      2. #REF! грешка. Се појавува ако опсезите на познати_x и познати_y имаат различни димензии.
      3. #VALUE! грешка. Се појавува ако познати_x's или known_y's содржи најмалку една празна ќелија, текстуална вредност или текстуална претстава на број што Excel не го препознава како нумеричка вредност. Исто така, грешката #VALUE се појавува ако аргументот const или stats не може да се оцени на TRUE или FALSE.

      Така го користите LINEST во Excel за едноставна и повеќекратна линеарна регресивна анализа. За да ги погледнете подетално формулите дискутирани во ова упатство, добредојдени сте да ја преземете нашата примерок работна книга подолу. Ви благодарам што прочитавте и се надевам дека ќе се видиме на нашиот блог следната недела!

      Вежбајте работна книга за преземање

      Примери на функцијата Excel LINEST (датотека .xlsx)

      (ја означува стрмнината на линијата на регресија, т.е. стапката на промена за y како што се менува x).

    Во својата основна форма, функцијата LINEST го враќа пресекот (a) и наклонот (b) за регресивната равенка. Изборно, може да врати и дополнителна статистика за регресиската анализа како што е прикажано во овој пример.

    Синтакса на функцијата LINEST

    Синтаксата на функцијата Excel LINEST е како што следува:

    LINEST(познати_y's , [known_x's], [const], [stats])

    Каде:

    • known_y's (задолжително) е опсег од зависните y -вредности во регресивната равенка. Вообичаено, тоа е една колона или единечен ред.
    • known_x's (опционално) е опсег од независните x-вредности. Ако се испушти, се претпоставува дека е низата {1,2,3,...} со иста големина како known_y's .
    • const (изборно) - логичка вредност што одредува како треба да се третира пресекот (константа a ):
      • Ако ТОЧНО или испуштена, константата a се пресметува нормално.
      • Ако FALSE, константата a е принудена на 0 и наклонот ( b коефициент) се пресметува да одговара на y=bx.
    • stats (опционално) е логичка вредност што одредува дали да се издадат дополнителни статистики или не:
      • Ако е ТОЧНО, функцијата LINEST враќа низа со дополнителна статистика за регресија.
      • Ако FALSE или изоставени, LINEST ја враќа само константата на пресекот и наклоноткоефициент(и).

    Забелешка. Бидејќи LINEST враќа низа од вредности, таа мора да се внесе како формула за низа со притискање на кратенката Ctrl + Shift + Enter. Ако се внесе како редовна формула, се враќа само првиот коефициент на наклон.

    Дополнителни статистики вратени од LINEST

    Аргументот stats поставен на TRUE и наложува на функцијата LINEST да ја врати следната статистика за вашата регресивна анализа:

    Статистика Опис
    Коефициент на наклон b вредност во y = bx + a
    Пресечна константа вредност во y = bx + a
    Стандардна грешка на наклон Стандардна вредност(и) на грешка за b коефициент(и).
    Стандардна грешка при пресретнување Стандардна вредност на грешка за константата a .
    Коефициент на определување (R2) Покажува колку добро регресивната равенка ја објаснува врската помеѓу променливите.
    Стандардна грешка за проценката Y Ја покажува прецизноста на регресивната анализа.
    F статистика или F-набљудуваната вредност Се користи за да се направи F-тестот за нулта хипотеза за одредување на севкупната добрина на вклопувањето на моделот.
    Степени на fr eedom (df) Бројот на степени на слобода.
    Регресивен збир на квадрати Покажува колку од варијациите возависната променлива се објаснува со моделот.
    Преостаната сума на квадрати Го мери количеството на варијанса во зависната променлива што не е објаснето со вашиот регресивен модел.

    Подолу мапата го прикажува редоследот по кој LINEST враќа низа статистики:

    Во последните три реда, Грешки #N/A ќе се појават во третата и следните колони кои не се пополнети со податоци. Тоа е стандардното однесување на функцијата LINEST, но ако сакате да ги скриете ознаките за грешки, завиткајте ја формулата LINEST во IFERROR како што е прикажано во овој пример.

    Како да го користите LINEST во Excel - примери на формули

    Функцијата LINEST може да биде незгодна за користење, особено за почетниците, бидејќи не само што треба правилно да изградите формула, туку и правилно да го интерпретирате нејзиниот излез. Подолу, ќе најдете неколку примери за користење LINEST формули во Excel кои се надеваме дека ќе помогнат да се потопи теоретското знаење :)

    Едноставна линеарна регресија: пресметајте го наклонот и пресретнете

    За да го добиете пресекот и наклонот на линијата за регресија, ја користите функцијата LINEST во нејзината наједноставна форма: наведете опсег на зависни вредности за аргументот known_y's и опсег на независни вредности за known_x's аргумент. Последните два аргументи може да се постават на TRUE или да се испуштат.

    На пример, со y вредности (продажни броеви) во C2:C13 и x вредности(трошок за рекламирање) во B2:B13, нашата формула за линеарна регресија е едноставна како:

    =LINEST(C2:C13,B2:B13)

    За правилно да ја внесете во вашиот работен лист, изберете две соседни ќелии во истиот ред, E2: F2 во овој пример, напишете ја формулата и притиснете Ctrl + Shift + Enter за да ја завршите.

    Формулата ќе го врати коефициентот на наклон во првата ќелија (E2) и константата на пресек во втората ќелија (F2 ):

    наклонот е приближно 0,52 (заокружена на две децимални места). Тоа значи дека кога x се зголемува за 1, y се зголемува за 0,52.

    Y-пресекот е негативен -4,99. Тоа е очекуваната вредност на y кога x=0. Ако се нацрта на графикон, тоа е вредноста со која регресивната линија ја преминува y-оската.

    Наведете ги горенаведените вредности на едноставна линеарна регресивна равенка и ќе ја добиете следнава формула за да го предвидите продажниот број врз основа на трошоците за рекламирање:

    y = 0.52*x - 4.99

    На пример, ако потрошите 50 долари за рекламирање, се очекува да продадете 21 чадори:

    0.52*50 - 4.99 = 21.01

    Вредностите на наклонот и пресекот може да се добијат и одделно со користење на соодветната функција или со вгнездување на формулата LINEST во INDEX:

    Slope

    =SLOPE(C2:C13,B2:B13)

    =INDEX(LINEST(C2:C13,B2:B13),1)

    Пресечување

    =INTERCEPT(C2:C13,B2:B13)

    =INDEX(LINEST(C2:C13,B2:B13),2)

    Како што е прикажано на сликата подолу, сите три формули ги даваат истите резултати:

    Повеќекратна линеарна регресија: наклон и пресек

    Во случај да иматедве или повеќе независни променливи, задолжително внесете ги во соседните колони и доставете го целиот тој опсег со аргументот known_x .

    На пример, со продажни броеви ( y вредности) во D2:D13, трошоци за рекламирање (еден сет од x вредности) во B2:B13 и просечни месечни врнежи (друг сет од x вредности) во C2:C13, ја користите оваа формула:

    =LINEST(D2:D13,B2:C13)

    Бидејќи формулата ќе врати низа од 3 вредности (2 коефициенти на наклон и константата на пресекот), избираме три соседни ќелии во истиот ред, ја внесуваме формулата и го притискаме Ctrl + Shift + Enter кратенка.

    Ве молиме имајте предвид дека формулата за повеќекратна регресија ги враќа коефициентите на наклон во обратен редослед на независните променливи (од десно кон лево), што е b n , b n-1 , …, b 2 , b 1 :

    За да го предвидиме бројот на продажба, ги доставуваме вредностите вратени со формулата LINEST во равенката на повеќекратна регресија:

    y = 0,3*x 2 + 0,19*x 1 - 10,74

    На пр изобилство, со 50 долари потрошени за рекламирање и просечни месечни врнежи од 100 mm, се очекува да продадете приближно 23 чадори:

    0.3*50 + 0.19*100 - 10.74 = 23.26

    Едноставна линеарна регресија: предвиди зависна променлива

    Покрај пресметувањето на вредностите a и b за регресивната равенка, функцијата Excel LINEST може да ја процени и зависната променлива (y) врз основа на познатата независнапроменлива (x). За ова, го користите LINEST во комбинација со функцијата SUM или SUMPRODUCT.

    На пример, еве како можете да го пресметате бројот на продажби за чадор за следниот месец, на пример октомври, врз основа на продажбите во претходните месеци и Рекламниот буџет за октомври од 50 долари:

    =SUM(LINEST(C2:C10, B2:B10)*{50,1})

    Наместо да ја внесете вредноста x во формулата, можете да ја дадете како референца на ќелијата. Во овој случај, треба да ја внесете и константата 1 во некоја ќелија бидејќи не можете да мешате референци и вредности во константа на низа.

    Со вредноста x во E2 и константата 1 во F2, која било од долунаведените формули ќе работи како резултат:

    Регуларна формула (внесена со притискање Enter):

    =SUMPRODUCT(LINEST(C2:C10, B2:B10)*(E2:F2))

    Формула за низа (внесена со притискање Ctrl + Shift + Внесете ):

    =SUM(LINEST(C2:C10, B2:B10)*(E2:F2))

    За да го потврдите резултатот, можете да го добиете пресекот и наклонот за истите податоци, а потоа да ја користите формулата за линеарна регресија за пресметај y :

    =E2*G2+F2

    каде E2 е наклонот, G2 е вредноста x , а F2 е пресекот:

    Повеќекратна регресија: предвиди зависна променлива

    Во случај да имаш работа со неколку предвидувачи, т.е. неколку различни групи од x вредности, вклучете ги сите оние предиктори во константата на низата. На пример, со буџетот за рекламирање од 50 долари (x 2 ) и просечни месечни врнежи од 100 mm (x 1 ), формулата оди какоследува:

    =SUM(LINEST(D2:D10, B2:C10)*{50,100,1})

    каде D2:D10 се познатите y вредности и B2:C10 се две групи од x вредности:

    Ве молиме обрнете внимание на редоследот на вредностите x во константата на низата. Како што беше наведено претходно, кога функцијата Excel LINEST се користи за повеќекратна регресија, таа ги враќа коефициентите на наклон од десно кон лево. Во нашиот пример, прво се враќа коефициентот Рекламирање , а потоа коефициентот врнежи . За правилно да го пресметате предвидениот број на продажба, треба да ги помножите коефициентите со соодветните x вредности, па елементите на константата на низата да ги ставите по овој редослед: {50,100,1}. Последниот елемент е 1, бидејќи последната вредност што ја враќа LINEST е пресекот што не треба да се менува, па едноставно го помножите со 1.

    Наместо да користите константа на низа, можете да ги внесете сите x променливи во некои ќелии и упатете ги тие ќелии во вашата формула како што направивме во претходниот пример.

    Регуларна формула:

    =SUMPRODUCT(LINEST(D2:D10, B2:C10)*(F2:H2))

    Формула за низа:

    =SUM(LINEST(D2:D10, B2:C10)*(F2:H2))

    Каде F2 и G2 се вредностите x , а H2 е 1:

    LINEST формула: дополнителна статистика за регресија

    Како што можеби се сеќавате, за да добиете повеќе статистики за вашата регресивна анализа, ставате ТОЧНО во последниот аргумент на функцијата LINEST. Применета на нашиот примерок на податоци, формулата го добива следниов облик:

    =LINEST(D2:D13, B2:C13, TRUE, TRUE)

    Како што имаме 2 независнипроменливи во колоните B и C, избираме бес кој се состои од 3 реда (две x вредности + пресек) и 5 ​​колони, внесете ја горната формула, притиснете Ctrl + Shift + Enter и го добивате овој резултат:

    За да се ослободите од грешките #N/A, можете да го вгнездите LINEST во IFERROR вака:

    =IFERROR(LINEST(D2:D13, B2:C13, TRUE, TRUE), "")

    Сликата од екранот подолу го покажува резултатот и објаснува што секој број значи:

    Коефициентите на наклон и пресекот Y беа објаснети во претходните примери, па ајде набрзина да ги погледнеме другите статистики.

    Коефициент на определување (R2). Вредноста на R2 е резултат на делење на регресиониот збир на квадрати со вкупниот збир на квадрати. Ви кажува колку y вредности се објаснети со x променливи. Може да биде кој било број од 0 до 1, тоа е од 0% до 100%. Во овој пример, R2 е приближно 0,97, што значи дека 97% од нашите зависни променливи (продажба на чадор) се објаснети со независните променливи (рекламирање + просечни месечни врнежи), што е одлично одговара!

    Стандардни грешки . Општо земено, овие вредности ја покажуваат прецизноста на регресивната анализа. Колку се помали бројките, толку посигурни можете да бидете за вашиот регресивен модел.

    F статистика . Ја користите статистиката F за да ја поддржите или отфрлите нултата хипотеза. Се препорачува да се користи статистиката F во комбинација со вредноста P кога се одлучува дали се вкупните резултати

    Мајкл Браун е посветен технолошки ентузијаст со страст за поедноставување на сложените процеси користејќи софтверски алатки. Со повеќе од една деценија искуство во технолошката индустрија, тој ги усоврши своите вештини во Microsoft Excel и Outlook, како и Google Sheets и Docs. Блогот на Мајкл е посветен на споделување на своето знаење и експертиза со другите, обезбедувајќи лесни за следење совети и упатства за подобрување на продуктивноста и ефикасноста. Без разлика дали сте искусен професионалец или почетник, блогот на Мајкл нуди вредни сознанија и практични совети за да го извлечете максимумот од овие основни софтверски алатки.