Як разлічыць дысперсію ў Excel – прыклад & формула дысперсіі насельніцтва

  • Падзяліцца Гэтым
Michael Brown

У гэтым уроку мы разгледзім, як рабіць дысперсійны аналіз Excel і якія формулы выкарыстоўваць для вызначэння дысперсіі выбаркі і генеральнай сукупнасці.

Дысперыяцыя - адна з самых карысных інструменты тэорыі верагоднасцей і статыстыкі. У навуцы гэта апісвае, наколькі кожны лік у наборы даных знаходзіцца ад сярэдняга. На практыцы гэта часта паказвае, наколькі нешта мяняецца. Напрыклад, тэмпература каля экватара адрозніваецца меншай дысперсіяй, чым у іншых кліматычных зонах. У гэтым артыкуле мы прааналізуем розныя метады вылічэння дысперсіі ў Excel.

    Што такое дысперсія?

    Дысперсія - гэта мера зменлівасці набор даных, які паказвае, як далёка распаўсюджваюцца розныя значэнні. Матэматычна гэта вызначаецца як сярэдняе значэнне квадрата адрозненняў ад сярэдняга.

    Каб лепш зразумець, што вы на самой справе разлічваеце з дысперсіяй, разгледзьце гэты просты прыклад.

    Выкажам здагадку, што ёсць 5 тыграў у вашым мясцовым заапарку 14, 10, 8, 6 і 2 гадоў.

    Каб знайсці дысперсію, выканайце наступныя простыя дзеянні:

    1. Вылічыце сярэдняе (простае сярэдняе) з пяці лікаў:

    2. Ад кожнага ліку адніміце сярэдняе значэнне, каб знайсці розніцы. Каб уявіць гэта, давайце нанясем розніцы на дыяграму:

    3. Звядзіце кожную розніцу ў квадрат.
    4. Вылічыце сярэдняе значэнне квадратаў розніц.

    Такім чынам, дысперсія роўная 16. Але што азначае гэты лікнасамрэч азначае?

    Па праўдзе кажучы, дысперсія проста дае вам вельмі агульнае ўяўленне аб дысперсіі набору даных. Значэнне 0 азначае адсутнасць зменлівасці, гэта значыць, што ўсе лічбы ў наборы дадзеных аднолькавыя. Чым больш лік, тым больш разрозненыя дадзеныя.

    Гэты прыклад прыведзены для дысперсіі папуляцыі (г.зн. 5 тыграў - гэта ўся група, якая вас цікавіць). Калі вашы даныя з'яўляюцца выбаркай з большай сукупнасці, вам трэба вылічыць дысперсію выбаркі, выкарыстоўваючы крыху іншую формулу.

    Як разлічыць дысперсію ў Excel

    Ёсць 6 убудаваных функцый каб зрабіць дысперсію ў Excel: VAR, VAR.S, VARP, VAR.P, VARA і VARPA.

    Ваш выбар формулы дысперсіі вызначаецца наступнымі фактарамі:

    • Версія Excel, якую вы выкарыстоўваеце.
    • Калі вы разлічваеце дысперсію выбаркі або генеральнай сукупнасці.
    • Калі вы хочаце ацаніць або праігнараваць тэкст і лагічныя значэнні.

    Функцыі варыяцыі Excel

    У табліцы ніжэй прадстаўлены агляд функцый варыяцыі, даступных у Excel, каб дапамагчы вам выбраць формулу, якая найлепшым чынам адпавядае вашым патрэбам.

    Імя Версія Excel Тып даных Тэкст і логіка
    VAR 2000 - 2019 Узор Ігнараваны
    VAR.S 2010 - 2019 Узор Ігнараваны
    VARA 2000 -2019 Выбарка Ацэнена
    VARP 2000 - 2019 Насельніцтва Ігнаруецца
    VAR.P 2010 - 2019 Насельніцтва Ігнаруецца
    VARPA 2000 - 2019 Насельніцтва Ацэнена

    VAR.S супраць VARA і VAR.P супраць VARPA

    VARA і VARPA адрозніваюцца ад іншых дысперсійных функцый толькі спосабам апрацоўкі лагічных і тэкставых значэнняў у спасылках. У наступнай табліцы прыводзіцца кароткі змест таго, як ацэньваюцца тэкставыя прадстаўленні лікаў і лагічных значэнняў.

    Тып аргумента VAR, VAR.S, VARP, VAR.P VARA & VARPA
    Лагічныя значэнні ў масівах і спасылках Ігнаруюцца Ацэньваецца

    (TRUE=1, FALSE=0)

    Тэкставыя прадстаўленні лікаў у масівах і спасылках Ігнаруюцца Ацэньваецца як нуль
    Лагічны значэнні і тэкставыя прадстаўленні лікаў, якія ўводзяцца непасрэдна ў аргументы Вылічваецца

    (TRUE=1, FALSE=0)

    Пустыя вочкі Ігнаруецца

    Як разлічыць дысперсію выбаркі ў Excel

    Выбарка - гэта набор даных, вынятых з усёй сукупнасці. Дысперсія, разлічаная з выбаркі, называецца дысперсіяй выбаркі .

    Напрыклад, калі вы хочаце ведаць, як змяняецца рост людзей, вам было б тэхнічна немагчыма вымераць кожнага чалавека на зямля.Рашэнне складаецца ў тым, каб узяць выбарку насельніцтва, скажам, 1000 чалавек, і ацаніць рост усёй сукупнасці на аснове гэтай выбаркі.

    Дысперсія выбаркі разлічваецца па гэтай формуле:

    Дзе:

    • x̄ — сярэдняе (простае сярэдняе) значэнняў выбаркі.
    • n — памер выбаркі, г.зн. колькасць значэнняў у узор.

    У Excel ёсць 3 функцыі для пошуку дысперсіі ўзору: VAR, VAR.S і VARA.

    Функцыя VAR у Excel

    Гэта самая старая Функцыя Excel для ацэнкі дысперсіі на аснове выбаркі. Функцыя VAR даступная ва ўсіх версіях Excel з 2000 па 2019 год.

    VAR(нумар1, [нумар2], …)

    Заўвага. У Excel 2010 функцыя VAR была заменена на VAR.S, якая забяспечвае павышаную дакладнасць. Хоць VAR па-ранейшаму даступны для зваротнай сумяшчальнасці, рэкамендуецца выкарыстоўваць VAR.S у бягучых версіях Excel.

    Функцыя VAR.S у Excel

    Гэта сучасны аналаг Excel Функцыя VAR. Выкарыстоўвайце функцыю VAR.S, каб знайсці ўзор дысперсіі ў Excel 2010 і пазнейшых версіях.

    VAR.S(number1, [number2], …)

    Функцыя VARA ў Excel

    Функцыя Excel VARA вяртае выбарка дысперсіі на аснове набору лічбаў, тэксту і лагічных значэнняў, як паказана ў гэтай табліцы.

    VARA(значэнне1, [значэнне2], …)

    Прыклад формулы дысперсіі ў Excel

    Пры працы з лікавы набор даных, вы можаце выкарыстоўваць любую з вышэйпералічаных функцый для разліку дысперсіі выбаркіу Excel.

    У якасці прыкладу знойдзем дысперсію выбаркі, якая складаецца з 6 элементаў (B2:B7). Для гэтага вы можаце выкарыстоўваць адну з наступных формул:

    =VAR(B2:B7)

    =VAR.S(B2:B7)

    =VARA(B2:B7)

    Як паказана на скрыншоце, усе формулы вяртаюць той самы вынік (з акругленнем да 2 знакаў пасля коскі):

    Каб праверыць вынік, давайце зробім разлік варыянтаў уручную:

    1. Знайдзіце сярэдняе значэнне з дапамогай функцыя AVERAGE:

      =AVERAGE(B2:B7)

      Сярэдняе значэнне ідзе ў любую пустую ячэйку, скажам, B8.

    2. Адніміце сярэдняе значэнне з кожнага ліку ў выбарцы:

      =B2-$B$8

      Розніцы ідуць у слупок C, пачынаючы з C2.

    3. Звядзіце кожную розніцу ў квадрат і занясіце вынікі ў слупок D, пачынаючы з D2:

      =C2^2

    4. Складзеце ўзведзеныя ў квадрат рознасці і падзяліце вынік на колькасць элементы ў выбарцы мінус 1:

      =SUM(D2:D7)/(6-1)

    Як бачыце, вынік нашага ручнога разліку варыятыўнай сапраўды такі ж, як і лік, які вяртаецца ўбудаванымі функцыямі Excel:

    Калі ваш набор даных змяшчае значэнні Boolean і/або text , функцыя VARA верне іншы вынік. Прычына ў тым, што VAR і VAR.S ігнаруюць любыя значэнні, акрамя лікаў у спасылках, у той час як VARA ацэньвае тэкставыя значэнні як нулі, TRUE як 1 і FALSE як 0. Такім чынам, уважліва выбірайце функцыю дысперсіі для вашых разлікаў у залежнасці ад таго, ці вы жадаеце апрацоўваць або ігнараваць тэкст і лагічныя элементы.

    Яквылічыць дысперсію папуляцыі ў Excel

    Насельніцтва - гэта ўсе члены дадзенай групы, г.зн. усе назіранні ў вобласці даследавання. Дысперсія сукупнасці апісвае, як кропкі даных ва ўсёй папуляцыі раскіданыя.

    Дысперсію сукупнасці можна знайсці з дапамогай гэтай формулы:

    Дзе:

    • x̄ - гэта сярэдняе значэнне сукупнасці.
    • n - памер сукупнасці, г.зн. агульная колькасць значэнняў у сукупнасці.

    У Excel ёсць 3 функцыі для разліку дысперсіі сукупнасці: VARP, VAR .P і VARPA.

    Функцыя VARP у Excel

    Функцыя VARP Excel вяртае дысперсію сукупнасці на аснове ўсяго набору лікаў. Ён даступны ва ўсіх версіях Excel з 2000 па 2019 год.

    VARP(нумар1, [нумар2], …)

    Заўвага. У Excel 2010 VARP быў заменены на VAR.P, але ўсё яшчэ захоўваецца для зваротнай сумяшчальнасці. Рэкамендуецца выкарыстоўваць VAR.P у бягучых версіях Excel, таму што няма гарантыі, што функцыя VARP будзе даступная ў будучых версіях Excel.

    Функцыя VAR.P у Excel

    Гэта палепшаная версія функцыі VARP, даступная ў Excel 2010 і пазнейшых версіях.

    VAR.P(number1, [number2], …)

    Функцыя VARPA ў Excel

    Функцыя VARPA вылічае дысперсію сукупнасці на аснове ўсяго набору лічбаў, тэксту і лагічных значэнняў. Ён даступны ва ўсіх версіях Excel з 2000 па 2019.

    VARA(значэнне1,[значэнне2], …)

    Формула дысперсіі сукупнасці ў Excel

    У прыкладзе разліку var мы выявілі дысперсію ў 5 экзаменацыйных балаў, мяркуючы, што гэтыя балы былі выбраны ад большай групы студэнтаў. Калі вы збіраеце даныя аб усіх студэнтах у групе, гэтыя даныя будуць прадстаўляць усю генеральную сукупнасць, і вы вылічыце дысперсію генеральнай сукупнасці з дапамогай прыведзеных вышэй функцый.

    Дапусцім, у нас ёсць экзаменацыйныя балы групы з 10 студэнтаў (B2:B11). Ацэнкі складаюць усю сукупнасць, таму мы будзем рабіць дысперсію з дапамогай гэтых формул:

    =VARP(B2:B11)

    =VAR.P(B2:B11)

    =VARPA(B2:B11)

    І ўсе формулы вернуць ідэнтычны вынік:

    Каб пераканацца, што Excel правільна зрабіў дысперсію, вы можаце праверыць гэта з дапамогай ручной формулы разліку зменнай, паказанай на скрыншоце ніжэй:

    Калі некаторыя студэнты не здалі экзамен і замест нумара бала маюць N/A, функцыя VARPA верне іншы вынік. Прычына ў тым, што VARPA ацэньвае тэкставыя значэнні як нулі, а VARP і VAR.P ігнаруюць тэкст і лагічныя значэнні ў спасылках. Калі ласка, глядзіце VAR.P супраць VARPA для больш падрабязнай інфармацыі.

    Формула дысперсіі ў Excel - заўвагі па выкарыстанні

    Каб правільна правесці аналіз дысперсіі ў Excel, прытрымлівайцеся гэтыя простыя правілы:

    • Падайце аргументы ў выглядзе значэнняў, масіваў або спасылак на вочкі.
    • У Excel 2007 і пазнейшых версіях вы можаце падаць да 255 аргументаў, якія адпавядаюцьвыбарка або сукупнасць; у Excel 2003 і старэй - да 30 аргументаў.
    • Каб ацэньваць толькі лічбы ў спасылках, ігнаруючы пустыя вочкі, тэкст і лагічныя значэнні, выкарыстоўвайце функцыю VAR або VAR.S для вылічыце дысперсію выбаркі і VARP або VAR.P, каб знайсці дысперсію сукупнасці.
    • Каб ацаніць лагічныя і тэкставыя значэнні ў спасылках, выкарыстоўвайце функцыю VARA або VARPA.
    • Увядзіце як мінімум два лікавыя значэнні ў формулу дысперсіі выбаркі і як мінімум адно лікавае значэнне у формулу дысперсіі генеральнай сукупнасці ў Excel, інакш #DIV/0! адбываецца памылка.
    • Аргументы, якія змяшчаюць тэкст, які нельга інтэрпрэтаваць як лічбы, выклікаюць #VALUE! памылкі.

    Дысперсія супраць стандартнага адхілення ў Excel

    Дысперсія, несумненна, карысная канцэпцыя ў навуцы, але яна дае вельмі мала практычнай інфармацыі. Напрыклад, мы знайшлі ўзрост папуляцыі тыграў у мясцовым заапарку і вылічылі дысперсію, якая роўная 16. Пытанне ў тым, як мы можам выкарыстоўваць гэтую лічбу?

    Вы можаце выкарыстоўваць дысперсію, каб вылічыць стандартнае адхіленне, якое з'яўляецца значна лепшай мерай колькасці варыяцый у наборы даных.

    Стандартнае адхіленне разлічваецца як квадратны корань з дысперсіі. Такім чынам, мы бярэм квадратны корань з 16 і атрымліваем стандартнае адхіленне 4.

    У спалучэнні з сярэднім, стандартнае адхіленне можа сказаць вам, колькі гадоў большасці тыграў. Напрыклад, калісярэдняе значэнне роўна 8, а стандартнае адхіленне роўна 4, большасці тыграў у заапарку ад 4 гадоў (8 - 4) да 12 гадоў (8 + 4).

    Microsoft Excel мае спецыяльныя функцыі для распрацоўкі стандартнага адхілення выбаркі і сукупнасці. Падрабязнае тлумачэнне ўсіх функцый можна знайсці ў гэтым падручніку: Як разлічыць стандартнае адхіленне ў Excel.

    Вось як зрабіць дысперсію ў Excel. Каб больш падрабязна разгледзець формулы, якія абмяркоўваюцца ў гэтым уроку, вы можаце загрузіць наш узор працоўнага сшытка ў канцы гэтага паведамлення. Я дзякую вам за чытанне і спадзяюся ўбачыць вас у нашым блогу на наступным тыдні!

    Практычны сшытак

    Вылічыць дысперсію ў Excel - прыклады (файл .xlsx)

    Майкл Браўн - адданы энтузіяст тэхналогій, які любіць спрашчэнне складаных працэсаў з дапамогай праграмных інструментаў. Маючы больш чым дзесяцігадовы досвед працы ў індустрыі тэхналогій, ён удасканальваў свае навыкі ў Microsoft Excel і Outlook, а таксама ў Google Sheets і Docs. Блог Майкла прысвечаны таму, каб падзяліцца сваімі ведамі і вопытам з іншымі, даючы простыя ў выкананні парады і падручнікі для павышэння прадукцыйнасці і эфектыўнасці. Незалежна ад таго, з'яўляецеся вы дасведчаным прафесіяналам або пачаткоўцам, блог Майкла прапануе каштоўную інфармацыю і практычныя парады, каб атрымаць максімальную аддачу ад гэтых неабходных праграмных інструментаў.