Korrelazioa Excel-en: koefizientea, matrizea eta grafikoa

  • Partekatu Hau
Michael Brown

Tutorialak Excel-en korrelazioaren oinarriak azaltzen ditu, korrelazio-koefiziente bat nola kalkulatu, korrelazio-matrize bat eraiki eta emaitzak nola interpretatu erakusten du.

Excel-en egin dezakezun kalkulu estatistiko errazenetako bat korrelazioa da. Sinplea bada ere, oso erabilgarria da bi aldagai edo gehiagoren arteko erlazioak ulertzeko. Microsoft Excel-ek beharrezko tresna guztiak eskaintzen ditu korrelazio-analisia egiteko, haiek erabiltzen jakitea besterik ez duzu behar.

    Correlazioa Excel-en - oinarriak

    Korrelazioa bi aldagairen arteko erlazioaren indarra eta norabidea deskribatzen dituen neurria da. Estatistikan, ekonomian eta gizarte-zientzietan erabili ohi da aurrekontuetarako, negozio-planetarako eta antzekoetarako.

    Aldagaiak zenbat erlazio dauden aztertzeko erabiltzen den metodoari korrelazio-analisia deitzen zaio.

    Hona hemen korrelazio sendoaren adibide pare bat:

    • Jaten dituzun kaloria kopurua eta zure pisua (korrelazio positiboa)
    • Kanpoko tenperatura eta berokuntza-fakturak ( korrelazio negatiboa)

    Eta hemen korrelazio ahula edo ez duten datuen adibideak:

    • Zure katuaren izena eta bere janaririk gogokoena
    • Kolorea. zure begiak eta zure altuera

    Korelazioari buruz ulertzeko ezinbesteko gauza bat da bi aldagaien arteko erlazio estua erakusten duela soilik. Korrelazioak, ordea, ez du esan nahizehaztutako barruti batetik.

  • ERRENkadak eta ZUTAPEak - barruti bateko errenkada eta zutabe kopurua itzultzen du, hurrenez hurren. Gure korrelazio formulan, biak helburu batekin erabiltzen dira: lortu hasierako barrutitik konpentsatzeko zutabe kopurua. Eta hori erreferentzia absolutuak eta erlatiboak trebeki erabiliz lortzen da.
  • Logika hobeto ulertzeko, ikus dezagun nola kalkulatzen dituen formulak goiko pantaila-argazkian nabarmendutako koefizienteak.

    Lehenik eta behin, ditzagun. aztertu B18ko formula, zeinak hileko tenperaturaren (B2:B13) eta saldutako berogailuen (D2:D13) arteko korrelazioa aurkitzen duena:

    =CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))

    Lehenengo OFFSET funtzioan, ROWS($1: 1) ROWS($1:3) bihurtu da bigarren koordenatua erlatiboa delako, beraz, formula kopiatzen den errenkadaren posizio erlatiboaren arabera aldatzen da (2 errenkada behera). Horrela, ROWS() 3 itzultzen du, eta hortik 1 kentzen dugu, eta iturburu-barrutiaren eskuinaldean 2 zutabe dituen barrutia lortzen da, hau da, $D$2:$D$13 (berogailuaren salmenta).

    The bigarren OFFSET-ak ez du $B$2:$B$13 (tenperatura) zehaztutako tartea aldatzen, ZUTABIDEAK($A:A)-1 zero itzultzen duelako.

    Ondorioz, gure formula luzea CORREL() soil bihurtzen da. $D$2:$D$13, $B$2:$B$13) eta zehazki nahi dugun koefizientea itzultzen du.

    Publizitate kostuaren (C2:C13) eta salmenten (C2:C13) eta salmenten (C2:C13) eta salmenten korrelazio-koefizientea kalkulatzen duen C18-ko formula. D2:D13) antzera funtzionatzen du:

    =CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:B)-1))

    Lehenengo OFFSET funtzioa daGoian deskribatutako guztiz berdina, $D$2:$D$13 (berogailu salmentak) tartea itzuliz.

    Bigarren OFFSET-ean, COLUMNS($A:A)-1 COLUMNS($A:)-ra aldatzen da. B)-1 1 formularen zutabea eskuinera kopiatu dugulako. Ondorioz, OFFSETek iturburu-barrutiaren eskuinaldean zutabe 1 dagoen barruti bat lortzen du, hau da, $C$2:$C$13 (iragarki-kostua).

    Nola marraztu korrelazio grafikoa Excel-en

    Excel-en korrelazioa egiten duzunean, zure datuen arteko erlazioen irudikapen bisual bat lortzeko modurik onena sakabanaketa grafikoa marraztea da joera batekin. Hona hemen nola:

    1. Hautatu zenbakizko datuak dituzten bi zutabe, zutabeen goiburuak barne. Zutabeen ordena garrantzitsua da: independentea aldagaia ezkerreko zutabean egon behar da zutabe hau x ardatzean marraztu behar baita; menpeko aldagaiak eskuineko zutabean egon behar du, y ardatzean marraztuko baita.
    2. Txertatu fitxan, Txatak n> taldean, egin klik Skatter diagramaren ikonoan. Honek berehala txertatuko du XY sakabanatze-diagrama zure lan-orrian.
    3. Egin klik eskuineko botoiaz diagramako edozein datu-puntu eta aukeratu Gehitu joera-lerroa... testuinguru-menuan.

    Urratsez urratseko argibide zehatzak ikusteko, ikusi:

    • Nola sortu sakabanatze grafikoa Excel-en
    • Nola gehitu joera-lerroa Excel-eko taulan

    Gure lagin-datu multzorako, korrelazio grafikoek beheko irudian agertzen diren bezalakoak dirudite.Gainera, R karratuaren balioa erakutsi dugu, Determinazio-koefizientea ere deitua. Balio honek joera-lerroa datuekin zenbat eta ondo egokitzen den adierazten du; zenbat eta R2 1etik hurbilago, orduan eta egokitzapen hobea izango da.

    Zure dispertsioan bistaratzen den R2 balioaren arabera, erraz kalkula dezakezu korrelazio-koefizientea:

    1. Zehaztasun hobea lortzeko, lortu Excel-ek lehenespenez egiten duen baino digitu gehiago erakusteko R karratuaren balioan.
    2. Sakatu grafikoko R2 balioa, hautatu sagua erabiliz eta sakatu Ktrl. + C kopiatzeko.
    3. Lortu R2-ren erro karratu bat SQRT funtzioa erabiliz edo kopiatutako R2 balioa 0,5eko potentziara igoz.

    Adibidez, Bigarren grafikoko R2 balioa 0,9174339392 da. Beraz, Publizitatea eta Saldutako berogailuak ren korrelazio koefizientea aurki dezakezu formula hauetako batekin:

    =SQRT(0.9174339392)

    =0.9174339392^0.5

    Ziurtatu dezakezunez, horrela kalkulatutako koefizienteak guztiz bat datoz aurreko adibideetan aurkitutako korrelazio-koefizienteekin, seinalea izan ezik :

    Excel-en korrelazioarekin izan daitezkeen arazoak

    Pearson Produktu Momentuaren Korrelazioak bi aldagaien arteko lineala erlazioa soilik erakusten du. Hau da, zure aldagaiak beste modu kurbilineo batean erlazionatuta egon daitezke eta oraindik ere korrelazio koefizientea zeroren berdina edo hurbila izatea.

    Pearson-en korrelazioa ezin dabereizi menpeko eta independente aldagaiak. Esaterako, CORREL funtzioa erabiltzean hileko batez besteko tenperaturaren eta saldutako berogailu kopuruaren arteko lotura aurkitzeko, -0,97ko koefizientea lortu dugu, eta horrek korrelazio negatibo handia adierazten du. Hala ere, aldagaiak alda ditzakezu eta emaitza bera lor dezakezu. Beraz, norbaitek ondorioztatu dezake berogailuen salmenta handiagoak tenperatura jaisten duela, eta horrek, jakina, ez du zentzurik. Hori dela eta, Excel-en korrelazio-analisia exekutatzen ari zarenean, kontuan izan hornitzen ari zaren datuez.

    Gainera, Pearson-en korrelazioa oso sentikorra da outliers . Gainontzeko datuetatik oso desberdinak diren datu-puntu bat edo gehiago badituzu, baliteke aldagaien arteko erlazioaren irudi distortsionatua izatea. Kasu honetan, zentzuzkoa izango litzateke Spearman-en rank-korrelazioa erabiltzea ordez.

    Horrela egin daiteke korrelazioa Excel-en. Tutorial honetan eztabaidatutako adibideak gertuagotik ikusteko, ongi etorriko zara behean gure lan-koadernoaren adibidea deskargatzera. Eskerrik asko irakurtzeagatik eta datorren astean gure blogean ikustea espero dut!

    Lan koadernoa

    Kalkulatu korrelazioa Excel-en (.xlsx fitxategia)

    kausa. Aldagai baten aldaketak beste aldagaiaren aldaketekin lotuta egoteak ez du esan nahi aldagai batek bestea aldatzen duenik.

    Kausalitatea ikasi eta iragarpenak egiteko interesa baduzu, eman urrats bat aurrera. eta erregresio linealaren analisia egin.

    Correlazio-koefizientea Excel-en - korrelazioaren interpretazioa

    Bi aldagai jarraituen arteko elkartze-mailaren zenbakizko neurriari korrelazio-koefizientea deitzen zaio ( r).

    Koefizientearen balioa beti -1 eta 1 artean dago eta aldagaien arteko erlazio linealaren indarra eta norabidea neurtzen ditu.

    Indarra

    Zenbat eta handiagoa. koefizientearen balio absolutua izanik, orduan eta harreman sendoagoa da:

    • -1 eta 1-ren muturreko balioek erlazio lineal perfektua adierazten dute datu-puntu guztiak zuzen baten gainean erortzen direnean. Praktikan, oso gutxitan ikusten da korrelazio perfektua, positiboa edo negatiboa.
    • 0 koefizienteak aldagaien arteko erlazio linealik ez duela adierazten du. Hau da ausazko bi zenbaki multzorekin lortuko duzuna.
    • 0 eta +1/-1 arteko balioek erlazio ahulen, moderatuen eta sendoen eskala adierazten dute. r -1 edo 1era hurbiltzen den heinean, erlazioaren indarra handitzen da.

    Norabidea

    Koefizientearen zeinuak (gehi edo minus) adierazten du. ren norabideaerlazioa.

    • Positibo koefizienteek korrelazio zuzena adierazten dute eta grafiko batean goranzko malda sortzen dute -aldagai bat handitzen den heinean bestea ere handitu ahala, eta alderantziz.
    • Negatibo koefizienteek alderantzizko korrelazioa adierazten dute eta grafiko batean beheranzko malda sortzen dute; aldagai bat handitzen den heinean, beste aldagaia txikiagotu ohi da.

    Hobeto ulertzeko, begiratu begiratu hau. korrelazio grafiko hauek:

    • 1 koefizienteak erlazio positibo perfektua esan nahi du - aldagai bat handitzen den heinean, bestea proportzionalki handitzen da.
    • -1 erlazio negatibo perfektua esan nahi du - aldagai bat handitzen den heinean, bestea proportzionalki txikitzen da.
    • 0 koefizienteak bi aldagairen arteko erlaziorik ez duela esan nahi du - datu-puntuak dira. grafikoan zehar sakabanatuta.

    Pearson-en korrelazioa

    Estatistikan, hainbat korrelazio mota neurtzen dituzte lantzen ari zaren datu motaren arabera. Tutorial honetan, ohikoenean zentratuko gara.

    Pearson Korrelazioa , izen osoa Pearson Product Moment Correlation (PPMC) da, erabiltzen da. datuen arteko erlazio linealak ebaluatzea aldagai baten aldaketa beste aldagaiaren aldaketa proportzionalarekin lotzen denean. Termino sinpleetan, Pearson Korrelazioak galdera honi erantzuten dio: Datuak a batean irudikatu al daitezkelerroa?

    Estatistikan, korrelazio-mota ezagunena da, eta "korrelazio-koefiziente" batekin ari bazara beste kalifikaziorik gabe, litekeena da Pearson izatea.

    Hona hemen Pearson-en korrelazio-koefizientea aurkitzeko gehien erabiltzen den formula, Pearson-en R ere deitua:

    Batzuetan, beste bi formula topa ditzakezu laginaren korrelazio-koefizientea kalkulatzeko. (r) eta biztanleriaren korrelazio-koefizientea (ρ).

    Nola egin Pearson-en korrelazioa Excel-en

    Pearson-en korrelazio-koefizientea eskuz kalkulatzeak matematika asko eskatzen du. . Zorionez, Microsoft Excel-ek gauzak oso erraz egin ditu. Zure datu-multzoaren eta zure helburuaren arabera, teknika hauetako bat erabiltzeko askea zara:

    • Aurkitu Pearson-en korrelazio-koefizientea CORREL funtzioarekin.
    • Egin korrelazio-matrize bat erabiliz. Datuen Analisia egitea.
    • Bilatu formula batekin korrelazio-koefiziente anitz.
    • Markatu korrelazio grafiko bat datu-erlazioaren irudikapen bisuala lortzeko.

    Nola kalkulatu Excel-en korrelazio-koefizientea

    Korelazio-koefiziente bat eskuz kalkulatzeko, formula luze hau erabili beharko zenuke. Excel-en korrelazio-koefizientea aurkitzeko, aprobetxatu CORREL edo PEARSON funtzioa eta lortu emaitza segundo zati batean.

    Excel CORREL funtzioa

    CorREL funtzioak itzultzen du.Pearson korrelazio koefizientea bi balio multzotarako. Bere sintaxia oso erraza eta zuzena da:

    CORREL(array1, array2)

    Non:

    • Matrize1 balioen lehen sorta da.
    • Matrizea2 bigarren balio-barrutia da.

    Bi matrizeek luzera berdina izan behar dute.

    Aldagai independenteen multzoa dugula suposatuz ( x ) B2:B13-n eta menpeko aldagaiak (y) C2:C13-n, gure korrelazio-koefizientearen formula hauxe da:

    =CORREL(B2:B13, C2:C13)

    Edo, barrutiak trukatu genitzake eta oraindik ere lortu emaitza bera:

    =CORREL(C2:C13, B2:B13)

    Edozein modura, formulak korrelazio negatibo handia erakusten du (-0,97 inguru) hileko batez besteko tenperaturaren eta saldutako berogailu kopuruaren artean:

    Excel-en CORREL funtzioari buruz jakin behar dituzun 3 gauza

    Excel-en korrelazio-koefizientea behar bezala kalkulatzeko, kontuan izan 3 datu erraz hauek:

    • Gelula bat edo gehiago bada matrize batean testua, balio logikoak edo hutsuneak ditu, horrelako gelaxkak ez dira aintzat hartzen; zero balioak dituzten gelaxkak kalkulatzen dira.
    • Emandako matrizeak luzera ezberdinekoak badira, #N/A errorea itzultzen da.
    • Matrizeetako bat hutsik badago edo desbideratze estandarra bada. haien balioak zero berdinak dira, #DIV/0 bat! errorea gertatzen da.

    Excel PEARSON funtzioa

    Excel-en PEARSON funtzioak gauza bera egiten du: Pearson produktuaren momentuaren korrelazio koefizientea kalkulatzen du.

    PEARSON(array1,array2)

    Non:

    • Matrize1 balio independenteen sorta da.
    • Matrize2 menpeko balioen sorta bat da.

    PEARSONek eta CORRELek Pearsonen korrelazio linealaren koefizientea kalkulatzen dutenez, haien emaitzek bat etorri beharko lukete eta, oro har, Excel 2007-ren azken bertsioetan egiten dute Excel 2019-en.

    Excel 2003 eta Excel 2003-n. aurreko bertsioetan, ordea, PEARSON funtzioak biribiltze-errore batzuk ager ditzake. Beraz, bertsio zaharretan, CORREL erabiltzea gomendatzen da PEARSON baino lehen.

    Gure lagin-datu multzoan, bi funtzioek emaitza berdinak erakusten dituzte:

    =CORREL(B2:B13, C2:C13)

    =PEARSON(B2:B13, C2:C13)

    Nola egin korrelazio-matrize bat Excel-en Datuen Analisiarekin

    Bi aldagai baino gehiagoren arteko erlazioak probatu behar dituzunean, zentzuzkoa da korrelazio-matrize bat eraikitzea, batzuetan <1 deitzen dena>korrelazio-koefiziente anitzak .

    korrelazio-matrizea dagozkien errenkaden eta zutabeen ebakiduran aldagaien arteko korrelazio-koefizienteak erakusten dituen taula da.

    Excel-en korrelazio-matrizea Analisi ToolPak gehigarriko Correlation tresna erabiliz eraikitzen da. Gehigarri hau Excel 2003 bertsio guztietan dago eskuragarri Excel 2019 bidez, baina ez dago gaituta lehenespenez. Oraindik aktibatu ez baduzu, egin ezazu orain Nola gaitu datuen analisirako tresna Excel-en deskribatzen diren urratsak jarraituz.

    HorrekinExcel zintan gehitutako Datuak Analisi tresnak, korrelazio analisia egiteko prest zaude:

    1. Datuak fitxaren goiko eskuineko ertzean > Analisia taldean, egin klik Datuen analisia botoian.
    2. Datuen analisia elkarrizketa-koadroan, hautatu Korrelazioa eta sakatu Ados.
    3. Korrelazioa koadroan, konfiguratu parametroak modu honetan:
      • Egin klik Input Range koadroan eta hautatu barrutia. zure iturburuko datuak, zutabeen goiburuak barne (B1:D13 gure kasuan).
      • Taldekatuta atalean, ziurtatu Ztabeak irrati-koadroa hautatuta dagoela (emandakoa). zure iturburuko datuak zutabeetan multzokatuta daudela).
      • Hautatu Etiketak lehen lerroan kontrol-laukia, hautatutako barrutiak zutabeen goiburuak baditu.
      • Aukeratu nahi duzun irteera-aukera. Matrizea orri berean edukitzeko, hautatu Irteera barrutia eta zehaztu matrizea atera nahi den ezkerreko gelaxkaren erreferentzia (A15 adibide honetan).

    Bukatzean, egin klik Ados botoian:

    Zure korrelazio-koefizienteen matrizea eginda dago eta hurrengo atalean erakusten den itxura izan beharko luke.

    Korrelazio-analisiaren emaitzak interpretatzea

    Zure Excel korrelazio-matrizean, errenkaden eta zutabeen elkargunean aurki ditzakezu koefizienteak. Zutabe eta errenkadaren koordenatuak berdinak badira, 1 balioa ateratzen da.

    Aurrekoanadibidez, menpeko aldagaiaren (saldutako berogailu kopurua) eta bi aldagai independenteren (hileko batez besteko tenperatura eta iragarki kostuen) arteko korrelazioa ezagutzea interesatzen zaigu. Beraz, errenkada eta zutabe hauen ebakiduran dauden zenbakiei bakarrik begiratzen diegu, beheko pantaila-argazkian nabarmenduta daudenak:

    -0,97 koefiziente negatiboak (2 zifra hamartartara biribilduta) arteko alderantzizko korrelazio handia erakusten du. hileko tenperatura eta berogailuen salmentak -tenperatura igotzen den heinean, berogailu gutxiago saltzen dira.

    0,97ko koefiziente positiboak (bi hamartarrekin biribilduta) publizitate aurrekontuaren eta salmenten arteko lotura zuzen sendoa adierazten du - zenbat eta gehiago publizitatean gastatzen duzun dirua, orduan eta salmenta handiagoak.

    Nola egin Excel-en hainbat korrelazio-analisia formulekin

    Erraza da korrelazio-taula eraikitzea Datuen Analisi tresnarekin. Hala ere, matrize hori estatikoa da, hau da, korrelazio-analisia berriro exekutatu beharko duzu iturburuko datuak aldatzen diren bakoitzean.

    Albiste ona da zuk zeuk erraz eraiki dezakezula antzeko korrelazio-taula bat, eta matrize hori automatikoki eguneratuko dela. iturburu-balioetan aldaketa bakoitzarekin.

    Hori egiteko, erabili formula generiko hau:

    CORREL(OFFSET( lehen_aldagai_barrutia , 0, ERRENKADAK($1:1)-1) , OFFSET( lehen_aldagai_barrutia , 0, ZUTAPEAK($A:A)-1))

    Ohar garrantzitsua! Formulak funtziona dezan, blokeatu beharko zenukelehenengo aldagai-barrutia gelaxka-erreferentzia absolutuak erabiliz.

    Gure kasuan, lehen aldagai-barrutia $B$2:$B$13 da (kontuan izan erreferentzia blokeatzen duen $ ikurra), eta gure korrelazio formulak hau hartzen du. forma:

    =CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:1)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))

    Formula prest dugula, eraiki dezagun korrelazio-matrize bat:

    1. Matrizearen lehen errenkadan eta lehen zutabean, idatzi aldagaiak' etiketak zure iturburu-taulan agertzen diren ordena berean (ikus beheko pantaila-argazkia).
    2. Idatzi goiko formula ezkerreko gelaxkan (B16 gure kasuan).
    3. Arrastatu formula. behera eta eskuinera behar adina errenkada eta zutabetan kopiatzeko (3 errenkada eta 3 zutabe gure adibidean).

    Ondorioz, korrelazio anitzeko matrizea lortu dugu. koefizienteak. Kontuan izan gure formulak itzultzen dituen koefizienteak Excel-ek aurreko adibidean ateratakoaren berdinak direla (dagokionak nabarmenduta daude):

    Nola funtzionatzen duen formula honek

    Dagoeneko dakizuenez, Excel CORREL funtzioak zehazten dituzun bi aldagai multzoren korrelazio koefizientea itzultzen du. Erronka nagusia matrizeari dagozkion gelaxketan tarte egokiak hornitzea da. Horretarako, formulan lehen aldagai-barrutia bakarrik sartu eta funtzio hauek erabili behar diren doikuntzak egiteko:

    • OFFSET - errenkada eta zutabe kopuru jakin bat den barrutia itzultzen du.

    Michael Brown teknologia-zale dedikatua da, software-tresnak erabiliz prozesu konplexuak sinplifikatzeko grina duena. Hamarkada bat baino gehiagoko esperientzia duen teknologia-industrian, Microsoft Excel eta Outlook-en eta Google Sheets eta Docs-en trebetasunak landu ditu. Michael-en bloga bere ezagutzak eta esperientziak besteekin partekatzera zuzenduta dago, produktibitatea eta eraginkortasuna hobetzeko aholku eta tutorial errazak eskaintzen ditu. Profesional ondua edo hasiberria izan, Michael-en blogak informazio baliotsuak eta aholku praktikoak eskaintzen ditu funtsezko software-tresna horiei etekinik handiena ateratzeko.