Korelacio en Excel: koeficiento, matrico kaj grafikaĵo

Enhavtabelo

La lernilo klarigas la bazojn de korelacio en Excel, montras kiel kalkuli korelacian koeficienton, konstrui korelacian matricon kaj interpreti la rezultojn.

Unu el la plej simplaj statistikaj kalkuloj, kiujn vi povas fari en Excel, estas korelacio. Kvankam simple, ĝi estas tre utila por kompreni la rilatojn inter du aŭ pli da variabloj. Microsoft Excel provizas ĉiujn necesajn ilojn por efektivigi korelacian analizon, vi nur bezonas scii kiel uzi ilin.

Korelacio en Excel - la bazaĵoj

Korelacio. estas mezuro, kiu priskribas la forton kaj direkton de rilato inter du variabloj. Ĝi estas kutime uzata en statistiko, ekonomio kaj sociaj sciencoj por buĝetoj, komercaj planoj kaj similaj.

La metodo uzata por studi kiom proksime la variabloj rilatas nomiĝas korelacianalizo .

Jen kelkaj ekzemploj de forta korelacio:

La nombro da kalorioj, kiujn vi manĝas kaj via pezo (pozitiva korelacio)
La ekstera temperaturo kaj viaj hejtadkontoj ( negativa korelacio)

Kaj ĉi tie la ekzemploj de datumoj kiuj havas malfortan aŭ neniun korelacion:

La nomo de via kato kaj ilia plej ŝatata manĝaĵo
La koloro de viaj okuloj kaj via alteco

Nepra afero por kompreni pri korelacio estas ke ĝi nur montras kiom proksime rilataj estas du variabloj. Korelacio, tamen, ne implicasel difinita intervalo.

VICJOJ kaj KOLUNOJ - resendas la nombron da vicoj kaj kolumnoj en intervalo, respektive. En nia korelacia formulo, ambaŭ estas uzataj kun unu celo - akiri la nombron da kolumnoj por kompensi de la komenca gamo. Kaj tio estas atingita per lerte uzado de absolutaj kaj relativaj referencoj.

Por pli bone kompreni la logikon, ni vidu kiel la formulo kalkulas la koeficientojn elstarigitajn en la supra ekrankopio.

Unue, ni ni vidu. ekzamenu la formulon en B18, kiu trovas korelacion inter la monata temperaturo (B2:B13) kaj hejtiloj venditaj (D2:D13):

=CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))

En la unua OFFSET-funkcio, ROWS($1: 1) transformiĝis al ROWS($1:3) ĉar la dua koordinato estas relativa, do ĝi ŝanĝiĝas laŭ la relativa pozicio de la vico kie la formulo estas kopiita (2 vicoj malsupre). Tiel, ROWS() liveras 3, de kiu ni subtrahas 1, kaj ricevas intervalon kiu estas 2 kolumnoj dekstre de la fonta gamo, t.e. $D$2:$D$13 (hejtigvendoj).

La dua OFFSET ne ŝanĝas la specifitan intervalon $B$2:$B$13 (temperaturo) ĉar COLUMNS($A:A)-1 liveras nul.

Kiel rezulto, nia longa formulo iĝas simpla KORELO( $D$2:$D$13, $B$2:$B$13) kaj redonas precize la koeficienton kiun ni volas.

La formulo en C18, kiu kalkulas korelacian koeficienton por reklamkosto (C2:C13) kaj vendo ( D2:D13) funkcias simile:

=CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:3)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:B)-1))

La unua OFFSET-funkcio estasabsolute la sama kiel priskribita supre, redonante la gamon de $D$2:$D$13 (hejtigvendoj).

En la dua OFFSETO, COLUMNS($A:A)-1 ŝanĝiĝas al COLUMNS($A: B)-1 ĉar ni kopiis la formulon 1-kolumnon dekstren. Sekve, OFFSET ricevas gamon, kiu estas 1 kolumno dekstre de la fonta gamo, t.e. $C$2:$C$13 (reklama kosto).

Vidu ankaŭ: Kiel montri kradliniojn en Excel; kaŝi (forigi) liniojn

Kiel bildigi korelacian grafikon en Excel

Kiam vi faras korelacion en Excel, la plej bona maniero akiri vidan reprezenton de la rilatoj inter viaj datumoj estas desegni disvastigilon kun tendenco . Jen kiel:

Elektu du kolumnojn kun nombraj datumoj, inkluzive de kolumnaj kapoj. La ordo de kolumnoj estas grava: la sendependa variablo devus esti en la maldekstra kolumno ĉar ĉi tiu kolumno estas grafikota sur la x-akso; la dependa variablo devus esti en la dekstra kolumno ĉar ĝi estos grafikaĵo sur la y-akso.
Sur la langeto Inset , en la Babiloj grupo, alklaku la piktogramon Disigi . Ĉi tio tuj enigos XY disvastigan diagramon en vian laborfolion.
Dekstre alklaku iun ajn datumpunkton en la diagramo kaj elektu Aldoni Tendencon... el la kunteksta menuo.

Por la detalaj paŝo post paŝo instrukcioj, bonvolu vidi:

Kiel krei disvastigon en Excel
Kiel aldoni tendenclinion al Excel-diagramo

Por nia specimena datumaro, la korelaciaj grafikaĵoj aspektas kiel montritaj en la suba bildo.Aldone, ni montris R-kvadratan valoron, ankaŭ nomatan Koeficiento de Determino . Ĉi tiu valoro indikas kiom bone la tendenclinio respondas al la datumoj - ju pli proksima R2 al 1, des pli bona la konveno.

El la R2-valoro montrata sur via disvastigo, vi povas facile kalkuli la korelacian koeficienton:

Por pli bona precizeco, igu Excel montri pli da ciferoj en la R-kvadrata valoro ol ĝi faras defaŭlte.
Alklaku la R2-valoron sur la diagramo, elektu ĝin per la muso, kaj premu Ctrl. + C por kopii ĝin.
Akiru kvadratan radikon de R2 aŭ uzante la SQRT-funkcion aŭ altigante la kopiitan R2-valoron al la potenco de 0,5.

Ekzemple, la R2-valoro en la dua grafikaĵo estas 0.9174339392. Do, vi povas trovi la korelacian koeficienton por Reklamado kaj Hejtiloj venditaj kun unu el ĉi tiuj formuloj:

=SQRT(0.9174339392)

=0.9174339392^0.5

Kiel vi povas certigi, la koeficientoj tiel kalkulitaj estas perfekte konformaj al la korelaciaj koeficientoj trovitaj en la antaŭaj ekzemploj, krom la signo :

Eblaj problemoj kun korelacio en Excel

La Pearson Product Moment Correlation nur malkaŝas linian rilaton inter la du variabloj. Signifo, viaj variabloj povas esti forte rilataj en alia kurba maniero kaj ankoraŭ havi la korelacian koeficienton egala aŭ proksima al nulo.

La Pearson-korelacio ne kapablasdistingi dependajn kaj sendependajn variablojn. Ekzemple, kiam vi uzas la funkcion CORREL por trovi la asocion inter meza monata temperaturo kaj la nombro da hejtiloj venditaj, ni ricevis koeficienton de -0.97, kiu indikas altan negativan korelacion. Tamen, vi povus ŝanĝi la variablojn kaj akiri la saman rezulton. Do, iu povas konkludi, ke pli altaj hejtilaj vendoj kaŭzas malaltiĝon de temperaturo, kio evidente ne havas sencon. Tial, kiam vi rulas korelacian analizon en Excel, estu konscia pri la datumoj, kiujn vi liveras.

Krome, la Pearson-korelacio estas tre sentema al outlieroj . Se vi havas unu aŭ plurajn datumpunktojn, kiuj tre diferencas de la resto de la datumoj, vi povas ricevi distorditan bildon de la rilato inter la variabloj. En ĉi tiu kazo, vi estus saĝe uzi la korelacion de rango Spearman anstataŭe.

Tiel fari korelacion en Excel. Por pli detale rigardi la ekzemplojn diskutitajn en ĉi tiu lernilo, vi bonvenas elŝuti nian specimenan laborlibron sube. Mi dankas vin pro legado kaj esperas vidi vin en nia blogo venontsemajne!

Praktiku laborlibron

Kalkuli Korelacion en Excel (.xlsx-dosiero)

kaŭzado. La fakto ke ŝanĝoj en unu variablo estas asociitaj kun ŝanĝoj en la alia variablo ne signifas ke unu variablo efektive igas la alian ŝanĝi.

Se vi interesiĝas lerni kaŭzecon kaj fari antaŭdirojn, faru paŝon antaŭen. kaj fari liniaran regresan analizon.

Koeficiento de korelacio en Excel - interpreto de korelacio

La nombra mezuro de la grado de asocio inter du kontinuaj variabloj nomiĝas koeficiento de korelacio ( r).

La koeficientvaloro ĉiam estas inter -1 kaj 1 kaj ĝi mezuras kaj la forton kaj direkton de la linia rilato inter la variabloj.

Forto

Ju pli granda la absoluta valoro de la koeficiento, des pli forta la rilato:

La ekstremaj valoroj de -1 kaj 1 indikas perfektan linearan rilaton kiam ĉiuj datenpunktoj falas sur linio. En la praktiko, perfekta korelacio, ĉu pozitiva aŭ negativa, estas malofte observita.
Koeficiento de 0 indikas neniun linearan rilaton inter la variabloj. Jen kion vi verŝajne ricevos per du aroj da hazardaj nombroj.
Valoroj inter 0 kaj +1/-1 reprezentas skalon de malfortaj, moderaj kaj fortaj rilatoj. Kiam r proksimiĝas al aŭ -1 aŭ 1, la forto de la rilato pliiĝas.

Direkto

La koeficienta signo (plus aŭ minus) indikas la direkto de larilato.

Pozitivaj koeficientoj reprezentas rektan korelacion kaj produktas suprenan deklivon sur grafeo - kiam unu variablo pligrandiĝas tiel ankaŭ la alia, kaj inverse.
Negativaj koeficientoj reprezentas inversan korelacion kaj produktas malsuprenan deklivon sur grafeo - kiam unu variablo pligrandiĝas, la alia variablo tendencas malpliiĝi.

Por pli bona kompreno, bonvolu rigardi la jenaj korelaciaj grafikaĵoj:

Koeficiento de 1 signifas perfektan pozitivan rilaton - kiam unu variablo pligrandiĝas, la alia proporcie pligrandiĝas.
Koeficiento de -1 signifas perfektan negativan rilaton - kiam unu variablo pligrandiĝas, la alia proporcie malpliiĝas.
Koeficiento de 0 signifas neniun rilaton inter du variabloj - la datumpunktoj estas disigitaj ĉie en la grafeo.

Pearson-korelacio

En statistiko, ili mezuras plurajn specojn de korelacio depende de tipo de la datumoj kun kiuj vi laboras. En ĉi tiu lernilo, ni koncentriĝos pri la plej ofta.

Pearson Correlation , la plena nomo estas la Pearson Product Moment Correlation (PPMC), estas uzata por taksi liniajn rilatojn inter datenoj kiam ŝanĝo en unu variablo estas rilata al proporcia ŝanĝo en la alia variablo. En simplaj esprimoj, la Pearson Korelacio respondas la demandon: Ĉu la datumoj povas esti reprezentitaj sur alinio?

En statistiko, ĝi estas la plej populara korelacia tipo, kaj se vi traktas "korelacian koeficienton" sen plia kvalifiko, plej verŝajne ĝi estas la Pearson.

Jen la plej ofte uzata formulo por trovi la Pearson-korelacian koeficienton, ankaŭ nomatan Pearson-a R :

Foje, vi povas trovi du aliajn formulojn por kalkuli la specimplan korelacian koeficienton (r) kaj la populacia korelacia koeficiento (ρ).

Kiel fari Pearson-korelacion en Excel

Kalkuli la Pearson-korelacian koeficienton mane implikas multe da matematiko. . Feliĉe, Microsoft Excel faris aferojn tre simplaj. Depende de via datumaro kaj via celo, vi rajtas uzi unu el la jenaj teknikoj:

Trovu la korelacian koeficienton de Pearson kun la funkcio CORREL.
Faru korelacian matricon per farante Analizon de Datumoj.
Trovu plurajn korelaciajn koeficientojn kun formulo.
Ploku korelacian grafikon por akiri la vidan prezenton de la datumrilato.

Kiel kalkuli korelacia koeficiento en Excel

Por kalkuli korelacian koeficienton mane, vi devus uzi ĉi tiun longan formulon. Por trovi korelacian koeficienton en Excel, utiligu la funkcion CORREL aŭ PEARSON kaj ricevu la rezulton en frakcio de sekundo.

Excel CORREL-funkcio

La funkcio CORREL redonas la funkcion.Pearson-korelacia koeficiento por du aroj de valoroj. Ĝia sintakso estas tre facila kaj simpla:

CORREL(tabelo1, tabelo2)

Kie:

Tabelo1 estas la unua gamo de valoroj.
Tabelo2 estas la dua gamo de valoroj.

La du tabeloj havu egalan longon.

Supozinte ke ni havas aron de sendependaj variabloj ( x ) en B2:B13 kaj dependaj variabloj (y) en C2:C13, nia korelacia koeficienta formulo iras jene:

=CORREL(B2:B13, C2:C13)

Aŭ, ni povus interŝanĝi la intervalojn kaj ankoraŭ ricevu la saman rezulton:

=CORREL(C2:C13, B2:B13)

Ĉiuokaze, la formulo montras fortan negativan korelacion (ĉirkaŭ -0,97) inter la averaĝa monata temperaturo kaj la nombro de venditaj hejtiloj:

3 aferoj, kiujn vi devus scii pri la funkcio CORREL en Excel

Por sukcese kalkuli la korelacian koeficienton en Excel, bonvolu memori ĉi tiujn 3 simplajn faktojn:

Se unu aŭ pluraj ĉeloj en tabelo enhavas tekston, logikaj valoroj aŭ malplenaj, tiaj ĉeloj estas ignorataj; ĉeloj kun nul valoroj estas kalkulitaj.
Se la provizitaj tabeloj estas de malsamaj longoj, #N/A eraro estas resendita.
Se iu el la tabeloj estas malplena aŭ se la norma devio de iliaj valoroj egalas nul, #DIV/0! eraro okazas.

Excel PEARSON-funkcio

La PEARSON-funkcio en Excel faras la samon - kalkulas la Pearson Product Moment Correlation-koeficienton.

PEARSON(array1,tabelo2)

Kie:

Tabelo1 estas gamo de sendependaj valoroj.
Tabelo2 estas gamo de dependaj valoroj.

Ĉar PEARSON kaj CORREL ambaŭ kalkulas la linearan korelacian koeficienton de Pearson, iliaj rezultoj devus konsenti, kaj ili ĝenerale faras en lastatempaj versioj de Excel 2007 ĝis Excel 2019.

En Excel 2003 kaj pli fruaj versioj, tamen, la funkcio PEARSON povas montri kelkajn rondigajn erarojn. Tial, en pli malnovaj versioj, oni rekomendas uzi CORREL prefere ol PEARSON.

Sur nia ekzempla datumaro, ambaŭ funkcioj montras la samajn rezultojn:

=CORREL(B2:B13, C2:C13)

=PEARSON(B2:B13, C2:C13)

Kiel fari korelacian matricon en Excel kun Datuma Analizo

Kiam vi bezonas testi interrilatojn inter pli ol du variabloj, estas senco konstrui korelacian matricon, kiu foje nomiĝas multobla korelacia koeficiento .

La korelacia matrico estas tabelo, kiu montras la korelaciajn koeficientojn inter la variabloj ĉe la intersekco de la respondaj vicoj kaj kolumnoj.

La korelacia matrico en Excel estas konstruita per la Korelacio ilo de la aldono Analiza ToolPak . Ĉi tiu aldonaĵo disponeblas en ĉiuj versioj de Excel 2003 ĝis Excel 2019, sed ne estas ebligita defaŭlte. Se vi ankoraŭ ne aktivigis ĝin, bonvolu fari tion nun sekvante la paŝojn priskribitajn en Kiel ebligi Data Analysis ToolPak en Excel.

Perla iloj de Datuma Analizo aldonitaj al via Excel-rubando, vi pretas fari korelacian analizon:

Sur la supra dekstra angulo de la langeto Datumoj > Analizo grupo, alklaku la butonon Analizo de datumoj .
En la dialogkesto Analizo de datumoj , elektu Korelacio kaj alklaku OK.
En la skatolo Korelacio , agordu la parametrojn tiamaniere:
- Alklaku en la skatolo Eniga Gamo kaj elektu la intervalon per viaj fontaj datumoj, inkluzive de kolumnaj kaplinioj (B1:D13 en nia kazo).
- En la sekcio Grupita per , certigu, ke la radioskatolo Kolumnoj estas elektita (donita ke viaj fontaj datumoj estas grupigitaj en kolumnojn).
- Elektu la markobutonon Etikedoj en la unua vico se la elektita gamo enhavas kolumnajn kapojn.
- Elektu la deziratan eligopcion. Por havi la matricon en la sama folio, elektu Eliga Gamo kaj specifu la referencon al la plej maldekstra ĉelo en kiu la matrico estas eligota (A15 en ĉi tiu ekzemplo).

Kiam finite, alklaku la butonon OK :

Via matrico de korelaciaj koeficientoj estas farita kaj devus aspekti kiel montrite en la sekva sekcio.

Vidu ankaŭ: Kiel uzi IFNA-funkcion en Excel kun ekzemploj

Interpretante korelaciajn analizrezultojn

En via Excel-korelacia matrico, vi povas trovi la koeficientojn ĉe la intersekco de vicoj kaj kolumnoj. Se la koordinatoj de kolumno kaj vico estas samaj, la valoro 1 estas eligita.

En la ĉi-supraekzemplo, ni interesiĝas scii la korelacion inter la dependa variablo (nombro da hejtiloj venditaj) kaj du sendependaj variabloj (averaĝa monata temperaturo kaj reklamkostoj). Do, ni rigardas nur la nombrojn ĉe la intersekco de ĉi tiuj vicoj kaj kolumnoj, kiuj estas emfazitaj en la ekrankopio malsupre:

La negativa koeficiento de -0,97 (rondita al 2 decimalaj lokoj) montras fortan inversan korelacion inter la monata temperaturo kaj hejtila vendo - dum la temperaturo kreskas pli alta, malpli da hejtiloj estas vendataj.

La pozitiva koeficiento de 0,97 (rondita al 2 decimalaj lokoj) indikas fortan rektan ligon inter la reklambuĝeto kaj vendoj - des pli mono, kiun vi elspezas por reklamado, des pli altas la vendoj.

Kiel fari multoblan korelacian analizon en Excel kun formuloj

Konstrui la korelacian tabelon per la ilo de Datuma Analizo estas facile. Tamen, tiu matrico estas senmova, tio signifas, ke vi devos denove ruli korelacian analizon ĉiufoje kiam la fontaj datumoj ŝanĝiĝas.

La bona novaĵo estas, ke vi povas facile konstrui similan korelacian tabelon mem, kaj tiu matrico aŭtomate ĝisdatiĝos. kun ĉiu ŝanĝo en la fontaj valoroj.

Por fari ĝin, uzu ĉi tiun ĝeneralan formulon:

CORREL(OFFSET( unua_variabla_gamo , 0, VICJOS($1:1)-1) , OFFSET( unua_variabla_amplekso , 0, KOLUMNOS($A:A)-1))

Grava noto! Por ke la formulo funkciu, vi devus ŝlosila unua varia gamo uzante absolutajn ĉelreferencojn.

En nia kazo, la unua varia gamo estas $B$2:$B$13 (bonvolu rimarki la $-signon, kiu ŝlosas la referencon), kaj nia korelacia formulo prenas ĉi tion. formo:

=CORREL(OFFSET($B$2:$B$13, 0, ROWS($1:1)-1), OFFSET($B$2:$B$13, 0, COLUMNS($A:A)-1))

Kun la formulo preta, ni konstruu korelacian matricon:

En la unua vico kaj unua kolumno de la matrico, tajpu la variablojn' etikedoj en la sama ordo kiel ili aperas en via fonttabelo (bonvolu vidi la ekrankopion sube).
Enigu la supran formulon en la plej maldekstra ĉelo (B16 en nia kazo).
Trenu la formulon. malsupren kaj dekstren por kopii ĝin al tiom da vicoj kaj kolumnoj kiom necesas (3 vicoj kaj 3 kolumnoj en nia ekzemplo).

Kiel rezulto, ni havas la sekvan matricon kun multobla korelacio. koeficientoj. Bonvolu rimarki, ke la koeficientoj redonitaj de nia formulo estas ekzakte la sama kiel eligo de Excel en la antaŭa ekzemplo (la koncernaj estas emfazitaj):

Kiel ĉi tiu formulo funkcias

Kiel vi jam scias, la Excel CORREL-funkcio resendas la korelacian koeficienton por du aroj de variabloj, kiujn vi specifas. La ĉefa defio estas provizi la taŭgajn intervalojn en la respondaj ĉeloj de la matrico. Por tio, vi enigu nur la unuan varian gamon en la formulo kaj uzu la sekvajn funkciojn por fari la necesajn ĝustigojn:

OFFSET - liveras gamon, kiu estas donita nombro da vicoj kaj kolumnoj.

Antaŭa afiŝo Konverti CSV al Excel: solvoj por oftaj problemoj

Sekva afiŝo Excel TOROW-funkcio por transformi gamon aŭ tabelon al vico

Michael Brown

Michael Brown estas diligenta teknologia entuziasmulo kun pasio por simpligi kompleksajn procezojn uzante programarajn ilojn. Kun pli ol jardeko da sperto en la teknologia industrio, li perfektigis siajn kapablojn en Microsoft Excel kaj Outlook, same kiel Google Sheets kaj Docs. La blogo de Mikaelo estas dediĉita al kunhavigi siajn sciojn kaj kompetentecon kun aliaj, provizante facilajn sekvajn konsiletojn kaj lernilojn por plibonigi produktivecon kaj efikecon. Ĉu vi estas sperta profesiulo aŭ komencanto, la blogo de Mikaelo ofertas valorajn komprenojn kaj praktikajn konsilojn por eltiri la plej multajn el ĉi tiuj esencaj programaj iloj.

#EXCELTIPS