Bestem korrelasjonskoeffisienten

Forfatter: Morris Wright
Opprettelsesdato: 28 April 2021
Oppdater Dato: 19 Juni 2024
Anonim
Correlation Coefficient
Video: Correlation Coefficient

Innhold

Korrelasjonskoeffisienten, betegnet r eller ρ, er målingen på den lineære korrelasjonen (forholdet, både i styrke og retning) mellom to variabler. Det varierer fra -1 til +1, ved å bruke pluss- og minustegn for å representere den positive og negative korrelasjonen. Hvis korrelasjonskoeffisienten er nøyaktig -1, er forholdet mellom de to variablene helt negativt. hvis korrelasjonskoeffisienten er nøyaktig +1, er forholdet helt positivt. To variabler kan ha en positiv korrelasjon, en negativ korrelasjon eller ingen korrelasjon i det hele tatt. Du kan beregne korrelasjonen for hånd ved å bruke noen av de gratis korrelasjonsberegningene som er tilgjengelige online, eller ved å bruke de statistiske funksjonene til en god grafkalkulator.

Å trå

Metode 1 av 4: Beregn korrelasjonskoeffisienten for hånd

  1. Først samler du inn dataene dine. For å begynne å beregne en effektiv korrelasjon, må du først undersøke dataparene. Det er nyttig å legge dem i et bord, både vertikalt og horisontalt. Merk hver rad eller kolonne x og y.
    • Anta for eksempel at du har fire datapar for X og y. Tabellen kan da se slik ut:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Beregn gjennomsnittet av X. For å beregne gjennomsnittet trenger du alle verdier av X legg til og del deretter med antall verdier.
    • Legg merke til at du har fire verdier for ved hjelp av eksemplet ovenfor X. For å beregne gjennomsnittet legger du sammen alle verdiene X og del den med 4. Beregningen ser slik ut:
    • μX=(1+2+4+5)/4{ displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}Finn gjennomsnittet av y. Til gjennomsnittet av y For å finne det, følg de samme trinnene, legg alle verdiene til y sammen og del deretter med antall verdier.
      • I eksemplet ovenfor har du også fire verdier for y. Legg alle disse verdiene sammen og del dem deretter med 4. Beregningene vil se slik ut:
      • μy=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}Bestem standardavviket til X. Når du har kommet i stand, kan du beregne standardavviket. For å gjøre dette, bruk formelen:
        • σX=1n1Σ(XμX)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}Beregn standardavviket til y. Ved hjelp av de samme grunnleggende trinnene, finn standardavviket til y. Du kommer til å bruke den samme formelen ved å bruke datapunktene for y.
          • Med eksempeldataene vil beregningene dine se slik ut:
          • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}Gjennomgå den grunnleggende formelen for å bestemme en korrelasjonskoeffisient. Formelen for beregning av en korrelasjonskoeffisient bruker middel, standardavvik og antall par i et datasett (representert ved n). Selve korrelasjonskoeffisienten er representert med små bokstaver r eller den greske bokstaven ρ (rho). For denne artikkelen vil vi bruke formelen kjent som Pearson-korrelasjonskoeffisienten som vist nedenfor:
            • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } høyre) * venstre ({ frac {y- mu _ {y}} { sigma _ {y}}} høyre)}Bestem korrelasjonskoeffisienten. Du har nå midlene og standardavvikene for variablene dine, slik at du kan gå videre til korrelasjonskoeffisientformelen. Husk at n representerer antall verdier du har. Du har allerede utarbeidet annen relevant informasjon i trinnene ovenfor.
              • Ved hjelp av eksempeldataene kan du legge inn dataene i korrelasjonskoeffisientformelen og beregne dem som følger:
              • ρ=(1n1)Σ(XμXσX)(yμyσy){ displaystyle rho = left ({ frac {1} {n-1}} right) Sigma left ({ frac {x- mu _ {x}} { sigma _ {x}} } høyre) * venstre ({ frac {y- mu _ {y}} { sigma _ {y}}} høyre)}Tolke resultatet. For dette datasettet er korrelasjonskoeffisienten 0,988. Dette tallet forteller deg to ting om dataene. Se på tegnet på nummeret og størrelsen på nummeret.
                • Siden korrelasjonskoeffisienten er positiv, kan du si at det er en positiv korrelasjon mellom x-data og y-data. Dette betyr at hvis x-verdiene øker, forventer du at y-verdiene også øker.
                • Siden korrelasjonskoeffisienten er veldig nær +1, er x-data og y-data veldig nært beslektet. Hvis du skulle tegne disse punktene, ville du se at de er en veldig god tilnærming til en rett linje.

Metode 2 av 4: Bruke online korrelasjonskalkulatorer

  1. Søk på nettet etter korrelasjonskalkulatorer. Måling av korrelasjon er en ganske standard beregning for statistikere. Beregningen kan bli veldig kjedelig for store datasett hvis det gjøres for hånd. Derfor har mange kilder gjort vanlige korrelasjonsberegninger tilgjengelige online. Bruk hvilken som helst søkemotor og skriv inn søkeordet "korrelasjonskalkulator".
  2. Skriv inn dataene. Les instruksjonene på nettstedet nøye slik at du kan skrive inn dataene riktig. Det er viktig at datapar holdes i orden, ellers får du feil korrelasjonsresultat. Ulike nettsteder bruker forskjellige formater for å legge inn data.
    • På nettstedet http://ncalculators.com/statistics/correlation-coefficient-calculator.htm finner du for eksempel en horisontal rute for å legge inn x-verdier og en andre horisontal ramme for å legge inn y-verdier. Du skriver inn vilkårene, atskilt med komma. Dermed bør x-datasettet beregnet tidligere i denne artikkelen legges inn som 1,2,4,5. Y-datasettet er angitt som 1,3,5,7.
    • På et annet nettsted, http://www.alcula.com/calculators/statistics/correlation-coefficient/, kan du legge inn data horisontalt eller vertikalt, så lenge du holder datapunktene i orden.
  3. Beregn resultatene. Disse beregningsstedene er populære fordi du etter å ha tastet inn dataene vanligvis bare trenger å klikke på "Beregn" -knappen - resultatet vises automatisk.

Metode 3 av 4: Bruke en grafkalkulator

  1. Skriv inn dine detaljer. På grafkalkulatoren din, aktiver statistikkfunksjonen og velg deretter kommandoen "Rediger".
    • Hver kalkulator har litt forskjellige tastekommandoer. Denne artikkelen gir de spesifikke instruksjonene for Texas Instruments TI-86.
    • For å få tilgang til Stat-funksjonen, trykk [2nd] -Stat (over "+" -tasten) og trykk deretter F2-Edit.
  2. Slett alle gamle lagrede data. De fleste kalkulatorer vil beholde de statistiske dataene til de blir ryddet. For å sikre at du ikke forveksler gamle data med nye data, bør du først slette all tidligere lagret informasjon.
    • Bruk piltastene til å flytte markøren for å markere kategorien "xStat". Trykk deretter på "Clear" og "Enter. Dette bør fjerne alle verdier i xStat-kolonnen.
    • Bruk piltastene for å markere kategorien "yStat". Trykk på "Clear" og "Enter" for å også fjerne dataene for den kolonnen.
  3. Skriv inn dataverdiene. Bruk piltastene til å flytte markøren til første mellomrom under xStat-overskriften. Skriv inn din første dataverdi, og trykk deretter på Enter. Du bør se mellomrommet nederst på skjermen "xStat (1) = __", hvor verdien din fyller det tomme rommet. Når du trykker Enter, vil dataene fylle tabellen, markøren flytter til neste linje, og linjen nederst på skjermen skal nå lese "xStat (2) = __".
    • Fortsett å skrive inn alle x-verdiene.
    • Når du har angitt x-verdiene, bruker du piltastene til å flytte til yStat-kolonnen og angi y-verdiene.
    • Når alle data er lagt inn, trykker du Avslutt for å fjerne skjermen og avslutte Stat-menyen.
  4. Beregn statistikken for lineær regresjon. Korrelasjonskoeffisienten er et mål på hvor nært dataene tilnærmer seg en rett linje. En grafkalkulator med statistiske funksjoner kan beregne den beste tilpasningslinjen og korrelasjonskoeffisienten veldig raskt.
    • Gå inn i Stat-funksjonen og trykk deretter på Calc-knappen. På TI-86 er dette [2.] [Stat] [F1].
    • Velg beregningene for lineær regresjon. På TI-86 er dette [F3], merket "LinR." Grafikkdisplayet viser deretter linjen "LinR _" med en blinkende markør.
    • Du må nå skrive inn navnene på de to variablene du vil beregne. Dette er xStat og yStat.
      • På TI-86 velger du navnelisten ("Navn") ved å trykke på [2.] [Liste] [F3].
      • Bunnlinjen på skjermen din skal nå vise tilgjengelige variabler. Velg [xStat] (dette er sannsynligvis F1 eller F2-knappen), skriv deretter inn et komma og deretter [yStat].
      • Trykk på Enter for å beregne dataene
  5. Tolke resultatene. Når du trykker Enter, vil kalkulatoren umiddelbart beregne følgende informasjon for dataene du skrev inn:
    • y=en+bX{ displaystyle y = a + bx}Forstå begrepet korrelasjon. Korrelasjon refererer til det statistiske forholdet mellom to størrelser. Korrelasjonskoeffisienten er et enkelt tall som du kan beregne for to sett med datapunkter. Tallet er alltid noe mellom -1 og +1, og indikerer hvor tett de to datasettene er.
      • Hvis du for eksempel målte høyden og alderen til barn opp til 12 år, ville du forvente å finne en sterk positiv sammenheng. Når barna blir eldre, har de en tendens til å bli høyere.
      • Et eksempel på en negativ sammenheng er å sammenligne tiden noen bruker på å trene golf med vedkommendes golfpoeng. Etter hvert som øvelsen utvikler seg, skal poengsummen synke.
      • Til slutt vil du forvente liten sammenheng, for eksempel positiv eller negativ, mellom en persons skostørrelse og deres karakterer.
    • Beregn gjennomsnittet. Det aritmetiske gjennomsnittet, eller "gjennomsnittet", av et datasett blir beregnet ved å legge til alle verdiene til dataene og deretter dele med antall verdier i settet. For å bestemme korrelasjonskoeffisienten for dataene dine, må du beregne gjennomsnittet av hvert datasett.
      • Gjennomsnittet for en variabel er indikert av variabelen med en horisontal linje over den. Dette blir ofte referert til som "x-bar" eller "y-bar" for datasettene x og y. Alternativt kan gjennomsnittet betegnes med små bokstaver μ (mu). For eksempel, for å indikere gjennomsnittet av datapunkter på x, kan du bruke μX eller μ (x).
      • For eksempel, hvis du har et sett med x (1,2,5,6,9,10), beregnes gjennomsnittet av disse dataene som følger:
        • μX=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Kjenn til viktigheten av standardavviket. I statistikken måler standardavviket variasjonen, og viser spredningen av tallene fra gjennomsnittet. En gruppe med tall med lav standardavvik er ganske nær hverandre. En gruppe med tall med høyt standardavvik er mer spredt.
          • Som et symbol uttrykkes standardavviket med små bokstaver s eller den greske bokstaven σ (sigma). Dermed skrives standardavviket til x-data som sX eller σX.
        • Anerkjenn summeringsnotasjonen. Summasjonsoperatøren er en av de vanligste operatorene i matematikk, og den indikerer en sum av verdier. Det er representert med den greske store bokstaven, sigma eller ∑.
          • For eksempel, hvis du har en samling datapunkter x (1,2,5,6,9,10), betyr ∑x:
            • 1+2+5+6+9+10 = 33

Tips

  • Korrelasjonskoeffisienten blir noen ganger referert til som "Pearson produkt-øyeblikk korrelasjonskoeffisient" til ære for Karl Pearson, dens utvikler.
  • Generelt representerer en korrelasjonskoeffisient høyere enn 0,8 (positiv eller negativ) en sterk korrelasjon; en korrelasjonskoeffisient lavere enn 0,5 (positiv eller negativ igjen) representerer en svak korrelasjonskoeffisient.

Advarsler

  • Korrelasjon viser at to datasett er koblet sammen på en eller annen måte. Vær imidlertid forsiktig så du ikke tolker dette som et årsakssammenheng. Hvis du for eksempel sammenligner folks skostørrelser og høyde, vil du sannsynligvis finne en sterk positiv sammenheng. Større mennesker har generelt større føtter. Dette betyr imidlertid ikke at det å føle seg høyt vil få føttene til å vokse, eller at store føtter vil gjøre at du blir høy. De skjer bare sammen.