Måter å beregne avvik på

Forfatter: Robert Simon
Opprettelsesdato: 21 Juni 2021
Oppdater Dato: 1 Juli 2024
Anonim
Specific Heat Capacity Problems & Calculations - Chemistry Tutorial - Calorimetry
Video: Specific Heat Capacity Problems & Calculations - Chemistry Tutorial - Calorimetry

Innhold

Variasjon måler spredningen av datasettet. Det er veldig nyttig å bygge statistiske modeller: lav varians kan være en indikasjon på at du beskriver tilfeldig feil eller støy i stedet for det underliggende forholdet i dataene. Med denne artikkelen lærer wikiHow deg hvordan du beregner avvik.

Fremgangsmåte

Metode 1 av 2: Beregn variansen til et utvalg

  1. Skriv eksempeldatasettet. I de fleste tilfeller har statistikere bare informasjon om et utvalg eller delmengde av befolkningen de studerer. For eksempel, i stedet for å gjøre en generell analyse av "kostnaden for alle biler i Tyskland", kan en statistiker finne kostnaden for et tilfeldig utvalg på noen få tusen biler. Statistikeren kan bruke dette eksemplet for å få et godt estimat av kostnadene for biler i Tyskland. Det er imidlertid mer sannsynlig at det ikke stemmer overens med de faktiske tallene.
    • For eksempel: Når du analyserte antall muffins solgt per dag på en kaffebar, tok du en tilfeldig seks-dagers prøve og fikk følgende resultater: 38, 37, 36, 28, 18, 14, 12, 11, 10.7, 9.9. Dette er et utvalg, ikke en populasjon, fordi du ikke har data for hver dag butikken er åpen.
    • Hvis hver Datapunkter i masteren, gå til metoden nedenfor.

  2. Skriv ned variasjonsformelen. Variansen til et datasett indikerer spredningsgraden for datapunktene. Jo nærmere variansen er null, jo nærmere datapunktene er gruppert. Når du arbeider med eksempeldatasett, bruk følgende formel for å beregne avvik:
    • = /(n - 1)
    • er avviket. Avvik beregnes alltid i kvadratiske enheter.
    • representerer en verdi i datasettet.
    • ∑, som betyr "sum", forteller deg å beregne følgende parametere for hver verdi, og deretter legge dem sammen.
    • x̅ er gjennomsnittet av prøven.
    • n er antall datapunkter.

  3. Beregn gjennomsnittet av prøven. Symbolet x̅ eller "x-horisontal" brukes til å indikere gjennomsnittet av prøven. Beregn som for et hvilket som helst gjennomsnitt: legg sammen alle datapunktene og del det med antall poeng.
    • For eksempel: Først må du legge sammen datapunktene dine: 17 + 15 + 23 + 7 + 9 + 13 = 84
      Del deretter resultatet med antall datapunkter, i dette tilfellet seks: 84 ÷ 6 = 14.
      Eksempel gjennomsnitt = x̅ = 14.
    • Du kan tenke på gjennomsnittet som "midtpunktet" for dataene. Hvis dataene er sentrert rundt gjennomsnittet, er variansen lav. Hvis de er spredt langt fra gjennomsnittet, er variansen høy.

  4. Trekk gjennomsnittet fra hvert datapunkt. Nå er det på tide å beregne - x̅, hvor hvert punkt i datasettet ditt er. Hvert resultat vil indikere avvik fra gjennomsnittet for hvert tilsvarende punkt, eller for å si det enkelt, avstanden fra det til gjennomsnittet.
    • For eksempel:
      - x̅ = 17-14 = 3
      - x̅ = 15 - 14 = 1
      - x̅ = 23 - 14 = 9
      - x̅ = 7-14 = -7
      - x̅ = 9-14 = -5
      - x̅ = 13 - 14 = -1
    • Det er veldig enkelt å sjekke beregningene dine, fordi resultatene må summeres til null. Det er fordi, ved definisjonen av gjennomsnittlige negative resultater (avstanden fra gjennomsnittet til små tall positive resultater (avstand fra gjennomsnitt til større tall) elimineres fullstendig.
  5. Firkant alle resultatene. Som nevnt ovenfor har den nåværende avvikslisten (- x̅) en sum av null. Det betyr at "gjennomsnittlig avvik" også alltid vil være null og ingenting kan sies om spredningen av dataene. For å løse dette problemet finner vi kvadratet til hvert avvik. Takket være det er alle positive tall, negative verdier og positive verdier avbryter ikke lenger hverandre og gir summen null.
    • For eksempel:
      (- x̅)
      - x̅)
      9 = 81
      (-7) = 49
      (-5) = 25
      (-1) = 1
    • Du har nå (- x̅) for hvert datapunkt i prøven.
  6. Finn summen av kvadratverdiene. Nå er det på tide å beregne hele telleren med formelen: ∑. Den store syklusen, ∑, krever at du legger til følgende elementverdi for hver verdi. Du har beregnet (- x̅) for hver verdi i prøven, så alt du trenger å gjøre er å bare legge resultatene sammen.
    • For eksempel: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  7. Del med n - 1, hvor n er antall datapunkter. For lenge siden, ved beregning av variansen, ble statistikere bare delt med n. Denne divisjonen vil gi deg gjennomsnittet av kvadratavviket, som nøyaktig samsvarer med variansen til prøven. Husk imidlertid at utvalget bare er et estimat på en større populasjon. Hvis du tar et nytt tilfeldig utvalg og gjør samme beregning, får du et annet resultat. Når det viser seg å dele med n -1 i stedet for n gir deg et bedre estimat av variansen til en større populasjon - som du virkelig bryr deg om. Denne korreksjonen er så vanlig at det nå er den aksepterte definisjonen av variansen.
    • For eksempel: Det er seks datapunkter i utvalget, så n = 6.
      Eksempelvarians = 33,2
  8. Forstå varians og standardavvik. Vær oppmerksom på at, siden det er krefter i formelen, måles variansen i kvadratet til enhetene til de opprinnelige dataene. Dette er visuelt forvirrende. I stedet er standardavviket ofte ganske nyttig. Men det er ikke noe poeng i å kaste bort noe arbeid, ettersom standardavviket bestemmes av kvadratroten til variansen. Det er derfor prøvevariansen er skrevet i termer, og standardavviket til et utvalg er.
    • For eksempel er standardavviket for prøven ovenfor = s = √33.2 = 5.76.
    annonse

Metode 2 av 2: Beregn variansen til en populasjon

  1. Starter med hoveddatasettet. Begrepet "befolkning" brukes til å referere til alle relevante observasjoner. For eksempel, hvis du undersøker alderen på innbyggerne i Hanoi, vil den totale befolkningen inkludere alderen til alle personer som bor i Hanoi. Vanligvis lager du et regneark for et stort datasett som dette, men her er et mindre eksempel datasett:
    • For eksempel: I rommet til et akvarium er det nøyaktig seks akvarier. Disse seks tankene inneholder følgende antall fisk:





  2. Skriv ned formelen for total varians. Siden en populasjon inneholder alle dataene vi trenger, gir denne formelen oss den eksakte variasjonen i befolkningen. For å skille det fra utvalgsvariansen (som bare er et estimat) bruker statistikere andre variabler:
    • σ = /n
    • σ = prøvevarians. Dette er den normalt kvadratiske pølsen. Variasjon måles i kvadratiske enheter.
    • representerer et element i datasettet.
    • Elementet i ∑ beregnes for hver verdi, og legges deretter sammen.
    • μ er det totale gjennomsnittet.
    • n er antall datapunkter i befolkningen.
  3. Finn gjennomsnittet av befolkningen. Ved analyse av en populasjon representerer symbolet μ ("mu") det aritmetiske gjennomsnittet. For å finne gjennomsnittet, legg sammen alle datapunktene, og del deretter med antall poeng.
    • Du kan tenke på bety som "gjennomsnitt", men vær forsiktig, fordi ordet har mange matematiske definisjoner.
    • For eksempel: middelverdi = μ = = 10,5
  4. Trekk gjennomsnittet fra hvert datapunkt. Datapunkter nærmere gjennomsnittet har en forskjell nærmere null. Gjenta subtraksjonsproblemet for alle datapunktene, og du vil sannsynligvis begynne å føle spredningen av dataene.
    • For eksempel:
      - μ = 5 – 10,5 = -5,5
      - μ = 5 – 10,5 = -5,5
      - μ = 8 – 10,5 = -2,5
      - μ = 12 - 10., = 1,5
      - μ = 15 – 10,5 = 4,5
      - μ = 18 – 10,5 = 7,5
  5. Firkant hvert skilt. På dette punktet vil noen av resultatene fra forrige trinn være negative og noen vil være positive.Hvis du visualiserer dataene på en isomorf linje, representerer disse to elementene tallene til venstre og høyre for gjennomsnittet. Dette ville ikke ha noen nytte for å beregne avvik, da disse to gruppene ville avbryte hverandre. I stedet firkant dem alle slik at de alle er positive.
    • For eksempel:
      (- μ) for hver verdi av Jeg går fra 1 til 6:
      (-5,5) = 30,25
      (-5,5) = 30,25
      (-2,5) = 6,25
      (1,5) = 2,25
      (4,5) = 20,25
      (7,5) = 56,25
  6. Finn gjennomsnittet av resultatene dine. Du har nå en verdi for hvert datapunkt, relatert (ikke direkte) til hvor langt unna datapunktet er fra gjennomsnittet. Gjennomsnitt ved å legge dem sammen og dele på antall verdier du har.
    • For eksempel:
      Total varians = 24,25
  7. Kontaktoppskrift. Hvis du ikke er sikker på hvordan dette passer til formelen som ble skissert i begynnelsen av metoden, skriver du ned hele problemet for hånd, og ikke forkort:
    • Etter å ha funnet forskjellen fra gjennomsnittet og kvadrering, får du (- μ), (- μ) og så videre til (- μ), hvor er det siste datapunktet. i datasettet.
    • For å finne gjennomsnittet av disse verdiene, legg dem sammen og del med n: ((- μ) + (- μ) + ... + (- μ)) / n
    • Etter å ha skrevet om telleren med sigmoid notasjon, har du /n, formelvarians.
    annonse

Råd

  • Fordi variansen er vanskelig å tolke, blir denne verdien ofte beregnet som utgangspunkt for å finne standardavviket.
  • Å bruke "n-1" i stedet for "n" i nevneren er en teknikk som kalles Bessel-korreksjon. Utvalget er bare et estimat av en komplett populasjon, og gjennomsnittet av utvalget har en viss skjevhet for å matche det estimatet. Denne korreksjonen eliminerer bias ovenfor. Det gjelder det faktum at når n - 1 datapunkter er oppført, er det siste punktet n var en konstant, fordi bare bestemte verdier ble brukt til å beregne gjennomsnittet av prøven (x̅) i variansformelen.