Hvordan evaluere statistisk signifikans

Forfatter: Randy Alexander
Opprettelsesdato: 2 April 2021
Oppdater Dato: 26 Juni 2024
Anonim
Hypotesetesting
Video: Hypotesetesting

Innhold

Hypotesetesting styres av statistisk analyse. Statistisk signifikant tillit beregnes ved hjelp av p-verdi - som indikerer sannsynligheten for et observert resultat når en viss proposisjon (nullhypotesen) er sant. Hvis p-verdien er mindre enn signifikansnivået (vanligvis 0,05), kan eksperimentøren konkludere med at det er nok bevis for å motbevise nullhypotesen og innrømme den omvendte hypotesen. Ved hjelp av en enkel t-test kan du beregne p-verdien og bestemme signifikansen mellom to forskjellige datagrupper.

Fremgangsmåte

Del 1 av 3: Sett opp eksperimentene dine

  1. Bestem hypotesen din. Det første trinnet i å evaluere statistisk signifikans er å identifisere spørsmålene du skal svare på og erklære hypotesen din. Hypotese er en uttalelse av de empiriske dataene og mulige avvik i befolkningen. Hvert eksperiment har en nullhypotese og en invers hypotese. Generelt vil du sammenligne to grupper for å se om de er like eller forskjellige.
    • Generelt er hypotesen ikke (H0) bekrefte at det ikke er noen forskjell mellom de to datagruppene. Eksempel: Studenter som leser stoffet før klassen, får ikke bedre sluttkarakterer.
    • Den omvendte hypotesen (Hen) er i strid med nullhypotesen og er en uttalelse som du prøver å støtte med dine empiriske data. Eksempel: Studenter som leser stoffet før klassen, får faktisk bedre sluttkarakterer.

  2. Velg signifikansnivå for å bestemme graden av forskjell som kan sees på som meningsfull i dataene. Betydningsnivå (også kjent som alfa) er terskelen du velger for å bestemme betydningen. Hvis p-verdien er mindre enn eller lik et gitt signifikansnivå, anses dataene som statistisk signifikante.
    • Som hovedregel velges signifikansnivået (eller alfa) vanligvis på 0,05-nivået - noe som betyr at sannsynligheten for å observere forskjellen sett på dataene bare er tilfeldig 5%.
    • Jo høyere konfidensnivå (og derfor jo lavere p-verdi), desto mer meningsfylte blir resultatene.
    • Hvis mer tillit er nødvendig, senk p-verdien til 0,01. En lav p-verdi brukes ofte i produksjonen for å oppdage produktfeil. Høy pålitelighet er så viktig at det er akseptabelt at hver del fungerer som den skal.
    • For de fleste hypotesebaserte eksperimenter er et signifikansnivå på 0,05 akseptabelt.

  3. Bestem om du skal bruke en ensidig eller tosidig test. En av t-testforutsetningene er at dataene dine er i en normalfordeling. Normalfordelingen vil danne en bjellekurve med flertallet av observasjonene sentrert. T-testen er en matematisk test som sjekker om dataene dine faller på utsiden av normalfordelingen, over eller under, i den "øverste" delen av kurven.
    • Hvis du ikke er sikker på om dataene er over eller under kontrollgruppen, kan du bruke en tosidig test. Det lar deg sjekke betydning i begge retninger.
    • Hvis du vet hva den forventede retningen på dataene dine er, kan du bruke en ensidig test. I eksemplet ovenfor forventer du at studentens score vil bli bedre. Derfor bruker du ensidig test.

  4. Bestem prøvestørrelse med kraftanalyse. Kraften til en test er evnen til å observere det forventede resultatet med en gitt prøvestørrelse. Den vanlige terskelen for kraft (eller β) er 80%. Kraftanalyse kan være ganske komplisert uten noen foreløpige data fordi du trenger litt informasjon om forventet gjennomsnitt mellom gruppene og deres standardavvik. Bruk kraftbasert analyse på nettet for å bestemme den optimale prøvestørrelsen for dataene dine.
    • Forskere utfører ofte en liten premissstudie for å informere om kraftanalysen og bestemme størrelsen på prøvene som trengs for en stor og omfattende studie.
    • Hvis det ikke er noen midler til å gjøre komplekse premissundersøkelser, estimer du det mulige gjennomsnittet basert på å lese artikler og forskning som andre individer kan ha gjort. Det kan gi deg en god start med å bestemme prøvestørrelser.
    annonse

Del 2 av 3: Beregn standardavviket

  1. Bestem formelen for standardavvik. Standardavvik måler spredningen av dataene. Det gir deg informasjon om identiteten til hvert datapunkt i prøven. Når du først kommer i gang, kan ligninger se ganske kompliserte ut. Trinnene nedenfor vil imidlertid hjelpe deg med å forstå beregningsprosessen. Formelen er s = √∑ ((xJeg - µ) / (N - 1)).
    • s er standardavviket.
    • ∑ indikerer at du må legge sammen alle observasjonene som er samlet inn.
    • xJeg hver representerer dataverdien din.
    • µ er gjennomsnittet av dataene for hver gruppe.
    • N er det totale antallet observasjoner.
  2. Gjennomsnittlig antall observasjoner i hver gruppe. For å beregne standardavviket, må du først beregne gjennomsnittet av observasjonene for hver enkelt gruppe. Denne verdien er symbolisert med den greske bokstaven mu eller µ. For å gjøre det er det bare å legge til observasjonene og dele med det totale antallet observasjoner.
    • For eksempel, for å finne gjennomsnittlig poengsum for gruppen som leser dokumentet før klassen, la oss se på noen data. For enkelhets skyld vil vi bruke et datasett på 5 poeng: 90, 91, 85, 83 og 94 (på en 100-punkts skala).
    • Legg sammen alle observasjoner: 90 + 91 + 85 + 83 + 94 = 443.
    • Del summen over med antall observasjoner N (N = 5): 443/5 = 88,6.
    • Gjennomsnittlig poengsum for denne gruppen er 88,6.
  3. Trekk gjennomsnittet fra hver observerte verdi. Neste trinn involverer del (xJeg - µ) av ligningen. Trekk gjennomsnittsverdien fra hver observerte verdi. Med eksemplet ovenfor har vi fem subtraksjoner.
    • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) og (94 - 88,6).
    • Den beregnede verdien er 1,4; 2,4; -3,6; -5,6 og 5,4.
  4. Firkant disse forskjellene og legg dem sammen. Hver nye verdi som nettopp er beregnet, blir nå kvadratert. Her vil også negativtegnet bli fjernet. Hvis et negativt tegn vises etter dette trinnet eller på slutten av beregningen, har du kanskje glemt å gjøre trinnet ovenfor.
    • I vårt eksempel vil vi nå jobbe med 1,96; 5,76; 12,96; 31.36 og 29.16.
    • Legg disse rutene sammen: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Del med totalt antall observasjoner minus 1. Deling av N - 1 bidrar til å kompensere for en beregning som ikke blir utført på befolkningen som helhet, men som er basert på et utvalg av alle studenter.
    • Trekk fra: N - 1 = 5 - 1 = 4
    • Del: 81,2 / 4 = 20,3
  6. Få kvadratroten. Når du er delt med antall observasjoner minus 1, tar du kvadratroten av verdien du får. Dette er det siste trinnet i beregningen av standardavviket. Noen statistiske programmer vil hjelpe deg med å utføre denne beregningen etter at originaldataene er importert.
    • Med eksemplet ovenfor er standardavviket for sluttsemesterkarakteren til studenter som leser dokumentet før klassen: s = √20,3 = 4,51.
    annonse

Del 3 av 3: Bestemmelse av statistisk signifikans

  1. Beregn avviket mellom de to observasjonsgruppene dine. Inntil dette punktet har eksemplet bare handlet om en gruppe observasjoner. For å sammenligne to grupper trenger du åpenbart data fra begge. Beregn standardavviket til den andre gruppen observasjoner og bruk den til å beregne avviket mellom de to eksperimentelle gruppene. Formelen for beregning av varians er: sd = √ ((s1/ N1) + (s2/ N2)).
    • Sd er avviket mellom gruppene.
    • S1 er standardavviket til gruppe 1 og N1 er størrelsen på gruppe 1.
    • S2 er standardavviket til gruppe 2 og N2 er størrelsen på gruppe 2.
    • I vårt eksempel, la oss si at dataene fra gruppe 2 (studenter som ikke leste teksten før klassen) har en størrelse på 5 og et standardavvik på 5,81. Avviket er:
      • Sd = √ ((s1) / N1) + ((s2) / N2))
      • Sd = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Beregn t-poengsummen for dataene. T-statistikk lar deg konvertere data til et skjema som kan sammenlignes med andre data. T-verdien lar deg også utføre en t-test, en test som lar deg beregne sannsynligheten for en statistisk signifikant forskjell mellom de to gruppene. Formelen for beregning av t-statistikken er: t = (µ1 – µ2) / Sd.
    • µ1 er gjennomsnittet av den første gruppen.
    • µ2 er gjennomsnittet av den andre gruppen.
    • Sd er avviket mellom observasjonene.
    • Bruk det større gjennomsnittet som µ1 for ikke å få en negativ t-statistikk.
    • Anta for vårt eksempel at det observerte gjennomsnittet for gruppe 2 (som ikke leste forrige artikkel) er 80. T-poengsummen er: t = (µ1 – µ2) / Sd = (88,6 – 80)/3,29 = 2,61.
  3. Bestem graden av frihet for prøven. Når du bruker t-statistikken, bestemmes frihetsgrader basert på utvalgsstørrelsen. Legg opp antall observasjoner for hver gruppe og trekk deretter fra to. I eksemplet ovenfor er frihetsgraden (d.f.) 8 fordi det er 5 prøver i den første gruppen og 5 prøver i den andre gruppen ((5 + 5) - 2 = 8).
  4. Bruk tabell t for å evaluere betydning. Tabeller over t-verdier og frihetsgrader finnes i en standard statistikkbok eller på nettet. Finn raden som inneholder dataenes frihetsgrader, og p-verdien som tilsvarer t-statistikken du har.
    • Med frihetsgrader 8 og t = 2,61 ligger p-verdien for en ensidig test mellom 0,01 og 0,025. Siden det valgte signifikansnivået er mindre enn eller lik 0,05, er dataene våre statistisk signifikante. Med disse dataene avviser vi nullhypotesen og aksepterer den omvendte hypotesen: studenter som leser materialet før klassen, har høyere sluttkarakterer.
  5. Vurder å utføre videre forskning. Mange forskere utfører premissstudier med flere beregninger for å forstå hvordan man designer en større studie. Å gjøre annen forskning med flere beregninger vil øke tilliten din til konklusjonene dine. annonse

Råd

  • Statistikk er et stort og komplekst felt. Ta et videregående skole eller universitet (eller høyere) statistisk hypotesetestkurs for å forstå statistisk signifikans.

Advarsel

  • Denne analysen fokuserer på t-testen for å sjekke forskjellen mellom de to normalfordelingspopulasjonene. Avhengig av kompleksiteten i dataene, kan det hende du trenger en ny statistisk test.