giacomoRandazzo.it

  

Bästa artiklarna:

  
Main / Vad är en egenintressestudie i statistik

Vad är en egenintressestudie i statistik

Om du ser detta meddelande betyder det att vi har problem med att ladda externa resurser på vår webbplats. För att logga in och använda alla funktioner i Khan Academy, vänligen aktivera JavaScript i din webbläsare. Matematik Gymnasiestatistik Studiedesign Observationsstudier och experiment. Typer av statistiska studier. Korrelation och kausalitet. Lämpligt statistiskt studieexempel. Observationsstudier och experiment. Aktuell tid: Provundersökningar, observationsstudier och experiment.

Videoöverskrift Voiceover: Låt oss säga att du har en aning om att socker på något sätt orsakar hjärtsjukdom. Orsakar på något sätt hjärtsjukdomar. Så du vill undersöka detta vidare. Du vill se vilken typ av statistiska studier du kan utföra för att bättre förstå sockerintaget i befolkningen i allmänhet och om det verkar orsaka hjärtsjukdom på något sätt.

Det första du kanske vill göra är bara att försöka få en känsla av sockerintag i befolkningen som helhet. Nu är det klart att du inte vet, det finns inget sätt att mäta exakt hur mycket socker varje medlem, låt oss säga att du pratar om USA, varje medlem av den 300 miljoner befolkningen konsumerar varje dag. Sättet vi försöker få en känsla av hur mycket socker som konsumeras är att genomföra en provstudie.

Så du tar din befolkning, dina 300 miljoner människor. Så du tar din befolkning hit. Och du provar det. Du provar din population och inte bara provar du den, utan också slumpmässigt. Uppenbarligen vill du inte bara undersöka människor som lämnar en muffinsbutik eller personer som lämnar ett gym.

Du vill att det ska vara ett slumpmässigt urval av människor, där var du samplar dem bör inte på något sätt påverka huruvida deras svar eller hur mycket socker de kan säga att de konsumerar. Men de kommer att berätta för dig hur mycket socker de konsumerar, låt oss säga, på en genomsnittlig dag, kanske genom att fylla i en undersökning eller på annat sätt. Och genom det skulle du ta dessa data och uppenbarligen, ju fler prover du har desto bättre och vi pratar om det på djupet i andra statistikvideor.

Om hur du får en bättre förutsägelse för den faktiska sanna befolkningsparametern, desto fler prover kan du ta. Men du kan göra det för att få en mätning av hur mycket socker den genomsnittliga amerikanen konsumerar under en viss dag. Så här här borta där du tar slumpmässiga prover av befolkningen för att i huvudsak skapa en statistik som uppskattar en sann parameter, vilket är den faktiska mängden socker som amerikaner konsumerar varje dag.

Vi kallar detta en provstudie. Provstudie. Det är återigen ett sätt att bara uppskatta vad den faktiska mängden socker människor har varje dag. Låt oss säga att du vill gå längre. Detta kommer att ge dig en känsla av vad som sannolikt är mängden socker som människor konsumerar varje dag, men du vill verkligen se hur det är relaterat till hjärtsjukdomar.

Så istället, vad du gör är att du undersöker människor. Du undersöker människor och du säger, "Hur mycket socker har du" konsumerat över ", och återigen, när du väljer dessa människor, borde du göra det slumpmässigt.

Så låt oss säga att du undersöker ett slumpmässigt urval av 60-åringar. Så än en gång vill du inte prova människor som är på sjukhuset, du vill inte prova människor som är på eller bara på gymmet. Du skulle vilja hitta ett slumpmässigt urval eller prova dem på platser där det inte skulle påverka deras svar, vilken väg de ska gå.

Låt oss säga att du undersökte 300 60-åringar och du frågade dem hur mycket socker de har konsumerat under de senaste 30 åren. Och du frågade dem också om deras hjärta.

Och vad du får är ungefär så här. Så på den horisontella axeln planerar du sockerkonsumtion och sedan på den vertikala axeln planerar du hjärtsjukdomsrisk eller deras nivå av hjärtsjukdom. Hjärtsjukdom risk, låt oss säga vid 60. Och du hittar en plot som ser ungefär så här ut. Så var och en av dessa punkter. Det här är någon som konsumerade 200 gram socker per dag och de har nu en hög hjärtsjukdomsrisk nu vid 60 års ålder.

Men kanske är det någon som har låg hjärtsjukdom risk vid 60 års ålder trots att de konsumerade mycket socker varje dag. Och så fortsätter vi bara att plotta alla dessa punkter.

Och du säger, "Tja, du vet vad, det ser ut" och självklart kommer jag inte till alla 300. Du säger "Tja, det verkar faktiskt som om det finns" en grov korrelation här. Och då kan du säga, "Det ser ut som socker och hjärtsjukdom" riskerar vid 60 års ålder, att de är korrelerade, "att de är relaterade på det här sättet, att de rör sig tillsammans," att om någon konsumerade mycket socker över "de senaste 30 åren verkar de ha en sämre" hjärtsituation och om de konsumerade mycket lägre socker "verkar de ha en lägre eller bättre hjärtsituation.

Det är väldigt farligt för att bara se dessa uppgifter inte säger att socker orsakar hjärtsjukdomar. Det kan gå tvärtom.

Det kan vara så att människor som har en hög hjärtsjukdom risk, kanske de längtar efter socker, men det finns faktiskt någon annan underliggande orsak som får det att hända. Kanske har de någon annan brist som får dem att längta efter socker. Så det är inte klart på vilket sätt kausaliteten sker. Drivs sockerkonsumtionen det ohälsosamma hjärtat eller är det på något sätt det ohälsosamma hjärtat som driver sockerkonsumtionen eller kanske finns det någon annan faktor.

Kanske driver fettkonsumtionen hjärtsjukdomen och kanske människor som har mer fett också får mer socker eller tvärtom, vem vet.

Allt detta säger att det finns en korrelation. Så här här skulle du kalla detta en observationsstudie. Du har observerat ett förhållande, men du kan verkligen inte säga vad som orsakar vad. Så låt mig skriva ner detta. Detta är en observationsstudie. Du säger antagligen "Okej, hur skulle du kunna bevisa" eller må bättre om tanken att socker faktiskt är en "orsak, att det faktiskt finns kausalitet där?

Ett experiment. För att göra en experimentell studie här, vad du skulle göra är att försöka ta två grupper av människor. Du skulle ha din experimentgrupp. Så det är din experimentella grupp.

Låt mig faktiskt göra det till en cirkel här så det är en pool av människor. Låt oss säga att du har 100 personer som är experimentella. Det är din experimentella pool. Då har du din kontroll. Du har din kontroll. Vad du skulle göra om du ville köra den här typen av experiment och som vi kommer att se, skulle den här typen av experiment antagligen inte köras eftersom vissa anser att det är oetiskt eller faktiskt skulle jag också tycka att det är oetiskt. Men vad du skulle göra är att du slumpmässigt, låt oss säga ta 30-åringar, du skulle slumpmässigt ta 30-åringar och placera dem i en av dessa två grupper.

Återigen, när vi säger slumpmässigt, vill du inte placera alla friska människor i en grupp och alla ohälsosamma människor i den andra gruppen eller vice versa.

Du vill att det ska vara slumpmässigt, du vill inte placera alla människor av en typ, en demografisk, en ekonomisk status i en grupp eller den andra, du vill att den ska vara slumpmässig. Så du slumpmässigt placerar människor i dessa två grupper och sedan experimentgruppen, du skulle ändra en variabel. Variabeln du bryr dig om är socker. Så vad du kan säga är, "Okej, alla människor i denna" grupp här, oavsett socker som de skulle ha "konsumerat, dessutom måste de dricka, jag vet inte," de måste drick en kopp sirap varje kväll eller så måste de ha ett minimum av sockerintag.

Och sedan 30 år senare, så en, detta är förmodligen oetiskt för att tvinga människor att ha något som sannolikt inte är bra för deras hälsa och då måste du köra det under en lång tid, du skulle vänta i 30 år. Du skulle vänta i 30 år när de är 60 år och du skulle se vad som var hjärtat hos dessa människor. Hur många människor fick hjärtinfarkt? Vid 60 års ålder, vad är deras hälsotillstånd? Och då är det statistiskt osannolikt att skillnaden skulle bero på enbart slumpen?

Till exempel, om du gjorde det här, och låt oss säga att ja, dessa människor hade en något högre chans för hjärtsjukdomar eller hjärtinfarkt än dessa människor efter 30 år. Det skulle vara ett bra experiment, men det skulle inte tillåta dig att dra slutsatsen att socker orsakar det, för det kan ha hänt av en slump. Men om vi till exempel, efter 30 år, säger att den här gruppen här har tio gånger risken för hjärtinfarkt eller tio gånger oavsett riskfaktorer för hjärtsjukdom.

Du skulle statistiskt säga oddsen för att det skulle ske av en slump, att de 100 personerna i den här gruppen här har 10 gånger chansen att få hjärtinfarkt som den här gruppen här, det är osannolikt på grund av enbart slumpen. Så du skulle säga, "Okej!

Hur som helst kommer vi att gräva djupare in i var och en av dessa tre typer, men hela poängen med den här videon är att bara ge dig en uppskattning av att du vet att vi använder statistik mycket, men detta ger dig ett sammanhang för hur vi är använder det i olika situationer när vi utför statistiska studier. Detta för att uppskatta den sanna parametern för en befolkning.

Vad är det faktiska sockerintaget för befolkningen? Du samplar slumpmässigt och sedan använder du denna exempeldata för att skapa en statistik som uppskattar den sanna parametern. Observationsstudie, du observerar vad som händer. Sockerintag kontra hjärtrisk. Du säger "Hej, det finns kanske ett förhållande" det här är värt att göra ett experiment på.

Strax.

(с) 2019 giacomoRandazzo.it