Några tentatips

Här följer en checklista över saker som är bra att kunna (och/eller ha med sig på formelbladet) när man skriver tentan:

Beskrivande statistik:

  • Medelvärde, median, stickprovsstandardavvikelse, stickprovsvarians, och andra läges- och spridningsmått.
  • Histogram.
  • Lådagram.
  • Korrelationskoefficient.

Grundläggande sannolikhetsteori:

  • Räkneregler för sannolikheter, typ $latex P(A^*)=1-P(A)$.
  • Oberoende händelser.
  • Oförenliga händelser.
  • Betingade sannolikheter.

Slumpvariabler:

  • Diskreta slumpvariabler:
    • Att räkna med sannolikhetsfunktion.
    • Viktiga fördelningar: binomial-, Poisson-.
  • Kontinuerliga slumpvariabler:
    • Att räkna med täthetsfunktioner.
    • Viktiga fördelningar: normal-, exponential-, likformig.
    • Räkna ut sannolikheter för normalfördelningen med ”tricket” och tabell.
  • Väntevärde och varians:
    • Definitioner, hur man räknar ut dem.
    • Väntevärde och varians för viktiga fördelningar, t.ex. veta att om $latex X\sim Bin(n,p)$ så är $latex E(X)=np$ och $latex V(X)=np(1-p)$.
    • Räkneregler för summor av slumpvariabler.
  • Centrala gränsvärdessatsen.

 Skattningar:

  • Formler för de vanliga skattningarna av $latex \mu$ och $latex \sigma^2$ i $latex N(\mu,\sigma^2)$ samt $latex p$ i $latex Bin(n,p)$.
  • Medelfel för olika skattningar.
  • Hur man visar väntevärdesriktighet och jämför skattningar.

Konfidensintervall:

  • Formler för de konfidensintervall som vi har gått igenom: för $latex \mu$, $latex \mu_X-\mu_Y$, $latex p$ och $latex p_1-p_2$.
  • Veta när de olika konfidensintervallen för $latex \mu$ ska användas ($latex \sigma$ känd/okänd, normalfördelning/inte normalfördelning…).
  • Tumreglerna för när konfidensintervallen för $latex p$ och $latex p_1-p_2$ får användas.
  • Tolkning av resultatet när man beräknat ett konfidensintervall. När är något statistiskt säkerställt?

Regression:

  • Tolkning av $latex k$ och $latex m$ i funktionen $latex y=kx+m$.
  • Skattning av $latex k$ och $latex m$.
  • Förklaringsgraden $latex R^2$ och hur den tolkas.
  • Konfidensintervall för $latex k$.
  • Prediktion $latex y_0=\hat{k}x_0+\hat{m}$.
  • Konfidensintervall för $latex E(Y_0)$ (det förväntade värdet då $latex x=x_0$).
  • Prediktionsintervall för $latex Y_0$ (vad en observation kan tänkas bli då $latex x=x_0$).

Allmänna tips:

  • Kolla upp hur du kan använda din räknedosa för att räkna ut skattningar och sannolikheter.
  • När du använder räkneregeln för variansen för en summa av slumpvariabler på tentan, tänk på att poängtera att den bara fungera om slumpvariablerna är oberoende! (Annars blir det poängavdrag…)
  • När du använder centrala gränsvärdessatsen på tentan, tänk på att skriva att du använder CGS! (Annars blir det poängavdrag…) 
  • De konfidensintervall som vi har stött på har formen $latex skattning \pm kvantil \cdot medelfel$. Om du har svårt att komma ihåg vad medelfelet för olika skattningar är så kan du alltså försöka komma ihåg att de ingår i konfidensintervallsformeln!
  • Du får skriva upp lösningar på gamla tentaproblem på ditt formelblad!

Sannolikheter och statistik med räknedosan

Här kommer några länktips för hur man kan beräkna sannolikheter och räkna ut exempelvis medelvärden med hjälp av moderna räknedosor.

TI-83

Tips på hur man kan räkna ut medelvärden, standardavvikelser och liknande för ett datamaterial finns på här. Funktionen 1-Var Stats ger bland annat följande resultat:

$latex \bar{x}$ = medelvärdet
$latex \sum_{i=1}^n x_i$
$latex \sum_{i=1}^n x_i^2$
$latex s_x=\sqrt{s^2}=\sqrt{\frac{1}{n-1}\sum_{i=1} (x_i-\bar{x})^2}$ = stickprovsstandardavvikelsen
$latex \sigma_x=\sqrt{s^2}=\sqrt{\frac{1}{n}\sum_{i=1} (x_i-\bar{x})^2}$, vilket alltså inte är stickprovsstandardavvikelsen eftersom man delat med $n$ istället för $n-1$.

Räknedosan kan också användas för att räkna ut sannolikheter för exempelvis binomialfördelningen. Funktionen binompdf räknar ut sannolikhetsfunktionen $latex P(X=k)$ med binomcdf räknar ut fördelningsfunktionen $latex P(X\leq k)$.

Andra fördelningar som finns är Poissonfördelningen och normalfördelningen. Om du vill använda de funktionerna, kontrollera att du använder dem på rätt sätt genom att exempelvis använda dem för att beräkna sannolikheter som vi räknat ut på annat sätt under föreläsningarna!

Casio

Vissa av Casios räknedosor går också att använda för att beräkna sannolikheter och olika läges- och spridningsmått för datamaterial. Jag har inte själv tillgång till en Casioräknare och har därför inte kunnat kontrollera hur det fungerar!

Sannolikheter kan beräknas genom att man väljer Menu -> STAT -> DIST. Det är sedan de funktioner som slutar på ”cd” som ger $latex P(X\leq k)$. Hur det fungerar beskrivs i den här pdf:en. Binomialfördelningen finns på sidorna 57-59, Poissonfördelningen på sidorna 60-61 och normalfördelningen på sidan 45.

Beräkning av medelvärde och standardavvikelse (standard deviation) beskrivs här och i ett gäng Youtube-klipp.

Lägg gärna till fler länkar i kommentarsfältet nedan om du har hittat bättre sidor än de som jag länkar till här!

Integrationsproblem

Många studenter på kursen brukar tycka att en del av de integraler och summor som vi stöter på är lite besvärliga att ta sig an, eller att tabellerna för normalfördelningen är krångliga att använda. Lyckligtvis så finns det bra datorhjälpmedel för sådana problem!

Fördelen med att vi studerar ett antal standardfördelningar, som binomialfördelningen, exponentialfördelningen och normalfördelningen är vi genom att använda en känd fördelning i vår matematiska modell får en massa saker på köpet. Andra har redan räknat ut integralerna åt oss och för de flesta fördelningar kan man snabbt få exempelvis väntevärden och sannolikheter genom tabeller eller datorprogram som R. Här är några exempel på hur man med R kan räkna ut olika sannolikheter för de vanligaste fördelningarna:

Om man ändå är tvungen att räkna ut en integral som man tycker känns för svår så finns det idag bra datorverktyg för det. En mycket bra gratistjänst är Wolfram Alpha.

Som ett första exempel på hur man kan använda Wolfram Alpha beräknar vi sannolikheten att en Po(3)-fördelad slumpvariabel är mindre eller lika med 3. Sannolikhetsfunktionen är $latex P(X=x)=\frac{3^x}{x!}e^{-3}$ så $latex P(X\leq 3)=\sum_{x=0}^3P(X=x)=\sum_{x=0}^3\frac{3^x}{x!}e^{-3}$ vilket vi kan räkna ut genom att skriva:

Det går lika bra att beräkna integraler. Exempelvis kan vi beräkna väntevärdet för en exponentialfördelad slumpvariabel. Exponentialfördelningens täthetsfunktion är $latex f(x)=\frac{1}{a}e^{-x/a}$ för $latex x>0$. Så väntevärdet är $latex \int_0^\infty xf(x)dx=\int_0^\infty\frac{1}{a}e^{-x/a}dx$. I Wolfram Alpha skriver vi det som:

Det går bra att använda R och Wolfram Alpha för beräkna summor och integraler när du gör exempelvis inlämningsuppgiften (kanske för att dubbelkolla att du räknat rätt?) - men glöm inte att du inte får ta med dig datorn till tentan...