Datorövning 2 och inlämningsuppgift 2

Andra datorövningen
Instruktioner till andra datorövningen kan laddas ned här. Vi använder statistikspråket R för övningen.

Instruktionerna är utformade så att det ska gå att arbeta med övningarna på egen hand. Under de schemalagda övningarna i datorsal finns möjlighet att ställa frågor till läraren medan man arbetar med datorövningen.

Andra inlämningsuppgiften
Ett papper för att fylla i lösningarna till andra inluppen kan laddas ned här. Den består av nio små problem. OBS! Problemen ges i instruktionerna till datorövningen. Tillfredställande lösningar på inlämningsuppgift 2 ger 1 bonuspoäng till tentamen. För att lösningarna ska räknas som tillfredställande krävs att de:

  • Är korrekta.
  • För problem 1-5 räcker det att skriva ned resultatet av simuleringen/beräkningen.
  • För problem 6-9 ska lösningarna dessutom innehåller motiverande text.

Föreläsning 8 – 14/2

På den åttonde föreläsningen funderar vi över hur man exempelvis kan ta reda på vilka värden på $latex \mu$ och $latex \sigma^2$ som är rimliga om man inte vet något annat än att $latex X\sim N(\mu,\sigma^2)$. Lösningen är att använda sig av statistiska skattningar. Vi ser att en skattning kan betraktas som en slumpvariabler, vilket innebär att vi kan jämföra olika metoder för skattningar med hjälp av väntevärden och varianser.

Slides finns här. Tavelanteckningar finns här. R-koden till exemplen (hål i ost och normalfördelningsundersökning finns nedan).

Simulering av ostexperimentet:

Undersökning av normalfördelningsantaganden:

Integrationsproblem

Många studenter på kursen brukar tycka att en del av de integraler och summor som vi stöter på är lite besvärliga att ta sig an, eller att tabellerna för normalfördelningen är krångliga att använda. Lyckligtvis så finns det bra datorhjälpmedel för sådana problem!

Fördelen med att vi studerar ett antal standardfördelningar, som binomialfördelningen, exponentialfördelningen och normalfördelningen är vi genom att använda en känd fördelning i vår matematiska modell får en massa saker på köpet. Andra har redan räknat ut integralerna åt oss och för de flesta fördelningar kan man snabbt få exempelvis väntevärden och sannolikheter genom tabeller eller datorprogram som R. Här är några exempel på hur man med R kan räkna ut olika sannolikheter för de vanligaste fördelningarna:

Om man ändå är tvungen att räkna ut en integral som man tycker känns för svår så finns det idag bra datorverktyg för det. En mycket bra gratistjänst är Wolfram Alpha.

Som ett första exempel på hur man kan använda Wolfram Alpha beräknar vi sannolikheten att en Po(3)-fördelad slumpvariabel är mindre eller lika med 3. Sannolikhetsfunktionen är $latex P(X=x)=\frac{3^x}{x!}e^{-3}$ så $latex P(X\leq 3)=\sum_{x=0}^3P(X=x)=\sum_{x=0}^3\frac{3^x}{x!}e^{-3}$ vilket vi kan räkna ut genom att skriva:

Det går lika bra att beräkna integraler. Exempelvis kan vi beräkna väntevärdet för en exponentialfördelad slumpvariabel. Exponentialfördelningens täthetsfunktion är $latex f(x)=\frac{1}{a}e^{-x/a}$ för $latex x>0$. Så väntevärdet är $latex \int_0^\infty xf(x)dx=\int_0^\infty\frac{1}{a}e^{-x/a}dx$. I Wolfram Alpha skriver vi det som:

Det går bra att använda R och Wolfram Alpha för beräkna summor och integraler när du gör exempelvis inlämningsuppgiften (kanske för att dubbelkolla att du räknat rätt?) - men glöm inte att du inte får ta med dig datorn till tentan...

Föreläsning 5 – 4/2

På kursens fjärde föreläsning fördjupade vi oss lite mer om slumpvariabler. Vi införde de viktiga begreppen väntevärde och varians och börja titta på kontinuerliga slumpvariabler. Vi löste kretskortsproblemet och påbörjade lösningen till parkeringsplatsproblemet.

Slides finns här. Tavelanteckningar finns här. R-koden till exemplen finns här; några av exemplen går att köra direkt här nedanför.

Simulera av väntevärdet för antal ögon vid ett tärningskast:

Hur parametern $latex m$, som beskriver väntevärdet och variansen, påverkar Poissonfördelningen:

Högre $latex m$ ger större värden och större spridning!

Föreläsning 2 – 23/1

På dagens föreläsning går vi igenom sannolikhetsteorins grunder. Slides kan laddas ner här, medan mina handskrivna anteckningar (motsvarande det som skrivs på tavlan) finns här.

Under föreläsningen kör vi en datorsimulering av tärningsslag med R. För den som vill prova hemma så finns koden nedan:

Du kan antingen klistra in koden i R eller testköra den direkt i din webbläsare genom att trycka på Evaluate-knappen ovan. Klicka sedan på länken till Rplot001.png för att se resultatet.

Sannolikhetsteori på nätet
Det finns gott om engelskspråkiga nätresurser som tar upp sannolikhetsberäkningar – exempelvis Wikipedia där en sammanfattning av grunderna finns. Bättre är Khan Academy, som har ett stort antal inspelade nätföreläsningar om grundläggande sannolikhetsteori. Hos Virtual Laboratories in Probability and Statistics finns en något mer avancerad introduktion till sannolikhetsteori, men också ett antal trevlig applets för att illustrera sannolikhetsproblem. Bland annat kan man titta på Venndiagram för kombinationer av händelser (exempelvis $latex A\cap B$). Deras notation skiljer sig något från den som vi använder; komplementet $latex A^*$ skriver de $latex A^C$.

Slutligen kanske följande ordlista kan vara nyttig när man beger sig ut på webben.

Liten engelsk-svensk statistisk ordlista
Central limit theorem = central gränsvärdessatsen
Coefficient of variation = variationskoefficient
Conditional = betingad
Confidence interval = konfidensintervall
Correlation (coefficent) = korrelation(skoefficient)
Cumulative distribution function = fördelningsfunktion
Dependent = beroende
Disjoint events = oförenliga händelser
Distribution = fördelning
Event = händelse
Expected value = väntevärde
Independent = oberoende
Law of large numbers = stora talens lag
Mean = medelvärde (för data), väntevärde (för fördelningar)
Median = median
Mode = typvärde
Random variable = slumpvariabel, stokastisk variabel
Range = variationsbredd
R-squared = förklaringsgrad
Probability = sannolikhet
Probability density function = täthetsfunktion
Sample = stickprov, datamaterial
Standard deviation = standardavvikelse
Uniform = likformig
Variance = varians