Kvadratisk regression, forts.

Storlek: px
Starta visningen från sidan:

Download "Kvadratisk regression, forts."

Transkript

1 Kvadratisk regression, forts. Vi fortsätter med materialet om fastigheter. Tidigare föreslog vi som en tänkbar modell y x x Vari ligger tanken att just använda en kvadratisk term? Det inses att priset knappast kan öka helt linjärt med antal rum. För många rum i en fastighet gör den ointressant för de flesta hushåll. Ł Priset borde mattas av då rummen blir för många

2 Det är fullt tänkbart att denna avmattning kan ha följande utseende: och då kan en andragradskurva vara en lämplig anpassning. Notera dock att anpassningen bara kan göras i det rumsintervall som existerar. Det finns ingen anledning att tro att priset skulle vända och gå ned till 0 så småningom.

3 Varför y x x 3 + och inte bara y x 3 +? Med enbart x 32 med i modellen skulle vi försöka att anpassa följande typ av samband: _ ty renodlade x 2 -kurvor har sitt max/min-värde då x Antal Rum 3 Med en x-term med i modellen tillåts max (el. min) att hamna på annat ställe.

4 Kombination av en andragradskurva med andra variabler. Vi kan nu tänka oss att kombinera x 3 och x 32 med andra variabler i en modell. Pröva först modellen y 0 + x + 3 x x 3 + Ł Regression Analysis: Price versus Area, Rooms, Rooms_sq The regression equation is Price Area Rooms Rooms_sq Predictor Coef SE Coef T P Constant Area Rooms Rooms_sq S R-Sq 50.7% R-Sq(adj) 49.6%

5 b, b 3 och b 5 är alla signifikant 0 Hur kan vi tolka värdena på dessa koefficienter? Predictor Coef SE Coef T P Constant Area Rooms Rooms_sq Såväl b som b 3 är positiva, vilket är i linje med hur de enskilda sambanden verkar se ut. b 5 är negativ och detta innebär att vi har en kvadratisk form med max-punkt. Hade koefficienten varit positiv hade vi haft en min-punkt. Om vi fixerar x 3 dvs. antal rum till ett visst värde (spelar ingen roll vilket) tolkas värdet b som att priset ökar med i genomsnitt c:a 49 dollar då bostadsytan ökar med ft 2. Denna tolkning kan förstås skalas upp och blir liktydig med att priset ökar med c:a dollar då bostadsytan ökar med 000 ft 2. Om vi istället fixerar bostadsytan till ett visst värde finns inte samma enkla tolkning av b 3 och b 5 p g a att sambandet med x 3 ej är rent linjärt.

6 Predictor Coef SE Coef T P Constant Area Rooms Rooms_sq Notera att i denna modell blir alltså b 3 signifikant skild från 0 (alt. variabeln x 3 ingår signifikant i modellen/är signifikant). Så var inte fallet i modellen med bara x och x 3. Den kvadratiska termen medför alltså förutom sin egen förklaring även att sambandet mellan y och x 3 som helhet blir tydligare. Vi kan också fundera på hur bostadsyta och antal rum skulle kunna samspela i att förklara prisets variation. En bostad med mycket stor yta, men endast ett rum skulle förmodligen vara mindre attraktiv än en bostad med måttligt stor yta men fler rum.

7 Denna effekt kan testas i regressionsmodellen genom att införa en samspelsterm. Vi bildar då nya variabeln x x 3 och analyserar modellen Ł y 0 + x + 3 x x x x 3 + MTB > let c7c2*c4 MTB > name c7 'Area*Rooms' Regression Analysis: Price versus Area, Rooms, Rooms_sq, Area*Rooms The regression equation is Price Area Rooms + 26 Rooms_sq Area*Rooms Predictor Coef SE Coef T P Constant Area Rooms Rooms_sq Area*Roo S R-Sq 53.4% R-Sq(adj) 52.2%

8 Här får vi alltså en annan bild. Jämförelse med den föregående modellen: y 0 + x + 3 x x Predictor Coef SE Coef T P Constant Area Rooms Rooms_sq y 0 + x + 3 x x x x 3 + Predictor Coef SE Coef T P Constant Area Rooms I den nya modellen upphör b 3 och b 5 att vara sign. skilda från 0. Istället blir b 6 det. Det kvadratiska sambandet tas över av samspelstermen. Rooms_sq Area*Roo

9 Räcker det då med modellen y 0 + x + 6 x x 3 +? Regression Analysis: Price versus Area, Area*Rooms The regression equation is Price Area Area*Rooms Predictor Coef SE Coef T P Constant Area Area*Roo S R-Sq 50.3% R-Sq(adj) 49.6% Tydligen! Förklaringsgraden ändras något men är inte nämnvärt sämre än i den första av de tre modellerna.

10 The regression equation is Price Area Area*Rooms Predictor Coef SE Coef T P Constant Area Area*Roo Blir denna modell enklare att tolka? Numeriskt: Nej, men konceptmässigt kan det vara enklare att förstå att bostadsyta och antal rum samverkar när det gäller prissättning. Den kvadratiska modellen tar egentligen bara hand om sambanden mellan de två olika förklaringsvariablerna var för sig. Samspel kallas på engelska interaction och på svenska säger man också ibland att variablerna interagerar.

11 Följande graf kan kanske illustrera hur det förhåller sig: För bostäder med 3, 4, 5 och 6 rum ter sig sambandet med bostadsyta vara ganska tydligt linjärt. För bostäder med 7 rum eller fler börjar det spreta ordentligt och det linjära sambandet är inte längre tydligt.

12 Man skulle t ex kunna tänka sig att det finns olika regressionslinjer mellan pris och bostadsyta beroende på vad antalet rum är.

13 En modell med en samspelsterm kan också ses som ett specialfall av kvadratisk regression. Det gäller nämligen att det kvadratiska kan vara i fler än en variabel. En fullständig kvadratisk modell i två variabler, x och x 2 (dvs. vilka som helst, inte just motsvarande variabler i vårt datamaterial) ser ut på följande sätt: y 0 + x + 2 x x x x x 2 + Genom att plocka bort vissa av termerna i denna modell erhålls olika undermodeller Genom att plocka bort vissa av termerna i denna modell erhålls olika undermodeller där vissa fortfarande kan sägas tillhöra gruppen av kvadratiska regressionsmodeller.

14 Kvalitativa variabler Kvalitativa variabler har inte numeriskt tolkningsbara värden utan värdena är koder för olika klasser av observationer. Exempel är en variabel som är 0 för män och för kvinnor. Ett annat exempel är en variabel som är för småföretag, 2 för mellanstora företag och 3 för stora företag. För att kunna använda kvalitativa variabler i regressionsanalys krävs att de görs om till s k indikatorvariabler eller dummyvariabler. (Andra namn är 0/-variabler resp. dikotoma variabler)

15 En kvalitativ variabel som bara har två värden behöver egentligen inte göras om, men ur tolkningssynpunkt är det bra om värdena transformeras till 0 och. Exempel: Kön kodas med 0 och. Vad som är 0 resp. spelar förstås ingen roll. Om vi har en kod som har värdet för små företag och 2 för större och stora företag görs värdena enkelt om till 0 resp. En kvalitativ variabel med fler än två värden måste göras om till flera indikatorvariabler.

16 Exempel: Företag antas vara kodade med för små företag, 2 för mellanstora företag och 3 för stora företag. Denna variabel görs om till för små företag D D 2 0 för andra företag 0 för mellanstora företag för andra företag Ł Företagstyp Ursprunglig kod D D 2 Små 0 Mellanstora 2 0 Stora Grundregel: Om den kvalitativa variabeln har m olika koder eller värden (kallas också nivåer) skall m indikatorvariabler användas.

17 Minitab har funktioner för att manuellt koda om en variabels värden till andra värden skapa indikatorvariabler för att ersätta en kvalitativ variabel Exempel: Antag att vi i kolumnen C har en kvalitativ variabel med värdena, 2, 3, 4 och 5. Med kommandot MTB > indicator c c2 c3 c4 c5 c6 skapas fem indikatorvariabler (C2-C6), en för varje värde hos C I C2 är alltså värdet för de rader där värdet i C är och 0 i övriga rader I C3 är värdet för de rader där värdet i C är 2 och 0 i övriga rader osv. I regressionen används sedan fyra av dessa fem indikatorvariabler

18 Vi återvänder nu till vårt datamaterial om fastigheter. Antag att vi vill dela in fastigheterna i klasserna fastigheter med högst 6 rum fastigheter med fler än 6 rum För att göra detta kan vi skapa en indikatorvariabel som är 0 för fastigheter med högst 6 rum och för övriga, dvs D 0 då då x x 3 3 > 6 6

19 Vi behöver alltså koda om variabeln x 3 i Minitab. Detta kan göras med kommandon eller via menyer. Vi visar först med menyer: Manip Code Numeric to Numeric Ny kolumn anges här Värdena i x 3 går från 3 till 3

20 Med kommandon hade vi gett följande: MTB > code (3:6) 0 (7:3) c4 c8 (Observera mellanslagen) Den nya kolumnen ges här namnet D (för att få samstämmighet med det införda variabelnamnet) Vi prövar nu följande regressionsmodell y 0 + x + 7 D + Regression Analysis: Price versus Area, D The regression equation is Price Area D Predictor Coef SE Coef T P Constant Area D S R-Sq 49.3% R-Sq(adj) 48.6%

21 Predictor Coef SE Coef T P Constant Area D Indikatorvariabeln D blir inte signifikant, men vi låter den kvarstå tills vidare. Hur kan vi tolka denna analys? D kommer att dela in materialet i två delar och ger faktiskt två skattade regressionsmodeller för sambandet mellan pris och bostadsyta: ) D 0 Ł yˆ b 0 + b x + b7 0 b0 + b x x 2) D Ł yˆ b 0 + b ( ) + x + b 7 ( b 0 + b x 7 ) + b x x

22 Parallella linjer, med olika skärning med y-axeln.

23 För att inte tvingas in till parallella linjer inför vi nu en samspelsterm, x D, i modellen: y 0 + x + 7 D + 8 x D + Regression Analysis: Price versus Area, D, Area*D The regression equation is Price Area D Area*D Predictor Coef SE Coef T P Constant Area D Area*D S 0846 R-Sq 93.3% R-Sq(adj) 93.2% Samtliga variabler är signifikanta och vi har en mycket bra förklaringsgrad

24 Predictor Coef SE Coef T P Constant Area D Area*D Hur blir nu tolkningen av denna modell? Även här skiljer vi på två fall som ger två olika regressionssamband mellan pris och bostadsyta: ) D 0 Ł 2) D Ł ˆ x x b b b b x b b y ) ( ) (0370 ) ( ) ( ˆ x x x b b b b x b b x b b y

25 Icke-parallella linjer.

26 Vi får alltså olika tolkningar av bostadsytans betydelse beroende på om det är fastigheter med högst 6 rum eller fastigheter med mer än 6 rum. Högst 6 rum: yˆ x Ł Priset ökar med i genomsnitt 7454 dollar då bostadsytan ökar med 000 ft 2 Mer än 6 rum: y ˆ x Ł Priset ökar med i genomsnitt 8403 dollar då bostadsytan ökar med 000 ft 2 Skärningen med y-axeln tolkas ej då detta bara är ett nivåjusterande värde. Notera hur koefficienten för bostadsyta kan ändras mellan olika modeller. I detta fall genomsnitträknar vi över litet större klasser av lägenheter, men får mycket bra förklaringsgrad.

27 Indikatorvariabler används alltså för att dela in ett material i olika klasser. Indelningen ger upphov till olika regressionssamband i de övriga variablerna. Dessa kan ha olika lutningar och intercept (skärningar med y-axel) om vi inför indikatorvariabeln själv och dess samspelstermer med övriga variabler. Vi kan givetvis använda indikatorvariabeln för att skapa olika regressionssamband mellan y och flera av de andra x-variablerna. Det blir då inte längre olika regressionslinjer utan olika plan, hyperplan etc.

28 Partiellt F test Exempel: Vad påverkar kostnaden för produktion av korrugerat papper, dvs. sådant som ingår i wellpapp och kartonger (facktermen inom svensk pappersproduktion är floating )? Amerikansk studie: Kostnaden kan förmodligen förklaras av en eller flera av följande variabler: produktionsmängden (PAPER) maskintid (MACHINE) overhead-kostnader (OVERHEAD) antal direkta personarbetstimmar (LABOR)

29 Insamlade månadsvisa data: MONTH COST PAPER MACHINE OVERHEAD LABOR

30 Grafisk illustration av ev. samband:

31 Pröva först en modell där kostnaden förklaras av samtliga förklaringsvariabler: MTB > regress c 4 c2-c5 Regression Analysis: COST versus PAPER, MACHINE, OVERHEAD, LABOR The regression equation is COST PAPER MACHINE OVERHEAD LABOR Predictor Coef SE Coef T P Constant PAPER MACHINE OVERHEAD LABOR S.08 R-Sq 99.9% R-Sq(adj) 99.9% Hög förklaringsgrad, men alla x-variabler är ej signifikanta

32 Analysis of Variance Source DF SS MS F P Regression Residual Error Total Source DF Seq SS PAPER MACHINE 556 OVERHEAD 3 LABOR 93 F-testet anger att minst en av de ingående x-variablerna har betydelse. t-testen (på föreg. sida) visar att de två första har det, men inte de två andra.

33 Analysen antyder att det kanske räcker med modellen där COST förklaras av PAPER och MACHINE. Kan man vara säker på det? Pröva denna modell: MTB > regress c 2 c2 c3 Regression Analysis: COST versus PAPER, MACHINE The regression equation is COST PAPER MACHINE Predictor Coef SE Coef T P Constant PAPER MACHINE S 0.98 R-Sq 99.9% R-Sq(adj) 99.9% Analysis of Variance Source DF SS MS F P Regression Residual Error Total

34 Hur kan vi jämföra dessa modeller? Den fullständiga modellen kan skrivas: y β 0 + β x + β 2 x 2 + β 3 x 3 + β 4 x 4 + ε där x PAPER, x 2 MACHINE, x 3 OVERHEAD, x 4 LABOR Den reducerade modellen kan skrivas y β 0 + β x + β 2 x 2 + ε Om vi vill testa om någon av x 3 och x 4 skall läggas till blir nollhypotesen: H 0 : β 3 β 4 0

35 Som testfunktion kan vi använda F ( SSER SSE C SSEC ) /( k /( n k ) där SSE R Residualkvadratsumman (SSE) i den Reducerade modellen och SSE C Residualkvadratsumman i den fullständiga modellen (Complete) kantal förklaringsvariabler i den fullständiga modellen gantal förklaringsvariabler i den reducerade modellen g) Om H 0 är sann får F en F-fördelning med k-g och n-k- frihetsgrader och vi kan alltså jämföra värdet på F med F [α] (k-g,n-k-)

36 Från utskrifterna kan vi nu ta SSE R och SSE C : Fullständig modell: Analysis of Variance Source DF SS MS F P Regression Residual Error Total Reducerad modell: SSE C Analysis of Variance Source DF SS MS F P Regression Residual Error Total SSE R

37 Ł F ( ) /(4 2) 2699 /(27 4 ) 96 / / F [0.05] (2,22) 3.44>0.799 Ł H 0 kan ej förkastas! Ingen av x 3 och x 4 skall alltså vara med i modellen. Observera dock att detta inte är självklart bara för att t-testen för dessa variabler blev icke-signifikanta i den fullständiga modellen! Testmetoden kallas Partiellt F-test eftersom vi i ett test testar om en del (partition) av modellen skall uteslutas.

38 Förenklad beräkning i vissa sammanhang: Vi vet att SSTSSE+SSR Ł SSESST SSR Ł SSE R SSE C SSR C SSR R (fullständig utredning ges i instruktionen till Datorövning 2) Ł F ( SSER SSE C SSEC ) /( k /( n k ) g) ( SSRC SSE C SSRR ) /( k /( n k ) g) Det går alltså att använda regressionskvadratsummorna istället för residualkvadratsummorna.

39 Vad är vitsen med detta? Jo, vi vet sen tidigare att en regressionskvadratsumma kan beräknas sekventiellt i den ordning förklaringsvariablerna matas in. I den fullständiga modellen blir: SSR C SSR(PAPER) + SSR(MACHINE PAPER) + + SSR(OVERHEAD PAPER,MACHINE) + + SSR(LABOR PAPER,MACHINE,OVERHEAD) I den reducerade modellen blir: SSR R SSR(PAPER) + SSR(MACHINE PAPER) Ł SSR C SSR R SSR(OVERHEAD PAPER,MACHINE) + + SSR(LABOR PAPER,MACHINE,OVERHEAD)

40 Eftersom vi matat in förklaringsvariablerna i just denna ordning kan vi ta samtliga sekventiella kvadratsummor från utskriften i den fullständiga modellen: Analysis of Variance Source DF SS MS F P Regression Residual Error Total Source DF Seq SS PAPER MACHINE 556 OVERHEAD 3 LABOR 93 SSR(PAPER) SSR(MACHINE PAPER) SSR(OVERHEAD PAPER,MACHINE) SSR(LABOR PAPER,MACHINE,OVERHEAD) Ł SSR C SSR R och F(96/2)/(2699/22)0.799 som tidigare.

41 AJÅ använder en annan formelvariant: F där R och R ( 2 2 ) RUR RR r ( 2 ) R ( n k ) 2 UR 2 R UR Förklaringsgraden i modellen med Förklaringsgraden i den reducerade alla variabler (unrestricted) modellen (restricted) r i denna formel står för k g (och alltså inte någon korrelationskoefficient!) Att formlerna är identiska ser vi genom att skriva om (utveckla) ovanstående F 2 2 ( RUR RR ) ( k g) 2 ( R ) ( n k ) UR C SST SSE SST ( SSR SSR ) ( k g) C R ( n k ) SSRC SSR SST SST SSRC SST R ( k g) ( n k ) ( SSRC SSRR ) ( k g) SSE ( n k ) C SSRC SST SSE SST C SSR SST R ( k g) ( n k )

42 Något om transformationer Antag att vi upptäcker i en residualanalys att slumpvariansen (σ 2 ) ej är konstant. Detta ser man alltså i ett diagram där residualerna plottas mot anpassade värden (fitted values). T ex var detta kanske fallet i Datorövning 2:

43 Eftersom alla utvecklade analyser (med t-test, F-test och prognosintervall) bygger på antagandet om konstant varians Ł Trubbel med tolkningar av den skattade modellen. Ofta kan man lösa detta problem genom att göra en s k transformation av y- värdena. Följande grupp av transformationer är vanligast: λ y λ 0 g( y) ln y λ 0 Det vanligaste valet av λ är 0.5, vilket innebär att g ( y) y Näst vanligast är nog att beräkna ln(y) (alternativet då λ0)

44 Kvadratrotstransformationen kräver att y är 0, men så är ofta fallet för just ekonomiskt anknutna data. Logaritmtransformationen kräver att y > 0 och kan ge problem för vissa variabler som ibland faktiskt är just 0. Andra värden kan också väljas på λ, men är mer sällsynta och definitivt ovanliga i en sådan här kurs. Vi prövar nu att ) Beräkna kvadratroten ur variabeln Total$ i Datorövning 2 och använda den resulterande variabeln som vårt nya y. 2) Logaritmera variabeln Total$ och använda den resulterande variabeln som vårt nya y.

45 ) Kvadratrotstransformationen I Minitab gör vi detta med MTB > let c4sqrt(c2) MTB > name c4 rot_total$ Vi anpassar sedan modellen där rot_total$ förklaras av Acreage, stfarea och FullBath. Vi beräknar samtidigt den prognos, som gjordes i datorövningen, dvs för Acreage.600, stfarea2000 och FullBath2

46 Regression Analysis: rot_total$ versus Acreage, stfarea, FullBath The regression equation is rot_total$ Acreage stfarea FullBath 79 cases used 2 cases contain missing values Predictor Coef SE Coef T P Constant Acreage stfarea FullBath S R-Sq 77.9% R-Sq(adj) 77.0% Analysis of Variance Source DF SS MS F P Regression Residual Error Total

47 Predicted Values for New Observations New Obs Fit SE Fit 99.0% CI 99.0% PI ( , ) ( , ) Values of Predictors for New Observations New Obs Acreage stfarea FullBath Anpassningen blir ungefär lika bra som tidigare. Fundera dock vad det är vi har gjort prognos för. Hur skall vi transformera tillbaka prognosen och intervall gränserna till den riktiga skalan hos y?

48 Det aktuella residualdiagrammet blir: Residuals Versus the Fitted Values (response is rot_tota) 00 Residual 0-00 Jämför med det tidigare: Fitted Value Ser knappast ut att vara mindre strutmönstrat nu än förut.

49 ) Logaritmtransformationen I Minitab gör vi detta med MTB > let c5loge(c2) MTB > name c4 log_total$ Observera att den naturliga logaritmen ( ln(y) ) erhålls med kommandot loge. Vill man istället beräkna 0-logaritmen ( lg(y) ) görs detta med kommandot logt. Vilken logaritm man använder spelar egentligen mindre roll, men den naturliga logaritmen är den som matematiskt passar in när transformationen generellt definieras som g ( y) λ y

50 I samband med att vi inför logaritmisk transformation kan det vara bra att repetera logaritmlagarna: log( y x) log log y y x a log log y y a log y + log log x x Dessa gäller oavsett om det är ln eller lg som används. Det finns också formler för att räkna om ln till lg och vice versa: ln y ln 0 lg y lg ( lg y ) ( lg y) ln0 ( konstant lg y) ( ln y e ) (ln y) lg e ( konstant ln y) Vi ser alltså att valet av logaritm är bara en skalfråga. Ur transformationssynvinkel är det ingen skillnad.

51 Vi anpassar nu modellen där log_total$ förklaras av Acreage, stfarea och FullBath. Vi beräknar även här den prognos, som gjordes i datorövningen, dvs för Acreage.600, stfarea2000 och FullBath2 Regression Analysis: log_total$ versus Acreage, stfarea, FullBath The regression equation is log_total$ Acreage stfarea FullBath 79 cases used 2 cases contain missing values Predictor Coef SE Coef T P Constant Acreage stfarea FullBath

52 S R-Sq 75.3% R-Sq(adj) 74.3% Analysis of Variance Source DF SS MS F P Regression Residual Error Total : : Predicted Values for New Observations New Obs Fit SE Fit 99.0% CI 99.0% PI ( , ) (.5689, ) Även här måste vi tänka på hur vi skall tillbakatransformera prognosen och intervallgränserna.

53 Det aktuella residualdiagrammet blir: Residuals Versus the Fitted Values (response is log_tota) 0.5 Residual Jämför med de tidigare: Fitted Value Ej transformerad y: Rottransformerad y: Residuals Versus the Fitted Values (response is rot_tota) 00 Residual Fitted Value Ser faktiskt ut att bli litet bättre!

Föreläsning 3 Kap 3.4, 3.6, 4.2. 732G71 Statistik B

Föreläsning 3 Kap 3.4, 3.6, 4.2. 732G71 Statistik B Föreläsning 3 Kap 3.4, 3.6, 4.2 732G71 Statistik B Exempel 150 slumpmässigt utvalda fastigheter till salu i USA Pris (y) Bostadsyta Tomtyta Antal rum Antal badrum 179000 3060 0.75 8 2 285000 2516 8.1 7

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B Föreläsning 4 Kap 3.5, 3.8 Material om index 732G71 Statistik B Skötsel (y) Transformationer Ett av kraven för regressionsmodellens giltighet är att residualernas varians är konstant. Vad gör vi om så

Läs mer

Föreläsning 4. Kap 5,1-5,3

Föreläsning 4. Kap 5,1-5,3 Föreläsning 4 Kap 5,1-5,3 Multikolinjäritetsproblem De förklarande variablerna kan vara oberoende (korrelerade) av varann men det är inte så vanligt. Ofta är de korrelerade, och det är helt ok men beroendet

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet 7 maj Wänström (Linköpings universitet) F3 7 maj 1 / 26 Lite som vi inte hann med när

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet November 6, 2013 Wänström (Linköpings universitet) F3 November 6, 2013 1 / 22 Interaktion

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Laboration 2 multipel linjär regression

Laboration 2 multipel linjär regression Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler

Läs mer

Regressions- och Tidsserieanalys - F3

Regressions- och Tidsserieanalys - F3 Regressions- och Tidsserieanalys - F3 Multipel regressionsanalys kap 4.8-4.10 Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F3 1 / 21 Interaktion Ibland ser sambandet mellan en

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression Enkel linjär regression Exempel.7 i boken (sida 31). Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben och höjder på sockeln. De halvledare

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

tentaplugg.nu av studenter för studenter

tentaplugg.nu av studenter för studenter tentaplugg.nu av studenter för studenter Kurskod Kursnamn SM Matematisk statistik Datum LP - Material Laboration Kursexaminator Adam Betygsgränser Tentamenspoäng Övrig kommentar Försättsblad inlämningsuppgift

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri lördagen den 29 mars 2008 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan

Läs mer

Datorövning 1 Enkel linjär regressionsanalys

Datorövning 1 Enkel linjär regressionsanalys Datorövning 1 Enkel linjär regressionsanalys Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Excel och Minitab för att 1. få en visuell uppfattning om vad ett regressionssamband

Läs mer

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 3 Bertil Wegmann IDA, Linköpings universitet November 4, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 4, 2015 1 / 22 Kap. 4.8, interaktionsvariabler Ibland

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Exempel 1 på multipelregression

Exempel 1 på multipelregression Exempel på multipelregression Hastighet = högsta hastighet som uppnåtts fram till givna år (årtal) Årtal Hastighet 83 3 (tåg) 9 3 (tåg) 93 (flyg) 97 7 (flyg) 9 (flyg) 99 (raket) Fitted Line Plot Hastighet

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 732G71 Statistik B Föreläsning 7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29 Detaljhandelns försäljning (fasta priser, kalenderkorrigerat) Bertil Wegmann

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel

Läs mer

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1! LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper.

Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Multikolinjäritet: Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Trots att COST verkade ha ett tydligt positivt samband med var och en av variablerna PAPER, MACHINE, OVERHEAD

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet

Läs mer

Skrivning i ekonometri torsdagen den 8 februari 2007

Skrivning i ekonometri torsdagen den 8 februari 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)

Läs mer

F7 Polynomregression och Dummyvariabler

F7 Polynomregression och Dummyvariabler F7 Polnomregression och Dummvariabler Antag att man börjar med enkel linjär regression. Kap Polnomregression Emellanåt upptäcker man samband som är kvadratiska, kubiska osv. Allmänt: polnom av k:te ordningen

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2017-12-08, 8-12 Bertil Wegmann

Läs mer

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka. y Uppgift 1 (18p) I syfte för att se om antalet månader som man ägt en viss träningsutrustning påverkar träningsintensiteten har tio personer som har köpt träningsutrustningen fått ange hur många månader

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik, LP1, HT 2015, Adam Jonsson LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i enkel regressionsanalys

Läs mer

TENTAMEN I STATISTIK B,

TENTAMEN I STATISTIK B, 732G7 Tentamen. hp TENTAMEN I STATISTIK B, 24-2- Skrivtid: kl: -2 Tillåtna hjälpmedel: Ett A4-blad med egna handskrivna anteckningar samt räknedosa Jourhavande lärare: Lotta Hallberg Betygsgränser: Tentamen

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2015-02-06, 8-12 Bertil Wegmann

Läs mer

Skrivning i ekonometri lördagen den 15 januari 2005

Skrivning i ekonometri lördagen den 15 januari 2005 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA102:3 Skrivning i ekonometri lördagen den 15 januari 5 1. Vi vill undersöka hur variationen i försäljningspris = price för hus i en liten stad

Läs mer

Datorövning 5 Exponentiella modeller och elasticitetssamband

Datorövning 5 Exponentiella modeller och elasticitetssamband Datorövning 5 Exponentiella modeller och elasticitetssamband Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Minitab för att 1. anpassa och tolka analysen av en exponentiell

Läs mer

Skrivning i ekonometri lördagen den 25 augusti 2007

Skrivning i ekonometri lördagen den 25 augusti 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA10:3 Skrivning i ekonometri lördagen den 5 augusti 007 1. Vi vill undersöka hur variationen i ölförsäljningen i ett bryggeri i en stad i USA

Läs mer

Facit till Extra övningsuppgifter

Facit till Extra övningsuppgifter LINKÖPINGS UNIVERSITET Institutionen för datavetenskap Statistik, ANd 732G71 STATISTIK B, 8hp Civilekonomprogrammet, t3, Ht 09 Extra övningsuppgifter Facit till Extra övningsuppgifter 1. Modellen är en

Läs mer

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15

732G71 Statistik B. Föreläsning 6. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15 732G71 Statistik B Föreläsning 6 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 15 Efterfrågeanalys Metoder för att studera sambandet mellan efterfrågan på

Läs mer

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: Betygsgränser: 732G21 Sambandsmodeller 2009-01-14,

Läs mer

TENTAMEN I MATEMATISK STATISTIK

TENTAMEN I MATEMATISK STATISTIK UMEÅ UNIVERSITET Institutionen för matematisk statistik Regressions- och variansanalys, 5 poäng MSTA35 Leif Nilsson TENTAMEN 2003-01-10 TENTAMEN I MATEMATISK STATISTIK Regressions- och variansanalys, 5

Läs mer

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB2 Skrivning i ekonometri onsdagen den 1 juni 211 1. Vi vill undersöka hur variationen i försäljningspriset för ett hus (i en liten stad i USA

Läs mer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng. 1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Datorövning 2 Multipel regressionsanalys, del 1

Datorövning 2 Multipel regressionsanalys, del 1 Datorövning 2 Multipel regressionsanalys, del 1 Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Minitab för att 1. analysera data enligt en multipel regressionsmodell

Läs mer

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

TVM-Matematik Adam Jonsson

TVM-Matematik Adam Jonsson TVM-Matematik Adam Jonsson 014-1-09 LABORATION 3 I MATEMATISK STATISTIK, S0001M REGRESSIONSANALYS I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistikprogrammet

Läs mer

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet:

1. Man tror sig veta att en viss variabel, y, i genomsnitt beror av en annan variabel, x, enligt sambandet: LINKÖPINGS UNIVERSITET Institutionen för datavetenskap Statistik, ANd 732G71 STATISTIK B, 8hp Civilekonomprogrammet, t3, Ht 09 Extra övningsuppgifter Extra övningsuppgifter 1. Man tror sig veta att en

Läs mer

Multikolinjäritet: Vi kan också beräkna parvisa korrelationskoefficienter mellan förklaringsvariabler:

Multikolinjäritet: Vi kan också beräkna parvisa korrelationskoefficienter mellan förklaringsvariabler: Multikolinjäritet: Betrakta åter datamaterialet med kostnader för produktion av korrugerat papper. Vi plottar förklaringsvariablerna mot varandra: Graph Matrix Plot Trots att COST verkade ha ett tydligt

Läs mer

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Sid (7) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift Nedanstående beräkningar från Minitab är gjorda för en Poissonfördelning med väntevärde λ = 4.

Läs mer

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION. MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på

Läs mer

För betyget GODKÄND krävs preliminärt minst 28 poäng. För betyget VÄL GOD- KÄND krävs preliminärt minst 43 poäng.

För betyget GODKÄND krävs preliminärt minst 28 poäng. För betyget VÄL GOD- KÄND krävs preliminärt minst 43 poäng. STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson Skriftlig hemtentamen i Fortsättningskurs i statistik, moment 1, Statistisk Teori, poäng. Deltentamen 2: Regressionsanalys Måndagen den

Läs mer

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

tentaplugg.nu av studenter för studenter

tentaplugg.nu av studenter för studenter tentaplugg.nu av studenter för studenter Kurskod Kursnamn SM Matematisk statistik Datum LP - Material Laboration 4 Kursexaminator Adam Betygsgränser Tentamenspoäng Övrig kommentar Försättsblad inlämningsuppgift

Läs mer

Exempel 1 på multipelregression

Exempel 1 på multipelregression Exempel på multipelregression Hastighet = högsta hastighet som uppnåtts fram till givna år (årtal) Årtal Hastighet 8 (tåg) 95 (tåg) 9 (flyg) 97 7 (flyg) 95 5 (flyg) 99 5 (raket) Regression Plot Hastighet

Läs mer

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar: Flerfaktorförsök Blockförsök, randomiserade block Modell: yij i bj eij i 1,,, a j 1,,, b y ij vara en observation för den i:te behandlingen och det j:e blocket gemensamma medelvärdet ( grand mean ) effekt

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2015-01-13 Tentamen Tillämpad statistik A5 (15hp) 2015-01-13 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2015-12-09, 8-12 Bertil Wegmann

Läs mer

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson 1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III, statistiska metoder) 3 högskolepoäng, ingående i kursen Undersökningsmetodik

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 4.00-7.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2015-08-25 Tentamen Tillämpad statistik A5 (15hp) 2015-08-25 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:.. TENTAMEN Tentamensdatum 8-3-7 Statistik för ekonomer, Statistik A, Statistik A (Moment ) : (7.5 hp) Namn:.. Personnr:.. Tentakod: A3 Var noga med att fylla i din kod samt uppgiftsnummer på alla lösningsblad

Läs mer

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt Introduktion Vi har fått ta del av 13 mätningar av kroppstemperatur och hjärtfrekvens, varav på hälften män, hälften kvinnor, samt en studie på 77 olika flingsorters hyllplaceringar och sockerhalter. Vi

Läs mer

Examinationsuppgifter del 2

Examinationsuppgifter del 2 UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).

Läs mer

F11. Kvantitativa prognostekniker

F11. Kvantitativa prognostekniker F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen

HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik, ANd HSTA72 REGRESSIONS- OCH TIDSSERIEANALYS, 5p Ekonomprogrammet, t2, Vt 06 Tentamen REGRESSIONS- OCH TIDSSERIEANALYS, 5 P TENTAMEN LÖRDAGEN

Läs mer

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp) Uppsala universitet Statistiska institutionen A5 2014-08-26 Tentamen Tillämpad statistik A5 (15hp) 2014-08-26 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling

Läs mer

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, 2015. IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, 2015. IDA, Linköpings universitet 732G71 Statistik B Föreläsning 2 Bertil Wegmann IDA, Linköpings universitet November 13, 2015 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 13, 2015 1 / 26 Kap. 4.1-4.5, multipel linjär regressionsanalys

Läs mer

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys. Tentamen i Matematisk statistik Ämneskod-linje S0001M Poäng totalt för del 1 5 (8 uppgifter) Poäng totalt för del 0 ( uppgifter) Tentamensdatum 009-10-6 Adam Jonsson Lärare: Lennart Karlberg Robert Lundqvist

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Räkneövning 3 Variansanalys

Räkneövning 3 Variansanalys Räkneövning 3 Variansanalys Uppgift 1 Fyra sorter av majshybrider har utvecklats för att bli resistenta mot en svampinfektion. Nu vill man också studera deras produktionsegenskaper. Varje hybrid planteras

Läs mer

Justeringar och tillägg till Svar till numeriska uppgifter i Andersson, Jorner, Ågren: Regressions- och tidsserieanalys, 3:uppl.

Justeringar och tillägg till Svar till numeriska uppgifter i Andersson, Jorner, Ågren: Regressions- och tidsserieanalys, 3:uppl. LINKÖPINGS UNIVERSITET 73G71 Statistik B, 8 hp Institutionen för datavetenskap Civilekonomprogrammet, t 3 Avdelningen för Statistik/ANd HT 009 Justeringar och tillägg till Svar till numeriska uppgifter

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (9 uppgifter) Tentamensdatum 2013-08-27 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson och

Läs mer

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson 1 STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson Skriftlig omtentamen på momentet Statistiska metoder SDA III, 2 poäng ingående i kurserna Grundkurs i statistik 20 p samt Undersökningsmetodik

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson 1 STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik och

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2014-01-17 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 15.00 20.00 Lärare: Adam Jonsson, Mykola

Läs mer

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två

Läs mer

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa. Tentamen Linköpings universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: 732G71 Statistik B 2016-12-13, 8-12 Bertil Wegmann

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2014-03-26

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

Regressions- och Tidsserieanalys - F5

Regressions- och Tidsserieanalys - F5 Regressions- och Tidsserieanalys - F5 Linda Wänström Linköpings universitet November 20 Wänström (Linköpings universitet) F5 November 20 1 / 24 Modellbygge - vilka oberoende variabler ska vara med i modellen?

Läs mer

Följande resultat erhålls (enhet: 1000psi):

Följande resultat erhålls (enhet: 1000psi): Variansanalys Exempel Aluminiumstavar utsätts för uppvärmningsbehandlingar enligt fyra olika standardmetoder. Efter behandlingen uppmäts dragstyrkan hos varje stav. Fem upprepningar görs för varje behandling.

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS, TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS, 204-0-3 Skrivtid: kl 8-2 Hjälpmedel: Räknedosa. Bowerman, B.J., O'Connell, R, Koehler, A.: Forecasting, Time Series and Regression. 4th ed. Duxbury, 2005 som

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-10-29 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Mykola

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer