Het beoordelen van de pasvorm van Regressie Modellen

Een goed passende regressiemodel resultaten voorspelde waarden dicht bij de waargenomen data waarden. De gemiddelde model, dat het gemiddelde gebruikt voor elke voorspelde waarde, doorgaans worden gebruikt als er geen voorspellende variabelen informatief. De pasvorm van een beoogde regressiemodel derhalve beter dan de pasvorm van de gemiddelde model

Drie statistieken worden gebruikt Ordinary Least Squares (OLS) regressie model fit evalueren. R-kwadraat de totale F- test, en de Root Mean Square Error (RMSE). Alle drie zijn gebaseerd op twee sommen van pleinen: Som van Squares Totaal (SST) en Som van Squares Error (SSE). SST meet hoeverre de gegevens van de gemiddelde en SSE maatregelen hoeverre de gegevens van de voorspelde waarden van het model. Verschillende combinaties van deze twee waarden bieden verschillende informatie over hoe het regressiemodel te vergelijken met het gemiddelde model.

en R-kwadraat Adjusted R-kwadraat

Het verschil tussen SST en SSE is de verbetering van de voorspelling van het regressiemodel, vergeleken met het gemiddelde model. Te delen dat verschil door SST geeft R-kwadraat. Het is de proportionele verbetering van de voorspelling van het regressiemodel, vergeleken met het gemiddelde model. Het geeft de goedheid van fit van het model

R-kwadraat is de nuttige eigenschap dat de omvang ervan is intuïtief. Het varieert van nul tot één, met nul aangeeft dat het voorgestelde model niet verbetert de voorspelling over de gemiddelde model en één aangeeft perfecte voorspelling. Verbetering van het regressiemodel resulteert in proportionele stijgingen R-kwadraat.

Een valkuil van R-kwadraat is dat het alleen kan toenemen als voorspellers worden toegevoegd aan het regressiemodel. Deze stijging is kunstmatig wanneer voorspellers niet daadwerkelijk verbeteren fit van het model. Om dit te verhelpen, een verwante statistiek, Adjusted R-kwadraat, bevat vrijheidsgraden van het model. Aangepaste R-kwadraat zal afnemen als voorspellers worden toegevoegd als de stijging van de model fit geen make-up voor het verlies van de vrijheidsgraden. Ook zal verhogen als voorspellers worden toegevoegd als de stijging van de model fit is de moeite waard. Aangepaste R-kwadraat moeten altijd worden gebruikt met modellen met meer dan één predictor variabele. Het wordt geïnterpreteerd als het aandeel van de totale variantie die wordt verklaard door het model.

Er zijn situaties waarin een hoge R-kwadraat niet noodzakelijk of relevant. Als de rente in de relatie tussen variabelen, niet in de voorspelling, de R-kwadraat is minder belangrijk. Een voorbeeld is een onderzoek naar hoe de religiositeit van invloed op de gezondheidssituatie. Een goed resultaat is een betrouwbare relatie tussen religiositeit en gezondheid. Niemand verwacht dat religie verklaart een hoog percentage van de variatie in de gezondheidszorg, gezondheid wordt beïnvloed door vele factoren. Zelfs als het model vertegenwoordigt andere variabelen bekend gezondheid beïnvloeden, zoals inkomen en leeftijd, een R kwadraat in het gebied van 0,10-0,15 redelijk.

De F-toets

The F-test onder nulhypothese dat alle regressiecoëfficiënten gelijk aan nul versus subsidiair ten minste één niet doet. Een gelijkwaardige null hypothese is dat R-kwadraat gelijk is aan nul. Een aanzienlijk F-test blijkt dat de waargenomen R-kwadraat is betrouwbaar, en het is niet een vals resultaat van de eigenaardigheden in de dataset. Zo heeft de F-test bepaalt of de voorgestelde verhouding tussen de respons variabele en de set van voorspellers statistisch betrouwbaar, en kan nuttig zijn bij het doel van het onderzoek is ofwel voorspellen of uitleg.

RMSE

De RMSE is de vierkantswortel van de variantie van de residuen. Het geeft de absolute fit van het model om de gegevens - hoe dicht de waargenomen data punten zijn om de voorspelde waarden van het model. Overwegende dat de R-kwadraat is een relatieve maatstaf van fit, RMSE is een absolute maatstaf voor de pasvorm. Aangezien de vierkantswortel van een variantie, kan RMSE worden geïnterpreteerd als de standaarddeviatie van de onverklaarde variantie, en heeft de nuttige eigenschap dat in dezelfde eenheden als de respons variabele. Lagere waarden van RMSE geven betere pasvorm. RMSE is een goede maatstaf voor hoe nauwkeurig het model voorspelt de respons, en het is het belangrijkste criterium voor de pasvorm als het belangrijkste doel van het model is de voorspelling.

De beste maatstaf van model fit is afhankelijk van de doelstellingen van de onderzoeker, en meerdere vaak nuttig. De statistieken hierboven besproken zijn van toepassing op regressie modellen die OLS schatting gebruiken. Veel soorten regressie modellen, echter, zoals gemengde modellen, gegeneraliseerde lineaire modellen, en event history modellen, gebruik maximum likelihood schatting. Deze statistieken zijn niet beschikbaar voor dergelijke modellen. Een volgende nieuwsbrief zal beschrijven hoe de modellen geschat met behulp van maximum likelihood beoordelen

Copyright © 2008, Karen Grace-Martin
.

business consulting

  1. 7 Gemeenschappelijke Fouten van huurders en hoe ze te vermijden in de toekomst
  2. Gebruik Project Management Tools te voren Marketing Project Scope Creep
  3. Geniet grote korting aanbiedingen Online
  4. Product Development ideeën online
  5. Voor ouders Consumer Guidebook voor Nickelodeon Audities
  6. Wat is een makelaar mail List?
  7. *** Snijd de Vet, Houd de Muscle
  8. 10 Meer bewezen methodes om uw gratis Client attractie Device bevorderen
  9. De waargenomen commerciële levensvatbaarheid van Strategic Consulting voor micro-ondernemingen
  10. VoIP-telefoontje diensten
  11. Concurrentie is tot succesvolle marketing als meststof is vruchtbaar Landbouw
  12. Customer Service & De luchtvaartsector? Niet zo veel!
  13. Hoe Vernauwing uw niche markt kan uw bedrijf helpen
  14. Enkele nuttige tips over het inhuren van Groot-LA Movers
  15. De Franchise Disclosure Document (FDD) - Een Overzicht
  16. Conceptualiseren Bewust kapitalisme
  17. Voordelen van Custom Web Design Services
  18. Sky Broadband biedt, deals, pakketten en diensten
  19. Drupal Website Ontwikkeling en Services
  20. YouTube-video op te slaan in een paar eenvoudige stappen