Aanbevolen oplossingen ontbrekende gegevens

Er zijn twee methoden voor het omgaan met ontbrekende gegevens die beschikbaar zijn in de reguliere statistische software zijn geworden in de afgelopen jaren. Deze twee methoden zijn enorme verbeteringen ten opzichte van traditionele benaderingen, zoals beschreven in beperkingen om Common Approaches ontbrekende gegevens. Dit artikel schetst deze twee methoden.

Zowel van de methoden die hier besproken vereisen dat de ontbrekende gegevens mechanisme is ignorable, dat wil zeggen, niet gerelateerd aan de ontbrekende waarden (zie Ontbrekende gegevens Mechanisms). Als het mechanisme is ignorable, resulterend schattingen (dat wil zeggen, regressie parameters en standaard fouten) zal onpartijdige zonder verlies van macht.

De eerste methode is multipele imputatie (MI). Net als de imputatiemethoden besproken in Beperkingen aan een gemeenschappelijke aanpak van ontbrekende gegevens Meerdere Imputatie vult ramingen voor de ontbrekende gegevens. Echter, de onzekerheid in deze schattingen vangen, MI rekent de waarden meerdere keren. Omdat het gebruik maakt van een verrekeningsmethode met fout ingebouwd, moet het meerdere schattingen vergelijkbaar, maar niet identiek zijn. Het resultaat is meerdere gegevensreeksen met identieke waarden voor alle niet-ontbrekende waarden enigszins verschillende waarden voor de fictieve waarden in elke dataset. De statistische analyse van belang, zoals ANOVA of logistische regressie, wordt afzonderlijk uitgevoerd op elke set van gegevens, en de resultaten worden vervolgens gecombineerd. Door de variatie in de fictieve waarden dient tevens variatie in de parameter schattingen, waardoor passende schattingen standaardfouten en passende p-waarden.

Multiple toerekening beschikbaar in SAS, S-Plus en solas. In SAS PROC MI creëert meerdere gegevenssets, die dan gemakkelijk afzonderlijk worden geanalyseerd onder toepassing van standaard statistische methoden. PROC MIANALYZE zal dan combineren de resultaten van deze afzonderlijke analyses. Joe Schafer aan de Penn State heeft vier S-Plus bibliotheken voor meerdere toerekening van normale, categorische, gemengd en panel data ontwikkeld. Hij heeft de bibliotheek voor normale data beschikbaar als een gratis stand-alone pakket heet NORM gemaakt. Meervoudige toerekening is ook beschikbaar in Solas, maar de algoritmes zijn ondervraagd als ongepast, en we kunnen het gebruik ervan op dit moment niet aan te bevelen.

De tweede methode is om het analyseren van de volledige, onvolledige gegevens ingesteld met maximum likelihood schatting. Deze methode niet alle gegevens toe te rekenen, maar maakt gebruik van alle gegevens waargenomen voor elk geval tot maximum likelihood schattingen te berekenen. De maximumschatting waarschijnlijkheid van een parameter is de waarde van de parameter die het meest waarschijnlijk hebben geleid tot de waargenomen data. Indien gegevens ontbreken, kunnen we de waarschijnlijkheidsfunctie factor. De kans wordt afzonderlijk berekend voor die gevallen met volledige gegevens over een aantal variabelen en die met volledige gegevens over alle variabelen. Deze twee waarschijnlijkheden worden dan samen gemaximeerd op de schattingen te vinden. Zoals meerdere verrekeningsmethode, deze methode geeft onpartijdige parameterschattingen en de standaard fouten. Een voordeel is dat het niet de zorgvuldige selectie van variabelen voor waarden die Multiple Imputatie vereist toegerekend vereist. Het is echter beperkt tot lineaire modellen.

Analyse van de volledige, incomplete data ingesteld met maximum likelihood schatting is in AMOS. AMOS is een structural equation modeling pakket, maar het kan meervoudige lineaire regressie modellen lopen. AMOS is gemakkelijk te gebruiken en is nu geïntegreerd in SPSS, maar het zal geen residuplots, invloed statistieken en andere typische uitvoer van regressie pakketten. . De ontbrekende waarde analyse pakket SPSS zal een aantal zeer beperkte maximum likelihood schattingen voor de middelen en de correlaties alleen

Referenties doen:
Schafer, J. Software voor meerdere Imputatie
Hox, JJ (1999) Een overzicht van de huidige software voor het omgaan met ontbrekende gegevens Kwantitatieve Methoden, 62, 123-138.
Allison, P. (2000). Meerdere Imputatie voor Missing Data: Een waarschuwend verhaal, Sociologische Methods and Research, 28, 301-309
..

business consulting

  1. Consumer Product Markt penetratie is veel gemakkelijker als Exclusiviteit is de sleutel tot het Line…
  2. Te behouden en te groeien Current Accounts Door Klantenfeedback systemen voor de Enterprise
  3. Wie Zijn Nexus?
  4. büro mieten-een kosteneffectieve manier om uw bedrijf te runnen
  5. Tweevoudig Windows
  6. Hoe je de beste heftruck onderdelen leverancier van on-line te vinden?
  7. Frisse lucht zorgt voor een gezond milieu
  8. Voordelen van E-commerce Fulfillment Order of E-commerce Fulfillment in Business
  9. Nieuwe kansen voor High Risk Merchants
  10. VoIP-providers biedt vele optionele geavanceerde functies
  11. Xavor SharePoint 2010 Migrator (XSPM) - Een Kwalitatieve Overzicht
  12. 3 Belangrijke tips om Best Custom Logo Design Krijg voor uw bedrijf
  13. De Companywide invloed van accounting Finance
  14. Neem uw bedrijf naar nieuwe hoogten via Orange County SEO experts
  15. CRICKET SMS
  16. Rogue CFO Part-time en Interim CFO Services vol functies die zijn uiterste best voor u zaken
  17. Extra hulp met Business Software Programs
  18. Grote zakelijke motiverende sprekers
  19. De Geschiedenis en Sociologie van Beurzen
  20. Marketing van het artikel Expert onthult 5 artikel Templates for Thought Leaders