Aanbevolen oplossingen ontbrekende gegevens
Er zijn twee methoden voor het omgaan met ontbrekende gegevens die beschikbaar zijn in de reguliere statistische software zijn geworden in de afgelopen jaren. Deze twee methoden zijn enorme verbeteringen ten opzichte van traditionele benaderingen, zoals beschreven in beperkingen om Common Approaches ontbrekende gegevens. Dit artikel schetst deze twee methoden.
Zowel van de methoden die hier besproken vereisen dat de ontbrekende gegevens mechanisme is ignorable, dat wil zeggen, niet gerelateerd aan de ontbrekende waarden (zie Ontbrekende gegevens Mechanisms). Als het mechanisme is ignorable, resulterend schattingen (dat wil zeggen, regressie parameters en standaard fouten) zal onpartijdige zonder verlies van macht.
De eerste methode is multipele imputatie (MI). Net als de imputatiemethoden besproken in Beperkingen aan een gemeenschappelijke aanpak van ontbrekende gegevens Meerdere Imputatie vult ramingen voor de ontbrekende gegevens. Echter, de onzekerheid in deze schattingen vangen, MI rekent de waarden meerdere keren. Omdat het gebruik maakt van een verrekeningsmethode met fout ingebouwd, moet het meerdere schattingen vergelijkbaar, maar niet identiek zijn. Het resultaat is meerdere gegevensreeksen met identieke waarden voor alle niet-ontbrekende waarden enigszins verschillende waarden voor de fictieve waarden in elke dataset. De statistische analyse van belang, zoals ANOVA of logistische regressie, wordt afzonderlijk uitgevoerd op elke set van gegevens, en de resultaten worden vervolgens gecombineerd. Door de variatie in de fictieve waarden dient tevens variatie in de parameter schattingen, waardoor passende schattingen standaardfouten en passende p-waarden.
Multiple toerekening beschikbaar in SAS, S-Plus en solas. In SAS PROC MI creëert meerdere gegevenssets, die dan gemakkelijk afzonderlijk worden geanalyseerd onder toepassing van standaard statistische methoden. PROC MIANALYZE zal dan combineren de resultaten van deze afzonderlijke analyses. Joe Schafer aan de Penn State heeft vier S-Plus bibliotheken voor meerdere toerekening van normale, categorische, gemengd en panel data ontwikkeld. Hij heeft de bibliotheek voor normale data beschikbaar als een gratis stand-alone pakket heet NORM gemaakt. Meervoudige toerekening is ook beschikbaar in Solas, maar de algoritmes zijn ondervraagd als ongepast, en we kunnen het gebruik ervan op dit moment niet aan te bevelen.
De tweede methode is om het analyseren van de volledige, onvolledige gegevens ingesteld met maximum likelihood schatting. Deze methode niet alle gegevens toe te rekenen, maar maakt gebruik van alle gegevens waargenomen voor elk geval tot maximum likelihood schattingen te berekenen. De maximumschatting waarschijnlijkheid van een parameter is de waarde van de parameter die het meest waarschijnlijk hebben geleid tot de waargenomen data. Indien gegevens ontbreken, kunnen we de waarschijnlijkheidsfunctie factor. De kans wordt afzonderlijk berekend voor die gevallen met volledige gegevens over een aantal variabelen en die met volledige gegevens over alle variabelen. Deze twee waarschijnlijkheden worden dan samen gemaximeerd op de schattingen te vinden. Zoals meerdere verrekeningsmethode, deze methode geeft onpartijdige parameterschattingen en de standaard fouten. Een voordeel is dat het niet de zorgvuldige selectie van variabelen voor waarden die Multiple Imputatie vereist toegerekend vereist. Het is echter beperkt tot lineaire modellen.
Analyse van de volledige, incomplete data ingesteld met maximum likelihood schatting is in AMOS. AMOS is een structural equation modeling pakket, maar het kan meervoudige lineaire regressie modellen lopen. AMOS is gemakkelijk te gebruiken en is nu geïntegreerd in SPSS, maar het zal geen residuplots, invloed statistieken en andere typische uitvoer van regressie pakketten. . De ontbrekende waarde analyse pakket SPSS zal een aantal zeer beperkte maximum likelihood schattingen voor de middelen en de correlaties alleen
Referenties doen:
Schafer, J. Software voor meerdere Imputatie
Hox, JJ (1999) Een overzicht van de huidige software voor het omgaan met ontbrekende gegevens Kwantitatieve Methoden, 62, 123-138.
Allison, P. (2000). Meerdere Imputatie voor Missing Data: Een waarschuwend verhaal, Sociologische Methods and Research, 28, 301-309
..
business consulting
- Consumer Product Markt penetratie is veel gemakkelijker als Exclusiviteit is de sleutel tot het Line…
- Te behouden en te groeien Current Accounts Door Klantenfeedback systemen voor de Enterprise
- Wie Zijn Nexus?
- büro mieten-een kosteneffectieve manier om uw bedrijf te runnen
- Tweevoudig Windows
- Hoe je de beste heftruck onderdelen leverancier van on-line te vinden?
- Frisse lucht zorgt voor een gezond milieu
- Voordelen van E-commerce Fulfillment Order of E-commerce Fulfillment in Business
- Nieuwe kansen voor High Risk Merchants
- VoIP-providers biedt vele optionele geavanceerde functies
- Xavor SharePoint 2010 Migrator (XSPM) - Een Kwalitatieve Overzicht
- 3 Belangrijke tips om Best Custom Logo Design Krijg voor uw bedrijf
- De Companywide invloed van accounting Finance
- Neem uw bedrijf naar nieuwe hoogten via Orange County SEO experts
- CRICKET SMS
- Rogue CFO Part-time en Interim CFO Services vol functies die zijn uiterste best voor u zaken
- Extra hulp met Business Software Programs
- Grote zakelijke motiverende sprekers
- De Geschiedenis en Sociologie van Beurzen
- Marketing van het artikel Expert onthult 5 artikel Templates for Thought Leaders