Beperkingen van gemeenschappelijke oplossingen voor Missing Data
Een eerder artikel besproken sommige van de oorzaken van de ontbrekende gegevens en een aantal van de gevolgen van het analyseren enige complete gevallen. Deze nieuwsbrief zal bespreken een aantal andere veel voorkomende manieren van omgaan met ontbrekende gegevens, met een bespreking van de voor- en nadelen.
Beschikbaar case analyse (paarsgewijs schrapping) berekent elke stap van de analyse afzonderlijk met behulp van de gevallen dat de gegevens beschikbaar te hebben voor die stap. Daarom zal een geval met gegevens ontbreken aan een variabele worden gebruikt in stappen waarbij niet de variabele. Het voordeel is dat de steekproefomvang voor elke analyse in het algemeen hoger dan bij volledige dossier analyse, maar de resultaten zijn onpartijdige indien de gegevens MCAR. Het kan ook leiden tot een wiskundige problemen bij het berekenen van de ramingen van een aantal parameters, en wordt niet aanbevolen.
De meeste andere methoden te betrekken toerekening-vervanging van de ontbrekende waarden met een schatting, dan is het analyseren van de volledige dataset als de toegerekende waarden waren de werkelijke geobserveerde waarden. Er zijn vele manieren om een schatting te kiezen. De volgende zijn gemeenschappelijke methoden:
* Mean: het gemiddelde van de gemeten waarden voor die variabele
* Substitutie: de waarde van een nieuw persoon die niet werd geselecteerd om in de steekproef
* Hot dek: een willekeurig gekozen waarde van een persoon die heeft dezelfde waarden op andere variabelen
* Cold dek: een systematisch gekozen waarde van een persoon die dezelfde waarden heeft op andere variabelen
* Regressie: de voorspelde waarde verkregen door de regressie ontbrekende variabele op andere variabelen
* Stochastic regressie: de voorspelde waarde uit een regressie plus een willekeurige restwaarde
* interpolatie en extrapolatie.. een geschatte waarde uit andere waarnemingen van hetzelfde individu
Imputatie is populair omdat het conceptueel eenvoudig en omdat de verkregen monster heeft hetzelfde aantal waarnemingen de volledige gegevensset. Het kan erg verleidelijk zijn als complete case analyse elimineert een groot deel van de dataset. Maar heeft beperkingen. Sommige imputatiemethoden resulteren in een bevooroordeelde parameterschattingen, zoals middelen en correlaties, tenzij de gegevens MCAR. Het vooroordeel is vaak erger dan met een complete-case analyse, in het bijzonder voor de gemiddelde toerekening. De omvang van de voorspanning is afhankelijk van vele factoren, waaronder de ontbrekende data mechanisme, het deel van de gegevens ontbreekt, en de in de dataset informatie.
Bovendien zijn al deze imputatiemethoden onderschatten standaardfout . Omdat de toegerekende waarnemingen zelf schattingen, hebben hun waarden overeenkomstige toevallige fout. Desondanks worden toegerekend waarden behandeld als feitelijke waarnemingen in analyses. De extra bron van fouten wordt genegeerd, wat resulteert in te kleine standaard fouten en te kleine p-waarden. Bovendien, hoewel de toerekening is conceptueel eenvoudig, het is meestal moeilijk om goed te doen in de praktijk. Daarom zijn deze imputatiemethoden niet bevredigend in de meeste gevallen
Twee alternatieve methoden te behouden de volledige steekproefgrootte en kan resulteren in een onpartijdige schattingen van de parameters en de standaard fouten voor ignorable ontbrekende gegevens. Meervoudige toerekening en maximum likelihood schatting. Deze technieken zijn nu beschikbaar in de gemeenschappelijke statistische software. Volgende nieuwsbrieven zullen deze methoden te beschrijven en te bespreken hun beschikbaarheid in softwarepakketten
.
business consulting
- Network Security hoeft niet een last
- Business Owners moeten hun tactiek veranderen om
- Social bookmarking dienst
- Centreren Variabelen om multicollineariteit
- Coatesville Propaan Bedrijven What You Need
- Marketing van het artikel Expert onthult 5 artikel Templates for Thought Leaders
- Een online Mesothelioom Advocaten - Een reddende genade voor de slachtoffers mesothelioom
- 6 vitale elementen van een Business Growth Plan
- The Magic Of Two Becomes One
- Hoe te Self-Analyseer je Consumer Product Idee vergemakkelijken het tot leven brengen
- Het maken van veiligheid een primaire zorg in uw bedrijf
- Ethische verplichtingen in Real Estate
- Is Facebook echt belangrijk voor uw bedrijf?
- Risico is een essentieel onderdeel van het handelsproces
- All About Money
- Werken met Familie, Tips voor het beheren van een Family Business
- Verkeer School & Rijschool Cursussen Online Going
- Weven een "Freemium 'Business Model Element Into Your Consumer Product Marketing Strategy
- Best Business Attorney: Een voorwaarde voor de oprichting van een bedrijf zorg
- Pharma Market Research: De juiste manier te onderscheiden Superb Startups uit Schadelijk