Estimating missing data within an accounting and aggregation framework

07 december 2000

Nieuw methode voor schatting ontbrekende data bij EIM
EIM biedt in diverse producten, zoals 'Kleinschalig Ondernemen', een overzicht van de huidige omvang en ontwikkeling van het bedrijfsleven. Daarbij worden bedrijfsgroepen en grootteklassen onderscheiden. Dit maakt deze producten voor al degenen die bij de ontwikkeling van economisch beleid zijn betrokken tot een unieke, zeer gedetailleerde bron van informatie. Basis voor deze publicaties is een informatiesysteem over het Nederlandse bedrijfsleven. Hierin wordt een samenhangend overzicht gegeven van de omvang en structuur van het bedrijfsleven, gedesaggregeerd naar bedrijfsgroep en grootteklasse.

Veelal worden incomplete gegevens bij EIM aangeleverd, bijvoorbeeld omdat bepaalde data geheim zijn. Omdat EIM zich ten doel stelt om volledige gegevens over het Nederlandse bedrijfsleven te verschaffen, is het van belang om over adequate methoden voor schatting van ontbrekende data te beschikken. Omdat verschillende gegevens onderling samenhangen (bijvoorbeeld: winst is gelijk aan omzet minus kosten), dienen de onderlinge relaties expliciet deel uit te maken van zo'n methode. Dit pleit voor het gebruik van wiskundig geformaliseerde methoden. Het gebruik daarvan vergroot bovendien de transparantie van het dataverwerkingsproces.

Een drietal methoden is onderzocht, te weten de traditionele RAS-methode, een kleinste-kwadratenmodel en een entropie-methode. Deze zijn beoordeeld aan de hand van drie criteria: theoretische aanvaardbaarheid, empirische toetsing (resultaten van een toepassing op een complete dataset waarin bepaalde waarnemingen alsnog 'onbekend' zijn verondersteld) en overwegingen van praktische aard.

De RAS-methode verdient op theoretische gronden niet de voorkeur. De beide overige methoden scoren vergelijkbaar waar het empirische toetsing betreft. Beide methoden lieten op basis van relatief eenvoudige veronderstellingen een goede overeenkomst tussen geschatte en werkelijke data zien. De kleinste-kwadratenmethode levert echter de minste problemen op bij praktische toepassing. De conclusie is dan ook dat vooral deze methode in de toekomst gebruikt zal worden bij het schatten van ontbrekende data.


Voor inlichtingen: 079 343 06 04

Estimating missing data within an accounting and aggregation framework

07 december 2000

Onderzoek naar de methoden voor de berekening van ontbrekende data. Het onderzoek poogt een antwoord te geven op de vraag hoe schattingen geprepareerd kunnen worden voor ontbrekende data in een datamatrix.
Leave this field empty

Auteur(s): dr. N.S. Bosma, drs. A. Kwaak

Contact

Via onderstaande gegevens kunt u contact met ons opnemen. Als u op de hoogte wilt blijven van interessant nieuws, kunt u ons ook volgen op twitter en/of onze LinkedIn-pagina. Daarnaast hebben wij een grote bron van informatie over werk van Panteia op onze nieuws-pagina.

Postadres:
Postbus 7001
2701 AA Zoetermeer

tel: +31 (0)79 322 20 00
fax: +31 (0)79 322 21 01

e-mail: info@panteia.nl

Bezoekadres:
Bredewater 26
2715 CA Zoetermeer