Wat de meestgebruikte woorden in het Nederlands zijn, is niet zo eenvoudig vast te stellen. Dat komt deels door het verschil in woordgebruik tussen spreektaal en schrijftaal. Een woord als ik komt in spreektaal veel vaker voor dan in schrijftaal. Dat komt ook doordat schrijftaalonderzoek zich baseert op kranten, tijdschriften en boeken, en niet op weblogs en Twitterberichten. Een tweede probleem bij het tellen van woorden is het verschil tussen woordvormen en lemma’s. Woordvormen zijn de woorden zoals ze uitgesproken of geschreven zijn, zoals wordt, plantjes en ’t. Lemma’s zijn de vormen die in woordenboeken zijn opgenomen, zoals worden, plant en het. Bij een telling van woordvormen worden zelfs woorden die met een hoofdletter worden geschreven omdat ze aan het begin van de zin staan, apart geteld van dezelfde woorden met een kleine letter (zoals de en De).

De frequentie van woorden kan bepaald worden aan de hand van grote bestanden met (gesproken of geschreven) teksten, corpora genoemd. Het Instituut voor de Nederlandse Taal werkt aan het Corpus Hedendaags Nederlands. Dat corpus bestaat uit vele tientallen miljoenen woordvormen.

Het overzichtje hieronder is gebaseerd op oudere corpora: het Corpus Gesproken Nederlands (CGN) en het PAROLE-corpus, een verzameling van zo’n 20 miljoen woorden uit boeken, kranten en tijdschriften, uit de periode 1982-1998.

woordvorm (CGN) lemma (CGN) woordvorm (PAROLE) lemma (PAROLE)
ja
dat
de
en
uh
ik
een
is
die
van
't
maar
in
niet
je
zijn
ja
dat
de
ik
en
het
uh
een
hebben
die
van
maar
in
niet
de
van
het
een
en
in
is
te
dat
op
De
voor
met
zijn
die
de
van
het
zijn
een
in
en
dat
op
te
worden
voor
met
hebben
die

Bij deze woorden gaat het vrijwel altijd om woorden die alleen een grammaticale functie hebben (lidwoorden, voegwoorden, enz.). Er staan enkele werkwoorden tussen, maar geen zelfstandige of bijvoeglijke naamwoorden. Uit de bestanden zijn ook daar wel de meestgebruikte van te vinden.

De meestgebruikte zelfstandige naamwoorden zijn:
In het CGN: beetje, mensen, jaar, tijd, dag, dingen, tijd, man, moment, kinderen
In het PAROLE-corpus: jaar, mens, onderwerp, tijd, dag, gemeente, plaats, uur, land, Nederland

De meestgebruikte bijvoeglijke naamwoorden zijn:
In het CGN: goed, heel, gewoon, eigenlijk, ander, natuurlijk, leuk, groot, lang
In het PAROLE-corpus: goed, groot, nieuw, lang, hoog, oud, mogelijk, klein, belangrijk

De meestgebruikte werkwoorden zijn:
In het CGN: zijn, hebben, gaan, kunnen, moeten, zeggen, doen, zullen, worden, weten
In het PAROLE-corpus: zijn, worden, hebben, kunnen, zullen, moeten, komen, gaan, maken, willen

Blij met deze uitleg?

Met een donatie van € 5 steun je Onze Taal. Bedankt!

Toch nog een vraag?

Onze taaladviseurs staan elke werkdag voor je klaar.

Stel hier je vraag