Wat zijn de meestgebruikte woorden in het Nederlands?

Wat de meestgebruikte woorden in het Nederlands zijn, is niet zo eenvoudig vast te stellen. Dat komt deels door het verschil in woordgebruik tussen spreektaal en schrijftaal. Een woord als ik is in spreektaal heel gewoon, maar in schrijftaal veel minder; dat komt ook doordat schrijftaalonderzoek zich baseert op kranten, tijdschriften en boeken. Een tweede probleem bij het tellen van woorden is het verschil tussen woordvormen en lemma's. Woordvormen zijn de woorden zoals ze uitgesproken of geschreven zijn, zoals wordt, plantjes en 't. Lemma's zijn de vormen die in woordenboeken zijn opgenomen, zoals worden, plant en het. Bij een telling van woordvormen worden zelfs woorden die met een hoofdletter worden geschreven omdat ze aan het begin van de zin staan, apart geteld van dezelfde woorden met een kleine letter (zoals de en De).

De frequentie van woorden kan bepaald worden aan de hand van grote bestanden met (gesproken of geschreven) teksten, corpora genoemd. Voor gesproken taal is er bijvoorbeeld het Corpus Gesproken Nederlands (CGN). Daarin is zo'n 900 uur spreektaal opgenomen en woord voor woord uitgeschreven. Voor geschreven taal is het recentste corpus het PAROLE-corpus, een verzameling van zo'n 20 miljoen woorden uit boeken, kranten en tijdschriften, uit de periode 1982-1998.

woordvorm (CGN) lemma (CGN) woordvorm (PAROLE) lemma (PAROLE)
ja
dat
de
en
uh
ik
een
is
die
van
't
maar
in
niet
je
zijn
ja
dat
de
ik
en
het
uh
een
hebben
die
van
maar
in
niet
de
van
het
een
en
in
is
te
dat
op
De
voor
met
zijn
die
de
van
het
zijn
een
in
en
dat
op
te
worden
voor
met
hebben
die

Bij deze woorden gaat het vrijwel altijd om woorden die alleen een grammaticale functie hebben (lidwoorden, voegwoorden, enz.). Er staan enkele werkwoorden tussen, maar geen zelfstandige of bijvoeglijke naamwoorden. Uit de bestanden zijn ook daar wel de meestgebruikte van te vinden.

De meestgebruikte zelfstandige naamwoorden zijn:
In het CGN: beetje, mensen, jaar, tijd, dag, dingen, tijd, man, moment, kinderen
In het PAROLE-corpus: jaar, mens, onderwerp, tijd, dag, gemeente, plaats, uur, land, Nederland

De meestgebruikte bijvoeglijke naamwoorden zijn:
In het CGN: goed, heel, gewoon, eigenlijk, ander, natuurlijk, leuk, groot, lang
In het PAROLE-corpus: goed, groot, nieuw, lang, hoog, oud, mogelijk, klein, belangrijk

De meestgebruikte werkwoorden zijn:
In het CGN: zijn, hebben, gaan, kunnen, moeten, zeggen, doen, zullen, worden, weten
In het PAROLE-corpus: zijn, worden, hebben, kunnen, zullen, moeten, komen, gaan, maken, willen