Wat zijn de meestgebruikte woorden in het Nederlands?
Deze vraag is moeilijk te beantwoorden. We doen hieronder een poging.
Wat de meestgebruikte woorden in het Nederlands zijn, is niet zo eenvoudig vast te stellen. Dat komt deels door het verschil in woordgebruik tussen spreektaal en schrijftaal. Een woord als ik komt in spreektaal veel vaker voor dan in schrijftaal. Dat komt ook doordat schrijftaalonderzoek zich baseert op kranten, tijdschriften en boeken, en niet op weblogs en Twitterberichten. Een tweede probleem bij het tellen van woorden is het verschil tussen woordvormen en lemma’s. Woordvormen zijn de woorden zoals ze uitgesproken of geschreven zijn, zoals wordt, plantjes en ’t. Lemma’s zijn de vormen die in woordenboeken zijn opgenomen, zoals worden, plant en het. Bij een telling van woordvormen worden zelfs woorden die met een hoofdletter worden geschreven omdat ze aan het begin van de zin staan, apart geteld van dezelfde woorden met een kleine letter (zoals de en De).
De frequentie van woorden kan bepaald worden aan de hand van grote bestanden met (gesproken of geschreven) teksten, corpora genoemd. Het Instituut voor de Nederlandse Taal werkt aan het Corpus Hedendaags Nederlands. Dat corpus bestaat uit vele tientallen miljoenen woordvormen.
Het overzichtje hieronder is gebaseerd op oudere corpora: het Corpus Gesproken Nederlands (CGN) en het PAROLE-corpus, een verzameling van zo’n 20 miljoen woorden uit boeken, kranten en tijdschriften, uit de periode 1982-1998.
woordvorm (CGN) | lemma (CGN) | woordvorm (PAROLE) | lemma (PAROLE) |
ja dat de en uh ik een is die van 't maar in niet je |
zijn ja dat de ik en het uh een hebben die van maar in niet |
de van het een en in is te dat op De voor met zijn die |
de van het zijn een in en dat op te worden voor met hebben die |
Bij deze woorden gaat het vrijwel altijd om woorden die alleen een grammaticale functie hebben (lidwoorden, voegwoorden, enz.). Er staan enkele werkwoorden tussen, maar geen zelfstandige of bijvoeglijke naamwoorden. Uit de bestanden zijn ook daar wel de meestgebruikte van te vinden.
De meestgebruikte zelfstandige naamwoorden zijn:
In het CGN: beetje, mensen, jaar, tijd, dag, dingen, tijd, man, moment, kinderen
In het PAROLE-corpus: jaar, mens, onderwerp, tijd, dag, gemeente, plaats, uur, land, Nederland
De meestgebruikte bijvoeglijke naamwoorden zijn:
In het CGN: goed, heel, gewoon, eigenlijk, ander, natuurlijk, leuk, groot, lang
In het PAROLE-corpus: goed, groot, nieuw, lang, hoog, oud, mogelijk, klein, belangrijk
De meestgebruikte werkwoorden zijn:
In het CGN: zijn, hebben, gaan, kunnen, moeten, zeggen, doen, zullen, worden, weten
In het PAROLE-corpus: zijn, worden, hebben, kunnen, zullen, moeten, komen, gaan, maken, willen
Blij met deze uitleg?
Met een donatie van € 5 steun je Onze Taal. Bedankt!