Hoe oud zijn woorden als quatsch en overnieuw? Sinds wanneer komt de constructie 'een aantal mensen zijn' voor? Zulke vragen zijn met het digitale krantenarchief van de Koninklijke Bibliotheek een stuk makkelijker te beantwoorden dan voorheen.

Aleid Fokma | 15 juni 2010

Digitaliseren is hot. Dankzij het Meertens Instituut kunnen we onze familieleden en onze voornaamgenoten traceren. En de Koninklijke Bibliotheek voegt daar nog het nodige aan toe. Eén miljoen krantenpagina's zijn sinds een paar weken digitaal doorzoekbaar. En daar komen er nog zeven miljoen bij. Het gaat om het krantenarchief van de KB, dat in een omvangrijk project gedigitaliseerd wordt.

Vierhonderd jaar

Al die kranten zijn gescand, en op de pdf's van de pagina's is een tekstherkenningsprogramma (ocr) losgelaten. Het resultaat is een website waarop je vierhonderd jaar aan krantenhistorie (gratis) kunt doorzoeken. Een schat aan informatie; niet alleen voor historici, maar voor iedereen die iets wil opzoeken - bijvoorbeeld over de geschiedenis van je familie. En ook voor taalkundigen - en andere taalliefhebbers - is er veel te beleven.

Quatsch

Zo vroeg iemand ons onlangs of zij het woord quatsch ('onzin') kon gebruiken in een roman die in de jaren dertig van de vorige eeuw speelt. Onze gewone bronnen hielpen ons niet verder met het antwoord op deze vraag. Het Etymologisch Woordenboek van het Nederlands vermeldt het woord niet; Van Dale geeft als datering '1926-1950', en het oudste citaat van het Woordenboek der Nederlandsche Taal komt uit 1940.

Hier biedt het krantenarchief uitkomst: het werd al in 1912 gebruikt. In een verhaal over 1930 is het dus zeker geen onzin om quatsch te gebruiken.

Overnieuw

Ook leuk om te onderzoeken: hoelang komen (vermeende) taalfouten al voor? Het woord overnieuw is veel mensen een doorn in het oog - een verhaspeling van over en opnieuw. Wat leert het KB-archief ons? Het kwam al in 1868 voor in het Dagblad van Zuidholland en 's Gravenhage. Misschien een regionale afwijking, maar in het landelijke Algemeen Handelsblad werd het toch ook al in 1906 gebruikt. Is een woord dat al meer dan honderd jaar gebruikt wordt nog fout te noemen? Het is een interessante vraag.

Een aantal worden verzocht

Of neem een omstreden zinsconstructie als 'een aantal mensen zijn'. Veel mensen vinden dat dat zijn fout is; er moet is staan. In het KB-archief vind je in een krant uit 1772 de zinsnede: "waar in reeds een aantal Portien ingeteekent zyn", en uit 1779: "een aantal zijn daardoor reeds in 't Graf gesleept". Natuurlijk zijn er ook veel treffers met het enkelvoud, maar het meervoud komt toch met enige regelmaat voor.

En is het 'de mensen wordt verzocht' of 'de mensen worden verzocht'? Taalkundigen vinden het allebei goed, strenge schoolmeesters keuren het meervoud af. Toch blijkt dat meervoud juist de oudste papieren te hebben: "Sollicitanten worden verzocht zich in persoon aan te melden" was in de negentiende eeuw een heel gewone zin in personeelsadvertenties.

Verbeteringen

Er zijn dus interessante dingen te vinden in het krantenarchief. Het kan ons nieuwe inzichten bieden in de herkomst van woorden en constructies. En als er straks acht miljoen pagina's te raadplegen zijn - acht keer zo veel als nu - dan wordt dat alleen maar beter.

Hopelijk worden enkele kinderziektes in de toekomst ook nog verholpen. Het omzetten van beeld naar tekst is niet altijd goed gegaan; vooral bij oudere kranten is de foutmarge groot. Dat heeft tot gevolg dat wie zoekt op baby veel pagina's vindt waarop naby (of nabij) blijkt te staan. Het eerdergenoemde quatsch leverde ook treffers op met Duitsch en maatsch. (als afkorting van maatschappij), en als je naar verloedering zoekt, vind je verteedering en verbroedering.

Maar ondanks deze bezwaren biedt het archief een prachtige blik in ons (talige) verleden - en urenlang vermaak bij het doorzoeken van de kranten.


Meer Nu.nl-columns van Onze Taal