Wat is juist: ‘De data is onderzocht op fouten’ of ‘De data zijn onderzocht op fouten’?

‘De data zijn onderzocht op fouten’ is juist. In ict-jargon is ‘De data is onderzocht op fouten’ gebruikelijk, maar dat geldt (nog) niet voor het algemene taalgebruik. 

Data is een meervoudig woord. Het is oorspronkelijk het meervoud van het Latijnse datum, dat letterlijk ‘gegeven’ betekent (en ook ‘dagtekening’, ‘dag’ en ‘tijdstip’). ‘De data zijn onderzocht’ is dus in principe te vergelijken met ‘De gegevens zijn onderzocht.’ Data is echter in de betekenis ‘gegevens, informatie-eenheden’ als woord op zichzelf in gebruik gekomen - weinig mensen zien er nog het meervoud van datum in.  

Ict-jargon: de data is

Volgens alle woordenboeken is data een meervoud. Toch komen zinnen als ‘De data is onderzocht’ geregeld voor, vooral in het jargon van ict-medewerkers en statistici. Zij gebruiken data als een verzamelterm, vergelijkbaar met informatie. In de computerwereld en de statistiek lijken zinnen als: ‘De data is overgezet’ en ‘De data kan verwijderd worden’ volkomen ingeburgerd. De Dikke Van Dale (2015) maakt hier ook een opmerking over, maar neemt data toch alleen als meervoud op. In algemene teksten is de data is/wordt/zal ... nog niet geaccepteerd. 

Het Engels zou mede van invloed kunnen zijn op het gebruik van het enkelvoud na data. In het Engels komt ‘the data is/has/...’ namelijk ook vaak voor. Verschillende Engelse taalkundigen vinden dat dat niet meer hoeft te worden afgekeurd. Maar ook in het Engelse taalgebied is niet iedereen het daarmee eens.