Op 5 September is daar in die New York Times ’n artikel gepubliseer wat ’n opskudding veroorsaak het in die Trump-administrasie. Dit was in die vorm van ’n sogenaamde “Op-Ed”, ’n bydrae waarin daar dikwels kritiek uitgespreek word en op die bladsy teenoor die hoofartikel verskyn (“opposite editorial”). Hierdie artikel was uitsonderlik, om twee redes: Eerstens was dit, op versoek van die skrywer, anoniem, iets wat volgens die redakteur ’n uiters seldsame gebeurtenis is; en tweedens is daar aangedui dat die skrywer ’n senior administratiewe beampte van die president is, en dus deel van die binnekring van die administrasie. Die beskuldiging word onder andere in die artikel gemaak dat Trump wispelturig (“erratic”) is. Voorts word daar aangedui dat daar ’n stille weerstand (“quiet resistance”) onder kabinetslede is, en dat dié kabinetslede stappe oorweeg om van hom ontslae te raak. Dit het uiteraard ’n snydende reaksie by die president ontlok, en die anonimiteit van die skrywer uit vrees vir weerwraak is ook te verstane. ’n Vloedgolf bespiegelings oor die moontlike outeur het gevolg, en daar is veral gefokus op moontlike tekskenmerke op grond waarvan so ’n persoon uitgeken sou kon word.
Hoewel hier nie werklik sprake is van ’n strafregtelike of siviele misdaad nie, is die identifisering van anonieme outeurs, veral by lastersake en botsende aansprake op outeurskap van tekste waarby intellektuele eiendom ’n faktor is, ’n aktiwiteit wat gereeld deur forensiese linguiste onderneem word. Die prosedure om ’n outeur van ’n artikel soos die onderhawige te identifiseer, sou dus vanuit die perspektief van ’n forensiese linguis beskryf kon word.
Die aanname word gemaak dat ’n skrywer (of sprekers), benewens opsigtelike voorkeurvorme wat deur lesers (of hoorders) herken kan word, ook onbewustelik voorkeur gee aan die gebruik van sekere grammatikale woorde, iets wat statisties (dus kwantitatief) aangedui kan word met behulp van konkordansieprogrammatuur, soos bv Wordsmith, wat deur Oxford University Press ontwerp is. Dit word ’n stilometriese ontleding genoem, aangesien die gebruikstyl van die outeur kwantitatief gemeet word. Indien die aantal moontlike outeurs beperk is, wat gewoonlik wel die geval by so ’n ondersoek is, is daar meestal ’n statisties beduidende verskil in die frekwensie van algemeen gebruikte woorditems (en spesifiek grammatikale woorde) by twee of meer sulke outeurs. ’n Ontleder sou dus twee tekste op dié wyse met mekaar vergelyk met die oog daarop om beduidende verskille te identifiseer. Indien twee sulke tekste nou nie beduidend van mekaar verskil nie (binne ’n foutgrens van 5%), word ’n stilistiese analise onderneem, met die fokus op aantoonbare ooreenkomste tussen die betrokke tekste. Dit kan enige van ’n verskeidenheid tekskenmerke insluit, soos spelling, woordeskatitems, punktuasie, en dies meer. Nog ’n moontlike gemeenskaplike kenmerk is die groepering van woorde wat met ander kombineer en waarvan die voorkoms binne ’n korpus tekste (bv die British National Corpus, wat meer as 100 miljoen woorde beslaan), of op die internet, vasgestel kan word. As daar aangetoon kan word dat daar ’n duidelike, of selfs unieke ooreenkoms tussen twee tekste bestaan, nadat die statistiese ontleding met die oog op beduidende verskille tussen die twee tekste nie sulke verskille kan bevestig nie, kan daar met stelligheid aanvaar word dat een outeur vir beide tekste verantwoordelik is.
Wat betref die bruikbaarheid van sulke tekste, is die aard van die teks ’n belangrike faktor, aangesien eiesoortigheid grootliks bepaal word deur die uitoefening van ’n keuse uit die beskikbare taalvorme. Formele dokumente of briewe, wat gekenmerk word deur ’n geykte uitdrukkingswyse, is van veel minder waarde vir so ’n ontleding as ’n teks wat spontaan en sonder voorskrif neergepen (of ingesleutel) is. Daarby is die hoeveelheid teks uiteraard ook van belang, aangesien die waarskynlikheid van herhaling van bepaalde grammatikale woorde (funksiewoorde) of patrone in die geval van langer tekste groter is.
In die geval van die Op-Ed-teks sou die teks wel bruikbaar (en ontleedbaar) wees indien soortgelyke tekste deur die vermeende outeur(s) beskikbaar is. Die artikel is feitlik 1 000 woorde lank, heeltemal voldoende, en hoewel dit waarskynlik vir plasing geredigeer is, is die styl van aanbieding informeel en kenmerkend van ’n persoonlike uitdrukkingswyse. Informele tekste bevat ’n relatief groter persentasie grammatikale woorde as formele tekste, wat meer inhoudswoorde (leksikale woorde) bevat, en ook tekstueel digter is. Dit beteken dat informele tekste ’n groter persentasie ontleedbare items bevat en dus van meer waarde is vir die doel van outeursidentifikasie.
Die outeur van die Op-Ed-teks sal bes moontlik mettertyd deur die redakteur openbaar gemaak word wanneer dit “veilig” is en die outeur nie meer die gevaar loop om “aan die kaak” gestel te word en aan vergeldingsmaatreëls deur Trump blootgestel is nie. Aan die ander kant sou die president die dienste van ’n forensiese linguis kon bekom en tekste van vermeende “skuldiges” vir vergelykingsdoeleindes beskikbaar kon stel —indien tekste deur die werklike outeur geskryf deel vorm van die data, en so ’n linguis hom/haar met die gevolge van sodanige diensverlening kon versoen. ’n Deeglike ontleding sou eerstens die waarskynlikheid van outeurskap in ’n eerste ronde (dws as resultaat van ’n stilometriese ontleding) kon uitskakel indien beduidende verskille deur die statistiese chi-kwadraattoets uitgewys word. Indien nie, sou moontlike gemeenskaplike outeurskap van die anonieme en bevestigde tekste berus op kenmerke wat dan in die stilistiese ontleding na vore kom. Belangrik is dat beide ontledings, wat onderling ondersteunend is, nodig is voordat daar met sekerheid tot ’n gevolgtrekking gekom kan word.
Kommentaar
Die skrywer van so 'n anonieme artikel sou natuurlik doelbewus kon probeer om sy kenmerkende styl te verdoesel, deur dit byvoorbeeld met Google Translate na Frans of Duits te vertaal en terug na sê maar Britse Engels, met na elke vertaalstap 'n redigering om die outo-vertaler se mistastings reg te stel. Sou Wordsmith daarna meer kon doen as om te sê die artikel lees asof dit uit Frans of Duits vertaal is?
Elke keer wanneer 'n vertaling van 'n bronteks gedoen word, elektronies of andersins, kom daar 'n nuwe outeur aan boord en vervaag die moontlikheid om die oorspronklike outeur se taalkeuses stilisties of stilometries vas te lê en te ontleed. Individualiserende kenmerke kan ten beste in spontane en informele tekste opgespoor word. Dis nie onmoontlik om 'n outeur te identifiseer wat sy taalgebruik doelbewus manipuleer nie, maar dan net as daar 'n unieke afwyking of fout voorkom waarvan so iemand onbewus is - iets wat inderdaad onlangs wel voorgekom het.