|
Opsomming
Individue beskik elk oor ’n unieke idiolek wat op ’n multimodale wyse uitgedruk kan word. Die begrip idiolek verwys na sowel die unieke taalgebruik van bepaalde individue as die feit dat teksskrywers na gelang van hulle taalgebruik geïdentifiseer kan word. Hierdie artikel fokus op die idiolek van Joan Hambidge soos sigbaar in haar werke oor die grense van genres en lewer verslag oor ’n empiriese ondersoek wat geloods is om haar idiolek oor multimodaliteite en genres heen te ondersoek. Die empiriese ontleding het bestaan uit ’n inter- en intrakorpusondersoek wat die vorm van beide ’n stilistiese en ’n stilometriese ontleding aangeneem het. Ten einde die idiolek van Hambidge te kon identifiseer, is die Taalkommissiekorpus as die verwysingskorpus gebruik. Die verwysingskorpus is gebruik om te bepaal of die idiosinkratiese kenmerke wat uit die Hambidge-korpus verkry is, wel uniek aan Hambidge se idiolek was. Die toepassing en uitvoering van die verskillende metodes wat in hierdie artikel bespreek word, het dit moontlik gemaak om die aard van Hambidge se idiolek, oor die grense van die genres waarin sy skryf, te bepaal, asook hoe sigbaar hierdie idiolek is oor die grense van die verskillende genres waarin sy skryf. Bevindinge toon dat Hambidge sonder twyfel oor ’n kenmerkende idiolek beskik wat oor die grense van genres waargeneem kan word. Hierdie artikel hou ook ’n metodologie voor wat gebruik kan word wanneer bepaalde skrywers se idiolekte ondersoek en geïdentifiseer word en het spesifiek ten doel gehad om die idiosinkratiese kenmerke van Hambidge se idiolek te bepaal deur die toepassing van die metodologie wat geïdentifiseer is.
Trefwoorde: Joan Hambidge; idiolek; korpus; korpuslinguistiek; multimodaliteit; skrywerskapverifikasie; taalidentiteit; taaluniekheid
Abstract
Multimodal idiolectal language use and authorship verification: a corpus analysis of Joan Hambidge’s idiolect across the borders of genres
Individuals have unique idiolects or distinctive ways in which they use language and these idiolects can also be expressed multimodally in terms of different modes of delivery and through technology. The concept idiolect refers to the unique language usage as well as the fact that the writer of a text can be identified through their unique use of language. This article focuses on the idiolect of the Afrikaans-speaking writer Joan Hambidge. This writer was chosen as she publishes in different genres and modalities. Despite her being a prominent poet in Afrikaans it was decided within this research to focus on her work in terms of prose, academic texts and popular online texts. Furthermore, her idiolect was approached as its uniqueness is evident in her texts across different genres. The aim of this article was to provide an overview regarding her idiolect across different modalities and genres.
The notion of unique use of language that is distinguishable between language users has been discussed at length in the literature and research in this regard has gained popularity in different scientific disciplines over the past few years. This notion of a unique idiolect is an important feature of authorship identification studied within forensic linguistics. But there is even research published in terms of idiolects from literary perspectives and such views need to be considered when working with literary texts. Although strategies from forensic linguistics can be used in various disciplines, authorship identification and authorship verification can specifically give an answer to two important questions: (1) What is the meaning of a text? and (2) Who is the author of a text? Therefore, the author of a text can be identified by his/her use of language. This article focused on Joan Hambidge’s recognisable idiolect across the boundaries of genres and modalities.
The unique and recognisable idiolect of Hambidge was explored in terms of the different genres she writes in. By making use of forensic linguistics principles, methods and applications, it has been shown in other studies that it is possible to determine an individual’s idiolect. Hence, in this explorative study similar methods were employed. Even though forensic principles are specifically focused on identifying an author, the methodology used in the research field can be applied to a corpus linguistic study to determine how clearly an individual’s idiolect features across the boundaries of genres and multimodalities. Such insights might also have further implications regarding the interpretation of texts for literary purposes, for example.
By researching the research subject, explaining her oeuvre, creating a literary background, as well as discussing the literary approaches that Hambidge uses in her respective genres, and what she writes about, the necessary background was created in order to determine a complete image of Hambidge and her influences. By reviewing this background, it was possible to determine which external factors could have an influence on Hambidge's idiolect.
Furthermore, literature on relevant linguistic and sociolinguistic theoretical perspectives was also reviewed. In this regard, a background to forensic linguistics is provided, as well as an overview of the various corpus linguistic methods that can be used in a study such as this one. Following the background an overview of the methodology used in this research is provided, and the empirical analysis is discussed. This discussion covered both stylistic and stylometric analyses that were performed by making use of inter- and intra-corpus comparisons, according to which Hambidge’s idiolect was identified.
In the identification process of Hambidge’s idiolect, a selection from the Afrikaans Language Commission (Taalkommissie) corpus – the largest available corpus for Afrikaans – was used as a reference corpus. This was done to determine whether the idiosyncratic characteristics that were found in the Hambidge corpus truly are unique or whether they can also be found in the Afrikaans Language Commission corpus that includes wider use of Afrikaans by many different individuals. In this regard, the use of specific similar genres in the Afrikaans Language Commission corpus was essential. The application and execution of the methods identified for this research made it possible to determine to what extent, if at all, Hambidge has a unique identifiable idiolect, across the boundaries of genres.
The research determined that the idiolect of Joan Hambidge across the boundaries of genres shows unique identifiable features and that the idiolect is especially clear when an analysis is done with her corpus in its entirety. When Hambidge’s separate genres were compared with each other, it was clear that genre influences idiolect, but also that Hambidge did not follow prescribed genre conventions. Even though the two novels (one of which was published only as an e-book) that were compared did not match as was expected, the other genres did correspond. Various categories were identified, from which distinguishing characteristics could be found in Hambidge’s corpus. Specific unique elements were identified in terms of Hambidge's use of pronouns, prepositions and connectives. Through the stylistic analysis, unique use of eponyms, code-switching, parenthesis, punctuation, compounds and derivatives, changing of common nouns to proper nouns, omissions in spelling and the use of specific spelling variants were evident. It appears that the idiolect of Joan Hambidge is not clearly visible in terms of the comparison in use of pronouns, prepositions and connectives between the specialist and reference corpora. As far as the internal comparison is concerned, differences were identified in terms of prepositions and connectives. There is evidence that in terms of vocabulary selection there are differences between genres and modalities within the specific idiolect. However, in investigating the differences between die corpora in terms of keyness, the differences between genres and multimodalities in Hambidge's corpora were not found to be distinct. Yet the distinctness of the idiolect was verified, and this conclusion is also supported by the stylistic analysis.
It can therefore be said without a doubt that Hambidge has a unique multimodal idiolect functioning across the boundaries of genres. Furthermore, the methodology followed in this article presents a possible set of variables to be used in similar comparisons between texts in terms of the verification of authors. In addition, it is clear that the process should be refined in future studies by comparing different authors and different combinations of genres and multimodalities. Especially in Afrikaans further such studies are needed.
Keywords: authorship verification; corpus; corpus linguistics; Joan Hambidge; idiolect; language identity; multimodality
1. Inleiding
Individue kies wat hulle sê, hoe hulle dit sê, en ook waarom hulle dit sê. Die spreker se “stem” (die spesifieke woorde wat deur die individu gekies word) word dus strategies aangepas om te verseker dat die verlangde resultate met die boodskap (hetsy gesproke of geskrewe) behaal word (Johnstone 2000:405). Die skrywer se identiteit kan beskou word as ’n stel karaktereienskappe van retoriese standpunte en taalstyle wat doelbewus gekies word, en daarom kan ’n individu se identiteit beskou word as ’n doelbewuste keuse om ’n bepaalde gehoor te bereik, of om ’n doelbewuste boodskap uit te dra. Om hierdie spesifieke gehoor te bereik, maak skrywers taalkeuses wat as kenmerkend van die individu se taal beskou word. Hierdie taalkeuses word dan binne die konteks van bepaalde genres en modaliteite geneem.
Bateman e.a. (2017:7) beskryf multimodality as “a way of characterising communicative situations (considered very broadly) which rely upon combinations of different ‘forms’ of communication to be effective”. Hier gaan dit dus ook oor die meng van verskillende modusse (vgl. Bezemer en Kress 2008). Volgens Kress (2003:25) is ’n modus ’n kultureel- en sosiaal-aangepaste hulpbron vir die voorstelling en kommunikasie. In hierdie artikel word “multimodaliteite” verstaan as die meng van beide gedrukte en elektroniese modusse. Hierteenoor word genres met betrekking tot talige inhoud en struktuur onderskei.
Schmitt, Grandage en Adolphs (2004:138) postuleer dat individue oor ’n eie, unieke patroonmatigheid beskik wanneer hulle taal gebruik. Dit wil sê dat individue, na gelang van hul ondervinding en blootstelling aan taal, oor ’n kenmerkende en unieke woordeskat (oftewel patroonmatigheid met betrekking tot die wyse waarop hulle taal gebruik) en voorkeur in woordorde sal beskik. Hoey (2005:181) bevestig Schmitt e.a. (2004:138) se stelling deur aan te voer dat individue se taalgebruik uniek is, aangesien individue leksikale items verskillend in hul geskrewe en gesproke kommunikasie gebruik. Hierdie taalgebruik is dan, soos Kress (1997:9) aandui, met betrekking tot alle tekens en boodskappe altyd multimodaal van aard. Ongeag die genre kan tekste dus ook verskillende visuele aspekte, of “modes of information” (Bateman 2008:1), bevat. Multimodaliteit is ook juis in hierdie studie van belang, aangesien aanlyn tekste as deel van die korpus gebruik is (vgl. afdeling 2.3).
Hierdie kenmerkende taalgebruik van individue word as die persoon se idiolek gedefinieer, en verwys na die individu se unieke en kenmerkende taalgebruik2 en die wyse waarop persone hulle taal doelbewus gebruik (vgl. Grant 2010:509; Kraljic, Brennan en Samuel 2007; Kuhl 2003:4; Lancashire 1999:727; Wu, Lee en Liang 2009:127–8). Hierdie taalgebruik is uniek aan gebruikers en kan as ’n linguistiese taalafdruk van individue beskou word (vgl. Eckert 2008:456; Irizarry 1992:104; Johnstone 2000:417; Johnstone 2011:660; Kuhl 2003:4; Louwerse 2004:2; Mollin 2009:368-72; Newman 2010:1; Olsson 2008:29).
Wanneer daar ondersoek ingestel word na die idiolek van ’n bepaalde individu, word hierdie ondersoek (in die forensiese linguistiek) uitgevoer ten einde te bepaal wie die werklike skrywer van ’n bepaalde teks is. Volgens Brocardo, Traore, Saad en Woungang (2013) kan daar tussen drie verskillende perspektiewe met betrekking tot skrywerskapontleding onderskei word, naamlik: skrywerskapidentifikasie (dit bepaal wie die mees waarskynlike skrywer van ’n teks is); skrywerskapverifikasie (dit bepaal of ’n spesifieke dokument of dokumente wel deur ’n bepaalde skrywer geskryf is al dan nie); en ’n skrywerskapkarakterskets (dit ondersoek die kenmerke van ’n bepaalde teks ten einde te bepaal wat die moontlike geslag, kultuur en ouderdom van die skrywer van ’n teks is).
Aangesien die ondersoekte korpus in verskeie genres verdeel is, is dit belangrik om die begrip genre ook duidelik te definieer. Hambidge (1991:148) beskryf genre as die tipologie of klas waartoe ’n literêre werk behoort. Volgens Crystal (2008:210) kan genre in sosiolinguistiek, diskoersontleding en stylleer beskou word as ’n vereenvoudiging van ’n begrip wat algemeen in die letterkunde voorkom. Kress (1997:114), wat genre ook met betrekking tot multimodaliteit benader, merk op dat genres “are the effects of the social organization of the occasions in which we interact whether through language – spoken or written – or with any other media or mode”. Verder stel Kress (2003:83) dit dat genre “deals not with what is talked about, what is represented in the sense of what issues, but with who acts (and) in relation to whom, with the question of purposes” (beklemtoning deur oorspronklike skrywer). Vir die doel van dié studie word genre beskou as die unieke kategorie van tekste oor multimodaliteite heen wat op grond van talige sosiale behoeftes onderskei word (die genres wat in die gekose Hambidge-tekste onderskei kan word, word in afdeling 3.3 hanteer).
In hierdie artikel is die taalprofiel van die geïdentifiseerde “ondersoeksubjek”3 ondersoek ten einde te bepaal of die idiolek van die ondersoeksubjek wel oor die grense van genres waargeneem kan word. Na gelang van Brocardo e.a. (2013) se onderskeid tussen die verskillende benaderings tot skrywerskapontleding is hierdie studie uit die perspektief van skrywerskapverifikasie uitgevoer.
Coulthard (2013:447) voer aan dat die voorkoms van “gedeelde leksikale items” kenmerkend hoër is wanneer tekste (ongeag die skrywer) uit dieselfde genre of tekste met dieselfde onderwerp ondersoek word. Johnson en Wright (2014:41) sluit by Coulthard aan deur te sê dat alhoewel verskillende skrywers oor dieselfde onderwerp skryf (of selfs met dieselfde doel voor oë), mag die wyse waarop hulle skryf, steeds kenmerkend verskil. Volgens Brainerd (1974)4 mag ’n metode wat suksesvol blyk te wees vir die identifikasie van ’n skrywer in een genre nie noodwendig in ’n ander genre suksesvol wees nie, aangesien die skryfstyle in die onderskeie genres verskil. Stamatatos (2009:548) ondersteun Brainerd se argument rakende skrywerskapidentifikasie en postuleer dat tekste wat deel van dieselfde genre uitmaak, meer ooreenkomste toon, en dit daarom makliker sal wees om die skrywer van so ’n teks, waar die tematiese inhoud ooreenkomste toon, te identifiseer.
Op grond van bostaande uiteensetting ontstaan die vraag: Hoe herkenbaar is die idiolek van ’n enkele skrywer wanneer die ondersoek na hierdie individu se idiolek oor die grense van genres uitgevoer word? Die fokus van hierdie artikel is om vas te stel of daar ’n herkenbare idiolek geïdentifiseer kan word, soos moontlik teenwoordig in die verskillende genres van Joan Hambidge se oeuvre. Die vrae wat dus gestel word, is: Wat is kenmerkend van die idiolek van Joan Hambidge, en is dit sigbaar oor die grense heen van multimodaliteite en genres waarin sy publiseer? Die doelstelling van die artikel kan opgesom word as ’n korpuslinguistiese ondersoek ten einde Hambidge se skrywerskap oor die grense van genres te verifieer.5
2. Teoretiese raamwerk
Alvorens daar oor die empiriese ondersoek verslag gelewer kan word, moet daar ’n teoretiese agtergrond verskaf word. Om die onderskeie doelwitte van hierdie artikel te bereik, word enkele terme bespreek.
Idiolek, skrywerskapverifikasie en korpuslinguistiek is terme wat sentraal tot die studie staan en derhalwe die nodige teoretiese kontekstualisering skep. Verder word taal en interne variasie aanvanklik ook vlugtig voorgehou. Die terme taal, taalvariasie, idiolek, skrywerskapidentifikasie en korpuslinguistiek kontekstualiseer dié navorsing en bied ook die agtergrond waarteen die navorsingsmetodes bepaal is en die uiteindelike empiriese ondersoek uitgevoer is.
2.1 Taal en interne variasie
Alvorens idiolek voorgehou en bespreek kan word, is dit belangrik om eers die terme taal en interne variasie te bespreek.
Volgens Crystal (2008:265) verwys taal na die menslike stelsel van spraak. In die eenvoudigste vorm kan daar na taal verwys word as die konkrete handeling van spraak, skryf of gebare. Van Rooy (2014:5) argumenteer dat taal in die algemeen beskou kan word as “daardie middel wat mense gebruik om met mekaar te kommunikeer en hulle denke uit te druk”. Langacker (1973:54) voer aan dat elke taalhandeling inherent ’n kreatiewe handeling is, en dat die individu se taalgebruik telkens gebaseer word op die taalgebruik van die ontvangers van boodskappe. Taal is meer as net ’n instrument wat betekenis oordra – taal is ook “sosiaal van aard en dit kan ’n spreker in ’n gesprek identifiseer” en in ’n bepaalde verhouding tot aangesprokenes stel (Verhoef 1991:10). Hiermee saam kan genre ook as sosiale konstruk gereken word (vgl. Kress 1997:114). Kress (2003:107) stel dit juis dat hy genre beskou as “that category which realises the social relations of the participants involved in the text as interaction”. Taal vorm deel van die menslike kommunikasiestelsel, en alvorens die kommunikasie as geslaagd beskou kan word, moet sprekers mekaar verstaan. Sprekers moet daarom die gegewe kommunikasiesituasie ontleed en die gepaste taalsisteem gebruik om idees in boodskappe om te skakel wat ontvangers kan ontsyfer en waarop hulle kan reageer.
Alle kommunikasie verg interpretasie, en ten einde geslaagde kommunikasie te verseker, moet die boodskap in ’n kode oorgedra word wat vir beide die sender en die ontvanger verstaanbaar is. Daar kan aangevoer word dat die sosiale konteks waarin sprekers hulself bevind, die taalgebruik sal beïnvloed en bepaal. Uit die bogenoemde blyk dit dat taal nie net as ’n kommunikasiemedium waardeur boodskappe oorgedra word, beskou kan word nie, maar dat taal ook ’n sosiale verskynsel is waardeur ’n gemeenskap gekenmerk kan word. Hierdie voldoening aan die talige sosiale reëls word deur Kress (2003:90) uitgelig, wanneer die individu se skryfwerk uiteindelik ’n sosiale handeling word deurdat daar aan bepaalde sosiale mag voldoen moet word.
Op grond van individue se moontlike keuses rondom taalgebruik is dit duidelik dat daar talle linguistiese variasies, oftewel taalvariasies, sal voorkom. Die variasietaalkunde plaas die fokus op die moontlikheid dat daar meer as een gepaste woord binne ’n bepaalde situasie gekies kan word, soos bepaal deur die sosiale konteks en die variëteit van die betrokke taal wat gebruik word. Variasietaalkunde is dan ook ingestel op die bestudering van enige soort linguistiese variasie of taalverskeidenheid. Wanneer daar na variasietaalkunde verwys word, word daar onderskeid getref tussen kontak- en interne variasie. Volgens Du Plessis (1988:18) verwys kontakvariasie na die variasie in ’n taal na gelang van kontak met ander tale. Vir die doel van dié ondersoek was kontakvariasie egter nie van belang nie, aangesien daar op die ondersoeksubjek se idiolek gefokus is.
Interne variasie word vervolgens meer breedvoerig bespreek.
Interne variasie verwys na gebruiksvariasie (die situasionele gebruik van taal) en gebruikersvariasie (verskillende dialekte en die invloed wat sprekers se geografiese ligging en sosiale herkoms op die dialek het) (Du Plessis 1988:20). Beide hierdie aspekte sal dan ook uniek wees aan ’n individu. In teenstelling met gebruikersvariasie verwys gebruiksvariasie na die gebruik van ’n taal, oftewel die situasionele gebruik van ’n taal (Du Plessis 1988:20). Sprekers kan keuses maak in terme van hulle taalgebruik en hierdie keuses kan as hulle unieke variëteit, oftewel idiolek, beskou word. Carstens (2006:4–7) argumenteer (in aansluiting by die bogenoemde stelling rakende die situasionele gebruik van taal) dat die sosiale konteks van taal die gepaste taalvorm vir daardie bepaalde kontaksituasie sal bepaal en dat hierdie taalvorm nie noodwendig sal ooreenstem met sogenaamde Standaardafrikaans nie, maar dat dit eerder verwys na die gepaste taalvorm wat binne die gegewe sosiale konteks effektiewe kommunikasie sal bewerkstellig.
In aansluiting by Carstens se argument rakende die gepaste taalvorm binne die gegewe sosiale konteks is daar twee belangrike aspekte wat deel uitmaak van gebruiksvariasie, naamlik styl en register. Styl verwys na die keuse wat skrywers uit moontlike formulerings maak, en hierdie moontlike formulerings het betrekking op sinsbou, woorde, teksbou, onderwerp, doel, leserspubliek en genre (Du Toit en Smith-Müller 2015:15). Register, daarenteen, verwys (vgl. Du Plessis 1988:23) na taal in sosiale situasies en kan gedefinieer word as ’n stel linguistiese verskynsels wat sistematies met bepaalde beroepe of ander soorte sosiale groepe verband hou.
Uit die voorgaande oorsig blyk dit duidelik dat sowel die kommunikatiewe aard van taal as die voorkoms van interne (gebruiks-) variasie ’n invloed op die kenmerkende taalgebruik van ’n individu kan hê. Soos ook in afdeling 1 gemeld is, word taalgebruik wat uniek aan gebruikers is, as ’n linguistiese taalafdruk van individue beskou (Eckert 2008:456; Irizarry 1992:104). Olsson (2008:26) voer egter aan dat die begrip individuele variasie teenoor die populêre begrip van linguistiese vingerafdruk gestel moet word wanneer daar ondersoek na die idiolek van ’n individu ingestel word.
2.2 Idiolek
Uit afdelings 1 en 2.1 blyk dit dat individue oor ’n unieke, kenmerkende wyse beskik waarop hulle taal gebruik ten einde te kan kommunikeer. Langacker (1973:51) beskou idiolek as ’n begrip wat algemeen gebruik word om die kenmerkende taalgebruik van ’n bepaalde individu te beskryf.
Die individu se idiolek kan beskou word as die keuse wat ’n spreker op ’n gegewe tydstip uit al die moontlike keuses maak om te kommunikeer (Bloch 1948:7). Alhoewel daar eers in 1948 formeel na die begrip idiolek verwys is, naamlik deur Bloch in sy artikel “A set of postulates for phonemic analysis”, is dié begrip al vir etlike dekades voor dit ondersoek – Coleridge het byvoorbeeld in 1817 na die verskille in individue se taalgebruik verwys. Kotzé (2007) verwys in dié geval na Augustus de Morgan wat in 1851 ondersoek ingestel het na die skrywers van Bybelboeke deur die lengte van woorde wat gebruik is, na te vors. Olsson (2008) verwys spesifiek na die jare lange ondersoek na die moontlikheid van plagiaat by Griekse dramaturge. Ook Shakespeare se werk is ondersoek, en só het Wilmot in 1785 byvoorbeeld aangevoer dat Bacon die eintlike skrywer van die Shakespeare-tekste was (Love 2002:15; Olsson 2008:18). Alhoewel hierdie kwessie telkens ondersoek is, is daar geen definitiewe standpunt hieromtrent nie.
Idiolek, oftewel die totaliteit van al daardie aspekte wat ’n individu se taal kenmerk, is gevolglik nie ’n nuwe begrip nie. Jakobson (1994:104) verduidelik die begrip idiolek as ’n individu se individuele spreekwyse op enige gegewe tydstip. Jakobson (1994:104) beklemtoon voorts die feit dat individue hul taalgebruik sal aanpas om by ’n bepaalde (kommunikasie-) situasie te pas. ’n Spreker kan derhalwe gemene grond, in die vorm van woorde wat by alle sprekers teenwoordig is, soek. Gevolglik kan daar aangevoer word dat daar nie iets soos “private eiendom” (of dan kenmerkende eienskappe) in taal is nie (Jakobson 1994:104).
Bovermelde stelling is egter deur verskeie taalkundiges as verkeerd bewys. Idiolek is juis daardie aspekte van ’n individu se taalgebruik wat herhaaldelik en onbewustelik gebruik word. Ten einde dié stelling te ondersteun gaan daar eerstens verskeie definisies van idiolek voorgehou word, alvorens die terme skrywerskapverifikasie en korpuslinguistiek bespreek word.
Idiolek kan gedefinieer word as ’n voorstelling van ’n versameling van die individu se eie, persoonlike en unieke karaktereienskappe op ’n gegewe tydstip. Hierdie karaktereienskappe verwys na ’n kombinasie van sosiolekte, gender-invloede en jargon (vgl. Panicheva, Cardiff en Rosso 2010:1134), asook taalgewoontes, taalpatrone en taalmaniere (vgl. Kuhl 2003:4). Panicheva e.a.(2010:1136) sê voorts dat woordbetekenis en die gevoel en waarnemings wat deur middel van taal deur die individu oorgedra word, implisiet in spraak manifesteer en dat dit die taalgebruik van die skrywers tot so ’n mate beïnvloed dat ’n idiolek gevorm word. Die begrip idiolek word deur taalkundiges gebruik om na die taalsisteem van ’n individu te verwys, oftewel die individu se eie dialek (Crystal 2008:235). Volgens Crystal is ’n dialek die samevoeging van verskeie idiolekte.
Benewens ’n taalkundige benadering tot idiolekte, kan hierdie terme ook vanuit die letterkunde benader word. In ’n spesiale uitgawe van Literator (35(2))is navorsing van Heilna du Plooy, Nicholas Meihuizen, Hein Viljoen, Betsie van der Westhuizen, Phil van Schalkwyk, Philip van der Merwe en Susan Meyer oor die idiolekte van skrywers uit ’n literêre hoek hanteer (dit wil sê, daar is spesifiek ondersoek ingestel na die stem van die skrywer en die wyse waarop hierdie unieke stem weergegee word). Volgens Du Plooy (2014:2) is daar ’n geweldige verskeidenheid van moontlikhede wanneer dit kom by die literêre bestudering van idiolekte. Hierdie moontlikhede sluit aspekte in (maar is nie daartoe beperk nie) wat as literêr beduidend beskou kan word (o.a. genre, taalgebruik, tematiek, historiese plasing, die invloed van literêre strominge, en ideologiese en filosofiese paradigmas). In al die bogenoemde artikels was die fokus op “die skrywersidentiteite wat te make het met die unieke en eiesoortige, die kenmerkende styl en die stilistiese en tematiese merkers in die oeuvre van ’n bepaalde skrywer” (Du Plooy 2014:1). Uit hierdie artikels blyk dit dat die skrywersidentiteit duidelik sigbaar is, maar die vraag ontstaan hoe ’n enkele skrywer se idiolek figureer wanneer dit oor die grense van genres ondersoek word.
Die bostaande omskrywings omvat verskeie definisies vir die begrip idiolek. Dit is dus duidelik dat daar nie net ’n enkele opinie of definisie van dié begrip bestaan nie. Wat egter sonder twyfel uit hierdie verskillende definisies duidelik word, is dat individue oor unieke taalkenmerke beskik wat bewustelik of onbewustelik in hulle taalgebruik voorkom. Hierdie unieke taalkenmerke kan op verskeie wyses geïdentifiseer word. In dié artikel sal idiolek vervolgens as die taalsisteem beskou word wat uniek is aan ’n bepaalde individu (voorts ook die ondersoeksubjek genoem) en wat as kenmerkend van dié individu se taalgebruik beskou kan word. Hierdie kenmerkende taaleienskappe is die aspekte van individue se taalgebruik wat herhaaldelik en soms selfs onbewustelik gebruik word – eienskappe wat skrywerskapverifikasie bemoontlik.
2.3 Multimodaliteit en genre
Benewens die korpora wat in hierdie navorsing gebruik word, is ook die kontekste waarin die korpora voorkom van belang. Uit die ontleding van die tekste het dit duidelik geword dat dit nodig is om tussen die korpora in terme van multimodaliteit en genre te onderskei. Soos reeds genoem (afdeling 1) gaan dit by multimodaliteit oor die gebruik van verskillende modusse – in hierdie navorsing word sowel gedrukte as elektroniese tekste of modusse ingespan. Bateman (2008:1) noem dat multimodale dokumente verskillende visueelgebaseerde modusse gelyktydig inspan om bepaalde geïntegreerde kommunikatiewe doelwitte te bereik. Op so ’n wyse dien e-boeke en webwerwe dieselfde doel, veral met die integrasie van verskillende media (hetsy teks en grafika) of selfs hiperskakels.
Genre verwys, volgens Crystal (2008:210) na enige formeel onderskeibare variëteit van ’n taal wat ’n vlak van herkenning behaal het, hetsy in geskrewe of gesproke vorm, en waarin daar ’n identifiseerbare taalstyl aanwesig is. Crystal (2008:482) gaan voort en stel dit dat genre ook na die tekstipe kan verwys, en dat hierdie tekstipes verskil na gelang van kommunikatiewe funksie, en die tekstipes kan geïdentifiseer word op grond van kohesie, koherensie en informatiwiteit. Genres kan verwys na poësie, romans, nuusberigte, advertensies en dies meer.
2.4 Forensiese linguistiek: skrywerskapverifikasie
Hierdie studie is uitgevoer met die fokus op skrywerskapidentifikasie, ten einde die skrywersidentiteit wat in die taal van die skrywer opgesluit is, te identifiseer. Hoe dit ook al sy, die idiolek van ’n individu kan as ’n sentrale argument in skrywer- en sprekeridentifisering, wat as deel van forensiese linguistiek beskou word, gesien word.
Volgens Coulthard (2005:10) kan skrywerskapidentifisering of -verifikasie, wat deel van forensiese linguistiek vorm, antwoorde op een van twee vrae gee: (1) wat die betekenis van bepaalde tekste is, en (2) wie die skrywer van bepaalde tekste is. Die doel van hierdie artikel is om die idiolek van ’n bepaalde skrywer oor die grense van genres te identifiseer, en daarom sal hierdie studie, volgens Coulthard se beskrywing, die vraag “Wie is die skrywer van die teks?” beantwoord.
Nirkhi, Dharaskar en Thakare (2015:641) definieer skrywerskapverifikasie as die aanvaarding van die aanname dat alhoewel daar veranderinge in ’n skrywer se skryfstyl mag voorkom (na gelang van tydsverskille, die genre en die bedoelde teikengehoor), daar ’n enigmatiese skryfstyl teenwoordig is. Volgens Li (2015:13) verwys skrywerskapverifikasie na ’n ondersoek wat uitgevoer word ten einde te bepaal of die bevraagtekende dokumente wel deur ’n spesifieke skrywer geskryf is. Li (2015:13) stel dit voorts dat hierdie tipe navorsing ’n eenvoudige “ja”- of “nee”- antwoord sal gee. Skrywerskapverifikasie verskil van skrywerskapidentifikasie, aangesien skrywerskapidentifikasie na die identifisering van ’n enkele skrywer uit talle moontlike skrywers verwys (m.a.w. wie het die dokument geskryf?). Wanneer skrywerskapverifikasie uitgevoer word, word die vraag gevra: “Is hierdie dokument deur die spesifieke (bekende) skrywer geskryf?”
Koppel en Winter (2014:178) voer aan dat dié vraag deur skrywerskapverifikasie beantwoord kan word. Alhoewel alle vrae wat betrekking het op skrywerskapidentifikasie ook as skrywerskapverifikasie beantwoord kan word, is die teendeel nie waar nie. Hierdie stelling bevestig gevolglik die veronderstelling dat metodes wat gebruik word ten einde skrywerskapidentifikasie uit te voer, ook gebruik sal word in die proses van skrywerskapverifikasie. Alhoewel skrywerskapidentifikasie as die wetenskaplike studie van taal vir toepassing op forensiese ondersoeke (McMenamin 2002:67) beskou word, en hoewel skrywerskapverifikasie alle vrae wat deur skrywerskapidentifikasie beantwoord sou word, kan beantwoord, kan hierdie tipe ondersoeke ook lig werp op kwessies soos taalverandering, taalvariasie en die ooreenkomste wat binne ’n enkele skrywer se taalgebruik oor die grense van genres heen waargeneem kan word.
Die verskillende definisies van skrywerskapverifikasie wat voorgehou is, dui aan dat hierdie perspektief, wat uit die forensiese linguistiek ontstaan het, verwys na die enigmatiese skryfstyl van ’n individu. Dit is ook duidelik dat die vraag: “Is hierdie dokumente deur dieselfde skrywer geskryf?” deur skrywerskapverifikasie beantwoord kan word. Vir die doel van dié artikel word skrywerskapverifikasie beskou as die proses waardeur daar deur ’n graad van waarskynlikheid vasgestel kan word of bepaalde dokumente, ongeag die genre waarin dit geskryf is, deur ’n bepaalde individu geskryf is.
Volgens Coulthard (1994:27, 30) word korpuslinguistiek beskou as een van die belangrikste hulpmiddels vir forensiese linguistiek en dus ook skrywerskapverifikasie. Daar sou aangevoer kon word dat ’n forensies-linguistiese ontleding nie kan plaasvind sonder ’n deeglike oorsig en begrip van korpuslinguistiek nie. Die begrip korpuslinguistiek word vervolgens voorgehou, en daarmee word die beskrywing van die teoretiese raamwerk dan afgesluit.
2.5 Korpuslinguistiek
Fischer-Starcke (2010:62) postuleer dat korpuslinguistiek insig oor taal bied met betrekking tot ’n spesifieke teks (korpus) wat ondersoek word en dat die taalvariasie en patroonmatigheid wat in die betrokke korpus sigbaar word, die gevolg is van ’n deeglike ontleding van die gekose tekste asook ’n vergelyking met ander tekste. Hierdie beskrywing van korpuslinguistiek verwys na die belang van die korpus wat ondersoek word en hoe ’n spesifieke korpus ’n invloed op waarnemings kan hê.
Volgens Baker (2010:5) en McEnery en Wilson (2001:1) is die eenvoudigste definisie van korpuslinguistiek dat dit die studie van taal is gebaseer op die taalgebruik van individue of ’n groep soos wat dit in die werklikheid gebruik word. Korpuslinguistiek omvat ook studies waar tekste in terme van woordeskat en grammatika ontleed word en hoe hierdie faktore met die samehang en die struktuur van die betrokke tekste verband hou (Nesselhauf 2005). Crystal (2008:117) verwys na ’n korpus as ’n versameling linguistiese data, hetsy tekste of transkripsies van gesproke tekste (opnames), wat dan beskou word as ’n beginpunt van ’n linguistiese beskrywing, of as ’n wyse waarop ’n hipotese rakende taal bevestig kan word.
Korpora, en dan korpuslinguistiek (Crystal 2008:117), skep ’n basis vir veral rekenaargebaseerde linguistiek. Deur só ’n ondersoek word die konteks van taalgebruik ook uitgelig. Wanneer die invloed van sosiale faktore op die taalgebruik van bepaalde persone ondersoek word, is korpusontleding van groot nut, aangesien só ’n ontleding woorde wat gereeld gebruik word, asook die konteks waarin dit gebruik word, uitlig. Volgens Nesselhauf (2005) verwys korpuslinguistiek na ’n metode waardeur linguistiese ontledings uitgevoer word. Korpuslinguistiek kan dus omskryf word as die ontleding van taal op grond van gerekenariseerde korpora. So ’n studie word gewoonlik met behulp van gespesialiseerde rekenaarsagteware uitgevoer en fokus op, onder andere, die frekwensie waarmee die verskynsel wat ondersoek word, voorkom (Nesselhauf 2005).
Daar heers egter talle debatte oor die aard van korpuslinguistiek. Korpuslinguistiek word as ’n teorie (korpusgedrewe benadering) óf ’n metode (korpusgebaseerde benadering) beskou. McEnery en Wilson (2001:2) en Nesselhauf (2005) beskou korpuslinguistiek as ’n metode, aangesien ’n korpusgebaseerde benadering antwoorde op taalnavrae rakende sintaksis, semantiek en sosiolinguistiek kan verskaf, en hierdie metode gebruik word om linguistiese ontledings uit te voer. Daarteenoor verwys Tognini-Bonelli (2001:51) na korpuslinguistiek as ’n teorie, aangesien die gebruik van hierdie teorie bydraes kan lewer tot ander navorsingsgebiede, soos opvoedkunde (taalverwerwing), grammatika, dialekstudies, leksikografie, Bybel- en literêre studies, forensiese linguistiek en skrywerskapidentifikasie,
Navorsing rakende die aard van korpuslinguistiek dui daarop dat daar grondige redes is vir die argument dat korpuslinguistiek as ’n metode, ’n benadering, of ’n teorie beskou kan word. Om dit egter as ’n benadering te erken, omsluit beide die metodologiese en teoretiese aard daarvan. Wanneer ’n korpuslinguistiese benadering gevolg word, word daar van ’n korpus gebruik gemaak. Hierdie korpus word ontleed ten einde vrae oor die aard van taal (soos dit daagliks gebruik word) te beantwoord. Aangesien ’n korpuslinguistiese benadering in talle navorsingsgebiede toegepas kan word, is dit natuurlik ook moontlik om korpuslinguistiek in forensiese linguistiek te gebruik wanneer die skrywer van ’n bepaalde teks geïdentifiseer moet word.
’n Korpuslinguistiese benadering sluit ook ’n ondersoek in waar verskillende versamelings tekste met mekaar vergelyk word. ’n Versameling van tekste in hierdie konteks staan as korpora bekend. Baker (2010:12) en Nesselhauf (2005) verwys na die onderskeid wat tussen die tipes korpora getref kan word, en verwys dan spesifiek na ’n verwysingskorpus (’n prototipiese korpus, wat as ’n voorstelling van die norm van die bepaalde taal beskou word en wat van verskeie bronne afkomstig is, aangesien dit die norm van ’n taal moet voorstel) en ’n gespesialiseerde korpus (doelbewus geselekteerde groep tekste wat ondersoek word om ’n bepaalde vraag te beantwoord).6
3. Metodologie
Die voorgaande afdelings bied ’n oorsig wat die nodige literatuuragtergrond skets waarteen die ondersoek na die verifikasie van die skrywer van die gekose multimodale dokumente uitgevoer kan word. Dit blyk veral uit afdeling 2.5 dat dieselfde metodes wat in skrywerskapidentifikasie toegepas word, ook vir skrywerskapverifikasie gebruik kan word. Die navorsingsmetodologie word vervolgens in die afdeling bespreek.
Ten einde die vraag: “Hoe herkenbaar is die idiolek van ’n enkele skrywer wanneer die ondersoek na hierdie individu se idiolek oor die grense van genres uitgevoer word?” te beantwoord, sal die navorsingsontwerp, die ondersoeksubjek, korpussamestelling en die metode van ondersoek vervolgens bespreek word.
3.1 Navorsingsontwerp
Dié studie was ’n verkennende ondersoek ten einde te bepaal of die idiolek van ’n enkele skrywer wel sigbaar is oor die grense van genres heen. Weens die aard van dié ondersoek is ’n gemengde navorsingsmetode as geskik geag. Die gemengde metode is ’n metode waar beide ’n kwalitatiewe (teksverwante data – stilistiese ontleding) en ’n kwantitatiewe (numeriese data – stilometriese ontleding) metodologie gebruik word (Angouri 2010:29). Deur tradisionele kwalitatiewe en kwantitatiewe navorsingsmetodologieë te kombineer, kan vrae met behulp van bykomende data-ontledings beantwoord word (vgl. Ivankova, Creswell en Clark 2011:270). McMenamin (2002:54) beskryf stilistiese ondersoek as ’n ondersoek na patrone wat eie aan die skrywer se taalstyl is. Barry en Luna (2012:2) stel dit voorts dat stilometrie uit twee prosesse bestaan: (a) die ondersoek na moontlike kenmerke wat ondersoek kan word, en (b) die statistiese verwerking van die voorkoms van hierdie kenmerke.
3.2 Ondersoeksubjek
Die begrip ondersoeksubjek verwys na die individu wat aan die insluitingsvereistes7 van hierdie studie voldoen het. Vir die doel van dié studie is daar gevolglik ondersoek ingestel na verskeie moontlike skrywers, onder wie Hans du Plessis, André P. Brink, Ingrid Winterbach, Etienne Leroux, Jeanne Goosen, Eben Venter, Marlene van Niekerk en Joan Hambidge. Hierdie skrywers is oorweeg omdat hulle nie net oor ’n breedvoerige oeuvre oor genres heen beskik nie, maar ook baie kenmerkend skryf. Hierdie skrywers se oeuvres is ondersoek en daar is bevind dat ’n idiolektiese ondersoek wel moontlik kan wees.
Aangesien dié ondersoek die idiolek van ’n enkele skrywer oor die grense van genres en multimodaliteite heen verifieer, moes daar op ’n enkele skrywer onder die moontlike skrywers besluit word. Joan Hambidge is as ondersoeksubjek gekies, aangesien sy nie net in verskeie genres skryf nie, maar ook so ’n omstrede skrywer is. Hambidge is daarvoor bekend dat sy baie vinnig ’n omvattende oeuvre opgebou het (Fourie 2009:60). Volgens Marais (2005:149) het Hambidge “as digter, romanskrywer, letterkundige, akademikus en polemikus bekendheid verwerf, en het sy die wêreld van die akademie en skeppende skryfwerk bevrugtend op mekaar laat inwerk”. Dit is veral hierdie eienskappe wat Hambidge ’n geskikte en tersaaklike ondersoeksubjek maak.
3.3 Korpussamestelling en dataverwerking
In afdelings 2.4 en 2.5 is forensiese linguistiek en korpuslinguistiek bespreek, terwyl die gemengde-metode-navorsingsontwerp in afdeling 3.1 bespreek is. Alhoewel sommige navorsers korpuslinguistiek as ’n metode of selfs ’n teorie beskou, is korpuslinguistiek in hierdie ondersoek as ’n benadering beskou waardeur die navorsingsvrae beter beantwoord kon word.
Wanneer daar ’n forensies-linguistiese ondersoek uitgevoer word ten einde skrywerskap te bewys, word daar in die meeste gevalle van ’n tipe korpus gebruik gemaak. Coulthard (1994:27, 30) stel dit in dié verband dat korpuslinguistiek as een van die belangrikste hulpmiddels van forensiese linguistiek beskou kan word, en dat enige forensies-linguistiese ondersoek waardeur skrywerskap bewys word, die ontleding van ’n korpus moet insluit. Hierdie stelling word sonder twyfel as geldig bewys wanneer forensies-linguistiese studies – soos deur Solan en Tiersma (2004), Grant (2007), Jones en Bennell (2007), Barlow (2010), Ishihara (2014), Johnson en Wright (2014), Larner (2014a) en Larner (2014b) uitgevoer – bestudeer word.
Ook in Suid-Afrika word korpuslinguistiek, soos die internasionale norm blyk te wees, gebruik as aanvullende benadering waardeur forensies-linguistiese ondersoeke uitgevoer word, soos dit duidelik blyk uit navorsing soos gedoen deur Herbig en Joubert (2006), Klopper (2009), Michell (2013), Thiart (2014), Venter (2013) en Carney (2018). Die gebruik van korpuslinguistiek as ’n benadering om ’n forensies-linguistiese ondersoek uit te voer, kan vervolgens nie net as ’n aanvaarbare gebruik in dié navorsingsarea beskou word nie, maar ook as ’n vinnig-ontwikkelende fokusgebied wat deur die ontwikkeling van rekenaarprogrammatuur bevorder word.
Daar kan tussen twee verskillende soorte korpora onderskei word (Baker 2010:12; Nesselhauf 2005). Die eerste soort korpus word die verwysingskorpus genoem en is ’n prototipiese korpus wat as ’n voorstelling van die norm van ’n bepaalde taal beskou kan word. Die tweede soort korpus is ’n gespesialiseerde korpus – ’n doelbewus gekose groep tekste wat ondersoek word om ’n bepaalde vraag te beantwoord. Vir die doel van hierdie ondersoek is die Taalkommissiekorpus (TK-korpus)8 as verwysingskorpus gebruik en word as die algemene gestratifiseerde korpus, oftewel die verwysingskorpus beskou, terwyl die gespesialiseerde korpus uit ’n samestelling van multimodale tekste deur Joan Hambidge bestaan.
Aangesien daar ondersoek ingestel is na die idiolek van Hambidge oor die grense van genres en multimodaliteite heen, moes die gespesialiseerde korpus bestaan uit tekste uit verskillende genres en multimodaliteite waarin Hambidge skryf. Elektroniese weergawes van haar PhD (“Gender-konstruksie in die Afrikaanse letterkunde: ’n Ondersoek in kultuurstudies, literêre teorie en kreatiewe skryfwerk”), asook twee romans (Sewe Sonjas en wat hulle gedoen het en Palindroom) is gebruik. Dit is belangrik om met betrekking tot die multimodale te noem dat Sewe Sonjas en wat hulle gedoen het een van die eerste literêre e-boeke is wat in Afrikaans verskyn het. Om te verseker dat die korpus as omvattend beskou kan word, is ook elektroniese aanlyn resensies en reisjoernaalinskrywings versamel, en dus is multimodaliteite relevant tot hierdie studie. Die resensies en die reisjoernaal is vanaf die blogwebwerf Woorde wat weeg (Hambidge 2013a) geneem waar Hambidge ’n blog het en waar resensies wat sy skryf, geplaas word.9 Dus was die gespesialiseerde korpus beslis multimodaal van aard.
Ten einde te verseker dat soortgelyke genres ondersoek word, was dit noodsaaklik om eerstens die ooreenstemmende TK-dokumente te identifiseer. Dié keuse is gemaak om te verseker dat die statistiese bevindinge gebaseer is op data wat so verteenwoordigend moontlik is.
Hambidge se korpus (JH-korpus) is saamgestel uit:
- J1 – Sewe Sonjas en wat hulle gedoen het (prosa – roman)
- J2 – Palindroom (prosa – roman)
- J3 – “Gender-konstruksies in die Afrikaanse letterkunde: ’n Ondersoek in kultuurstudies, literêre teorie en kreatiewe skryfwerk” (PhD-proefskrif)
- J4 – resensies (aanlyn resensies)
- J5 – reisjoernaal (aanlyn reisjoernaal).
Die geselekteerde TK-korpus bestaan uit:
- TK1 – Fiksie (prosa – roman)
- TK2 – Fiksie (prosa – roman)
- TK3 – Niefiksie (akademiese proefskrifte en verhandelings: geesteswetenskappe)
- TK4 – Niefiksie (nie-akademiese koerante landwyd: Rapport, Beeld, Die Burger)
- TK5 – Niefiksie (nie-akademiese tydskrifte: algemeen).
In tabel 1 word die totale aantal lopende woorde en sinne in elk van die onderskeie genres wat by die korpora ingesluit is, aangedui.
Tabel 1. Lopende woorde en sinne in elke korpus
Soos in die tabel hier bo gesien kan word, bestaan elk van die onderskeie genres wat by die gespesialiseerde en verwysingskorpora ingesluit is, uit ’n verskillende aantal lopende woorde. Aangesien die TK-korpus ’n bestaande korpus is, was dit nie nodig om enige dataverwerking uit te voer nie, maar in die geval van die JH-korpus, wat spesiaal vir die doel van hierdie ondersoek saamgestel is, moes dataverwerking eers plaasvind alvorens enige ontledings (onder meer die samestelling van tabel 1) plaasgevind het.
Die eerste stap was om te verseker dat daar nie aanhalings van ander skrywers in Hambidge se tekste (veral in haar PhD-proefskrif) was nie. Nadat aanhalings verwyder is, is die dokumente as ongeformateerde teksdokumente (*.txt) gestoor. Uit hierdie formaat kon die afsonderlike lêers in WordSmith Toolsingevoer word en is woordelyste vir elke afsonderlike gedeelte van beide die gespesialiseerde en die verwysingskorpora geskep. Die woordelyste is in die woordelyslêers (MS Excel-lêers) gestoor. Sodoende kon die lêers telkens gebruik word om die ontledings in WordSmith Tools en AntConc uit te voer.
’n Verdere dataverwerking wat voor die aanvang van die ontledings moes plaasvind, was die bepaling van hoe die korpora vergelyk gaan word ten einde die navorsingsvraag te beantwoord. Aangesien die ondersoek oor skrywerskapverifikasie handel, kon daar nie net ’n vergelyking tussen die gespesialiseerde korpus en die verwysingskorpus getref word nie, aangesien literatuur daarop dui dat Hambidge se tekste van die TK-korpus sou verskil. Hierdie verskil kan waargeneem word na gelang van die stelling dat idiolek verwys na die taalsisteem van ’n individu, oftewel die individu se eie dialek (Crystal 2008:235). Om skrywerskapverifikasie moontlik te maak, is daar op ’n interkorpus- en intrakorpusondersoek besluit.
Die interkorpusondersoek is die korpusondersoek wat tussen die tekste uit verskillende genres en multimodaliteite van Hambidge self plaasgevind het. Hierdie ondersoek het beide stilometriese en stilistiese ondersoekmetodes behels. Interkorpusondersoek verwys hier dus na die vergelyking tussen die korpora van Hambidge en dié van die Taalkommissie. Uit die bostaande blyk dit duidelik dat die verskille en ooreenkomste in die ondersoeksubjek se korpus oor verskillende genres en multimodaliteite (JH-korpus) eerstens bestudeer moes word. Daarna is daar ondersoek ingestel na die verskille tussen die JH-korpus en dié van die Taalkommissie (TK-korpus). Die vergelyking tussen die korpora is soos volg gedoen:
Interkorpusondersoek:
- J1 (Sewe Sonjas en wat hulle gedoen het) met TK 1 (Fiksie: prosa – roman).
- J2 (Palindroom) met TK 2 (Fiksie: prosa – roman).
- J3 (“Gender-konstruksies in die Afrikaanse letterkunde: ’n Ondersoek in kultuurstudies, literêre teorie en kreatiewe skryfwerk” – Joan Hambidge ‒ PhD) met TK 3 (Niefiksie. Akademiese proefskrifte en verhandelings: geesteswetenskappe).
- J4 (aanlyn resensies) met TK 4 (Niefiksie. Nie-akademiese koerante landwyd: Rapport, Beeld, Die Burger).
- J5 (aanlyn reisjoernaal) met TK 5 (Nie-akademiese tydskrifte: algemeen).
Die vergelyking van die verskillende korpora se groottes word hier onder getabelleer.
Tabel 2. Korpusgroottevergelyking10
Intrakorpusondersoek:
J1 word vergelyk met J2
J1 word vergelyk met J3
J1 word vergelyk met J4
J1 word vergelyk met J5
J2 word vergelyk met J3
J2 word vergelyk met J4
J2 word vergelyk met J5
J3 word vergelyk met J4
J3 word vergelyk met J5
J4 word vergelyk met J5.
3.4 Metodes van ontleding
Deur van korpuslinguistiese metodes gebruik te maak, kan die idiolek van die betrokke individu geïdentifiseer word. Wanneer daar korpuslinguisties gewerk word, is die volgende parameters van belang:
- Frekwensie: Die eenvoudigste definisie van frekwensie is dat dit verwys na die aantal kere wat ’n leksikale item (’n woord, sinsnede of sin) in ’n korpus (of teks) voorkom. Die frekwensie van die voorkoms van leksikale items is belangrik aangesien dit as ’n vergelykingsbasis kan dien. Indien die JH-korpus byvoorbeeld ’n frekwensie het van 339 vir die leksikale item “soos in”,11 en dié leksikale item kom slegs 190 maal in die TK-korpus voor, is daar gronde vir ’n vergelyking, aangesien die spesifieke leksikale item teen ’n hoër frekwensie in die Hambidge-korpus kan voorkom.
Daar is onderskeidelik 13 235 (JH-korpus) en 15 000 (TK-korpus) tipes woorde in die korpora (tabel 3 dien as ’n voorstelling van die uiteensetting van die korpora). Die leksikale item “soos in”is in beide die JH-korpus en die TK-korpus opgesoek. Daarna is die frekwensie per 10 000 woorde bereken ten einde ’n genormaliseerde waarde12 vir die frekwensies te kan voorhou.
Die formule waarvolgens die frekwensie van leksikale items genormaliseer is, lyk soos volg:
Deur die bostaande formule te gebruik, kan die frekwensie van bepaalde leksikale items in ’n korpus bepaal word, asook hoe dit vergelyk met die korpus wat die taalnorm voorstel. Daardeur kan daar uiteindelik bepaal word of die woorde as uniek met betrekking tot die individu se idiolek beskou kon word. Tabel 3 is ’n voorbeeld van die wyse waarop die bevindinge (genormaliseerde waarde van die frekwensies van leksikale items wanneer die gespesialiseerde korpus en die verwysingskorpus met mekaar vergelyk word) voorgehou word.
Tabel 3. Frekwensieberekeninge van “soos in”
Die korpuslinguistiek-sagteware AntConc[13] en WordSmith Toolsis gebruik om die frekwensies van woorde te bepaal.
- Tipe-teken-ratio (“type-token ratio”) kan bereken word na gelang van die frekwensies (Stamatatos 2009:1‒15). Tipe-teken-ratio verwys na die leksikale variasie van die woordeskat van skrywers. Indien skrywers dieselfde leksikale items (woordtipes) herhaaldelik gebruik, is die tipe-teken-ratio laag en die teks dus nie leksikaal ryk nie (Anon. 2013). Wanneer die tipe-teken-ratio bereken word, is dit belangrik om in ag te neem dat hoe groter die korpus is (totale aantal woorde), hoe waarskynliker is dit dat woorde herhaal sal word. Ter wille van vergelyking is dit belangrik om die aanvanklike bevindinge te bereken na ’n getal uit 1 000 woorde. Die formule hiervoor lyk dan so:
- Ratiobepaling verwys na ’n berekening waardeur die aantal tipes woorde van verskillende tekste met mekaar vergelyk word. Hiermee kan bepaal word watter teks leksikaal die rykste is. ’n Verskil van groter of kleiner as 20%, oftewel groter as 1,2 of kleiner as 0,8, dui ’n sg. praktiese beduidendheid aan (vgl. Van Rooy en Terblanche 2006). Volgens Steyn en Ellis (2006:173) kan bevindinge as prakties beduidend bestempel word wanneer die indeks groot genoeg is en die woord in verskillende kontekste gebruik kan word.
Om die ratio’s te bepaal, is die volgende stappe gevolg:
Nadat ’n spesifieke item in WordSmith Tools gesoek is, is dit, soos reeds genoem, in ’n MS Excel-lêer gestoor. Uit dié lêer is die frekwensie uit 1 000 eers bepaal.
Die frekwensie van ’n spesifieke item uit 1 000 woorde kan soos volg bereken word:
Die frekwensie vir die leksikale item “al” in TK1 is dus soos volg bereken:
Die frekwensie vir dieselfde leksikale item “al” in J1 is soos volg bepaal:
Nadat die frekwensie bepaal is, is die ratio bereken. Ten einde die ratio te bepaal, is die frekwensieresultaat van die JH-korpus deur dié van die TK-korpus gedeel.
Hierdie ratio is gebruik om te bepaal of daar ’n prakties beduidende verskil tussen die JH-korpus en die TK-korpus waargeneem kon word wat leksikale rykheid betref.
Soos reeds genoem, is die praktiese beduidendheid van die gekose leksikale items (hier word na die grammatikale items14 verwys wat in dié ondersoek gebruik is) bereken om sodoende ’n verskil van groter of kleiner as 20%, oftewel >1,2 of <0,8 (vgl. Van Rooy en Terblanche 2006), aan te dui. Ten einde die geldigheid van die bevindinge te staaf, is daar van die statistiek-sagtewareprogram SPSS gebruik gemaak om p-waardes deur middel van gepaarde t-toetse te bepaal. As die p-waarde kleiner as 0,05 is, kan daar gesê word dat daar ’n prakties beduidende verskil bestaan.
- Persentasies is ook telkens by elk van die ratiobepalings se bevindinge bereken. Die persentasies dien as ’n aanduiding van die persentasie voornaamwoorde, byvoorbeeld, wat oor ’n praktiese beduidendheid, al dan nie, beskik. Die persentasies is soos volg bereken:
In elk van die onderskeie afdelings is ’n n-aantal15 woorde opgesoek. Daarna is bepaal hoeveel woorde oor ’n prakties beduidende verskil beskik – dit wil sê, die aantal grammatikale items wat in die vergelyking van die gespesialiseerde en vergelykingskorpus wel oor ’n prakties beduidende verskil van kleiner as 0,05 beskik, is aangeteken. Die getal is afgetrek van die totale aantal items wat gesoek is. Ten slotte is persentasies uitgewerk. Die metode wat gebruik is, kan soos volg voorgestel word:
Die bostaande soort berekening is telkens gevolg om die persentasie van die grammatikale woorde (voornaamwoorde, voorsetsels en konjunksiemerkers) met en sonder ’n prakties beduidende verskil te bereken. Wanneer daar nie ’n prakties beduidende verskil in die voorkoms van ’n bepaalde grammatikale woord in die vergelykte korpora waargeneem kan word nie, kan daar aangevoer word dat die teks moontlik deur dieselfde skrywer geskryf is (p-waarde is groter as 0,05). Die teendeel is egter ook van belang, aangesien ’n prakties beduidende verskil (p-waarde is kleiner as 0,05) aandui dat die tekste moontlik deur verskillende skrywers geskryf is. Deur die persentasie te bereken kon daar makliker afleidings gemaak word rakende die uniekheid van bepaalde leksikale items in die korpora van Joan Hambidge.
- Sleutelwaarde-ondersoeke verwys na ’n wyse waarop die relatiewe frekwensie van bepaalde woorde in korpora bepaal kan word (Baker 2010:26). Die woord “die” kom byvoorbeeld algemeen in alle tekste voor. Indien dit gebeur dat ’n korpus oor ’n hoër frekwensie van “die” in verhouding tot die verwysingskorpus beskik, dui dit dan ook op ’n moontlike kenmerk van ’n idiolek. Sleutelwoorde word deur die Chi-kwadraattoets16 (Jenset 2008:5) bepaal. Die sleutelwaardebepaling is op dieselfde wyse as deur Kotzé (2010) uitgevoer. Woordelyste is van die afsonderlike lêers geskep en dit is alfabeties gesorteer en gestoor. Vervolgens is sleutelwoordberekeninge in WordSmith Tools gedoen. Die inhoudswoorde is telkens per hand verwyder. Daarna is die eerste 15 oorblywende woorde gebruik vir die sleutelwaarde-indeksbepalinge. In die ondersoek is bevind dat die gemiddelde sleutelwaarde-indeks vir die onderskeie tekste soos volg lyk:
Tabel 4. Voorstelling van sleutelwaarde in genres
Hoe hoër die gemiddelde sleutelwaarde, hoe meer verskil die tekste. Die sleutelwaarde-ontleding is dus ’n bykomende ontleding wat gebruik word om skrywerskapverifikasie uit te voer.
- Gepaarde t-toetse word gedefinieer as tipes toetse waar waardes wat ver genoeg aan die teenoorgestelde kante van die spektrum lê, gebruik word as bewyse vir H1 (teenstelling van die nulhipotese) (vgl. Woods, Fletcher en Hughes1989:122). Woods e.a. (1989:122) sê voorts dat die gepaarde t-toets veral as die gepaste metode van ondersoek beskou kan word wanneer die alternatiewe hipotese nie voorspel na welke rigting die statistiese bevindinge gaan neig nie. Die gepaarde t-toets toon dus statistiese beduidendheid aan.
- Statistiese beduidendheid verwys na die sleutelwaarde-indeks waardeur woorde geïdentifiseer word wat beskou kan word as beduidend verskillend in die tekste wat met mekaar vergelyk word. Ten einde hierdie ondersoek uit te voer word daar van WordSmith Tools se sleutelwoordfunksie gebruik gemaak. Anthony (2014:7) stel dit dat hierdie funksie aandui welke woorde teen ’n hoër frekwensie as die norm in die korpus aangetref word in vergelyking met die verwysingskorpus.
Die metodes wat in hierdie afdeling voorgehou is, is deurlopend in dié ondersoek gebruik. Alvorens die ontleding en bevindinge van hierdie ondersoek bespreek word, gaan die stilometriese en stilistiese ontledings wat tydens die inter- en intrakorpusondersoeke uitgevoer is, opsommenderwys bespreek word.
3.5 Stilometriese en stilistiese ontleding
’n Stilometriese ontleding is ’n numeriese ontleding van linguistiese kenmerke. Kotzé (2007:309) verduidelik dat daar in ’n stilometriese ontleding na die tipiese strukture van taalgebruik ondersoek ingestel sal word. Die stilistiese ondersoek behels, volgens McMenamin (2002:163) na die identifikasie van patrone van variasie in geskrewe taal, aangesien geen twee skrywers se taalstyl dieselfde is nie – die “ongewone” eienskappe in ’n skrywer se tekste word geïdentifiseer. In hierdie ondersoek is ’n inter- en intrakorpusondersoek onderneem, en beide hierdie ondersoeke is stilisties en stilometries uitgevoer. Tydens die ontledings is die verskille en ooreenkomste in die ondersoeksubjek se korpus oor verskillende genres bepaal alvorens daar ondersoek ingestel is na die verskille tussen die ondersoeksubjek se korpus en dié van die TK-korpus.
Die stilometriese toetse het die ondersoek na die frekwensies en ratio’s van grammatikale woorde behels. Grammatikale woorde is woorde wat nie deur die konteks (die inhoud van tekste) beïnvloed word nie (vgl. Michell 2013:50). Vir die doel van hierdie artikel is daar besluit om voornaamwoorde, voorsetsels en konjunksiemerkers as grammatikale woorde te ondersoek.
Die stilometriese ontleding van die tekste is deur middel van WordSmith Tools se KeyWords-funksie vergelyk. Daar is ook van SPSS (SPSS Inc. 2011) gebruik gemaak om ’n p-waarde deur middel van t-toetse te bereken. Deur van hierdie statistiese toetse gebruik te maak is daar tesame met die korpuslinguistiese ontleding bepaal of die gespesialiseerde korpora in so ’n mate statisties beduidend van die algemene korpora verskil dat die bevinding gemaak kon word dat Hambidge wel oor ’n idiolek met identifiseerbare eienskappe beskik.
Volgens McMenamin (2002:163) kan forensiese skrywerskapidentifikasie uitgevoer word deur ontledings van die geskrewe taal van individue – dit wil sê linguistiese stilistiek. McMenamin (2002:163) stel dit onomwonde dat geen twee skrywers in ’n taal eenders skryf nie, en ook dat individue nie voortdurend eenders skryf nie. Stilistiese ontleding kan omskryf word as die wetenskaplike studie van variasiepatrone in geskrewe taal (McMenamin 2002:163). Deur dié ontleding is sewe kategorieë geïdentifiseer waarvolgens die stilistiese ondersoek plaasgevind het, naamlik: gebruik van eponieme; kodewisseling; punktuasie; samestellings; verheffing; weglatings; en wisselvorme. Deur die genoemde kategorieë stilisties te ondersoek kan verdere afleidings rakende die idiolek van Hambidge gemaak word.
Deur die stilometriese en stilistiese intra- en interkorpusontledings is daar vervolgens ondersoek ingestel na die idiolek van Hambidge, soos sigbaar oor die grense van genres en multimodaliteite heen. Ten einde dié ondersoek voor te hou, gaan die stilometriese ontleding eers bespreek word alvorens die stilistiese ontleding voorgehou word.
4. Empiriese ondersoek
Die empiriese ondersoek het uit twee afsonderlike afdelings bestaan: die interkorpusondersoek en die intrakorpusondersoek.
4.1 Stilometriese ondersoek
In hierdie afdeling is die afsonderlike korpora van Hambidge vergelyk met die afsonderlike dele van die TK-korpus, en Hambidge se eie tekste is ook met mekaar vergelyk. Soos reeds genoem, is stilometriese toetse in terme van grammatikale woorde onderneem. Voornaamwoorde, voorsetsels en konjunksiemerkers is as grammatikale woordsoortkategorieë ondersoek. Vir elk van die woordgroepe (voornaamwoorde, voorsetsels en konjunksiemerkers) is daar ’n woordelys opgestel wat uit die leksikale items bestaan wat in elk van die grammatikale woordgroepe geplaas kan word. Ten einde die lyste saam te stel is daar na Carstens (2006), Carstens en Van de Poel (2011), Taljaard (2002), asook Taljaard en Smit (1982) verwys. In die woordelys is 59 voornaamwoorde, 80 voorsetsels en 80 konjunksiemerkers geïdentifiseer.
Die bevindinge op grond van die ratiobepalings, t-toetse en p-waardes word vervolgens bespreek.
4.1.1 Interkorpusondersoek: stilometriese ontleding
Die afsonderlike tekste van Hambidge se korpus is met dele van die TK-korpus (sien tabelle 1 en 2) vergelyk. Die doel van hierdie vergelyking was om te bepaal tot watter mate, Hambidge se idiolek verskil van die voorgestelde norm soos in die algemene TK-korpus uitgebeeld word, wanneer daar ondersoek ingestel word na die gebruik van grammatikale woorde.
4.1.1.1 Voornaamwoorde
Die ratio’s van elk van die voornaamwoorde wat in die gespesialiseerde en verwysingskorpus voorkom, is bereken (sien tabel 5) en sodoende is die prakties beduidende verskil van die leksikale items bereken. Voornaamwoorde wat in drie of meer van die korpora voorkom en wat nie prakties beduidend verskil nie – dit wil sê voornaamwoorde waarvan die gebruik tot so ’n mate ooreenstem dat daar nie met absolute sekerheid aangevoer kan word dat die tekste nie deur verskillende skrywers geskryf is nie – is aangeteken.
Tabel 5. Voorstelling van ratio’s van voornaamwoorde wat nie prakties beduidend in drie of meer korpora verskil nie
Die bevindinge in tabel 5 toon dat daar slegs vier voornaamwoorde is (“al”, “hoe”, “wat” en “watter”) wat tot so ’n mate deur die verskillende skrywers gebruik word dat daar in die meerderheid vergelykings nie sonder twyfel aangevoer kan word dat die tekste nie deur dieselfde skrywers geskryf is nie. Tabel 6 beeld dan ook die aantal voornaamwoorde uit wat in die vyf vergelykings (TK1 & J1, TK2 & J2, TK3 & J3, TK4 & J4, en TK5 & J5) ondersoek is.
Tabel 6. Voornaamwoordondersoek
Slegs 17,3% van die voornaamwoorde in die gespesialiseerde en verwysingskorpus het ooreengestem en daar kan nie sonder redelike twyfel aangevoer word dat die moontlikheid bestaan dat die tekste waarin hierdie voornaamwoorde voorkom deur dieselfde skrywer geskryf is nie.
Tabel 6 toon egter ook dat daar in die gebruik van 244 van die 295 (82,7%) voornaamwoorde wel ’n prakties beduidende verskil waargeneem kan word, oftewel, die gebruik van die voornaamwoorde verskil sodanig dat daar gesê kan word dat die skrywers van die tekste verskil. Die afleiding kan dus gemaak word dat Hambidge se gebruik van voornaamwoorde as idiosinkraties beskou kan word wanneer dit met die gebruik van voornaamwoorde in die TK-korpus vergelyk word.
Wanneer die vergelykings van die afsonderlike genres ondersoek word, blyk dit dat Hambidge se gebruik van voornaamwoorde in al die ondersoekte genres as kenmerkend beskou kan word (daar is ’n prakties beduidende verskil van meer as 75% in al die vergelykings).
Tabel 7. Gepaarde t-toetse van die voornaamwoorde
Uit bostaande tabel blyk dit dat daar slegs tussen TK2 & J2 ’n statisties beduidende verskil voorkom. TK2 en J2 bestaan uit die verwysingskorpusroman (TK2) vergeleke met Palindroom van Hambidge (gespesialiseerde korpus J2). Uit hierdie data wil dit voorkom of daar statisties beduidend nie ’n onderskeid tussen die gespesialiseerde korpus en die verwysingskorpus getref kan word nie. Aangesien hierdie ondersoek die interkorpusondersoek is – waar die tekste van Hambidge met dié van die Taalkommissie vergelyk word, maar steeds binne die raamwerk van bepaalde genres – kan daar na aanleiding van hierdie bevinding gesê word dat daar (oorwegend) nie ’n verskil in die gebruik van voornaamwoorde tussen die gespesialiseerde korpus en die verwysingskorpus voorkom nie. Veral nie wanneer die ondersoek in terme van definitiewe genres uitgevoer word nie, nieteenstaande ’n verskil met betrekking tot praktiese beduidendheid.
4.1.1.2 Voorsetsels
Soortgelyk aan die interkorpusondersoek na die gebruik van voornaamwoorde, is ook die gebruik van voorsetsels ondersoek. Die ratiobepalings van die voorsetsels (kyk tabel 8) het getoon dat daar meer voorsetsels is wat prakties beduidend verskil (dus kenmerkend van Hambidge se idiolek is) tussen die gespesialiseerde en verwysingskorpus (83,5%). Dit wil sê dat Hambidge se tekste in ’n mate van die TK-korpus verskil, soos bepaal deur die praktiesebeduidendheidsbepalinge vir voorsetsels volgens die ratio.
Tabel 8. Voorsetselondersoek
Uit tabel 9 (wat die gepaarde t-toetse weergee) blyk dit dat daar geen statisties beduidende verskil tussen die voorkoms van voorsetsels in die gespesialiseerde en verwysingskorpus is nie. Die ontleding bewys dat daar statisties beduidend dus nie onderskeid getref kon word tussen die idiolek van die bepaalde skrywer (soos voorgestel deur die gespesialiseerde korpus) en die TK-korpus (soos voorgestel deur die verwysingskorpus wat uit die TK-korpus bestaan) wat as norm voorgehou word op grond van voorsetsels in bepaalde genres nie.
Tabel 9. Gepaarde t-toetse: voorsetsels
4.1.1.3 Konjunksiemerkers
Ook die konjunksiemerkers is soos in afdelings 4.1.1.1. en 4.1.1.2 ondersoek. Die ratiobepalings van die konjunksiemerkers het aangetoon dat daar meer gevalle in die gebruik van konjunksiemerkers (sien tabel 10) is wat prakties beduidend (89,2%) tussen die gespesialiseerde en verwysingskorpus verskil. Dit wil sê dat Hambidge se tekste in ’n groot mate kan verskil van die TK-korpus soos bepaal deur die praktiesebeduidendheidsbepalinge volgens die ratio. Dit dui aan dat Hambidge wel oor ’n kenmerkende idiolek beskik wanneer daar stilometries na die konjunksiemerkers ondersoek ingestel word aan die hand van praktiese beduidendheid.
Tabel 10. Konjunksiemerkerondersoek
Uit die gepaarde t-toetse (sien tabel 11) blyk dit dat daar geen statisties beduidende verskil tussen die voorkoms van konjunksiemerkers in die gespesialiseerde en verwysingskorpus is nie.
Tabel 11. Konjunksiemerkers gepaarde t-toetse
Uit die ondersoek na die gebruik van grammatikale woorde in die gespesialiseerde en verwysingskorpus blyk dit dat daar twee verskillende bevindinge uit die ratiobepalings en die gepaarde t-toetse gemaak kan word. In die geval van die gebruik van voornaamwoorde is 82,7% prakties beduidend, 83,5% voorsetsels is prakties beduidend en konjunksiemerkers is 89,2% prakties beduidend. Hambidge se gebruik van voornaamwoorde, voorsetsels en konjunksiemerkers is daarom baie meer kenmerkend as dié van die verwysingskorpus (TK-korpus). Die bevindinge van die gepaarde t-toetse (statistiese beduidendheid) toon egter nie ’n duidelike verskil in die gebruik van grammatikale woorde tussen die gespesialiseerde en die verwysingskorpus nie. Kotzé (2007:190) is van mening dat die afwesigheid van statisties beduidende verskille nie noodwendig gemeenskaplike skrywerskap sonder verdere vergelykings impliseer nie, maar dat dit wel ’n sterk basis verteenwoordig om moontlik tot so ’n gevolgtrekking te kom.
Vervolgens word die intrakorpusondersoek bespreek.
4.1.2 Intrakorpusondersoek
’n Interne stilometriese ontleding is onderneem om die bevindinge van die interkorpusondersoek te kontroleer. Die interne stilometriese ontleding het die interne ontleding en vergelyking van Hambidge se tekste behels. Die onderskeie genres is met mekaar vergelyk om Hambidge se idiolek in die verskillende genres te bepaal. McEnery en Wilson (2001:117) redeneer dat ’n volkome beeld van individue se idiolek gevorm kan word slegs wanneer verskeie vergelykings tussen die styl van individue (intrakorpusondersoek) asook vergelykings met ander individue (interkorpusondersoek) getref word. Die metodes sluit in die bepaling van die praktiese beduidendheid deur middel van ratiobepalings, asook die bepaling van die statistiese beduidendheid deur middel van gepaarde t-toetse. Die ontledings het die verskillende genres en multimodaliteite in Hambidge se prosatekste vergelyk.
Afsonderlike korpora van Hambidge is intern met mekaar vergelyk. Die doel van hierdie vergelyking was om te bepaal in watter mate, indien enigsins, Hambidge se idiolek ooreenstem wanneer die stilometriese ontleding intern oor die grense van genres en multimodaliteite heen uitgevoer word.
Die vergelykings is soos volg hanteer:
J1 is vergelyk met J2
J1 is vergelyk met J3
J1 is vergelyk met J4
J1 is vergelyk met J5
J2 is vergelyk met J3
J2 is vergelyk met J4
J2 is vergelyk met J5
J3 is vergelyk met J4
J3 is vergelyk met J5
J4 is vergelyk met J5.
Wanneer die vergelykings getref word soos hier bo uiteengesit, verseker dit dat al die genres met mekaar vergelyk word en sodoende kan ’n gevolgtrekking met gemak gevorm word. Net soos by die eksterne vergelykings is daar ook van voornaamwoorde, voorsetsels en konjunksiemerkers gebruik gemaak. Die data is op presies dieselfde wyse verwerk soos uiteengesit in 4.1.1. Die interne statisties beduidende bevindinge toon dat daar nie ’n verskil in die gebruik van voornaamwoorde tussen die tekste van Hambidge voorgekom het nie, ongeag die genre waarin sy skryf. Die voorsetsels en konjunksiemerkers toon wel statisties beduidende verskille, wat beteken dat die genre dan wel ’n invloed op Hambidge se idiolek het.
Tabel 12. Voorstelling van sleutelwaarde in genres
Hoe hoër die gemiddelde sleutelwaarde, hoe meer verskil tekste. Uit dié ontleding is daar afgelei dat J3 & J5 (proefskrif en die reisjoernaal) die meeste verskil, gevolg deur J1 & J3 (Sewe Sonjas en wat hulle gedoen het en PhD), J2 & J3 (Palindroom en PhD), J2 & J5 (Palindroom en PhD), J1 & J5 (Sewe Sonjas en wat hulle gedoen het en die reisjoernaal), J1 & J4 (Sewe Sonjas en wat hulle gedoen het en resensies), en J2 & J4 (Palindroom en resensies).
Die tekste met die laagste sleutelwaardes wat die meeste ooreenstem, was J3 & J4 (proefskrif en die resensies), J4 & J5 (resensies en reisjoernaal) en ook J1 & J2 (Sewe Sonjas en wat hulle gedoen het en Palindroom). Daar is dus sterk ooreenkomste tussen die verwagte genres gevind, alhoewel die voorkoms van ’n ooreenkoms tussen die PhD en die resensies groot was (die verwagting was dat die PhD ’n meer akademiese teks sou wees, terwyl die resensies as meer informele tekste beskou kon word). Die afleiding wat hieruit gemaak kan word, is dat Hambidge se idiolek nie noodwendig genre-spesifiek is nie, en ook dat tekste wat deur dieselfde skrywer (Hambidge) geskryf is, nie noodwendig kenmerkende eienskappe volgens die genre sal toon nie, maar dat daar wel ooreenkomste in die idiolek van Hambidge sigbaar sal wees, ongeag die genre waarin sy skryf.
4.1.2.1 Voornaamwoorde
Wanneer Hambidge se eie tekste aan die hand van voornaamwoorde met mekaar vergelyk word (dit wil sê verskillende genres met mekaar) blyk dit dat daar oorwegend ’n prakties beduidende verskil in die gebruik van voornaamwoorde (84,4% van die woorde is prakties beduidend) waargeneem kan word. Die woorde almal (J3 & J5), daarvoor (J1 & J5), haarself (J2 & J3), hier (J1 & J3), hierdie (J1 & J2), hom (J1 & J2), homself (J1 & J2), hy (J2 & J4), jou (J3 & J4), jouself (J1 & J2), julle (J1 & J2), jy (J1 & J5), my (J1 & J5), onsself (J2 & J3) en watter (J2 & J4) is slegs in een van die vergelykings nie prakties beduidend nie. Aangesien hierdie ondersoek die ondersoek na die praktiese beduidendheid in terme van die interne ondersoek oor die grense van genres heen is, sou die idiolek as kenmerkend tot die ondersoeksubjek beskou kon word, as daar minder gevalle van praktiese beduidendheid voorgekom het
4.1.2.2 Voorsetsels
Wanneer Hambidge se eie tekste aan die hand van voorsetsels met mekaar vergelyk word (dit wil sê verskillende genres met mekaar), blyk dit dat daar oorwegend ’n prakties beduidende verskil in die gebruik van voorsetsels (82,9% van die woorde is prakties beduidend verskillend) waargeneem kan word. Die woorde agter (J2 & J4), behalwe (J2 & J4), sedert (J1 & J5), sonder (J3 & J5), totdat (J3 & J5), vanweë (J3 & J4), vir (J4 & J5) en volgens (J3 & J5) is slegs in een van die vergelykings nie prakties beduidend nie. Die gebruik van die voorsetsel in (J1 & J5) is slegs een maal prakties beduidend, en daarom kan dit beskou word as die voorsetsel wat mees kenmerkend van Hambidge se idiolek is.
4.1.2.3 Konjunksiemerkers
Soos in die ontleding van die voorsetsels en die voornaamwoorde, is daar ook by die gebruik van konjunksiemerkers (Carstens en Van de Poel 2011) ’n oorwegende prakties beduidende verskil (87,7% van die konjunksiemerkers dui wel ’n prakties beduidende verskil aan). Die woorde ander (J1 & J4), behalwe (J2 & J4), die volgende dag (J2 & J3), dus (J4 & J5), eerder (J2 & J5), in plaas van (J2 & J3), indien (J1 & J5), meer (J1 & J4), ook (J1 & J5), te wete (J4 & J5), ten slotte (J1 & J2), ten spyte van (J1 & J3) en want (J1 & J5) is slegs in een van die vergelykings nie prakties beduidend nie.
Uit die ratiobepalings blyk dit duidelik dat die voornaamwoorde wat Hambidge oor die grense van genres gebruik nie ooreenstem nie. Daar is telkens by dié vergelykings minder as 20% van die voornaamwoorde wat ooreenstem. Voorsetsels in die afsonderlike genres van Hambidge verskil ook na aanleiding van die genres. Daar is ook bepaal dat Hambidge nie dieselfde konjunksiemerkers in die onderskeie genres gebruik nie. Die afleiding kan gemaak word dat nie een van Hambidge se genres prakties beduidend ooreenstem betreffende die voorkoms van die gebruik van voornaamwoorde, voorsetsels of konjunksiemerkers nie. Hieruit kan afgelei word dat genre wel ’n invloed op Hambidge se idiolek het.
4.2 Stilistiese ondersoek
Besonderhede rondom die stilistiese ondersoek word vervolgens weergegee.
4.2.1 Eponieme
Eponieme word omskryf as woorde waarin die name van persone voorkom (Prinsloo 2011:6). Vir die doel van hierdie ondersoek is eponiem gebruik as ’n term om na afleidings van eiename wat as soortname, werkwoorde, bywoorde en byvoeglike naamwoorde funksioneer, te verwys.
Voorbeelde sluit in:
J3. (reël 1025) ... gewoon die kind wat nie geoedipaliseer het nie ...
J3. (reël 5419) ... sy eie ongeoedipaliseerde ... (in hierdie voorbeeld is
dit opmerklik hoe Hambidge ’n negatiewe vorm van die eponiem geskep het)
J3. (reël 9282) ... nie-geoedipaliseerde digter wat ... (ook in hierdie
voorbeeld het Hambidge ’n negatiewe vorm van die eponiem geskep)
J5. (reël 40) ... die kind geoedipaliseer met sy eie identiteit ...
J3. (reël 1834) ... die proses van oedipalisasie ...
Die afleiding “geoedipaliseerde” (ongeag die vorm waarin dit gebruik word) is uniek aan Hambidge se idiolek. Dit kom nie een maal in die TK-korpus voor nie, en met ’n soektog deur die Media24-argief17 was die enigste voorkoms van dié woord in ’n rubriek wat deur Hambidge self geskryf is (Op my literêre sofa, 1994, soos geplaas deur Beeld, en ook ingesluit by Hambidge se korpus). Hierdie woord word dus slegs deur haar gebruik, ongeag die genre.
Verdere voorbeelde van eponieme wat in Hambidge se korpus aangetref word, sluit in:
J3. (reël 2337) ... meer spesifiek Lacaniaanse psigoanalise ...
J3. (reël 6603) ... nosie van die Lacaniaanse ek/oog ...
J5. (reël 2080) ... van die Lacaniaanse fallus ...
J5. (reël 2118) ... van Lacaniaanse psigoanalise ...
J5. (reël 2125) ... fases in Lacaniaanse psigoanalise ...
Hambidge gebruik gereeld die woord “Lacaniaanse”. Daar is 17 voorbeelde van die voorkoms van hierdie woord in haar PhD. Hierdie eponiem is egter nie beperk tot Hambidge se idiolek nie, aangesien dit ook in die TK-korpus voorkom, maar die frekwensie waarteen dit voorkom, is hoër in Hambidge se tekste. Die woord kom in J3 (PhD) en J5 (reisjoernaal) voor en is dus nie genrespesifiek nie.
Variante skryfwyses van hierdie woord kom ook in Hambidge se tekste voor:
J3. (reël 2257) ... tans meer Freudiaans/Lacaniaans as Jungiaans ...
J3. (reël 6916) ... temas wat Lacaniaans gesien ...
J5. (reël 2161) ... ’n Lacaniaan, word ...
Die eponiem “Lacaniaans” kom slegs drie maal in die TK-korpus voor. Dit is interessant dat die woord nie in die akademiese korpus voorkom nie, maar wel in die koerantartikels en een maal in die roman. Dit is dus duidelik dat Hambidge gebruik maak van eponieme (veral in akademiese tekste) asook wisselvorme van die woorde. Verder blyk dit dat Hambidge se gebruik van eponieme (wat meestal in akademiese tekste gevind word) in nie-akademiese tekste kenmerkend is van haar idiolek.
Verdere voorbeelde van eponieme sluit in:
J2. (reël 3124) ... haar Jungiaanse terapeut ...
J3. (reël 2257) ... tans meer Freudiaans/Lacaniaans as Jungiaans ...
J1. (reël 76) ... sewe Gordiaanse knope ...
J1. (reël 2508) ... die Faustiaanse verlange ...
J1. (reël 2509) ... die Nietzcheaanse droom ...
J3. (reël 2325) ... die Kopernikaanse en Newtoniaanse rewolusie ...
J2. (reël 1547) ... as ’n Nabokofiaanse fantasie ...
J2. (reël 2039) ... die Tibetaanse Boek van Lewe en Dood ...
J3. (reël 8709) ... die Shakesperiaanse tyd ...
Uit die bogenoemde voorbeelde blyk dit duidelik dat Hambidge gereeld gebruik maak van eponieme, ongeag die genre waarin sy skryf. Die woorde kom verspreid oor die verskillende genres voor, alhoewel J3 (PhD) die meeste voorbeelde bevat. Wat hierdie verskynsel uniek aan Hambidge maak, is die feit dat van die eponieme wat wel in die TK-korpus voorkom, nié in die akademiese tekste verskyn nie, maar wel in die koerantartikels, tydskrifartikels en die romans. Die frekwensies waarteen die woorde voorkom, is egter baie hoër in Hambidge se korpus en ook spesifiek in haar PhD. Eponieme kan dus as kenmerkend van Hambidge se idiolek beskou word.
4.2.2 Kodewisseling
Volgens Du Plessis (1995:24) verwys kodewisseling na die wisseling wat sprekers toepas in gesprekke tussen variëteite van dieselfde taal of tussen tale. Kodewisseling kan gebruik word om aan te pas by gespreksituasies (gemaklike diskoers), of as een van die sprekers nie so vlot in ’n spesifieke taal is nie, of ter wille van aanvulling.
Voorbeelde uit die JH-korpus sluit in:
J1. (reël 96) ... Ubi, quis, quid ... prewel ...
J1. (reël 228) ... pudenda est bella) ...
J3. (reël 1336) ... Lees hier. Utrum stelle videantur ubi sint? ...
J4. (reël 302) ... kind gehad wat gedupe is ...
J3. (reël 6922) ... (le désir de l'analyst wat op Frans letterlik beteken ...
J3. (reël 6839) ... vader (nom-du-père) verwys ...
J3. (reël 6846) ... aktiveer die nom-du-père as ...
J2. (reël 2503) ... dat ek jou nooit weer lief sal hê nie: Gij die mij leest, vergeef mij en vergeet
J3. (reël 1327) ... via ’n monologue intérieur aan ...
Uit die bogenoemde voorbeelde is dit duidelik dat Hambidge wel van kodewisseling gebruik maak, maar ook dat daar nie ’n spesifieke leksikale item is wat sy deurgaans in al haar tekste (ongeag die genre) gebruik nie. Baie van die woorde is akademiese terme wat moeilik vertaalbaar is en kan dus binne die konteks waarin dit gebruik word, as onvermydelik geag word. Dit is wel duidelik dat daar nie ’n genre is waarin Hambidge nie van dié tipe kodewisseling gebruik maak nie. Dit is egter nie moontlik om kodewisseling as ’n unieke idiosinkratiese eienskap van Hambidge se idiolek te identifiseer nie, alhoewel die feit dat die kodewisseling telkens Frans, Nederlands en Latyn eerder as Engels is, tog wel as ’n aanduiding van Hambidge se skrywerskap beskou kan word.
Die bevinding kan moontlik gemaak word dat die voorkoms van kodewisseling ‒ soos hier bo voorgestel ‒ wel ’n aanduiding kan wees van Hambidge se skrywerskap, hetsy dit in resensies, akademiese artikels of romans voorkom. Aangesien hierdie woorde egter ook in die ander korpus voorkom (alhoewel nie in dieselfde sinskonstruksie nie), kan dit nie as idiosinkraties beskou word nie, maar eerder as ’n aanduiding van skrywerskap, aangesien Hambidge nie die enigste individu is wat van kodewisseling met Frans, Nederlands en Latyn gebruik maak nie. Noukeurige ondersoek sal kan bepaal of die teks wel deur Hambidge geskryf is. In die korpus is daar egter wel enkele voorbeelde van kodewisseling tussen Afrikaans en Engels:
J1. (reël 175) ... van ’n step-in ...
J1. (reël 2559) ... of is jy gedippity do? ...
J1. (reël 2726) ... vorm van ’n straight jacket ...
J2. (reël 754) ... Of dit delete? ...
J3. (reël 584) ... te wete Comic power in ...
J3. (reël 878) ... met die subway om ...
J3. (reël 930) ... Sy reis egter met mweb se airmail wat ...
J3. (reël 1100) ... alreeds ’n risque-boodskap oorgedra ...
J3. (reël 1505, 1526, 1539, 1571, 1630, 1697) ... sogenaamde cross-
dresser of
transvestiet ...
J3. (reël 5249) ... van die joking chain ...
Uit hierdie voorbeelde is dit duidelik dat Hambidge nie skroom om kodewisseling toe te pas nie, en verder blyk dit dat haar proefskrif ook woorde bevat wat as nie-akademies beskou kan word. Dit is egter ook duidelik dat daar nie ’n spesifieke woord uit ’n ander taal of bepaalde variëteit is wat kenmerkend van Hambidge se korpus is nie. Weer eens kan die afleiding slegs gemaak word dat Hambidge wel kodewisseling toepas (met Engels) ongeag die genre. Daar is gevalle (soos met die woorde “back-drop” en “backdrop”) waar die spelling ook nie konsekwent is nie. Die woorde kom ook algemeen in die TK-korpus voor, wat bewys dat die stilistiese ontleding van Hambidge se gebruik van hierdie Engelse woorde in die teks as eiesoortig beskou kan word nie.
Vervolgens is daar ook ondersoek ingestel na die invloed van Engels in die JH-korpus. Wat hierdie ondersoek betref, het dit verwys na die gebruik van Engelse woorde wat verafrikaans is in die JH-korpus. Daar is dus ondersoek ingestel na vreemde of verafrikaansde gebruike en/of spelvorme. Uit die ondersoek na kodewisseling is reeds bepaal dat Hambidge van Engelse woorde gebruik maak (ook as ’n vorm van kodewisseling) en dat daar ook verskeie woorde is wat gebruik word waar die invloed van Engels duidelik in haar idiolek sigbaar is. Voorbeelde sluit in:
J1. (reël 1048) ... as my persgedaaide hare ...
J1. (reël 1595) ... gedaaide hare ...
J1. (reël 2266) ... se hare is gedaai ...
Toe die woord “gedaai” in die TK-korpus opgesoek is, was dit duidelik dat Hambidge die woord in vergelyking met die voorkoms in die TK-korpus gereeld gebruik. Die woord kom egter net in J1 van Hambidge se korpus voor ‒ dus kon dit nie as idiolekties beskou word nie.
J1. (reël 2321) ... met sy motorbaaik en al ...
J1. (reël 2354) ... net ’n nuwe baaik wil koop ...
Die woord “baaik” is eie aan Hambidge se idiolek, aangesien dit glad nie in die TK-korpus voorgekom het nie. Dié woord kon nie as ’n kenmerkende eienskap van Hambidge se oorkoepelende idiolek beskou word nie, omdat dit net in een van die genres voorgekom het. Dit kan egter beskou word as ’n hapax legomenon18 in die roman Sewe Sonjas en wat hulle gedoen het, en dit kan ook gestel word dat indien die woord (met die bepaalde spelling) in ’n teks voorkom, daar ’n moontlikheid bestaan dat dit deur Hambidge geskryf is.
J4. (reël 400) ... by ’n komputer in ...
J3. (reël 6148) ... Uit ’n komputer-analise is daar...
Die woord “komputer” kon ook nie as kenmerkend van Hambidge se idiolek beskou word nie, aangesien dit ook in die TK-korpus voorgekom het. Wat wel interessant was, was dat dié woord in Hambidge se proefskrif (J3) en resensies (J4) voorkom – beide tekste wat as meer formeel as die romans (waarin die woord nie voorkom nie) beskou word. In die TK-korpus het dit wel in die romans voorgekom. Daar is ook ondersoek ingestel na woorde wat in Hambidge se korpus voorkom wat, soos die bogenoemde voorbeelde, eienskappe het van woorde wat uit Engels verafrikaans is. Hierdie woorde sluit in:
J1. (reël 2343) … ’n fountjie sodat sy ...
J1. (reël 182) ... die pantie op ...
J1. (reël 2261) ... Groot probleme. Trobbels ...
J1. (reël 2447) ... kan dit nie aanpaas ...
J2. (reël 1198) ... hy props nodig ...
J3. (reël 614) ... is altyd in transit ...
J3. (reël 1188) ... Klere signifieer ’n bepaalde ...
J3. (reël 1105) ... Klere signifieer ’n ...
J4. (reël 566) ... verteller en sy tjoms ...
Uit die bostaande lys is dit slegs die woorde “trobbels”, “signifieer” en “tjoms” wat nie in die TK-korpus voorgekom het nie. ’n Soektog is egter op die Media24-argief uitgevoer om te bepaal of die woorde elders ook voorkom. Die resultaat van die soektog het aangetoon dat die woorde “trobbels” en “tjoms” wel in die Media24-argief voorkom, en dus kon dit nie as uniek aan Hambidge se idiolek beskou word nie. Die woord “signifieer” kom egter slegs in Hambidge se korpus voor.
Figuur 1. Voorstelling van ’n konkordansiesoektog in WordSmith Tools na die woord “signifieer”
Uit figuur 1 is dit duidelik dat die woord “signifieer” gesamentlik nege maal in die JH- en TK-korpus voorkom. “Signifieer” het agt maal in die JH-korpus en slegs een maal in die TK-korpus voorgekom. Soos in figuur 1 gesien kan word, is die enkele keer wat die woord “signifieer” in die TK-korpus gebruik is, ’n verwysing na Hambidge se teks wat in die TK-korpus (TK3 [Niefiksie]) opgeneem is (Hambidge 1995:17). Na aanleiding van die bogenoemde is dit dus moontlik om dit te stel dat “signifieer” as uniek aan Hambidge se idiolek beskou kon word.
Vervolgens is ondersoek ingestel na etlike samestellings met Engelse woorde wat in die JH-korpus waargeneem is. Voorbeelde sluit in:
J4. (reël 560) ... propperse emosieswendelaar is wat ou tannies op ’n
toerbus belieg met sy hard luck-stories ...
J4. (reël 80) ... nie ’n struggle-digter ...
J3. (reël 3833) ... glo ’n tomboy-dogter ...
J3. (reël 3418) ... Sy no nonsense-manier...
J3. (reël 2923) ... my kom uit-bail ...
J2. (reël 2184) ... die trash-boksie ...
J2. (reël 517) ... na die draft-boksie ...
J2. (reël 512) ... duidelik ’n server-probleem ...
J1. (reël 2379) ... Elke dag sal paydag wees! ...
Hierdie voorbeelde dui daarop dat Hambidge gebruik maak van samestellings wat uit Afrikaanse en Engelse woorde bestaan. Lawrence (1999:272) verwys na die voorkoms van woorde soos “propperse” as ’n dubbele morfologie en stel dit as ’n uitsondering op die Blokhipotese. Die Blokhipotese veronderstel dat daar ’n blokkeringsfilter bestaan wat enige IT-inhoudsmorfeem (IT verwys na die ingebedde taal, dus die ander taal) blokkeer wat nie aan die MT (MT verwys na die matrikstaal, dus die hooftaal van die kodewisseling) kongruent is nie (vgl. Lawrence 1999:271). Dubbele morfologie (soos in “propperse”) verwys na die voorkoms van ’n enkele IT-stam met affikse van die IT en MT met dieselfde funksie.
Opvallend in die geval van kodewisseling is die voorkoms van samestellings waar dit betrekking het op rekenaarterme en terme rakende tegnologiese middele. Hierdie is dan ook die enigste voorbeelde (alhoewel nie dieselfde woorde nie) wat oor die hele korpus voorgekom het, ongeag die genre.
Met betrekking tot rekenaarterme is dit interessant om ook aan te dui dat Hambidge gereeld beskrywend oor die rekenaar en rekenaarprogrammatuur en/of die tegnologiese middele skryf. Voorbeelde hiervan sluit in:
J2. ... Ek sal my selfoon by my hou en jy kan my BlackBerry! ...
J2. ... Sent via my BlackBerry from Vodacom – let your email find you!
In die TK-korpus kom die woord “BlackBerry” net in koerantartikels (TK4) voor. Hambidge se gebruik is dus eerstens genrespesifiek, en tweedens gebruik sy dit uniek in die sin dat sy die “BlackBerry”-e-posstempel in haar romans insluit. Hierdie kan ook as ’n vorm van kodewisseling beskou word, aangesien dit gebruik word om die e-poswisseling tussen die mentor en die mentee in die roman aan te dui.
J3. ... Haar Compaq Armada rekenaar stol toe sy ...
J3. ... Ek kyk of daar virusse in my Compaq Armada is, maar die Norton man
verklaar ...
Die woorde “Compaq Armada” kom een maal in die TK-korpus voor (TK1), maar die voorkoms van dié woorde kon nie as bewys gebruik word dat ander individue, buiten Hambidge, ook die woord gebruik as deel van hulle idiolek nie, aangesien daar bepaal is dat daardie spesifieke gedeelte van die TK-korpus saamgestel is uit Joan Hambidge se Skoppensboer (2001). Die afleiding kan dus gemaak word dat die gebruik van “Compaq Armada” as kenmerkend van Hambidge se idiolek gesien kon word.
Ander verwysings na rekenaars en programmatuur sluit onder meer in:
J3. (reël 85) ... en Wordperfect for Windows was die program ...
J3. (reël 737) ... ’n nuwe sisteem (Microsoft Word, Office 97) ...
J3. (reël 1008) ... haar draagbare rekenaar ...
J5. (reël 645) ... op my laptop ...
Hierdie woorde is egter ook nie uniek aan Hambidge se idiolek nie, maar die genre (veral J3 – proefskrif) waarin dit gebruik word, verskil wel van die genres waarin dit oor die algemeen gevind word. Die verwysings hou ook nie noodwendig verband met die inhoud van die res van die dokument nie. Hierdie voorbeelde kan as aanvullend beskou word tot die voorkoms van die informele skryftrant wat Hambidge in haar proefskrif gebruik het. Sy onderbreek die akademiese skryfstyl om te vertel hoe sy besig is om aan die teks te skryf. Dit kan in ’n mate as ’n stylbreuk beskou word en is ook eie aan Hambidge se idiolek.
Uit die ondersoek oor kodewisseling in die JH-korpus is dit duidelik dat daar sekere woorde is wat as kenmerkend van Hambidge se idiolek beskou kon word. Die meeste voorbeelde is egter genrespesifiek en dit is met uitsondering dat daar ’n woord geïdentifiseer kon word wat oor die grense van genres voorkom. Die ondersoek na kodewisseling het egter getoon dat daar definitiewe woorde is wat, wanneer dit binne ’n bepaalde konteks gebruik word, as aanduidend van die idiolek van Hambidge beskou kon word.
4.2.3 Parenteses
Parentese verwys na die invoeging van sinne, sinsnedes en/of gedagtes deur middel van hakies, kommas of aandagstrepe in sinne (Pharos-woordeboek 2016). Hambidge maak veral in haar romans hiervan gebruik. Parenteses word ter wille van addisionele kommentaar deur skrywers aangewend. In die geval van tekste waar lesers weet dat Hambidge aan die woord is (soos die proefskrif, resensies of reisjoernaal), is ondersoek ingestel na die voorkoms van voorbeelde waar dit pertinent gestel word dat dit die skrywer se opinie is. Voorbeelde sluit in:
J1. (reël 72) ... (’n Lekroman. Die outeur.) ...
J1. (reël 178) ... (En ons sal later die digbundel Passiebomme te lese kry. Die
outeur.) ...
J1. (reël 711) ... (Om vanselfsprekende redes word die woord doos vermy. Die
outeur.) ...
J1. (reël 719) ... (vergeef hierdie klein onderbreking. Die outeur) ...
J1. (reël 192) ... (Beer is lesbiese sleng vir ’n gay vrou. Die outeur) ...
Die bostaande voorbeelde kom almal voor in die roman Sewe Sonjas en wat hulle gedoen het (J1). Aangesien die storie deur ’n verteller/fokalisator voorgehou word, is dit in dié geval belangrik dat die skrywer (Hambidge) dit duidelik stel wanneer dit haar stem/insette is wat gedurende die verloop van die verhaal gelewer word. In die geval van die oorblywende tekste wat in die korpus voorkom (J2, J3, J4 en J5), is daar gefokus op parenteses waardeur die skrywer (Hambidge) se stem gehoor kon word – dit wil sê die invoeging van sinne, sinsnedes en/of gedagtes in sinne waar dit voorkom asof Hambidge haar gedagtes byvoeg. Aangesien die oorblywende deel van die JH-korpus egter uit romans, ’n proefskrif, resensies en ’n reisjoernaal bestaan, was dit belangrik om in gedagte te hou dat die skrywer aan die woord is (met die uitsondering van die romans) en dit is dus haar mening wat in die onderskeie tekste uitgedruk word. Voorbeelde sluit in:
J3. (reël 1255) ... miljoen dollar (’n enorme bedrag vir 1975) gekry ...
J3. (reël 1311) ... leser (tensy die "ek" gelyk gestel word aan die outeur Jeanne
Goosen)
J3. (reël 1885) ... (en Bill Clinton se optrede in die Wit Huis) en ...
J4. (reël 27) ... (Miskien is die kind se waarnemings by Ackerman soms-soms
net te gesofistikeerd – maar dit is ’n klein beswaar.) ...
J4. (reël 767) ... en mees bisarre eindes – wat ek nie hier kan verklap nie! ...
J4. (reël 43) ... Ag, liewe leser, dan wil ek u ook nie opsaal nie met
staaltjies ...
J4. (reël 849) ..., dink ek terug aan ’n ervaring in Turkye in 2008 ...
J5. (reël 130) ... (op wie is daardie grap?) ...
J5. (reël 883) ... (het ’n paar selfs uitgedink) ...
J5. (reël 1084) ... (Ons proewerasies uitgesluit. Ek is bang my moeder lees
hierdie rubriek ...
Uit die bostaande voorbeelde blyk dit duidelik dat Hambidge gebruik maak van parenteses, ongeag die genre waarin sy skryf. In J1maak Hambidge egter gebruik van parenteses waar sy dit duidelik stel dat dit die skrywer se opinie is wat weerspieël word. Hierdie verskynsel of gebruik kan as ’n idiosinkratiese kenmerk van Hambidge beskou word.
4.2.4 Punktuasie
Punktuasie verwys na die gebruik van lees- en skryftekens. Daar is algemene reëls en norme (vgl. Carstens 2011:261–9) en daarom is daar ondersoek ingestel na afwykings van die norm. Voorbeelde sluit in:
J1. (reël 708) "Ja!!!!"
J3. (reël 7746) ... meer talentvol ... was
J1. (reël 620) ... Die geweer = die fallus; die bok = die libido
J3. (reël 145 ) ... Gender = meer as O of O ...
Dit was duidelik dat Hambidge nie oorwegend afwyk van die taalreëls nie. Daar is enkele voorbeelde waar sy van meer as een uitroepteken of vraagteken gebruik maak, of selfs gebruik maak van simbole of getalle in plaas van woorde in die korpus, maar dit kom nie genoegsaam voor dat dit as idiosinkraties beskou kon word nie.
Ander voorbeelde van ortografiese variasie wat in die tekste voorkom, is die gebruik van koppeltekens tussen letters om die aandag op sekere woorde te vestig (ge-na-de, D-R-A-M-A, E-M-I-L-Y D-I-C-K-I-N-S-O-N – J3).
Hoofletterwoorde word voorts ook gebruik om woorde te beklemtoon: sy sien WELLUS, ’n NAAM, “JaaaaaaaAAAAAAAAAA!", "JoooooooOOOOOOOOOOOOOOO!", "JeiiiiiIIIIIIIIIIIIIIIiIIIIIiiiii!" – J1
Hierdie voorbeelde kom egter in die romans voor – daarom kan dit beskou word as ’n wyse waarop kommunikasie plaasvind en die karakters se emosies uitgebeeld word. Die hoofletterwoorde en koppelteken gebruik kon nie as sodanig as uniek aan Hambidge se idiolek beskou word nie.
4.2.5 Samestellings en afleidings
Volgens Carstens (2006:133) verwys samestellings na die verbinding van twee of meer losstaande woorde om ’n nuwe sintaktiese eenheid te vorm. In dié studie is daar ondersoek ingestel na samestellings waar daar onnodig koppeltekens bygevoeg is. Die gebruik van voorvoegsels is ook ondersoek. Daar is reeds by kodewisseling ondersoek ingestel na samestellings met Engelse woorde. Vervolgens is daar op die gebruik van samestellings uitgebrei. Voorbeelde sluit in:
J2. (reël 1329) ... on-voor-die-hand-liggende ...
J5. (reël 1154) ... kroeg-cum-restaurant ...
J3. (reël 503) ... on-vervuldheid ...
J3. (reël 475) ... on-finaliteit ...
J1. (reël 517) ... donkerstroom-o-dieprivier ...
Die afleiding kon gemaak word dat Hambidge wel samestellings gebruik ongeag die genre waarin sy skryf, maar ook dat daar nie ’n spesifieke samestelling is wat oor die grense van genres voorkom nie. Hambidge maak deurlopend van “vreemde” koppeltekens gebruik.
4.2.6 Verheffing
Verheffing verwys na die gebruik om soortname tot eiename te verhef (Nel 2014). Voorbeelde sluit in:
J2. (reël 616) ... die Eks, die Geliefde en die Mentee
J2. (reël 1041) ... van haar mentee, die Eks en Geliefde het ...
J2. (reël 1433) ... die Mentee ...
J2. (reël 1434) ... op die Mentor...
J2. (reël 90) ... die Man ...
J1. (reël 260) ... dat die Matrone ...
Die voorbeelde wat in Hambidge se korpus voorkom ‒ waar sy soortname tot eiename verhef ‒ is beperk tot J1 en J2 (Sewe Sonjas en wat hulle gedoen het en Palindroom). Daar is egter nie ’n verheffing wat in beide die romans voorkom nie, en dus kon die verheffing van soortname tot eiename nie as kenmerkend van Hambidge se idiolek beskou word nie. Die verheffing wat die meeste voorkom, is “die Eks”. Aangesien die verheffing (“die Eks”) glad nie in die TK-korpus voorkom nie, kan dit gestel word dat die verheffing van soortname tot eiename as ’n eienskap van Hambidge se idiolek beskou kan word. Voorts moet bykomende ontledings plaasvind wanneer dié woorde in tekste (veral romans) aangetref word, aangesien dit tesame met van die reeds bespreekte kategorieë die identifikasie van Hambidge se idiolek kan vergemaklik.
4.2.7 Weglatings
Hier word verwys na die gebruik om sekere dele van woorde weg te laat ‒ ’n algemene verskynsel is in SMS-taal. Olivier (2013:490) verwys na weglatings as die uitlating van letters (soos in “hkm” vir “hoekom”), inkortings (korter woorde wat van langer woorde gevorm word met inagneming van die oorspronklike woord se morfologie) en knipsels (korter woorde wat na aanleiding van langer woorde geskep word sonder inagneming van die oorspronklike woord se morfologie). Voorbeelde sluit in:
J1. (reël 62) ... deur B-fontein se ...
J1. (reël 566) ... koringlande tussen B-fontein en P-Burg ...
J1. (reël 637) ... oor B-fontein, dan ...
J1. (reël 723) ... op B-fontein met ...
J1. (reël 348) ... staan Plagiaat is ’n p-woord ...
Voorbeelde van weglating kom slegs in J1 voor. Daar is ook nie ’n groot verskeidenheid woorde waarop Hambidge weglating toepas nie. Aangesien die bogenoemde voorbeelde slegs in een van die romans (dus nie oor ’n hele genre nie) voorkom, kon dit nie as ’n idiosinkratiese eienskap van Hambidge beskou word nie.
4.2.8 Wisselvorme
Woordbetekenis is konvensioneel en berus op gemeenskaplike verstandhoudings, gedagtes en tradisies (Carstens 2006:103). Woorde kan wel op ’n alternatiewe wyse geskryf word mits die betekenis nie verlore gaan nie. Daar is vervolgens na die wyse gekyk waarop Hambidge van wisselvorme gebruik maak. Voorbeelde sluit in:
J3. (reël 6286) ... studie is indiwiduasie, oftewel ...
J3. (reël 1959) ... hele Stonewall-rewolusie
J5. (reël 953) ... op ’n rewolusie-gebou afgeëts ...
J1. (reël 2305) ... my dierb're letterkunde ...
J1. (reël 2604) ... vashou, dierb're koningin ...
Uit die ondersoek na wisselvorme kan aangevoer word dat Hambidge wel hiervan gebruik maak, maar nie oor die grense van genres nie. Alhoewel daar voorbeelde van wisselvorme in bykans elke genre voorkom, is dit telkens ander voorbeelde – dus nie ’n wisselvorm wat kenmerkend van Hambidge se idiolek is nie. Uit J3 (PhD) is daar voorbeelde van “individu” asook “indiwidu” gevind, wat daarop dui dat Hambidge van beide die spelvorme gebruik maak.
4.2.9 Samevatting: stilistiese ondersoek
Die stilistiese ontleding het getoon dat daar enkele woorde en uitdrukkings is wat kenmerkend van Hambidge se idiolek is. Tog is daar ook bepaal dat slegs enkele van die voorbeelde wat genoem is, deurlopend in Hambidge se idiolek oor die grense van genres waargeneem kon word.
Daar is bepaal dat woorde soos “geoedipaliseerde” (ongeag die vorm waarin dit gebruik word) kenmerkend van Hambidge se idiolek is. Hambidge maak gereeld gebruik van eponieme ongeag die genre (soos ondersoek in hierdie navorsing) waarin sy skryf, en dus kan dit as eie en kenmerkend van haar idiolek beskou word.
Die woord “baaik” is eie aan Hambidge se idiolek, aangesien dit glad nie in die TK-korpus voorkom nie. Dié woord kan egter nie as ’n kenmerkende eienskap van Hambidge se oorkoepelende idiolek beskou word nie, omdat dit net in een van die genres voorkom. Dit kan egter beskou word as ’n hapax legomenon in die roman Sewe Sonjas en wat hulle gedoen het. Dit kan ook gestel word dat indien die woord (met die bepaalde spelling) in ’n teks voorkom, die moontlikheid bestaan dat dit deur Hambidge geskryf is, of dat dit by haar aangeleer is.
Die woord “signifieer” is eie aan Hambidge se idiolek. Dit kom een maal in die TK-korpus voor, maar dit is ’n aangehaal uit Hambidge (wat besig is om die werklikheid te help skep of “signifieer”) (Hambidge 1995:17) in TK3 (Niefiksie). “Signifieer” is dus uniek aan Hambidge se idiolek. Net só is die gebruik van die woorde “Compaq Armada” uniek in hierdie vergelyking aan Hambidge se tekste.
Uit die ondersoek na kodewisseling in die JH-korpus is dit duidelik dat daar sekere woorde is wat uniek aan en kenmerkend van Hambidge se idiolek is. Die meeste voorbeelde is egter genrespesifiek, en dit is met uitsondering dat ’n woord geïdentifiseer kon word wat oor die grense van genres voorkom. Dit blyk ook duidelik dat Hambidge gebruik maak van parenteses ongeag die genre waarin sy skryf. Die voorkoms van parenteses in J2 tot J3 is egter algemeen of selfs aanvaarbaar volgens die norm wat vir die genre daargestel is. In J1 maak Hambidge gebruik van parenteses waar sy dit duidelik stel dat dit die skrywer se opinie is wat weerspieël word. Hierdie gebruik kan as ’n idiosinkratiese kenmerk van Hambidge beskou word.
Verheffing van die woord “eks” na “Eks” kom glad nie in die TK-korpus voor nie en dus kan dit gestel word dat die verheffing van soortname tot eiename as ’n aanduider van Hambidge se idiolek beskou kon word.
Uit hierdie gedeelte van die stilistiese ondersoek is dit dus duidelik dat daar enkele woorde is wat uniek aan en kenmerkend van Hambidge se idiolek is, terwyl ander woorde net in ’n sekere genre en multimodaliteit voorkom. Daar is ook verskeie woorde geïdentifiseer wat ’n definitiewe aanduider van Hambidge se skrywerskap kan wees.
5. Samevattende gevolgtrekkings
Met die aanvang van hierdie artikel is die vraag gestel: “Hoe herkenbaar is die idiolek van ’n enkele skrywer wanneer die ondersoek na hierdie individu se idiolek oor die grense van genres uitgevoer word?” Om dié vraag te beantwoord, is ’n korpusondersoek onderneem om te bepaal wat die verskillende kenmerkende eienskappe van Joan Hambidge se idiolek is en om te bepaal of dit oor die grense van die multimodaliteite en genres sigbaar is.
Ondersoek is ingestel na die gebruik van voornaamwoorde, konjunksiemerkers en voorsetsels. Statistiese berekenings het getoon dat daar geen statisties beduidende verskil tussen die gespesialiseerde en verwysingskorpus waargeneem kan word nie, behalwe ten opsigte van die voornaamwoorde wat Joan Hambidge in Palindroom gebruik en in die fiksie-afdeling van die TK-korpus (TK2 & J2). Dit wil dus voorkom of die idiolek van Joan Hambidge, ongeag die modaliteite, nie duidelik herkenbaar is wanneer voorsetsels, voornaamwoorde en konjunksiemerkers deur middel van gepaarde t-toetse ondersoek word nie.
Die ratio-ontleding het bewys dat daar ’n prakties beduidende verskil by die voornaamwoorde (82,7%), voorsetsels (83,5%) en die konjunksiemerkers (89,2%) aanwesig is. Dit dui dus op ’n kenmerkende idiolek by die ondersoeksubjek wanneer die tekste met soortgelyke tekste (genrespesifiek) uit die TK-korpus vergelyk word.
Die interne statistiese resultate het getoon dat daar nie ’n verskil in die gebruik van voornaamwoorde voorkom tussen die tekste van Hambidge nie, ongeag die genre of multimodaliteit waarin sy skryf. Die voorsetsels en konjunksiemerkers toon wel statisties beduidende verskille aan, wat beteken dat die genre dan wel ’n invloed het op Hambidge se idiolek met betrekking tot voorsetsels en konjunksiemerkers.
Die ontledings het getoon dat Hambidge se idiolek nie so duidelik herkenbaar is wanneer die ontledings tussen die onderskeie genres en multimodaliteite plaasgevind het nie. Daar is kenmerkende eienskappe, maar dit wil voorkom asof die verwagte genrekonvensies nie geld nie. Die bevinding, wat uit die stilometriese ontledings gemaak is, is dus dat Hambidge statisties beduidend oor ’n kenmerkende idiolek beskik wanneer haar korpus met dié van die Taalkommissie vergelyk word. Die praktiese beduidendheid van die ratio-ontleding ondersteun hierdie bevinding. Die interne vergelyking bewys dat slegs voornaamwoorde nie statisties beduidend oor die grense van genres en multimodaliteite voorkom nie, maar dat daar ook statisties onderskeid getref kan word tussen die idiolek van Hambidge oor die grense van genres en multimodaliteite heen aan die hand van voorsetsels en konjunksiemerkers. Die ratio-ontledings ondersteun weer eens die statistiese bevindinge dat Hambidge se idiolek wissel afhangende van die genre waarin sy skryf.
Rakende die lemma-ondersoek is bepaal dat Hambidge se woordkeuse met betrekking tot die herhaaldelike voorkoms daarvan as kenmerkend beskou kan word (soos sigbaar uit die vergelyking met die TK-korpus). Daar is dus tekens van ’n kenmerkende idiolek as Hambidge se woordgebruik in die geheel ondersoek word. Wanneer Hambidge se woorde egter intern tussen die genres vergelyk word, blyk dit duidelik dat die woordgebruik tussen die genres verskil. Die aanname kan dus gemaak word dat Hambidge se taalgebruik wel verander afhangende van die genre en multimodaliteit waarin sy skryf, maar dat haar oorkoepelende multimodale idiolek as kenmerkend beskou kan word. Die woorde “vrou” en “skryf” kom nie net gereeld in al Hambidge se genres voor nie, maar wanneer die JH-korpus met die TK-korpus vergelyk word, is die frekwensie van hierdie twee woorde ook baie hoër in die eersgenoemde korpus, en dus kan die twee woorde as kenmerkend van Hambidge se idiolek beskou word. Aangesien dit egter inhoudswoorde is, sal bykomende ontledings moet plaasvind om te bepaal of dit ’n Hambidge-teks is wanneer ’n herhaaldelike voorkoms van die woorde “vrou” en “skryf” bepaal word.
Die sleutelwaardebepalings het aangetoon dat Hambidge se tekste oor die algemeen as ooreenstemmend beskou kan word. Die rol van genre as ’n veranderlike is dus nie so groot nie. Daar is egter ook bevind dat die PhD en die reisjoernaal volgens die sleutelwaarde-indeks die grootste ooreenkoms toon. Die afleiding wat uit die sleutelwaarde-ontleding gemaak kan word, is dat Hambidge wel oor ’n herkenbare idiolek beskik, maar dat die idiolek nie noodwendig so sterk ooreenstem tussen ooreenstemmende multimodaliteite en genres nie. Bogenoemde dui aan dat Hambidge oor ’n kenmerkende idiolek beskik as haar korpus in sy geheel ondersoek word. Die idiolek is nie noodwendig so sigbaar tussen die afsonderlike genres nie. Die genres wat wel ooreenstem, is nie noodwendig die verwagte genres nie. Dus kan die aanname gemaak word dat Hambidge, soos deur die sleutelwaardebepalings aangedui, nie noodwendig volgens die verwagte genrebeperkings skryf nie. Die resultaat dui slegs daarop dat die genres wat in hierdie studie gebruik is, ooreenstem volgens die sleutelwaardebepalings, en dat daar nie ’n verskil is tussen die genoemde genres wat in dié ondersoek gebruik is nie.
Die stilistiese ontleding het getoon dat daar enkele woorde en uitdrukkings is wat as kenmerkend van Hambidge se idiolek beskou kan word. Tog is daar ook bepaal dat slegs enkele van die voorbeelde wat genoem is, deurlopend in Hambidge se idiolek oor die grense van genres waargeneem kon word. Uit die kategorieë wat tydens die ondersoek gebruik is, kan die volgende afleidings gemaak word:
- Dit is duidelik dat woorde soos “geoedipaliseerde (ongeag die vorm waarin dit gebruik word) kenmerkend van Hambidge se idiolek is. Hambidge maak gereeld van eponieme gebruik, ongeag die genre waarin sy skryf, en dus kan dit as eie aan haar idiolek beskou word. Verder is die woorde “baaik” en “signifeer” sowel as “Compaq Armada” woorde wat kenmerkend is van Hambidge se idiolek.
- it die ondersoek oor kodewisseling in die JH-korpus is dit duidelik dat daar sekere woorde is wat as kenmerkend van Hambidge se idiolek beskou kan word. Die meeste voorbeelde is egter genrespesifiek, en dit is met uitsondering dat ’n woord geïdentifiseer kon word wat oor die grense van genres heen voorkom.
- Parenteses is nóg ’n verskynsel wat as ’n kenmerk van Hambidge se idiolek beskou kan word.
- Verheffing kom nie in die TK-korpus voor nie en dus kan dit gestel word dat die verheffing van soortname tot eiename as ’n aanduider van Hambidge se idiolek beskou kan word.
Uit die stilistiese ondersoek is dit dus duidelik dat daar enkele woorde is wat kenmerkend van Hambidge se idiolek is, terwyl ander woorde net in ’n sekere genre voorkom. Ondersoek is ook ingestel na die tekste as ’n geheel en daar is na die eienskappe van die genres gekyk. Daar is bepaal dat Hambidge haar nie deur die verwagte genrekonvensies laat voorskryf nie. Haar skryfstyl verskil dus in die afsonderlike genres. Aangesien die TK-korpus slegs ter vergelyking gedien het, sal bykomende ondersoeke gedoen moet word om te bepaal of Hambidge se skryfstyl afwyk van tekste deur ander skrywers uit dieselfde genre.
Die aanvanklik-gestelde hipotese impliseer dat daar wel ’n herkenbare idiolek by die navorsingsubjek (Joan Hambidge) waargeneem sou word ‒ oor die grense van die multimodaliteite en genres heen ‒ en dat hierdie idiolek eie aan die ondersoeksubjek sal wees, asook dat dit sigbaar sal wees ongeag die genre. Hambidge beskik beslis oor ’n herkenbare idiolek wanneer haar genres as ’n multimodale geheel ondersoek word. Haar idiolek is dan duidelik sigbaar en kenmerkend. Wanneer die afsonderlike genres ondersoek word, is dit duidelik dat daar sekere verskynsels (kenmerkende kategorieë wat ondersoek kan word) is wat oor die grense van genres voorkom. Daar is egter nie ’n enkele kenmerk wat só sterk in al die genres voorkom dat dit as onbetwisbaar uniek aan Hambidge se idiolek beskou kan word nie. Alhoewel daar kenmerke is wat in al die genres en multimodaliteite voorkom, blyk dit dus dat daar nie ’n woord of sinsnede is wat deurgaans uniek in elke genre en multimodaliteit voorkom nie. Voorts, alhoewel die onderskeie korpora waaruit die Hambidge korpus bestaan onbetwisbaar Hambidge-tekste is, verskil hulle tog ook baie van mekaar. Hierdie verskille is nie net in terme van die genre of multimodaliteit nie, maar is eerder teksgebonde, aangesien twee romans ontleed is en dié romans eerder verskille as ooreenkomste toon.
Deur die verskillende ontledingsmetodes te volg (soos in die artikel gedoen is) wat as aanvullend tot mekaar uitgevoer is, is dit egter duidelik dat die ondersoek na die genoemde (soos deur die artikel bepaal) idiosinkratiese kenmerke aanleiding kan gee tot die identifisering van Hambidge se idiolek, ongeag die genre waarin sy skryf.
Deur die stilometriese ondersoek is daar ondersoek ingestel na die voornaamwoord-, voorsetsel- en konjunksiemerkergebruik in die korpus. Die gebruik van die TK-korpus het ten doel gehad om ’n basis te skep waarteen Hambidge se korpus vergelyk kon word. Hierdie ondersoekmetode is veral geslaagd wanneer skrywerskapidentifikasie plaasvind, maar om die idiolek van individue te identifiseer, sou dit meer akkuraat wees om nie anonieme skrywers te gebruik nie. Vir die aard van dié ondersoek was die gekose wyse van ondersoek voldoende, maar vir bykomende studies, waar die metodologie van ondersoek verfyn sal moet word, sal dit meer gepas wees om verskillende skrywers te gebruik om sodoende vas te stel wat elk se idiolek is, en hulle dan te vergelyk. Deur so ’n vergelyking te tref, sal dit ook moontlik wees om verskillende styl-, skrywerstem- en registerkenmerke te identifiseer. Daar sal ook na meer as net die voornaamwoorde, voorsetsels en konjunksiemerkers gekyk moet word. Woordsoortetikettering kan in dié geval ’n goeie vertrekpunt wees, aangesien daar dan na al die verskillende woordsoorte, asook die wyse waarop die woordsoorte gebruik word, ondersoek ingestel kan word.
Die metode wat gebruik is om die stilistiese ondersoek uit te voer, kan as voldoende aanvaar word, alhoewel daar meer kategorieë geïdentifiseer kan word wat in die ondersoek ingesluit kon word. Soos in die geval van die stilometriese ondersoek, sal ’n uitgebreide studie waar verskillende skrywers se idiosinkratiese stylkenmerke met mekaar vergelyk word, meer beduidende antwoorde verskaf. Alhoewel daar dus beslis gepoog moet word om die ondersoekmetodes uit te brei, was die metode voldoende vir die aard van dié ondersoek en kon die navorsingsvraag beantwoord word. Daarom is dit moontlik om aan te voer dat Joan Hambidge oor ’n kenmerkende multimodale idiolek beskik, en dat dié idiolek sigbaar is, ongeag die genre waarin sy skryf.
Bibliografie
Angouri, J. 2010. Quantitative, qualitative or both? Combining methods in linguistic research. In Litosseliti (red.) 2010.
Anoniem. 2013. Corpus linguistics. http://www.lancs.ac.uk/fss/courses/ling/corpus/blue/l03_4.htm (1 Junie 2013 geraadpleeg).
AntConc. 2013. AntConc Weergawe 3.2.4. http://www.antlab.sci.waseda.ac.jp/software.html (1 Junie 2013 geraadpleeg).
Anthony, L. 2004. AntConc: A learner and classroom friendly, multi-platform corpus analysis toolkit. In Proceedings of IWLeL 2004: An interactive workshop on language e-learning. http://www.laurenceanthony.net/research/iwlel_2004_anthony_antconc.pdf (5 Augustus 2018 geraadpleeg).
Baker, P. 2010. Sociolinguistics and corpus linguistics. Edinburgh: Edinburgh University Press.
Barlow, M. 2010. Individual usage: a corpus-based study of idiolects. 34th International LAUD Symposium, Landau, Duitsland. http://michaelbarlow.com/barlowLAUD.pdf (2 April 2016 geraadpleeg).
Barry, K. en K. Luna. 2012. Stylometry for online forums. http://cs229.stanford.edu/proj2012/BarryLuna-StylometryforOnlineForums.pdf (19 Augustus 2015 geraadpleeg).
Bateman, J. 2008. Multimodality and genre: a foundation for the systematic analysis of multimodal documents. Houndmills, Basingstoke, Hampshire: Palgrave Macmillan.
Bateman, J., J. Wildfeuer en T. Hiipala. 2017. Multimodality. Berlyn: De Gruyter Mouton.
Bezemer, J. en G. Kress. 2008. Writing in multimodal texts: A social semiotic account of designs for learning. Written Communication, 25(2):166‒95.
Bloch, B. 1948. A set of postulates for phonemic analysis. Language, 24(1):3‒46. https://www.jstor.org/stable/410284?seq=2#page_scan_tab_contents (5 Januarie 2016 geraadpleeg).
Brainerd, B. 1974. Weighing evidence in language and literature: a statistical approach. Toronto: University of Toronto Press.
Brocardo, M.L., I. Traore, S. Saad en I. Woungang. 2013. Authorship verification for short messages using stylometry. IEEE Intl. Conference on Computer, Information and Telecommunication Systems. Piraeus-Athene, Griekeland. https://www.uvic.ca/engineering/ece/isot/assets/docs/Authorship_Verification_for_Short_Messages_using_Stylometry.pdf (21 Februarie 2016 geraadpleeg).
Carney, T.R. 2018. Disposing of bodies, semantically: notes on the meaning of “disposal” in S v Molefe. PER, 21:1-20.
Carstens, W.A.M. 2006. Norme vir Afrikaans. Pretoria: Van Schaik.
Carstens, W.A.M. en N. Bosman (reds.). 2014. Kontemporêre Afrikaanse taalkunde. Pretoria: Van Schaik.
Carstens, W.A.M. en K. van de Poel. 2011. Teksredaksie. Stellenbosch: SUN PReSS.
Cloete, T.T. (red.). Literêre terme en teorieë. Pretoria: HAUM-Literêr.
Coulthard, M. 1994. On the use of corpora in the analysis of forensic texts. The International Journal of Speech, Language and the Law, 1(1):27‒43.
—. 2005. Some forensic applications of descriptive linguistics. Veredas, 9(1):9–28.
—. 2013. On admissible linguistic evidence. Journal of Law and Policy, 21(2):441–66.
Coulthard, M. en A. Johnson (reds.). 2010. The Routledge handbook of forensic linguistics. New York: Routledge.
Creswell, J.W. 2013. Research design: qualitative, quantitative and mixed methods approaches. Londen: SAGE.
Crystal, D. 2008. A dictionary of linguistics and phonetics. Oxford: Blackwell Publishing.
De Vos, A.S., H. Strydom, C.B. Fouché en C.S.L. Delport. 2009. Research at grass roots: for the social sciences and human service professions. Pretoria: Van Schaik.
De Wet, K. 1990. Ars poëtiese solipsisme: ’n Padkaart van Joan Hambidge se poësie. MA-verhandeling, Universiteit van Pretoria.
Du Plessis, H. 1988. Variasietaalkunde. Pretoria: Serva Uitgewers.
—. 1995. Variasietaalkunde. Pretoria: Kagiso.
Du Plooy, H. 2014. Inleiding – Die idiolek van ’n skrywer. Literator, 35(2):1‒3.
Du Toit, P. en W. Smith-Müller. 2015. Stylboek: riglyne vir paslik skryf. Pretoria: Van Schaik.
Eckert, P. 2008. Variation and the indexical field. Journal of Sociolinguistics, 12(4):453‒76.
Fischer-Starcke, B. 2010. Corpus linguistics in literary analysis: Jane Austin and her contemporaries. Londen: Continuum.
Fourie, R. 2009. Die produksiegehalte van Palindroom en Kladboek deur Joan Hambidge as gevallestudies binne die uitgewersbedryf. LitNet Akademies, 6(1):59‒87. http://www.oulitnet.co.za/newlitnet/pdf/la/LA_6_1_fourie.pdf.
Grant, T. 2007. Quantifying evidence in forensic authorship analysis. International Journal of Speech, Language and the Law, 14(1):1‒25.
—. 2010. Text messaging forensics: Txt 4n6: Idiolect free authorship analysis?In Coulthard en Johnson (reds.) 2010.
Greeff, R. 1995. Joan lê aan. De Kat, 465(95):72‒5.
Hambidge, J. 1991. Genre. In Cloete (red.) 1991.
—. 1995. Postmodernisme. Pretoria: J.P. van der Walt.
—. 2013a. Woorde wat weeg. http://joanhambidge.blogspot.com (14 Februarie 2013 geraadpleeg).
Herbig, F.J.W. en S.J. Joubert. 2006. Criminological semantics: conservation criminology − vision or vagary? Acta Criminologica, 19(3):88–103.
Hoey, M. 2005. Lexical priming: a new theory of words and language. Londen: Routledge.
Irizarry, E. 1992. A computer-assisted investigation of gender-related idiolect in Octavio Paz and Rosario Castellanos. Computers and the Humanities, 26(2):103‒17.
Ishihara, S. 2014. A likelihood ratio-based evaluation of strength of authorship attribution evidence in SMS messages using N-grams. International Journal of Speech, Language and the Law, 21(1):23–49.
Ivankova, N.V., J.W. Creswell en V.L.P. Clark. 2011. Foundations and approaches to mixed method research. In Maree (red.) 2011.
Jakobson, R. 1994. Language in literature. Cambridge: The Belknap Press.
Jenset, G.B. 2008. Basic statistics for corpus linguistics. http://folk.uib.no/gje037/statTutorialR.pdf (9 Oktober 2013 geraadpleeg).
Johnson, A. en D. Wright. 2014. Identifying idiolect in forensic authorship attribution. Language and Law, (1):37–69.
Johnstone, B. 2000. The individual voice in language. Annual Review of Anthropology, 29:405‒24.
—. 2011. Dialect enregisterment in performance. Journal of Sociolinguistics, 15(5):657‒79.
Jones, N.J. en C. Bennell. 2007. The development and validation of statistical prediction rules for discriminating between genuine and simulated suicide notes. Archives of Suicide Research, 11(2):1-15.
Juola, P. 2008. Authorship attribution. Hanover: now publishers inc. https://books.google.co.za/books?id=_B2zDLdqe60C&printsec=frontcover#v=onepage&q&f=false (2 September 2012 geraadpleeg).
Klopper, R. 2009. The case of cyber forensic linguistics. Alternation, 16(1):261–94.
Koppel, M. en A. Winter. 2014. Determining if two documents are written by the
same author. Journal of the Association for Information Science and Technology, 65(1):178–87.
Kotzé, E.F. 2007. Die vangnet van die woord: forensies-linguistiese getuienis in ’n lastersaak. Southern African Linguistics and Applied Language Studies (SALALS), 25(3):385‒99.
—. 2010. Author identification from opposing perspectives in forensic linguistics. Southern African Linguistics and Applied Language Studies (SALALS), 28(2):185‒97.
Kraljic, T., E.S. Brennan en A.G. Samuel. 2007. Accommodating variation: dialects, idiolects, and speech processing. https://doi.org/10.1016/j.cognition.2007.07.013 (26 Maart 2012 geraadpleeg).
Kress, G. 1997. Before writing: rethinking the paths to literacy. Londen: Routledge.
—. 2003. Literacy in the new media age. Londen: Routledge.
Kuhl, J.W. 2003. The idiolect, chaos and language custom far from equilibrium: Conversations in Morocco. PhD-proefskrif, University of Georgia.
Lancashire, I. 1999. Probing Shakespeare’s idiolect in Troilus and Cressida. University of Toronto Quarterly, 68(3):7‒28.
Larner, S. 2014a. A preliminary investigation into the use of fixed formulaic sequences as a marker of authorship. International Journal of Speech, Language and the Law, 21(1):1–22.
—. 2014b. Forensic authorship analysis and the world wide web. Basingstoke: Palgrave Pivot.
Langacker, R.W. 1973. Language and its structure. New York: Harcourt Brave Jovanavich.
Lawrence, D. 1999. Kodewisseling: Engels in Afrikaans – ’n instrument tot effektiewe kommunikasie. Journal for Language Teaching, 33(3):265‒74.
Lexical Analysis Software en Oxford University Press. 2013. WordSmith Tools Version 5.0. https://lexically.net/wordsmith/.
Li, J.S. 2015. An investigation of authorship authentication in short messages from a social networking site. Proefskrif, School of Computer Science and Information Systems, Pace University.
Litosseliti, L. (red.). 2010. Research methods in linguistics. New York: Continuum International Publishing Group.
Louwerse, M.M. 2004. Semantic variation in idiolect and sociolect: corpus linguistic evidence from literary texts. Computers and the Humanities, 38(2):207‒21.
Love, H. 2002. Attributing authorship: an introduction. New York: Cambridge University Press.
Marais, J.L. 2005. Die Afrikaanse poësie sedert die 1980’s ondenkbaar sonder Hambidge. Literator, 26(3):149‒80.
Maree, K. (red.). 2011. First steps in research. Pretoria: Van Schaik.
McEnery, T. en A. Wilson. 2001. Corpus linguistics. Edinburgh: Edinburgh University Press.
McMenamin, G.R. 2002. Forensic linguistics: advances in forensic stylistics. Londen: CRC Press.
Media24 Argief. http://152.111.1.251/ (2 Oktober 2013 geraadpleeg).
Michell, C.S. 2013. Investigating the use of forensic stylistics and stylometric techniques in the analyses of authorship on a publicly accessible social networking site (Facebook). MA-verhandeling, Universiteit van Suid-Afrika.
Mollin, S. 2009. “I entirely understand” is a Blairism: the methodology of identifying idiolectal collocations. International Journal of Corpus Linguistics, 14(3):367‒92.
Nel, M. 2014. Joan Hambidge se idiolek oor die grense van genres: ’n korpuslinguistiese ondersoek. MA-verhandeling, Noordwes-Universiteit (Potchefstroomkampus).
Newman, P. 2010. The Routledge handbook of forensic linguistics. Review. The International Journal of Speech, Language and the Law, 18(1):161‒67.
Nesselhauf, N. 2005. Corpus linguistics: a practical introduction. http://www.as.uni-heidelberg.de/personen/Nesselhauf/files/Corpus%20Linguistics%20Practical%20Introduction.pdf (20 Januarie 2013 geraadpleeg).
Nirkhi, S., R.V. Dharaskar en V.M. Thakare. 2015. Authorship verification of online messages for forensic investigation. Procedia Computer Science, 78(2016):640–5.
Olivier, J. 2013. Die mate van konsekwentheid in SMS-Afrikaans. LitNet Akademies, 10(2):479‒505. https://www.litnet.co.za/assets/pdf/joernaaluitgawe_10_2/10(2)_GW_Olivier.pdf
Olsson, J. 2008. Forensic linguistics. Londen: Continuum International Publishing Group.
Oxford advanced learner's dictionary. 2005. 7de uitgawe. Londen: Oxford University Press.
Panicheva, P., P. Cardiff en P. Rosso. 2010. Personal sense and idiolect: combining authorship attribution and opinion analysis. Verrigtinge van die 7de International Conference on Language Resources and Evaluation, LREC-2010, Mei 17‒23, Malta. http://users.dsic.upv.es/~prosso/resources/PanichevaEtAl_LREC10.pdf (31 Julie 2013 geraadpleeg).
Pharos-woordeboek. https://www.pharosaanlyn.co.za/tuis (20 Maart 2016 geraadpleeg).
Prinsloo, A. 2011. Die aap in jou koffie: Afrikaanse eponieme van A tot Z. Pretoria: Protea Boekhuis.
Sanderson, P. 2007. Linguistic analysis of competing trademarks. Language matters, 38(1):132–49.
Schmitt, N. (red.). 2004. Formulaic sequences: acquisition, processing and use. Amsterdam: John Benjamins Publishing Company.
Schmitt, N., S. Grandage en S. Adolphs. 2004. Are corpus-derived recurrent clusters psycholinguistically valid? In Schmitt (red.) 2004.
Solan, L.M. en P.M. Tiersma. 2004. Author identification in American courts. Applied Linguistics, 25(4):448–65.
SPSS Inc. 2011. IBM SPSS Statistics 21, Vrystelling 20.0.0, Kopiereg IBM Corporation. http://www-01.ibm.com/software/analytics/spss (20 Maart 2016 geraadpleeg).
Stamatatos, E. 2009. A survey of modern authorship attribution methods. Journal of the American Society for Information Science and Technology, 60(3):538–56.
Steyn, J.R. en S.M. Ellis. 2006. Die gebruik van effekgrootte-indekse by die bepaling van praktiese betekenisvolheid. Suid-Afrikaanse Tydskrif vir Natuurwetenskap en Tegnologie, 25(3):172‒75.
Taljaard, P.J. 2002. Tweetalige voorsetselwoordeboek. Pretoria: Content Solutions.
Taljaard, P.J. en W.K. Smit. 1982. Tweetalige voorsetselwoordeboek. Roodepoort: CUM-Boeke.
Thiart, L. 2014. Outeuridentifikasie: ’n forensies-taalkundige ondersoek na Afrikaanse SMS-taal. MA-verhandeling, Universiteit van Pretoria.
Tognini-Bonelli, E. 2001. Corpus linguistics at work. Philadelphia: John Benjamins.
Van Rooy, B. 2014. Die Afrikaanse taalkunde van toeka tot nou. In Carstens en Bosman (reds.) 2014.
Van Rooy, B. en L. Terblanche. 2006. A corpus-based analysis of involved aspects of student writing. Language Matters, 37(2):160‒82.
Van Zyl, J. 2001. Blond, beeldskoon en straight (Kê-kê-kê-kê). Beeld, 24 November, bl. 3.
Venter, R.I. 2013. Die relevansie van forensies-linguistiese getuienis vir die doeleindes van persoonsidentifikasie by witboordjiemisdade. MCom-verhandeling, Noordwes-Universiteit.
Verhoef, M.M. 1991. Taalbeplanning: die stand en die toekoms van taalbeplanning vir Afrikaans in ’n multitalige Suid-Afrika. PhD-proefskrif, Potchefstroomse Universiteit vir Christelike Hoër Onderwys.
Woods, A.F., P. Fletcher en A. Hughes. 1989. Statistics in language studies. New York: Cambridge University Press.
Wu, C.H., C. Lee en H. Liang. 2009. Idiolect extraction and generation for personalized speaking style modeling. Transactions on Audio, Speech, and Language Processing, 17(1):127‒37.
Eindnotas
1 Hierdie werk is gebaseer op navorsing wat gedeeltelik deur die Nasionale Navorsingstigting van Suid-Afrika ondersteun is (toekenningnommer: 112143).
2 Volgens Crystal (2008:279) verwys leksikon na die taalgebruik in ’n taal, terwyl ’n leksikale item as ’n enkele taaleenheid beskou word.
3 Die begrip ondersoeksubjek word neutraal gebruik en veronderstel geen magsverhouding tussen die navorsers en die ondersoekte individu nie.
4 Brainerd (1974) het spesifiek ondersoek ingestel na die verspreiding van lettergrepe per woord as ’n suksesvolle wyse om die skrywer van ’n teks te bepaal.
5Hierdie artikel is gebaseer op ’n MA-verhandeling (Nel 2014).
6 Daar kan tussen ander tipes korpora ook onderskei word (historiese, meertalige, streeks, of selfs gesproke korpora).
7 (Insluitings)vereistes hou in hierdie konteks verband met publikasie in verskillende genres in Afrikaans. Daar word glad nie geïmpliseer dat een skrywer beter is as ’n ander nie, maar slegs dat sommige skrywers meer geskik vir die doel van hierdie ondersoek is.
8 Die Taalkommissie het toestemming verleen dat die korpus as verwysingskorpus gebruik kan word in die ondersoek na Joan Hambidge se idiolek (Nel 2014).
9 Ten einde hierdie navorsing uit te voer, is Joan Hambidge se gedigte nie by die korpus ingesluit nie. Die vergelyking van Hambidge se idiolek soos dit in haar gedigte en in die res van haar skryfwerk aangetref word, kan egter as ’n verdere studie onderneem word.
10 Die terminologie in hierdie tabel word in afdeling 3.4 bespreek.
11 Die leksikale item soos in is bloot gekies ter wille van illustrasie van die berekening van die frekwensies.
12 Die genormaliseerde waarde vir die frekwensiebevindinge vergemaklik die interpretasie van die data.
13 AntConc is gebruik ter wille van die verifiëring van bevindinge wat uit die ontleding in WordSmith Tools verkry is.
14 Grammatikale woorde (ook funksiewoorde genoem) is volgens Crystal (2008:203), Juola (2008:265) en Kotzé (2007:388) woorde wat semanties oor min of geen onafhanklike betekenis beskik nie, maar wat grammatikale betekenis van die taal oordra en sluit lidwoorde, hulpwerkwoorde, voegwoorde en voorsetsels in. In hierdie ondersoek is daar op voorsetsels, voornaamwoorde en konjunksiemerkers gefokus.
15 N-aantal verwys in dié geval na die veranderlike, aangesien daar verskillende getalle voornaamwoorde, voorsetsels en konjunksiemerkers geïdentifiseer is.
16 Die Chi-kwadraattoets word deur WordSmith Tools gegenereer en daarom word die statistiese term nie vir die doel van dié ondersoek gedefinieer nie.
17 Vir die doel van dié artikel is daar gebruik gemaak van Beeld, Die Burger en Rapport op die Media24-argief. Hierdie argief is gebruik wanneer ’n spesifieke leksikale item nie in die TK-korpus voorgekom het nie, maar wel in die Hambidge-korpus. Sodoende is daar bepaal of die leksikale item wel as uniek aan Hambidge se idiolek beskou kan word.
18 Hapax legomenon verwys na ’n woord wat net een maal in die teks van ’n bepaalde skrywer voorkom (Crystal 2008:224).
LitNet Akademies (ISSN 1995-5928) is geakkrediteer by die SA Departement Onderwys en vorm deel van die Suid-Afrikaanse lys goedgekeurde vaktydskrifte (South African list of Approved Journals). Hierdie artikel is portuurbeoordeel vir LitNet Akademies en kwalifiseer vir subsidie deur die SA Departement Onderwys.