Integrasie van artikulatoriese en akoestiese eienskappe van vokale: ’n beskrywingsraamwerk

  • 0

Integrasie van artikulatoriese en akoestiese eienskappe van vokale: ’n beskrywingsraamwerk

Daan Wissing, Senior Navorser, Sentrum vir Tekstegnologie, Noordwes-Universiteit

LitNet Akademies Jaargang 9 (2)
ISSN 1995-5928

Abstract

Opsomming

Die hoofdoel van hierdie artikel is om ’n raamwerk te ontwikkel wat gebruik kan word vir die beskrywing, ontleding en interpretering van die vokale, natuurlike klasse vokale, soos byvoorbeeld die gemerkte geronde vokale, asook volledige vokaalsisteme, van enige taal, in ons geval hoofsaaklik Afrikaans. Vokale word onder meer beskryf in terme van die manier waarop dit geproduseer word, dit is in die artikulatoriese fonetiek. Daarvan bestaan daar etlike goeie voorbeelde wat betref Afrikaans, maar geen omvattende behandeling van die akoestiese eienskappe van Afrikaanse vokale nie. Dit is anders gestel in die geval van Nederlands, en dit kan baie kan bydra tot die ontwikkeling van sodanige beskrywing in akoestiese terme. In hierdie bydrae probeer ek om hierdie gapings te vul. Wat betref die artikulatoriese, kyk spesifiek hier na die interaktiewe vokaalkaart deur op http://www.nwu.ac.za/af/content/ctext-vokaalkaart te klik, en die aanduidings daar te volg. Hier kan mens nie net hoor hoe ’n spesifieke vokaal klink nie, maar mens kan ook ’n magnetiese resonansbeeld (MRI) van die mondkanaal (insluitende die posisies van die tong en vorm van die lippe) daarvan sien.

Ek gee die meeste aandag aan die akoestiese eienskappe van vokale. Juis omdat dit nie vir spesifiek die Afrikaanse vokaalsisteem bestaan nie, maak ek ruim gebruik van die meer gevorderde Nederlandse literatuur, maar ook die uitspraak self van die Nederlandse vokale. Die voordeel hiervan is dat daar ’n groot ooreenkoms is tussen die vokale van hierdie twee tale. Vokaalparameters wat toegelig word, is duur, intensiteit, grondfrekwensie (F0), en die vokaalformante (F1, F2, F3), asook die bandwydte van F1. Kort vokale kan met behulp van slegs hierdie stel parameters ontleed word, maar vir die lang, middelhoë vokale, wat geneig is om te diftongeer, is die gradiënt waarteen hulle vokaalformante verloop, ook van groot belang. Hierdie aspek van vokale kry spesiale aandag. In hierdie artikel lig ek ’n spesifieke vokaalontledingsprogram, Vowelyse (Van der Walt en Wissing 2004) toe, en wys op die sterkpunte daarvan vergeleke met ander metodes soos wat dit in die vakliteratuur gevind word.

Trefwoorde: Afrikaans; akoestiese fonetiek; akoestiese vokaalkaart; artikulatoriese fonetiek; interaktiewe vokaalkaart; MRI (magnetiese resonansbeelde); Nederlands; vokaal; vokaalparameter; vokaalparameterhiërargie; vokaalsisteem; vokaalontledingsmetodes.

Abstract

Integrating articulatory and acoustic phonetics: a framework for the study of vowels

The main purpose of this research was to develop an integrated framework for the description, analysis and interpretation of vowels, which should be applicable first and foremost to Afrikaans, but also to other languages. This broad applicability is, to a large extent, due to the nature of articulatory and acoustic phonetics. This framework can therefore be seen as an attempt to develop a universally applicable descriptive model. Although many well-written works exist which provide detailed discussions on the two types of phonetics, a comprehensive, integrated model such as the one proposed here has not yet been developed. This article is an attempt to contribute to the development of such a framework. I focus on the description of the physical, i.e. the acoustic, characteristics of vowels, as this facet gives one the opportunity to provide a wider-ranging and more precise description, which is imperative when different vowel systems are being compared. Such comparisons include those between the related languages Afrikaans and Dutch, but also, and in particular, the comparison of a number of pronunciation varieties of Afrikaans. The latter is an important aim of this comprehensive research project, of which this article provides an overview.

In the absence of sufficient artwork, I have made ample use of Dutch works (particularly that of Rietveld and Van Heuven, 2009), which constitute a comprehensive discussion of the articulation of vowels. Furthermore, these authors personally made available to me a complete set of magnetic resonance imaging (MRI), one for each Dutch vowel. The second author also provided his sound files of his reading of the vowels in the framework h_t. This was used in the development of an online interactive vowel chart. As can be seen and heard on this web page, the manner in which vowels are formed (articulated) is illustrated graphically. The pronunciation of vowels is combined with these images. An attractive feature available on this interactive chart is the comparison of the tongue and lip stances of a specific vowel with each of the remaining eleven vowels in a graphic manner.

The acoustic parameters under consideration in this article are the temporal parameter, duration and particularly various spectral parameters. The most important parameters are those which refer to the vowel formant frequency parameters F1, F2 and F3, as well as F0, which is the fundamental frequency. The bandwidth of vowels is often neglected in vowel descriptions in general. Nevertheless, I do discuss them here with specific reference to F1. Other parameters that are also interesting and important for a comprehensive description of vowels are total intensity and the intensity that can be measured in certain spectral areas (I investigate two: those called BF1 and BF2, respectively Band Pass Filter 1 and Band Pass Filter 2). According to my knowledge, the ratio between harmonicity and noise that can be found in vowel waveforms (i.e. harmonicity-to-noise ratio, or HNR) has not yet been used in the way in which I represent it in this research. The latter may be valuable when studying emphasis on vowels, be it stress or sentence accent.   

In this article, both acoustic vowel charts and line graphs are proposed to describe the acoustic characteristics of vowels in a precise and comprehensive manner. These vowel charts and line graphs were derived from acoustic information extracted from the acoustic wave form and provided in the form of tables. It is indicated that although the use of gradient-related parameters is not required in the case of the short, steady-state vowels, the opposite applies to the diphthonged vowels with gliding first and second formants. This aspect of vowels receives special attention. Various methods of approach are illustrated, among others those related to the one that I propose. I refer to the method of description of Adank et al. (2004) in particular, which simply uses two readings on the temporal line of the formants, one on the 25% mark and one on the 75% mark. Smakman (2006) refines this method by suggesting a diphthongisation index. I indicate that this method is not superior to the one suggested in the present article.

In addition to explaining the use of acoustic vowel charts and line graphs, it is demonstrated how the statistical method of discriminant function analysis can be used to determine which parameters discriminate best between two or more naturally occurring groups of vowels. It is pointed out, for example, that one should always be able to discriminate between vowels that belong to the same natural phonological class in a more precise manner when making use of the full set of parameters rather than only the two traditional vowel frequency parameters, namely F1 and F2, even if duration, the other customary phonological feature,  is also brought into the equation. This is demonstrated with reference to the high middle and high back vowels (/u/ and /o/). When only F1 and F2 are used, /u/ is classified correctly for only 56%, and /o/ for 75%. This level of success is increased to 94% and 95% respectively if all parameters are used.

Key words: Afrikaans; acoustic phonetics; acoustic vowel chart; articulatory phonetics; Dutch; interactive vowel chart; MRI (magnetic resonance imaging); vowel;  vowel parameter; vowel parameter hierarchy; vowel system; vowel analysis methods.

1. Inleiding

Ten einde vokale van enige taal op ’n omvattende en insiggewende wyse te kan beskryf, is ’n volledige teoretiese raamwerk nodig. Daarvoor benodig mens ’n goeie ondersteunende fonetiekraamwerk. Dit sluit veral in grondige kennis van toepaslike aspekte van die akoestiese fonetiek, maar ook, hoewel slegs in ’n ondersteunende rol, van die artikulatoriese fonetiek. Daar is baie inleidende studies hieroor. Vergelyk hiervoor werke soos dié van Kent en Read (1992), wat Engels as basis neem, en Rietveld en Van Heuven (1997; 2009)1, ’n besonder uitgebreide Nederlandse werk. Onder die bekendste ander bronne is dié van Jones (1934; Engels), Ladefoged (2001; Engels) en Catford (1988; hoofsaaklik Engels) en Nooteboom en Cohen (1984; Nederlands). In die Suid-Afrikaanse konteks is Coetzee (1981) ’n algemene inleiding tot die Afrikaanse fonetiek. Van Wyk (1977; Suid-Afrikaanse tale) se Praktiese fonetiek is ’n belangrike werk. Laasgenoemde twee fokus uitsluitlik op artikulatoriese aspekte; die ander, veral die werke van Kent en Read (1992) en Rietveld en Van Heuven (2009), gaan ook deeglik in op die akoestiese sy van die klankleer. Sodanige werk bestaan nie in die geval van Afrikaans nie, behalwe, in ’n mate, Van der Merwe, Groenewald, Van Aardt, Tesner en Grimbeek (1993), wat beperkte akoestiese inligting gee oor sommige Afrikaanse vokale. Wissing (2005; 2006; 2010; 2011a) het ’n aantal studies gepubliseer oor individuele vokale en een diftong, maar het geen aandag geskenk aan die vokaalsisteem as entiteit nie.

’n Basiese agtergrond van die fisiologie van klankproduksie is nodig vir die verstaan van die akoestiese eienskappe van die individuele segmente. Ek probeer om die artikulatoriese en veral akoestiese inligting aangaande vokale in hierdie artikel op ’n enkelvoudige, maar geïntegreerde wyse te ontplooi. Omdat die bepaling van sodanige foneme nie ’n onbenullige kwessie is nie, bespreek ek kortliks die metodologie waarvolgens dit gewoonlik – ook in hierdie geval – gedoen word. Die artikel het in hierdie opsig ’n meer algemene toepassing deurdat dit nie tot Afrikaans beperk is nie. Trouens, die Afrikaanse vokale, en veral die volledige vokaalstelsel van Afrikaans, is nog baie onvolledig beskryf, veral wat die akoestiese eienskappe daarvan betref. Daarom wend ek my, met die oog op die beoogde  geïntegreerde beskrywingsraamwerk, tot die toepaslike inligting wat wel ten opsigte van die veel omvangryker studies van Nederlands beskikbaar is. Die groot ooreenkoms tussen die vokale van Afrikaans en Nederlands vergemaklik hierdie taak in ’n hoë mate. Ek maak wel waar toepaslik van Afrikaanse voorbeelde gebruik.   

Vokale vorm die kern van sillabes, wat op hulle beurt enkelvoudige of kompleks-gevormde woorde saamstel. In normale spraak word sodanige woorde gewoonlik uitgespreek as onderdele van sinne. In spraaknavorsing (hier die artikulatoriese, en veral die akoestiese fonetiek), waar dit gaan om die bestudering van die basiese karakter van enkelklanke, word vokale tipies in lyste wat bestaan uit eensillabige enkelwoorde deur die betrokke deelnemers gelees. In die geval van die fonologie van ’n taal gaan dit veral om klankprosesse en hoe klanke op ’n sistematiese wyse kan verander na gelang van die betrokke klankomgewing (soos frases of sinne) waarin dit kan voorkom. Dit geld bowenal die invloed wat nadruk of die afwesigheid van nadruk kan hê op die vorming en klankkwaliteit van klanke. Hier dink mens aan die redusering (tipies in die rigting van die neutrale sjwa2) van vokale wanneer dit in ’n onbeklemtoonde posisie voorkom. Ander vokaalveranderinge sluit in ontronding, verhoging, verlaging, en verlenging; hierdie prosesse is nie beperk tot onbeklemtoonde posisies nie. Dit is vanselfsprekend dat sodanige vokaalveranderende omstandighede vermy sal word in gevalle van die bestudering van die basiese vokale van ’n taal. Die lees van enkelsillabige woorde in isolasie (in woordlyste) word tipies hiervoor gebruik. In lyste word die vokale in sodanige enkelsillabige woorde geaksentueer, wat, gesamentlik beskou, verseker dat die volvorm van die vokale verkry word. Lass en Wright (1985:158) motiveer die gebruik van geïsoleerde woorde in soortgelyke studies soos volg: “We do not apologize for using words in isolation as primary evidence: in terms of ‘psychological reality’, ‘canonicalness’ or whatever, these are surely the primary input to any phonological study, synchronic or diachronic [...].” Ek sluit my volledig daarby aan.

2. Die produksie van spraakklanke en die akoestiese korrelate daarvan

Daar is, soos reeds gesê, ’n groot aantal werke oor die manier van vorming van vokale enersyds, en in ’n mindere mate ook die akoestiese eienskappe daarvan. Die wyse waarop hierdie twee fasette saamhang, word egter meestal afgeskeep. Ek probeer hier om hierdie gaping te vul.

Ten aanvang is dit nodig om die algemeen geldende gegewe te stel dat bewegende lug nodig is vir die vorming van alle spraakklanke. Spraak bestaan uit ’n vinnige opeenvolging van klein versteurinkies van die lugdruk. Lugdeeltjies word afwisselend verdig en verdun deur die beweging van die spraakorgane. Die proses kan opgeneem word deur middel van ’n mikrofoon, en dan weer sigbaar gemaak word in die vorm van ’n ossilogram (meestal golfvorm genoem; Rietveld en Van Heuven 2009, hoofstuk 6 gee meer besonderhede). Spektrogramme kan afgelei word van sodanige golfvorme. Hierdie golfvorme en spektrogramme vorm die basis vir die bepaling van die akoestiese kenmerke van vokale.

Die volgende anatomiese spraaksisteme word gewoonlik onderskei:

  • die subglottale sisteem: die longe, en die spiere wat die longe bystaan om lug deur die spraakkanaal te dryf (die inisiasiefase)
  • die glottale sisteem, wat betrokke is by stemgewing: die strottehoof, en die stembande wat daarin gesetel is (die fonasiefase) 
  • die supraglottale sisteem, dit is die keel-mond-neusholte: alles bokant die strottehoof waarmee die uitvloeiende lug gewysig kan word deur resonansie in dié ruimtes ten einde die spraakklanke te vorm (die artikulasiefase).

Ons fokus hier op die artikulasiefases, en in ’n mindere mate op die fonasiefase. Die akoestiese eienskappe van vokale (en, waar moontlik, die terme wat nodig is om te beskryf hoe vokale waargeneem word – dit is persepsie-fonetiese inligting) word in hierdie artikel sover moontlik met hierdie fisiologiese gegewens in verband gebring.

Die inisiasiefase is vir die doeleindes van die beskrywing van vokale van belang slegs in soverre dit verantwoordelik is vir die mate van intensiteit waarmee klanke voortgebring word.

2.1 Die inisiasiefase

Die intensiteit waarmee klanke, in ons geval vokale, voortgebring word, word hoofsaaklik bepaal deur die mate van transglottale drukverskil by die voortbrenging van vokale (en ander klanke) – dit is dus ’n fisiologiese oorsaak. Hoe hoër die transglottale drukverskil, hoe hoër is die amplitudes van ’n golfvorm – dit is die akoestiese korrelaat daarvan (kyk laer af vir ’n uiteensetting van akoestiese terme soos amplitude). Amplitudehoogte is ’n aanduiding van die betrokke intensiteit waarteen ’n klank voorgebring word. Dit kan ook gesien word as die krag waarteen ’n klankgolf verplaas word. Dit kom neer op die luidheid (of hardheid; Eng. loudness) waarteen die klank waargeneem word – dit is die perseptuele aspek van ’n klank (Kent en Read 1992:227; Rietveld en Van Heuven 2009:220). Intensiteit word gesien aan hoër amplitudes van ’n vokaal; gemeet in desibel (dB; INTENS), en word as hardheid of luidheid van ’n vokaal deur die luisteraar ervaar. Intensiteit kan oor die hele energiespektrum van ’n klank bepaal word (genoem totale intensiteit), of in bepaalde energie-areas. Sodanige areas word bepaal deur die gebruik van banddeurlaatfilters (BF’s).

Sien verder die uiteensetting by Figuur 1, wat ’n uitknipsel is van ’n Praat-skerm3, en voorsien is van verduidelikings in die vorm van ’n pyl, rame en etikette.

Venster A is die golfvorm van die vokaal /i/ in BIER4; Vensters B, C en D saam is die spektrogram daarvan. In die spektrogram word drie gedeeltes van die frekwensiespektrum aangedui as intensiteitsbande (Vensters B, C, D). Die rooi pyl toon aan dat ’n hoër intensiteit in die klank op twee maniere gesien kan word (sodanige gedeeltes sal harder klink). In Venster A is die amplitudes groter as dié onmiddellik links en regs daarvan, in Venster B stem dit ooreen met die verhoging in die geel streep – wat in Praat die intensiteitsverloop aandui. Dit is origens duidelik te sien aan die horisontaal-lopende bande, wat donkerder is as die res van die spektrogram direk bo en onder dié energiebande. Die rooi kolletjies in hierdie bande is ’n aanduiding van die betrokke formante. Formant-inligting vorm die kern van die beskrywing van vokale. Daar word later volledig in afdeling 5, “Die akoestiese korrelate van die plek van vorming van vokale”, hierop ingegaan.

Figuur 1. Golfvorm (Venster A) en spektrogram (Vensters B, C, D) van die vokaal /i/ in die woord BIER. Vensters B, C en D saam strek oor die totale intensiteitsband (groen pyl); afsonderlike bande in Venster B, C en D word deur etikette aangedui. F1–F3 word voorgestel deur die horisontaal-lopende rooi kolletjies.

Die akoestiese parameters wat ten opsigte van intensiteit van belang is, en in verdere ondersoeke betrek sal word, is Totale Intensiteit, Intensiteit van Banddeurlaatfilter1 en Intensiteit van Banddeurlaatfilter2, afgekort tot BF1 en BF2. Totale Intensiteit word oor die hele spektrum van die vokaal gevind, in die geval van die /i/ van Figuur 1 van 0 Hz – 5 000 Hz5. Formant 1 (F1) val dus in BF1 (hier 0 Hz – 700 Hz), en Formant 2 (F2) in BF2 (hier 700 Hz – 3 000 Hz. Die intensiteit in Venster B, waarin die derde vokaalformant, F3, gewoonlik voorkom, word selde gebruik. F1 word in Figuur 1 in Venster D gevind; BF2 in Venster C bevat F2. Die motivering vir die insluiting van domeinspesifieke intensiteitsparameters kom uit werk van die Nederlandse ondersoekers Sluijter en Van Heuven (1996). Hulle bevind dat in die geval van Nederlandse vokale die totale intensiteit (spesifiek in die geval van die Nederlandse vokale wat deur hulle ondersoek is, vanaf 0 Hz tot 4 kHz) van minder belang is by die uitdrukking van klemtoon as in die geval van die spektrale band van 500 Hz en 2 000 Hz. Die eerste band (wat ruweg ooreenkom met Figuur 1 se Venster D) bly stabiel, of die vokaal beklemtoond is of nie. Rietveld en Van Heuven (2009) noem dit selektiewe intensiteitsverskille. Wissing (2007) vind dieselfde vir Afrikaanse gevalle.

2.2 Die fonasiefase

Alle Afrikaanse sillabiese segmente, dus ook vokale, is stemhebbend, dit wil sê die stembande tril by die produksie daarvan.

Soos hier bo reeds gesien, kan stembande tot trilling kom slegs indien ’n gepaardgaande voldoende transglottale drukverskil aanwesig is (vgl. ook Rietveld en Van Heuven 2009:58; 77). ’n Optimale transglottale druk moet bowendien gehandhaaf word ten einde stembandtrilling te kan volhou, dus om te kan aanhou om stemhebbende (periodiese) klanke te produseer. Stembandtrilling korreleer in akoestiese terme met grondfrekwensie (afgekort tot F0), en in perseptuele terme met toonhoogte. Ek konsentreer in die volgende deel op grondfrekwensie, maar maak ook ’n opmerking oor harmonisiteit-tot-geraas-verhouding (HGV), ’n parameter wat nog net deur Wissing (2007) bestudeer is in soverre dit ’n rol speel by die beklemtoning van vokale. Sommige werke betrek die bandwydte van formante ook by die wyse waarop die stembande funksioneer, wat dus ook hier van toepassing is. Ek behandel hierdie saak verder onder vokaalformante, die faset van die artikulasie van vokale wat vir ons die meeste van belang is.

2.2.1 Grondfrekwensie

Grondfrekwensie word ook genoem fundamentele frekwensie of grondtoon. Frekwensie is ’n fisiese, akoestiese term: dit verwys na die tempo van vibrasie van ’n periodiese klank (hier vokale). Frekwensie word gemeet in terme van die aantal kere wat die stembande per sekonde tril. Dit staan bekend as siklusse, uitgedruk in hertz (Hz); die akoestiese metingseenheid is F0 (Kent en Read 1992:230; Rietveld en Van Heuven 2009:142–3). Grondfrekwensie is die laagste frekwensie van ’n periodiese sein (genoem die eerste harmoniese7). Die aard van die vibrasie van die stembande (bv. snelheid) word bepaal deur die lengte en dikte van die stembande, asook deur die mate van subglottale druk – hoe hoër die druk, hoe hoër die frekwensie, hoe hoër klink die geproduseerde klank. Verder: hoe langer (en dikker) die bande – soos tipies by mans – hoe laer die klank, en andersom: kort (dun) stembande – soos tipies by klein kindertjies – bring hoër klanke voort. Die waarneembare eienskap wat toegeken word aan verskille in grondfrekwensie word toonhoogte (Eng. pitch) genoem; dit is dus ’n perseptuele eenheid.

Voordat na die derde fase (artikulasie) oorgegaan word, word in Figuur 2 ’n voorbeeld gegee waarin sowel grondfrekwensie as intensiteit se aanwesigheid in ’n golfvorm en die daarmee geassosieerde spektrogram visueel sigbaar gemaak word, in hierdie geval in Praat. Die betrokke aspekte van die woord afgemat (met hoofklem op die eerste sillabe) word in Figuur 2 voorgestel.

Figuur 2. Grondfrekwensie- en totale-intensiteitsvoorstellings van die woord afgemat. Sien teks vir verdere uiteensetting.

In Figuur 2 word die wyse gedemonstreer waarop die akoestiese eienskappe van die parameters grondfrekwensie en intensiteit in ’n golfvorm (in Venster A) en die daarmee gepaardgaande spektrogram (in Venster B) neerslag vind. Die blou horisontale lyne stel grondfrekwensie (F0, in terme van Hz) voor, en die geel strepe intensiteit (in terme van dB). Die metingswaardes (in Hz, resp. dB) daarvan is in die onderste venster in rooi aangebring8. Die feit dat die eerste sillabe van die woord afgemat beklemtoon is, kan gesien word aan die akoestiese gegewens: die amplitude van af- in die boonste venster is duidelik hoër as dié van -mat (en van -ge-, maar ek konsentreer verder net op die eerste en laaste sillabes). -mat se vokaal klink gevolglik ook harder. Die perskleurige vertikale, dubbelkoppige pyl in Venster A by af- is baie langer as dié van -mat. Let op dat af- se 79 dB korreleer met die langer amplitude-pyl, en 66 dB met die korte by -mat. Rietveld en Van Heuven (2009:302) meld egter dat selfs ’n verskil van 20 dB nouliks genoeg is om een vokaal (soos -af hier) as beklemtoond te ervaar (vergeleke by -mat in dié geval). Dit sal, in persepsieterme, dus nie so maklik wees om te hoor dat af- sterker as -mat beklemtoon is nie; daarvoor moet ander parameterverskille ook aanwesig wees: dit kan die vokaal se kwaliteit wees (beklemtoonde vokale word voller (vollediger) uitgespreek as onbeklemtoondes (wat dikwels na sjwa toe neig); dit kan ook groter duur (klink langer) en/of hoër grondfrekwensie (klink hoër) wees. Rietveld en Van Heuven (2009:302) meld juis dat F0 ’n belangrike aanduider is van klemtoon (toonhoogte in die geval van die hoorder) is. af- se 253 Hz is hier duidelik hoër in grondfrekwensie as die 156 Hz van -mat. Die stembandvibrasie word in terme van stembandpulse deur middel van dun, vertikale blou strepe (pulse), Venster A van Figuur 2, aangedui.

2.2.2 Harmonisiteit-tot-Geraas-verhouding

Harmonisiteit verwys na die graad van akoestiese periodisiteit. Vokale is tipies harmonies (periodies) omdat, soos reeds gesien, deurdat die stembande tydens die fonasiefase voorspelbaar (reëlmatig) tril, die daarmee geassosieerde klankgolf ook ’n patroonmatige (harmoniese) struktuur vertoon. Dit staan teenoor aperiodiese klanke (soos frikatiewe), wat geen sodanige periodiese struktuur het nie. Geraas word in spraakakoestiekverband gesien as ’n aperiodiese element binne die periodiese klankgolfvorm. Die aard van sodanige geluid word in hierdie opset beperk tot artikulatoriese oorsprong, byvoorbeeld ’n hees of krakerige stem (soos tipies in bejaardes), teenoor ’n jong, welluidende stem. Die verhouding tussen die twee spraakgolfkomponente word in die akoestiese, intensiteitsverwante dB uitgedruk. Wanneer daar ewe veel energie as geraas in die klankgolfvorm is, is die Harmonisiteit-tot-Geraas-verhouding (HGV) 0 dB. ’n “Goeie” golf van die /A/-vokaal (in BAR) sal ’n HGV van byvoorbeeld 20 dB hê, wat beteken dat 99 persent van die energie in die periodiese deel van die klank is; slegs 1 persent sal dus geraas wees9 (Boersma en Weenink 2011, 4.4.5). Let op dat die eenheid waarin dit uitgedruk word, nie lineêr is nie, maar logaritmies. Schötz (2006) haal studies aan wat ’n afname by ouer vroulike sprekers se HGV rapporteer, en ’n toename by jong mans. Hierdie bevindinge kon egter nie deur ander navorsers bevestig word nie.

2.3 Die artikulasiefase

Die bronsein of basiese klank vir die produsering van vokale word, soos gesien, verskaf deur die stemhebbende, periodiese lugstroom soos voortgebring in die fonasiefase. Hierdie bronsein word dan in die spraakkanaal (die keel-mond-neusholte) sodanig vervorm dat die enkelvoudige klankgolf afkomstig van die stembande gewysig word tot ’n komplekse golf, wat gehoor word as ’n bepaalde vokaal. Elke spesifieke konfigurasie van die deelnemende10 artikulatore (veral tong-, lip- en onderkaakstand) bring dus ’n bepaalde mondholtevorm (dit funksioneer as filter) teweeg, wat as resonator dien. Hierdie filter versterk bepaalde frekwensies van die bronsein, en verswak weer ander. Die versterkte frekwensies en die verhoogde energie wat daarmee gepaardgaan, vorm terselfdertyd die vokaalformante (in akoestiese terme, gemeet in frekwensies, spesifiek F1, F2 en (soms) F3. Hierop word later, nadat die fisiologiese grondslag hiervan gehanteer is, dieper ingegaan. Kyk net eers na Figuur 4a–4f hier onder om ’n idee te vorm van die mondholtevorme en die daarmee gepaardgaande tongstande. Ek kom weer hierop terug.

3. Artikulatoriese eienskappe van vokale

Vervolgens word die artikulatoriese eienskappe van vokale in meer besonderhede behandel. Dit word aan die hand van die Afrikaanse vokale gedoen. In die afdeling oor die akoestiese eienskappe van vokale gebruik ek Nederlandse voorbeelde, omdat daar, soos reeds gesê, onvoldoende gegewens hieroor vir Afrikaans bestaan. Daar verwys ek weer terug na die artikulasie van vokale; artikulasie en akoestiek gaan uit die aard van spraakkommunikasie hand aan hand.

Die hoofsaak hier is die korrelasie tussen die stand van die artikulatore (lippe, tong en onderkaak). Nie net die stand van die artikulatore is van belang nie, maar ook die beweging daarvan in die vormingsproses van sommige klanke, soos die lang vokale, indien dit gediftongeerd uitgespreek word (geskryf “ee”, “eu” en “oo”11), asook die egte12 diftonge (geskryf “ei” of “y”, “ou” en “ui”13). Dit is taamlik algemeen dat daar in die Engelse literatuur (eerste gedoen deur Wells 1982) deur middel van ’n vaste stel enkelsillabige voorbeeldwoorde (in hoofletters geskryf) na vokale verwys word. As voorbeeld: Engels DRESS word gebruik om na die vokaal /E/; /ε/ te verwys. /E/ is die SAMPA-transkripsie daarvan, en /ε/ is die IPA-simbool14 vir dié vokaal. In Tabel 1 stel ek ’n soortgelyke sisteem voor vir Afrikaans. Ek gebruik dus byvoorbeeld bewoording soos “die /E/; /ε/-vokaal in PET”, of slegs “die PET-vokaal” as ek na hierdie vokaal verwys. In gevalle waar dit in die betrokke konteks reeds duidelik is watter vokaal bedoel word, gee ek slegs die simbole – altyd eers SAMPA, dan IPA. Uit die aard van die saak word slegs één simbool gegee as dié van SAMPA en IPA dieselfde is.

Voorbeeldwoord waarmee na Afrikaanse vokale verwys word

SAMPA-simbool

IPA-simbool

BIER

i

i

BUUR

y

y

BEER

e

e

BEUR

2

ø

PET

E

ε

VER

{

æ

BAR

A

?

BAAR

a

a

PIT

@

?

PUT

9

œ

POT

O

?

BOOR

o

o

BOER

u

u

Tabel 1. Die Afrikaanse vokale, met kernverwysingswoorde, in kolom 1, SAMPA-simbole in Kolom 2, en IPA-simbole in Kolom 3.

3.1 Die kardinale-vokaal-kaart

Figuur 3 is ’n gestileerde vokaalkaart, geskoei op dié van die International Phonetic Association. Dit beteken dat die primêre kardinale vokale (1 to 8 is in rooi genommer; vokale self is in seegroen gedruk) op die uiterste punte en sye van die kaart aangebring is; dit is nie bedoel om die vokaalstande van enige bepaalde taal te weerspieël nie. Let daarop dat daar ook ’n aantal ander vokale ook in seegroen voorkom – hulle is almal, uitgesonderd die sjwa /@/; /?/ en /{/; /æ/ sekondêre kardinale vokale; ook hulle posisies is bloot teoreties. Die swart, onderstreepte vokale is dié wat in Afrikaans voorkom – almal behalwe /{/; /æ/ het foneemstatus in Afrikaans. Let op dat dit ook nie bedoel is om ooreen te kom met die werklike stand van die Afrikaanse vokaalsisteem nie; daarvoor is daar nog geen omvattende navorsingsresultate beskikbaar nie.

Figuur 3. Diagrammatiese voorstelling van die ligging van primêre en sekondêre kardinale en Afrikaanse vokale op ’n artikulatoriese kaart. Sien teks vir uiteensetting.

Soos hier bo gesê, is dit taamlik seker dat Afrikaans se vokale binne die kardinale grense val, sommige baie duidelik. Wissing (2010) toon dit byvoorbeeld aan die hand van eksperimentele resultate duidelik aan vir byvoorbeeld die BOER-vokaal. In Figuur 3 word die Afrikaanse vokale – soos dit op hierdie stadium waarskynlik lyk (dit moet nog eksperimenteel presies vasgestel word15) – met vet, swart simbole voorgestel; dit is boonop onderstreep en gekursiveer. Daar is /u/ taamlik diep na binne geplaas.

Daar is drie pare simbole in die drie blou blokkies. Die linkerkantse simbool is die ongeronde lid van die betrokke paar; die regterkantstes is telkens gerond. Hulle is gewoonlik “abnormaal rond” genoem; hedendaags word hulle “gemerkte ronde vokale” genoem (vgl. Wissing 2011a vir ’n volledige bespreking hiervan).

Die vokaalkaart soos dit in Figuur 3 weergegee is, vermeld nie die aard van gerondheid – ook gestulptheid16 genoem – van die lippe nie. Die geronde vokale (gevorm deur gestulpte lippe) word soms aangedui deur die betrokke simbool te onderstreep. Hier kan dit nie gedoen word nie, omdat sommige simbole wat nie gerond is nie, reeds onderstreep is. Die ongemerkte ronde vokale – dit is dié wat per definisie altyd gerond is – is die boonste drie agtervokale /u/, /o/ en /O/. Die gemerkte geronde vokale is /y/, /2/ en /9/; hulle is die geronde eweknieë van dié wat direk links van hulle staan.

Let ten slotte op dat hoe laer ’n voorvokaal is, hoe meer neutraal is dit op die horisontale as – kyk hiervoor /A/ in Figuur 3, asook Figuur 13 laer af.

In die volgende afdeling word die presiese artikulasiestande van die vokale gegee aan die hand van ’n stel magnetiese resonansiebeelde (die algemene afkorting hiervoor is MRI17). Nederlandse beelde word gebruik bloot omdat dit beskikbaar is. Dit gaan hier in elk geval om die basiese, taal-niespesifieke agtergrondskennis van die artikulasie van vokale. Gepaard met die MRI’s verskaf ek ’n klankinsetsel van die uitspraak van elke spreker (“A_*” en “B_*”, bv. “A_hiet”). Ter wille van latere terugverwysing gee ek ook ’n spektrogram18 van die vokale soos uitgespreek deur Spreker B. Sy uitspraak kan deurgaan as Algemeen-Beskaafde Nederlands, of dan Standaardnederlands;19 Spreker A se uitspraak is miskien ’n bietjie suidelik20 gekleurd; veral sy “heet-”, “heut-” en “hoot-”vokale geld by hierdie waarneming.

4. MRI-beelde, spektrogramme en klankinsetsels van die produksie van vokale

Deur die posisies van die drie aktiewe artikulatore: lippe, tong en onderkaak, te bestudeer, en deur daarmee saam te luister na hoe die betrokke vokaal klink, kan ’n baie beter idee gevorm word van die artikulatoriese aard van die vokale. Onthou dat die MRI-beelde nie dié is van ’n Afrikaanse spreker nie, maar dié van ’n Nederlander21. Bowendien het die manier waarop hierdie beelde gemaak is, die “normale” uitspraak van die spreker moontlik effens aangetas. Hy moes naamlik op sy rug in die aftastingstonnel lê, en sy spraakartikulatore by die begin van elke vokaal staties hou sodat die “foto” geneem kan word. Die horisontale posisie by die maak van die beelde kon moontlik tot gevolg hê dat die tongliggaam deur die effek van swaartekrag ietwat na agter in die keel getrek kon gewees het. Dieselfde geld, hoewel waarskynlik in ’n mindere mate, die stulping van die lippe by geronde vokale. Veral by die lang vokale, wat, soos in Afrikaans, ook in Nederlands geredelik tot verglyding (breking) geneig is22, is dit belangrik om hierdie gegewe in gedagte te hou.

In die volgende MRI-beelde word die vorming van 12 vokale getoon. Die hoogste posisie van die tongliggaam word met ’n wit kolletjie aangedui. Let ook op die gestulpte vorm van die lippe in die geval van geronde vokale. Vir ’n interaktiewe vokaalkaart, met klank geïllustreer, gaan ook na http://ctext.p.nwu.ac.za/TongEnLipstandeVanVokale/VowelChart/Vokaalkaart/Vokaalkaart.en.html. Dit vertoon onder meer dieselfde vokaalkaart as in Figuur 3. Hierin word die MRI’s van vokale gewys, en kan die betrokke vokaal se uitspraak ook beluister word deur op ’n vokaalsimbool te klik. Daar is ook ’n spesiale fasiliteit waarmee een vokaal met die 11 ander ten opsigte van tong- en lipposisies op ’n grafiese wyse vergelyk kan word. Klik hiervoor op die balkie VERGELYKINGS, en volg die INSTRUKSIES. Die gebruiker het ook die keuse om die IPA- of SAMPA-alfabet te gebruik. Vergelyk Tabel 1 vir Afrikaanse transkripsies.

4.1 Groepe vokale

In die volgende afdeling word die vokale per subgroep van naderby beskou. Die volgende sal behandel word: gemerkte geronde vokale en hulle ongeronde teenhangers; die egte agtervokale; die lae, en die mid-lae vokale. Vir elke vokaal word twee beelde en twee klankinsetsels verskaf. Die beelde is MRI’s en ’n spektrogram van die betrokke vokaal, asook twee klankinsetsels, gemerk A_* en B_*. B_* se uitspraak is tipies Standaardnederlands. A_* s’n benader dit ook, maar is iets duideliker Suid-Nederlands van aard. Die vokale is in die fonetiese konteks h__t gelees. Dit is algemene gebruik om dit so te doen sedert Peterson en Barney (1953) se werk oor die Amerikaanse Engelse vokale. Werk oor Nederlands deur Pols, Tromp en Plomp (1973) en Adank, Van Houten en Smits (2004) is ook so gedoen. Meer hieroor word laer af oor laasgenoemde twee werke gesê.

4.1.1 Die “abnormale” geronde (gemerkte) vokale en hulle ongeronde teenhangers

Die gemerkte (eers genoem abnormale23) geronde vokale is die HUUT-24 vokaal, die HEUT-vokaal (beide is hoë voorvokale) en die HUT-vokaal (’n neutrale, mid-lae vokaal25). Hulle ongeronde (ongemerkte) teenhangers, respektiewelik die HIET-vokaal, die HEET-vokaal en die HIT-vokaal26, word op dieselfde plek deur die verhoging van die tongliggaam gevorm. Dit kan gesien word aan die wit kolletjie in die MRI-beelde, wat die hoogste tongliggaamposisie by die produksie van ’n vokaal aandui.

Figuur 4. /i/ in hiet en /y/ in huut

Luister na HIET-vokaal A.

Luister na HIET-vokaal B.

Luister na HUUT-vokaal A.

Luister na HUUT-vokaal B.

Die enigste verskil tussen dié drie pare vokale onderling lê by die gestulptheid. Dit kan ook genoem word tuiting van die lippe in die geval van die HUUT-, die HEUT- en die HUT-vokaal enersyds, teenoor die afwesigheid van stulping in hulle teenhangers (resp. die HIET-, die HEET- en die HIT-vokaal). Afgesien van die verskille in lipstande is dit ook opvallend dat die mondholte in Figuur 4 (vir die HIET-vokaal en die HUUT-vokaal) kleiner is as dié van die HEET-vokaal en die HEUT-vokaal in Figuur 5. Dit word veral teweeg gebring deurdat die onderkaak laat sak word. Dit is ’n tipiese wyse waarop die mate van hoogheid (hoog, middelhoog, middellaag en laag) gemanipuleer word. Dit geld dus ook ander vokale as net dié wat hier genoem is. By die egte ronde agtervokale (Figuur 7) is die vorm van die tongliggaam en die lipvorming die primêre artikulatore.

Figuur 5. /e/ in heet en /2/;/ø/ in heut

Luister na HEET-vokaal A.

Luister na HEET-vokaal B.

Luister na HEUT-vokaal A.

Luister na HEUT-vokaal B.

Figuur 6. /I/ in hit en /9/;/œ/ in hut

Luister na HIT-vokaal A.

Luister na HIT-vokaal B.

Luister na HUT-vokaal A.

Luister na HUT-vokaal B.

4.2 Die egte (ronde) agtervokale

Daar is drie egte ronde agtervokale in Figuur 1: die HOET-vokaal (hoog, agter), die HOOT-vokaal (middelhoog, agter) en die HOT-vokaal (middellaag, agter).

Figuur 7. /u/ in hoet, /o/ in hoot en /O/ in hot

Luister na HOET-vokaal A.

Luister na HOET-vokaal B.

Luister na HOOT-vokaal A.

Luister na HOOT-vokaal B.

Luister na HOT-vokaal A.

Luister na HOT-vokaal B.

Let op in Figuur 7 dat die tongliggaam in die agterste deel van die mondholte opbult. Al drie hierdie geronde vokale word per definisie met gestulpte lippe gevorm. Afgesien van die prominente eienskap van die drie egte ronde agtervokale se gestulpte lipvorm, val die verskil in mondholtevorm, en veral die grootte van die mondholte, hier op. Let ook op die plat posisie van die tong in die geval van die HOT-vokaal27. Die verskil tussen hierdie posisie van die tong met dié van die BOOR-vokaal, tesame daarmee dat die hoogste tongdeel meer na agter in die mond lê, is verantwoordelik vir die verskil tussen dié twee vokale. Nederlands se /o/ klink nogal op ’n kort /O/, maar as beide beluister word, is die verskil wel duidelik. Die HOET-vokaal lyk asof die tongbult iets verder voor in die mond lê as by die HOOT-vokaal en die HOT-vokaal. Die HOET-vokaal is verder ook soos te verwagte duidelik ’n hoër vokaal as die ander twee.

4.3 Die middellae voorvokaal /E/

Die PET-vokaal in Nederlands is ouditief beoordeel aanmerklik laer as dié van Afrikaans. Neem hierby in ag dat Afrikaans  (in baie gevalle) ook ’n [{]-allofoon28 besit. Die Nederlandse /E/ lê ongeveer tussen die Afrikaanse /{/ en /E/, selfs nader aan Afrikaanse [{] - vergelyk hiervoor byvoorbeeld Figuur 14.

Figuur 8. /E/;/ε/ van het

Luister na HET-vokaal A.

Luister na HET-vokaal B.

Hierdie toedrag moet in gedagte gehou word wanneer vokaalkaarte van die tipe van Figuur 1 bestudeer word.

4.4 Die lae vokale

Die twee vokale wat as laag gekarakteriseer word, /A/ en /a/, het verskillende kwaliteite in Afrikaans en Nederlands. Die Nederlandse BAR-vokaal klink “ronder” as die lang, “platter”  HAAT-vokaal; dit word ook so voorgestel in die MRI-beelde van Figuur 9. Dit is omdat die HAT-vokaal verder na agter in die mondholte gevorm word as die HAAT-vokaal. Die mondkanaal is ook iets groter by HAAT; vandaar die gegewe dat Nederlands se vokaal in hierdie woord “platter” klink as dié in HAT. In Afrikaans is dit, bloot ouditief beoordeel, andersom. Lengteverskille speel natuurlik ’n belangrike rol by die onderskeid tussen die HAT-vokaal en die HAAT-vokaal29.

Figuur 9. /A/;/α/ in hat en /a/ in haat  

Luister na HAT-vokaal A.

Luister na HAT-vokaal B.

Luister na HAAT-vokaal A.

Luister na HAAT-vokaal B.

Vervolgens gaan ek oor tot die behandeling van die akoestiese korrelate van vokale. Ek beperk die bespreking eers net tot die vokaalfrekwensie-inligting. Daarna gee ek vlugtig aandag aan ander, sekondêre parameters wat ’n meer volledige beskrywing van vokale moontlik maak.

5. Die akoestiese korrelate van die plek van vorming van vokale

Soos tevore uitgewys is, is daar is ’n direkte verband tussen die artikulasiewyse van vokale en die akoestiese eienskappe daarvan. Dit is eintlik vanselfsprekend, indien in ag geneem word dat die bedoeling van spraak juis kommunikasie is. Spraakkommunikasie impliseer enersyds ’n spreker, en andersyds ’n hoorder. Die spreker produseer vokale wat deur middel van klankgolwe na die hoorder oorgesein word. Elke vokaal se klankgolf het ’n eie akoestiese karakter of eienskap, waardeur elke vokaal as uniek geïdentifiseer kan word. Dit is hierdie akoestiese karakter van vokale wat in hierdie afdeling behandel word. Voordat dit gedoen word, gee ek egter eers baie kortliks aandag aan die metode van spraakinsameling en die prosessering daarvan wat die eintlike spraakanalise voorafgaan.

Spraakopnames word in gedigitaliseerde formaat (*.wav30) oorgedra op die hardeskyf van ’n rekenaar. Opnames word op verskillende maniere gemaak, gewoonlik met behulp van toepaslike programmatuur, en natuurlik ook goeie mikrofone. Praat (Boersma en Weenink 2011) word meestal hiervoor gebruik – dit is deesdae die mees algemene manier om opnames te maak. Daar kan egter ook van digitale opnemers gebruik gemaak word – selfs analoogopnemers, maar die opnames moet dan omgeskakel word tot formate wat rekenaarmatig verder hanteer kan word.

Voorafprosessering van opnames word in ons geval in Praat gedoen. Dit hou as eerste stap in dat die golfvorme en die daarvan afgeleide spektrogramme van die gedigitaliseerde opnames ouditief en visueel ondersoek kan word met die oog op die begrensing en benoeming van die spraakelemente wat ondersoek word; in ons geval slegs individuele vokale. Laer af word dieper hierop ingegaan.

Vokaalkwaliteit word in akoestiese terme veral uitgedruk ten opsigte van hulle frekwensie-eienskappe. Die formante F1 en F2 is hier die belangrikste; daar is reeds in die verbygang hierna verwys. Dit is hierdie aspek waarop daar in hierdie afdeling ingegaan word.

As uitgangspunt vir die behandeling van die korrelasie tussen die artikulatoriese vorming van vokale aan die een kant en die akoestiese eienskappe daarvan aan die ander kant is dit nodig om die volgende in gedagte te hou. Hoë vokale op die vertikale dimensie van ’n artikulatoriese vokaalkaart, soos wat dit in Figuur 3 aangetref word, word gekenmerk deur ’n lae F1-waarde, en dan, natuurlik, ook andersom: lae vokale vertoon hoë F1-waardes. Wat F2 se korrelasie met artikulasie betref: lae F2-waardes gaan tipies gepaard met (meer) gestulptheid van die lippe (die vokale is meer getuit). Sodanige stulping het as gevolg dat die spraakkanaal ietwat verleng word vergeleke by dié van ’n andersins identiese vokaal. Die effek hiervan is dan ’n ietwat laer F2. Vergelyk hiervoor Figuur 3 (wat ek herhaal vir makliker vergelyking) met Figuur 10 hier onder. Ook hierdie kaart is hipoteties van aard.

Figuur 10 (Figuur 3 herhaal). ’n Hipotetiese artikulatoriese vokaalkaart, met Afrikaanse vokale ingevoeg.

Figuur 11. ’n Hipotetiese akoestiese vokaalkaart, waarin vier basiese vokale aangebring is. Die vokaaldriehoek word ook gesien.

Vokaalkaarte soos dié in Figuur 11 word op die standaardwyse gekonstrueer.  Deur F1 op die y-as te plaas, met lae Hz-waardes bo en hoës onder, en F2 op die x-as, met lae waardes regs en hoës links, word ’n voorstelling geskep wat gelyksoortig is aan artikulatoriese vokaalkaarte (vgl. Figuur 3), met die vertikale dimensie parallel aan F1, en die horisontale dimensie parallel aan F2. Die hoë voorvokale (soos hier /i/ – die BIER-vokaal) lê dus byvoorbeeld, soos ook in die geval van die artikulatoriese kaart, links bo, die hoë agtervokale (soos hier /u/ – die BOER-vokaal) lê regs bo. Lae vokale (soos hier /?/ – die BAAR-vokaal) lê, soos die benaming aandui, onderaan die kaart. Afhangende van watter taal ter sprake is, kan dit minder of meer vorentoe of agtertoe skuif. Dit is ook interessant om te meld dat Nederlandse agter-/a/ meer na Afrikaanse voor-/α/ klink, en andersom. Die V-vorm wat hier gesien kan word, kom in alle tale voor wat die vokale /i, ?, u/ het. /@/ is ’n neutrale vokaal: dit lê nóg voor, nóg agter; nóg hoog, nóg laag. Let wel op dat hierdie vokaal selde in ander tale as foneem voorkom.

Vokaalformante se spektrale eienskappe kan visueel in die vorm van golfvorme en spektrogramme voorgestel word. Voorbeelde hiervan is reeds hoër op gesien. Voordat die vokaalformante behandel kan word, moet eers aandag gegee word aan die wyse waarop vokale geïdentifiseer of gesegmenteer word, asook die areas in ’n vokaal waar die inligting gevind kan word op grond waarvan formante geanaliseer en beskryf kan word.

6. Die bepaling van vokaalgrense

Rietveld en Van Heuven (2009:130 e.v.) gee ’n volledige oorsig waarvolgens alle soorte spraakklanke gesegmenteer kan word. Wat vokale betref, gee hulle die volgende riglyne: vokale word gekenmerk deur ’n periodiese (harmoniese) sigsag-patroon van die golfvorm (soos wat in die volgende figure gesien sal word); dit vertoon ’n relatief groot amplitude, en, met ’n tipiese duur tussen 50 ms (die sjwa /@/) en 100 ms (die kort vokale), tot 300 ms (die lang vokale), afhangende van faktore soos spraaktempo en klem. In Figuur 16 kan die beskrywing van die BEER-vokaal in die Afrikaanse woord mees duidelik gesien word.

Figuur 12. Golfvorm (Venster A), spektrogram (Venster B) en twee tekslae (Venster C) van die Afrikaanse woord mees (gedeeltelike skerm van Praat).

Vokale het normaalweg baie duidelike formante (F1, F2 en F3 in die spektrogram, Venster B van Figuur 12). Die omliggende klanke (/m/ en /s/) – respektiewelik ’n bilabiale nasaal en ’n stemlose frikatief, vertoon duidelik andersoortige akoestiese eienskappe, soos gesien kan word in sowel Venster A as Venster B. Ek gaan nie verder hierop in nie. Rietveld en Van Heuven (2009:134, 135) kan met vrug hiervoor geraadpleeg word. Grabe en Low (2002) gee ook duidelike segmentasieriglyne. Figuur 13 is ’n goeie visuele voorstelling van die golfvorm van die nasaal /m/ en (die eerste gedeelte van) /e/. Die patroonmatige verskil tussen die twee is duidelik sigbaar. Luister ook na die woord mees in die klankinsetsel. Meer oor die vasstelling van vokaalformante word laer af in afdeling 8, “Vowelyse”, gesê.

Figuur 13. Die klankgolfvorm van die eerste gedeelte van die woord mees. Sien verder die teks vir besonderhede. Die oranjekleurige vertikale lyn dui die grens tussen /m/ en /e/ aan. /m/ is liggroen ingekleur.

Luister na die woord mees.

7. Vokaalareas waar akoestiese inligting gevind word

Aanvanklik is die middelpunt van ’n vokaal hiervoor gebruik, omdat die verteenwoordigende eienskappe van ’n klank by uitstek daar te vinde is (Rietveld en Van Heuven 2009:130). Dit geld veral stabiele vokale. Die voordeel hiervan is dat dit wisselende koartikulatoriese invloede van naasliggende konsonante vermy. Pols e.a. (1973), Labov (1994:164), Adank e.a. (2004), Boberg (2005), Langstrof (2006) en Bekker (2009) is enkele skrywers wat dieselfde metode volg. Pols e.a. (1973) en Adank e.a. (2004) wysig dié metode effens. Hulle bepaal nege punte, ewe ver uit mekaar, in Nederlandse vokale, en gebruik dan die middelste een as verteenwoordigend van die vokaal. Hierdie metode is problematies in die geval van lang vokale wat gediftongeerd uitgespreek word, en natuurlik ook vir die diftonge self. Dit is waarom Adank e.a. (2004) ’n ander benadering met betrekking tot dié foneme volg. Hulle gebruik die absolute verskille van formantfrekwensies (F1, F2, F3) tussen die 25 persent-merk en die 75 persent-merk (soos vasgestel op die absolute duur van die klanke). So word byvoorbeeld die F1-waarde soos verkry op die 75 persent-merk afgetrek van dié op die 25 persent-merk, wat dan ’n waarde gee wat nie noodwendig ooreenkom met blote gemiddeldes nie. In die volgende afdeling verduidelik ek die Vowelyse-metode wat ek gebruik vir die vasstelling en onttrekking van ’n verskeidenheid vokaalinligting. Ook hier konsentreer ek op die vokaalformante.

8. Vowelyse

Vowelyse (Van der Walt en Wissing 2003) is ’n omvattende rekenaarpakket wat veral gebruik word vir die onttrekking van ’n verskeidenheid akoestiese vokaalinligting. Dié program maak onder meer van funksies en fasiliteite van Praat (Boersma en Weenink 2011), en Akustyk (Akustyk 1.9.3 for Windows; http://bartus.org.akustyk) gebruik. Die metode waarop vokale ontleed word met Vowelyse, word vervolgens kortliks uiteengesit. Terselfdertyd word die aard van formante as belangrike aanduiders van vokaalkwaliteit ook belig.

Soos reeds gesê, stel Vowelyse die langste lineêre (regressielyn) stabiele deel van die formante van ’n vokaal vas. Al die toepaslike spektrale en temporale inligting aangaande vokale word in hierdie area vasgestel en onttrek. Ek gee eers ’n voorbeeld van ’n kort, stabiele vokaal (die BOER-vokaal).

Figuur 14. Die eerste drie formante van die vokaal /u/ (in BOER), aangedui op die Praat-skerm se spektrogram in Venster B, en die golfvorm in Venster A van dié vokaal; beide is Praat-skerms.

Luister na die BOER-vokaal.

Figuur 15 is ’n afbeelding van die /e/ in mees, waarin die drie formanttrajekte F1, F2 en F3 deur Vowelyse vasgestel is; spektrale inligting in die vorm van ’n spektrogram word hierin weggelaat. Die stippellyne deur die formante is die lineêre passingslyne wat deur Vowelyse bepaal is.

Figuur 15. Vowelyse-afbeelding van /u/ in boer, afgelei van spektrogram van boer van Praat
in Figuur 18.

In Figuur 16 gee ek ’n voorbeeld soos onttrek deur Vowelyse van ’n lang, gediftongeerde vokaal (die BEER-vokaal). (Ek gee nie weer die Praat-figuur hiervan nie, omdat dit in wese in Figuur 14 aanwesig is.) Gediftongeerde vokale is, soos reeds gesê, problematies van aard, daarom gaan ek ’n bietjie daarop in.

Figuur 16. Produk van Vowelyse se onttrekking van die eerste drie formante van /e/ in die woord mees. Die rooi vertikale stippellyn dui die temporele middelpunt van die vokaal aan. Die groen pyl wys na ’n deel van F3 wat verwerp is. Sien verder die teks.

Beginnende by die temporele middelpunt van die vokaal (aangedui deur die rooi stippellyn in Figuur 16) word ’n lineêre regressielyn (passingslyn) (geelkleurig) na weerskante toe bepaal, tot op ’n punt waar daardie lyn nie meer as reglynig volgehou kan word nie, byvoorbeeld waar die begin- of eindpunt skerp na bo of na onder begin buig, of waar daar nie meer duidelike formante aanwesig is nie. Geeneen van die drie formante verloop horisontaal nie, en die trajekte daarvan is ook nie stabiel nie, maar dinamies, en die trajek wat dit volg, is ook nie stabiel nie. Die eerste derde van al drie die formante is weliswaar redelik horisontaal, en so ook die laaste derde, maar die tussendeel nie. Peters (1991) se beskrywing van die dinamiek van Nederlandse verglydende diftongtrajekte lyk baie hierop; Raubenheimer (1998) vind soortgelyke patrone vir Afrikaanse diftonge.

Hoër op is aangetoon dat Adank e.a. (2004) in gevalle soos dié van die /e/ van mees in Figuur 17 die lesing van die formante op die 25 persent-merk en weer op die 75 persent-merk neem, en die eerste van die laaste aftrek. Vowelyse se passingslyn strek tot meer as 25 persent na links of na regs van die middelpunt (sien hiervoor Figuur 17). Die horisontale stippellyne dui die punte aan waar Adank e.a. (2004) hulle metings vir diftongagtige vokale neem. Die twee metodes lewer egter baie dieselfde resultate. Die voordeel van Vowelyse is dat dit ook gradiëntwaardes (sien volgende afdeling) kan vasstel vir verglydende formanttrajekte soos wat in mees gesien kan word; iets wat Adank e.a. (2004) se gemiddelde waardes (die verskil tussen 25 persent en 75 persent) nie kan doen nie.

Figuur 17. Die eerste drie formante van /e/ in die woord mees, soos deur Vowelyse bepaal.

Wat betref die vokaalduurte, word die totale afstand tussen twee vokaalgrense gemeet, dit wil sê die afstand vanaf die begingrens van die vokaal tot by sy eindgrens, ongeag waar die passingslyn in feite begin of eindig. In Figuur 18 is F3 se passingslyn byvoorbeeld iets korter as dié van F1. Dis omdat die eerste deeltjie van F3 nie ingereken is by die bepaling van die passingslyn nie. Die rede hiervoor kan in die spektrogram (Figuur 16) gesien word: die eerste paar millisekondes (in feite 0,023 sek) van F3 buig te sterk af na onder om as deel van die passing gesien te kan word. Hierdie deeltjie word dan verwerp. Die kort stukkie blou dwarslêende strepie links onder in die hoekie van Figuur 18 (aangedui met ’n groen pyl) dui dit aan.

Hierna gee ek ’n oorsig van die inligting aangaande akoestiese eienskappe van vokale wat deur middel van Vowelyse onttrek kan word en uitgedruk word in terme van vokaalparameters. Sodanige inligting is nodig vir die beskrywing van vokale, maar ook vir die vergelyking van vokaalsisteme, soos wat in ’n volgende artikel van hierdie reeks beoog word. Die meeste van die vokaalparameters het reeds ter sprake gekom; dié wat nog nie eksplisiet vermeld en uiteengesit is nie, sal toegelig word.

9. Die vokaalparameters

Die meeste akoestiese parameters wat van belang is vir die ontleding van vokale het reeds in mindere of meerdere ter sprake gekom. Hiervan is die volgende die belangrikste: Duur, grondtoon, harmonisiteit-tot-geraas-verhouding (HGV) en intensiteit. Omdat die vokaalformante, F1, F2 en F3) so ’n groot rol speel by die bepaling van vokaalkwaliteit, gaan ek hier in meer besonderhede daarop in. Die bandwydte van vokale is ook van belang, veral waar nadruk (aksent of klemtoon) ter sprake is. Hoe smaller die vokaal se bandwydte31 (Bdw; gemeet in Hertz), hoe duideliker word dit deur die hoorders ervaar; smal bandwydte gaan gepaard met ’n voller kwaliteit, en sterker nadruk van ’n vokaal. Ek kombineer die werking van Vowelyse met die bespreking van hierdie parameters.

Tot dusver is daar slegs na vokale se spektrale eienskappe, meer in die besonder dié van vokaalformante, verwys in terme van roumetinge, naamlik Hertzwaardes. Hierdie metode word ook in die meeste ouer werke oor vokaalakoestiek gevind. In sommige gevalle is dit egter gewens om ’n normaliseringsproses te gebruik. Ek gaan in die volgende afdeling kortliks daarop in. In 9.2 kom die metode wat hier voorgestel word om vokaalparameterinligting uit spraakseine te onttrek, ter sprake.

9.1 Vokaalnormalisering

Dit hou in dat die basiese formantfrekwensiegegewens van vokale wat uit die spraakgolwe onttrek word en in terme van Hertz weergegee word, omgesit word na eenhede wat direkte vergelykings moontlik maak; soms word dit in aangepaste Hertzwaardes weergegee, en wel deur ’n skaleringstegniek. Die belangrikste motivering vir normalisering is eerstens dat verskillende sprekers (soos mans teenoor vroue) verskillende spraakkanaalgroottes het, wat veroorsaak dat hulle formantresonansies ook sal verskil. Lobanov (1971) se tegniek word steeds hiervoor gebruik. Tweedens word dié tegniek gebruik waar verskillende uitspraakvariante (byvoorbeeld dialekte) met mekaar vergelyk word. ’n Goeie voorbeeld hiervan word gevind in Labov, Ash en Boberg (2006) se hantering van die uitspraakvariasies in Amerikaanse Engels (dit word die Labov-tegniek genoem). Hierbenewens is Nearey (1977) se formant-intrinsieke en formant-ekstrinsieke metodes ook soms van toepassing. Adank (2004) se vergelyking van verskeie tegnieke wys daarop dat Lobanov s’n die beste presteer. Hierdie siening word hoofsaaklik deur SLAAP onderskryf. Laasgenoemde vermeld belangrike agtergrondinligting, en verskaf ’n uiters nuttige aanlynpakket waarmee vokaaldatastelle genormaliseer kan word. Twee tipes normaliserings,  vokaal-intrinsiek en vokaal-ekstrinsiek van aard, word onderskei. Bekker (2009:41 e.v.) gee ’n goeie oorsig hiervan. In die geval van ’n vokaal-intrinsieke tegniek word al die inligting wat in die normalisasie-algoritme gebruik word, binne een spesifieke vokaal gevind. Hierdie tegnieke gebruik verskillende kombinasies van formantwaardes, gewoonlik slegs F1 en F2, maar soms ook F3 en F0, so ook soms selfs bandwydtes. Dieselfde inligting word in die geval van vokaal-ekstrinsieke tegnieke gebruik, maar hier word verskillende vokale se formantwaardes van ’n individuele spreker betrek. ’n Analoë onderskeid word aangetref in die geval van spreker-intrinsieke en ekstrinsieke metodes. Waar eersgenoemde metodes gegrond is op data van een spreker, word meer as een spreker se vokale in berekening geneem. In gevalle waar slegs vrouespraak betrokke is, soos in die groter program Uitspraakvariëteite van Afrikaans, waarvan die huidige ondersoek deel is, is dit nie nodig om te normaliseer nie (Adank, persoonlike mededeling per e-pos). In ander gevalle, waar stelsels wat duidelik streeks- en ander variasies toon, moet dit wel gedoen word.  

9.2 Die uitvoer van Vowelyse

Dit kom in Excel-formaat. Van daar af kan dit na enige meer toegewyde statistiekpakket32 uitgevoer word waar die toepaslike statistiese verwerkings gedoen word. Dit sluit in die gewone basiese statistiek, soos hoeveelhede (N’s) van ’n gegewe tipe eenheid, die gemiddelde daarvan, maar ook resultate van bepaalde inferensiële statistiese verwerkings (bv. variansie-analises (ANOVAs), of diskriminant-analises (DA’s)). Dit word nie hier verder bespreek nie; dit sal ons te ver voer.

Daar is hoër op genoem dat Vowelyse ’n area wat in ’n betrokke vokaal ondersoek sal word, bepaal, beginnende van die horisontale middelpunt daarvan. Dit soek dan na links en na regs van dié punt van die vokaal na die langste lineêre (reglynige) stabiele deel, waarop die bewerkings gedoen word ten einde die toepaslike inligting te vind en te onttrek. Daar is ook gesê dat dit makliker gebeur in die geval van kort as van lang vokale. Die vier grafieke in Figure 18, 19, 20 en 21 illustreer in hoe ’n hoë mate veral die eerste twee vokaalformante van die kort vokale /i/, /y/, /@/ en /u/ wel prakties reglynig en horisontaal verloop. Dieselfde geld die ander kort vokale. Die gapings in sommige van die grafieke in hierdie tabelle is toe te skryf aan die feit dat die linkergrens ’n gedeelte van die konsonant insluit wat die vokaal voorafgaan.

Figuur 18. Formantstruktuur van die BIER-vokaal. Die geel blokkie toon aan dat Vowelyse nie enduit na regs ’n reglynige formanttrajek vir F3 kon sien nie; die groen pyl wys die gedeelte aan wat verwerp is.

Figuur 19. Formantstruktuur van die BUUR-vokaal.

Figuur 20. Formantstruktuur van die PIT-vokaal.

Figuur 21. Formantstruktuur van die BOER-vokaal.

10. ’n Voorbeeld van die akoestiese ontleding van vokale

In hierdie afdeling word die belangrikste akoestiese eienskappe van vokale as klankgroep belig. Ek bepaal my wel hoofsaaklik by die vokaalfrekwensieformante. Let daarop dat hierdie afdeling nie om ’n spesifieke taal se vokale gaan nie, maar om vokale as klankgroep oor die algemeen. Die uiteensetting is dus nie taalspesifiek nie; ek kon net sowel Engels, of enige ander taal, as voorbeeld gebruik het.

In die volgende afdeling gee ek eers in tabelvorm (Tabel 2) die resultate van ’n volledige ontleding deur Vowelysevan al die toepaslike vokaalparameters van die h_t-woorde van Spreker A, daarna kom ’n akoestiese vokaalkaart (Figuur 25) – wat F1 en F2 se waardes in Tabel 2 gebruik, asook ’n aantal lyngrafieke (Figuur 22 – Figuur 23), wat ook afgelei is van die resultate in Tabel 2.

WOORD

hiet

huut

heet

heut

het

hat

hot

haat

hit

hut

hoot

hoet

VOKAAL

ie

Y

ee

2

E

A

o

aa

I

9

oo

u

Duur (sek.)

0.112

0.182

0.196

0.199

0.077

0.077

0.082

0.185

0.064

0.088

0.184

0.108

HGV (dB)

14.3

15.1

11.6

14.1

6.8

7.0

6.1

2.2

8.1

10.8

9.2

9.1

F0 (Hz)

118

118

115

106

116

109

114

103

118

113

115

132

F1 (Hz)

259

274

366

360

651

618

501

707

444

427

436

322

BEGIN F1 (Hz)

258

264

312

335

650

626

464

639

479

383

415

262

EIND F1 (Hz)

255

267

329

354

591

597

460

664

373

427

471

327

GRAD F1 (Hz)

-27

-68

48

31

-138

-88

-39

-2

-399

35

3

69

Bdw F1 (Hz)

38

34

134

62

76

72

152

117

149

92

169

105

F2 (Hz)

2301

1803

2168

1438

1572

1028

773

1241

1813

1372

794

969

BEGIN F2 (Hz)

2296

1780

2230

1476

1639

1011

745

1221

1843

1360

821

962

EIND F2 (Hz)

2172

1918

1967

1534

1541

1047

805

1269

1735

1378

911

1072

GRAD F2 (Hz)

-34

34

-31

10

-83

49

62

20

-86

9

8

107

F3 (Hz)

3133

2251

2867

2241

2542

2586

2914

2502

2614

2394

2655

2295

BEGIN F3 (Hz)

3078

2199

3127

2242

2565

2524

2673

2389

2674

2299

2763

2420

EIND F3 (Hz)

3034

2541

2659

2388

2583

2672

3087

2572

2552

2591

2604

2075

GRAD F3 (Hz)

10

51

-64

14

-4

101

230

23

-33

119

-13

-60

INTENS (dB)

75

75

76

76

79

80

79

78

76

76

80

81

INTENS BF1 (dB)

71

73

74

73

78

79

78

76

74

74

79

79

INTENS BF2 (dB)

47

53

59

53

65

68

51

70

61

60

52

57


Tabel 2. Spreker A se akoestiese resultate van die twaalf vokale, gespreek in die raam hVt, gegee per vokaalparameter.

Afgesien van die reeds bekende parameters (duur, grondtoon (F0), intensiteit, die drie vokaalformante, F1, F2 en F3), en harmonisiteit-tot-geraas-verhouding (HGV), kom daar in Tabel 2 ook ’n aantal afgeleide parameters voor. Sodanige parameters word aangedui deur ’n toevoeging van “BEGIN” of “EIND”, asook GRAD(IËNT). Die parameter gradiënt kom voor by die meeste van die spektrale parameters wat hier toegelig word. Die gradiënt waarteen frekwensieverwante vokaalentiteite verloop, byvoorbeeld F0, of F1 en F2, word uitgedruk in persentasies33.  Dit is veral van belang by die beskrywing en vergelyking van vokaalformante van lang, gediftongeerde vokale, waarvan die trajekte nie hoofsaaklik horisontaal verloop nie, maar na bo of na onder buig, soos in mees hier bo (Figuur 16). Dit is praktyk in die literatuur om slegs ’n gemiddelde waarde ten opsigte van beide formante te gee, of selfs om hierdie vokale nie in te sluit by die beskrywing van die vokale van ’n taal nie, juis omdat weens hierdie dinamiek van hulle formante moeilik gemeet kan word. Dit is die geval by die werk van Van der Merwe e.a. (1993), wat slegs op die kort, stabiele Afrikaanse vokale fokus. Pols e.a. (1973) vermeld slegs gemiddeldes vir die Nederlandse vokale, ook vir die lang vokale, wat ook gekenmerk word deur gediftongeerdheid. Hulle gee formantwaardes soos gemeet op die temporele middelpunt van die vokaal. Gemiddeldes in die geval van diftongiese elemente kan misleidend wees.

Figuur 22 is ’n volledige grafiese voorstelling in die vorm van ’n akoestiese kaart, soos ook in Figuur 11 gesien is. Hierdie kaart is gekonstrueer op grond van die ontleding van die vokale van Spreker A. Beluister dit in die volgende klankinsetsel (Vokale Spreker A), en kyk ook na die MRI’s daarvan.

Klankinsetsel: Spreker A se vokale in h_t-konteks

Figuur 22. Akoestiese vokaalkaart van Spreker A se 12 vokale, soos uitgespreek in die raam hVt in meegaande klankinsetsel. Die volgorde waarin dit gelees word, word deur die rooi pyle aangedui.

’n Samevoeging van die twee groot groepe sprekers van Adank e.a. (2004) en Pols e.a. (1973) van 50 elk lewer ’n akoestiese vokaalkaart wat nie veel verskil van dié van ’n samevoeging van die twee individuele sprekers (Spreker A en Spreker B) nie. Figuur 23 is daarvan getuie. 

Figuur 23. Gemiddeldes van twee groepe Nederlandse manlike sprekers (sien teks vir besonderhede).

Laastens kyk ons vlugtig na ’n ander wyse om vokaalformante grafies voor te stel. Figuur 24 is ’n lyngrafiek van die data van Spreker A se drie vokaalformante. Lyngrafieke is veral nuttig by die vergelyking van verskillende van die vokaalparameters met mekaar; in hierdie geval kan F3, anders as in die standaard akoestiese vokaalkaarte, soos onder meer Figuur 22, ook met F1 en F2 vergelyk word. ’n Lyngrafiek stel mens in staat om ’n eerste indruk te vorm van die verbande tussen die verskillende vokale se formante. Op die oog af is daar ’n direkte verband tussen F2 en F3 van sommige vokale, en indirekte verbande tussen ander, terwyl daar in enkele gevalle geen verband is nie. Meer spesifiek: die eerste vyf vokale (van links na regs geneem onder op die x-as) se F3 loop parallel aan dié van F2; hulle is dan ook dig by mekaar. Die meeste van die res van die vokale se F2 en F3 lê ver van mekaar. Hoewel dit onpatroonmatig voorkom, is dit tipies van die verspreiding van hierdie twee formante.

Figuur 24. ’n Lyngrafiek van die eerste drie vokaalformante van die Nederlandse vokale van Spreker A. Op die x-as is die SAMPA-simbole van die h_t-woorde aangebring. Gemiddelde waardes per vokaal word met die rooi stippellyn aangetoon.

 

Ook wat F3 betref – soos die geval is met F1 en F2 (sien Figuur 26), is daar ’n groot ooreenkoms tussen Spreker A en die 50 ander Nederlandse sprekers; die besonderhede daarvoor hoef nie hier gegee te word nie. Dit dien, terloops, as sterk motivering daarvoor dat daar nie so ’n groot groep sprekers betrek hoef te word by ondersoeke soos hierdie nie. Daar bestaan statistiese metodes aan die hand waarvan sodanige mate van ooreenkoms presies bepaal kan word, maar dit is nie die fokus van hierdie artikel nie. Gevolglik sal ek slegs op ’n baie oppervlakkige wyse een daarvan aan die hand van ’n ander datastel illustreer.

Ten slotte illustreer ek kortliks die gebruik van statistiese metodes om die relatiewe kragtigheid te illustreer van een parameter, of ’n groep parameters, in die taak om vokale korrek te kan klassifiseer, sê maar as gerond of ongerond in die binêre gemerkte pare vokale (bv. /9/ teenoor /@/. Die statistiese metode wat ek hier gebruik, is die diskriminantfunksie-analise (afgekort tot DA).

Ek moet van ander datastelle gebruik maak om so ’n demonstrasie te kan gee, omdat die huidige hulle nie daartoe leen nie – dit bestaan slegs uit een gemiddelde waarde per vokaal van 50 sprekers in die geval van Pols e.a. (1973), en 50 in die geval van Adank e.a. (2004). Spreker A se vokale is ook slegs een keer gelees en gemeet. Die datastel wat ek gebruik,34 is dié van 20 vroulike sprekers – hulle het elke vokaal een maal gelees, wat ’n totaal van 20 metings per leser oplewer. Ek verwys hier slegs na twee vokale, die BOER-vokaal en die BOOR-vokaal. Ek gebruik juis hierdie twee omdat hulle naby aan mekaar lê – beide is hoë agtervokale (/o/ is net bietjie laer as /u/). Die vraag is of F1 en F2, wat tradisioneel gebruik word in die klassifikasie van vokale soos hierdie, voldoende kragtig is om hulle as sodanig korrek te klassifiseer. Dit is verder interessant om ook te bepaal of, en indien wel, in watter mate, ’n stel bestaande uit tien35 hoofparameters van Tabel 2 beter tussen hierdie twee vokale kan diskrimineer as net F1 + F2, en dus ook hoe suksesvol dié vokale geklassifiseer kan word as hoog-agter (/u/) en middelhoog-agter (/o/). Hou in gedagte dat F1 en F2 ingesluit is in die volledige stel. Tabel 3 gee die resultate van ’n diskriminantfunksie-analise.
 

PARAMETERSTELLE

VOKAALPAAR

F1+F2

ALMAL

/u/

56%

94%

/o/

75%

95%


Tabel 3. Persentasie vokale korrek geklassifiseer; F1+F2 en al tien parameters saam (ALMAL) is as twee stelle is gebruik (Kolom 2 en 3).

Tabel 3 se resultate wys baie duidelik dat die stel van tien parameters baie sterker figureer wat betref die klassifikasie van die twee vokale as wat slegs F1 en F2 dit kan doen. Die feit dat beide vokale so goed korrek geklassifiseer kan word, dui terselfdertyd op ’n baie goeie diskriminasievermoë.

Dit sal duidelik blyk dat die vokaalstelsels wat hier ter sprake was, op nog veel meer maniere ontleed en beskryf kan word. Hierdie was maar ’n dwarsdeursnit van ’n baie intrigerende “organisme”, die vokaalsisteem. Afrikaans kom in die volgende artikels spesifiek aan die orde.

Samevatting

Die hoofdoel van hierdie artikel was om ’n raamwerk te ontwikkel vir die beskrywing, ontleding en interpretering van die vokale, natuurlike klasse vokale, soos byvoorbeeld die gemerkte geronde vokale, asook volledige vokaalsisteme, van enige taal, in ons geval hoofsaaklik Afrikaans. Vokale word beskryf in terme van die manier waarop hulle geproduseer word, dit is in die artikulatoriese fonetiek. Daarvan bestaan daar etlike goeie voorbeelde wat betref Afrikaans, maar geen omvattende voorbeeld van die akoestiese eienskappe van Afrikaanse vokale nie; wel van Nederlands, wat baie kan bydra tot die ontwikkeling van sodanige omskrywing in die akoestiese fonetiek. In hierdie bydrae probeer ek om hierdie gapings te vul. Kyk ook spesifiek hier na die interaktiewe vokaalkaart deur op http://www.nwu.ac.za/af/content/ctext-vokaalkaart te klik en die aanduidings daar te volg. Hier kan mens nie net hoor hoe ’n spesifieke vokaal klink nie, maar mens kan ook ’n magnetiese resonansbeeld (MRI) van die mondkanaal (insluitende die posisies van die tong en vorm van die lippe) daarvan sien. Ek gee die meeste aandag aan die akoestiese eienskappe van vokale. Juis omdat met name ’n akoestiese raamwerk nog nie vir spesifiek die Afrikaanse vokaalsisteem bestaan nie, maak ek ruim gebruik van die meer gevorderde Nederlandse literatuur, maar ook die uitspraak self van die Nederlandse vokale. Die voordeel hiervan is dat daar ’n groot ooreenkoms is tussen die vokale van hierdie twee tale. Vokaalparameters wat toegelig word, is duur, intensiteit, grondfrekwensie (F0), en die vokaalformante (F1, F2, F3). Kort vokale kan met behulp van slegs hierdie stel parameters ontleed word, maar vir die lang, middelhoë vokale, wat geneig is om te diftongeer, is die gradiënt waarteen hulle vokaalformante verloop, ook van groot belang. Hierdie aspek van vokale kry spesiale aandag. In hierdie artikel lig ek ’n spesifieke vokaalontledingsmetode, Vowelyse (Van der Walt en Wissing 2004) toe, en wys op die sterkpunte daarvan vergeleke met ander metodes soos wat dit in die vakliteratuur gevind word.

Bibliografie

Adank, P., R. van Hout en R. Smits. 2004. An acoustic description of the vowels of Northern and Southern Standard Dutch. Journal of the Acoustical Society of America, 116:1729–38.

Akustyk. s.d. www.akustyk.com (20 September 2011 geraadpleeg).

Bekker. I. 2009. The vowels of South African English. Ongepubliseerde PhD-proefskrif, Noordwes-Universiteit, Potchefstroomkampus.

Boberg, C. 2005. The Canadian shift in Montreal. Language Variation and Change, 17:133–54.

Boersma, P. en D. Weenink. 2011. 4.4.5 [rekenaarsagteware]. http://www.praat.org
(1 September 2011 geraadpleeg).

Catford, J.C. 1988. A practical introduction to phonetics. Oxford: Oxford University Press.

Coetzee, A.E. 1981. Fonetiek vir eerstejaars. Pretoria: Academica.

Eaton, R., O. Fischer, W. Koopman en F. Van der Leek (reds.). 1985. Papers from the 4th International Conference on English Historical Linguistics. Amsterdam: John Benjamins.

Grabe, E. en E.L. Low. 2002. Durational variability in speech and the rhythm class hypothesis. In Gussenhoven en Warner (reds.) 2002.

Gussenhoven, C. en N. Warner (reds.). 2002. Laboratory phonology VII. Berlyn: Mouton de Gruyter.

Jones, D. 1934. An outline of English phonetics. Cambridge: Heffer.

Kent, R.D. en C. Read. 1992. The acoustic analysis of speech. San Diego: Singular Publishing Group.

Labov, W. 1994. Principles of linguistic change. Oxford: Blackwell.

Labov, W., S. Ash en C. Boberg. 2006.The Atlas of North American English: Phonology, Phonetics, and Sound Change. A Multimedia Reference Tool. Berlin: Mouton de Gruyter.

Ladefoged, P. 2001. Vowels and consonants: An introduction to the sounds of language. Los Angeles: Blackwell.

Langstrof, C. 2006. Acoustic evidence for a push-chain shift in the intermediate period of New Zealand English. Language Variation and Change,18:141–64.

Lass, R. en S. Wright. 1985. The South African chain shift: Order out of chaos? In Eaton, Fischer, Koopman en Van der Leek (reds.) 1985.

Le Roux, T.H. en P. De V. Pienaar. 1927. Afrikaanse fonetiek. Kaapstad: Juta.

Maddieson, I. 1995. Sounds of the world’s languages. Oxford: Blackwells.

Nearey, Terrance M. 1977. Phonetic Feature Systems for Vowels. Proefskrif, Universiteit van Alberta, VSA. Oorgedruk in 1978 deur die Indiana University Linguistics Club. Aanlyn beskikbaar: http://www.ualberta.ca/~tnearey/Nearey1978_compressed.pdf.

Nooteboom, S.G. en A. Cohen. 1984. Spreken en verstaan, een inleiding tot de experimentelee fonetiek. Assen: Van Gorcum.

Peeters, W.J.M. 1991. Diphthong dynamics. Ongepubliseerde PhD-proefskrif, Rijksuniversiteit, Utrecht.

Peterson, G. en H. Barney. 1952. Control methods used in a study of the vowels. Journal of the Acoustical Society of America, 24:175–84.

Pols, L.C.W., H.R.C. Tromp en R. Plomp. 1973. Frequency analysis of Dutch vowels from 50 male speakers. Journal of the Acoustical Society of America, 53:1093–101.

Raubenheimer, H. 1998. Acoustical features of diphthongs in Afrikaans. Ongepubliseerde PhD-proefskrif, Potchefstroomse Universiteit vir Christelike Hoër Onderwys (Noordwes-Universiteit).

Rietveld, A. en V. van Heuven. 2009. Algemene fonetiek. Bussum: Coutinho.

Schötz, S. 2006. Perception, analysis and synthesis of speaker age. Travaux de linguistique de Lund 47. Lund: The Graduate School of Language Technology.

Sluijter, A. en V. van Heuven. 1996. Spectral balance as an acoustic correlate of linguistic stress. Journal of the Acoustical Society of America, 100(4):2471–85.

Syrdal, A.K. en H.S. Gopal. 1986. A perceptual model of vowel recognition based on the auditory representation of American English vowels. Journal of the Acoustical Society of America, 79:1086–100.

Van der Merwe, A., E. Groenewald, D. van Aardt, H.E.C. Tesner en R.J. Grimbeek. 1993. Die formantpatrone van Afrikaanse vokale soos geproduseer deur manlike sprekers. Suid-Afrikaanse Tydskrif vir Taalkunde, 11(2):71–9.

Van der Walt, A.J. en D. Wissing. 2003. Vowelyse. http://www.puk.ac.za/opencms/export/PUK/html/fakulteite/lettere/HLT Resources/Tools/vowelise.html (28 Maart 2011 geraadpleeg).

Van Wyk, E.B. 1977. Praktiese fonetiek vir taalstudente: ’n inleiding. Durban: Butterworths.

Wells, J. 1982. Accents of English. Vol. 1. Cambridge: Cambridge University Press.

Wissing, D. 2005. Die Afrikaanse diftong /E+/: ’n Eksperimentele ondersoek. Southern African Linguistics and Applied Language Studies, 23(3):319–34.

—. 2006. Het jou mô en jou pô ’n strondhuis in Hortenbos? Feit of fiksie? Southern African Linguistics and Applied Language Studies, 24(1):87–100.

—. 2007. Gevorderde akoestiese korrelate van klemtoon in Afrikaans. Southern African Linguistics and Applied Language Studies, 25(4):607–24.

—. 2010. Oor die status van “oe” in Afrikaans: ’n Akoestiese analise. Tydskrif vir Geesteswetenskappe,50(1):31–49.

—. 2011a. Ontronding in Afrikaans. Tydskrif vir Geesteswetenskappe, 51(1):1–20.

—. 2011b. Ontronding in Kharkamsafrikaans? http://www.oulitnet.co.za/akademies_geestes/pdf/LA_8_2m_wissing.pdf LitNet Akademies, 8(2):309–30.  (12 September 2011 geraadpleeg).

SLAAP. http://ncslaap.lib.ncsu.edu/tools/norm/about_normalization1.php (Op 14 Augustus 2012 geraadpleeg).

Eindnotas

1 Ek verwys voorts slegs na die 2009-werk.

2 Die tweede vokaal in pitte. Die eerste vokaal is natuurlik ook ’n sjwa, maar is beklemtoon. Sien laer af vir meer besonderhede.

3 Praat is ’n uitgebreide en baie gesofistikeerde fonetiekprogram wat wêreldwyd gebruik word vir veral akoestiese analises. Dit kan gratis afgelaai word; is aanlyn beskikbaar (www.praat.org). Meer oor die funksionaliteit daarvan is beskikbaar op: http://www.fon.hum.uva.nl/praat (1 September 2011 geraadpleeg).

4 Laer af word ’n sisteem voorgestel waarvolgens na die verskillende vokale verwys word deur middel van woorde waarin hulle voorkom.

5 Die konsep van frekwensies en die metingseenheid daarvan, Hertz, word laer af bespreek.

6 Die eienaar van die video, op YouTube beskikbaar gestel, Massimo Martinelli, van die maatskappy Inventis srl, Italië, word bedank vir die toestemming om hierdie video so te kan gebruik.

7 Dit is ’n veelvoud van die fundamentele frekwensie in stemhebbende klanke.

8 Die waardes in groen regs onder en bo van die onderste venster dui die laagste en hoogste vlakke van intensiteit aan.

9 Die formule hiervoor is 10*log10(99/1) = 20dB.

10 Kan ook aktiewe genoem word. Dit is egter streng gesproke nie ter sprake by vokale nie, omdat al die artikulatore bewegend van aard is; by die vorming van konsonante is daar ook passiewe artikulatore, soos die tande en tandkas (= alveolum).

11 Kyk Tabel 1 hier onder vir die fonetiese transkripsies hiervan.

12 Daar word gewoonlik drie egte diftonge, dit is tweeklanke wat as een foneem erken word, vir Afrikaans – soos vir Nederlands – erken. Die onegte diftonge word opgemaak deur twee afsonderlike foneme met mekaar te kombineer, byvoorbeeld “ai”: /Ai/ (SAMPA/ en “aai”: /?i/. IPA is die afkorting vir International Phonetic Association – kyk http://www.langsci.ucl.ac.uk/ipa (2 September 2011 geraadpleeg).

13 Foneties word dit gewoonlik getranskribeer as respektiewelik /@i/, /9u/ en /9i/ (SAMPA), of /?i/, /œu/ en /œi/ (in IPA); daar is wel variasies hierop, waarop nie nou ingegaan word nie.

14 SAMPA is die afkorting van Speech Assessment Methods Phonetic Alphabet (daar is ook ’n nuwer weergawe X-SAMPA, maar die simbole is in ons geval dieselfde); IPA = International Phonetic Alphabet, ontwikkel deur die International Phonetic Association.

15 Wissing (2010) het dit wel reeds ten opsigte van die BOER-vokaal (/u/) vasgestel.

16 Ek gebruik voortaan slegs die term stulp en sy afleidings wanneer ek na die lipvorming verwys. Ek noem die vokale self steeds, volgens algemene konvensie, gerond of ongerond/ontrond, na gelang van omstandighede.

17 MRI is ’n erkende afkorting vir Magnetic Resonance Image; hoewel MRI-beeld streng gesproke ’n toutologiese vorm is (image = beeld), gebruik ek dit tog so.Hierdie beelde is goedgunstiglik beskikbaar gestel deur van die skrywers van die boek Algemene fonetiek (2009), Toni Rietveld en Vincent van Heuven, en met toestemming van die uitgewer Coutinho, Bussum. Ek erken die gebruik daarvan met dank.

18 Laer af word spektrogramme in besonderhede bespreek.

19 Dieselfde opmerking geld hier wat ek hoër op (eindnota ii) ten opsigte van Standaardafrikaans gemaak het.

20 Dit is bekend dat die Nederlands wat in die suide van Nederlands, maar ook in Vlaandere, nie gekenmerk word deur ’n sterk verglyding van die middelhoë vokale nie (Van Heuven; persoonlike mededeling).

21 Die eerste skrywer van die boek Algemene fonetiek, Toni Rietveld.

22 Anders as in die geval van Afrikaans, waar die BOOR-vokaal begin met ’n /u/-agtige kleur, en eindig met ’n /@/-agtige, is dit presies die teenoorgestelde geval in Nederlands. Dit is minder duidelik met die BOOR-vokaal voor /r/, maar in byvoorbeeld die woord boot is dit wel duidelik. Vergelyk ook Rietveld en Van Heuven (2009:172).

23 Hierdie groep vokale kom in baie min tale voor; vergelyk hiervoor die inligting wat deur Maddieson (1995) hieroor verstrek word. Volgens hom kom hierdie groep geronde vokale in slegs 37 voor van die 525 wat hy ondersoek het. Die produksie daarvan is ook moeilik vir anderstaliges en klein kindertjies om baas te raak. Dit maak van hulle “abnormale” klanke, soos wat dit in ouer werke (soos dié van Le Roux en Pienaar 1927) genoem is. Hedendaags word die term gemerk vir alle “spesiale” vorme (fonologies, sintakties en semanties)  gebruik. Ongemerkte vorme is dié wat meer algemeen is, meer geredelik sal voorkom, ensovoorts.

24 Ek wyk hier af van die konvensie om na die vokale in terme van die voorbeeldwoorde van Tabel 1 te verwys. Omdat h_t in hierdie afdeling gebruik word, gebruik ek dit ook hier in die teks.

25 Die rede waarom die drie vokale (die BUUR-, die BEUR- en die PUT-vokaal) gemerk genoem word, is dat hulle nie agtervokale is nie; slegs agtervokale is tipies gerond van aard.

26 Hierdie vokaal, die sjwa (/@/;/?/), kom in baie tale – soos Engels en Nederlands – slegs in onbeklemtoonde posisies voor. Afrikaans vorm ’n uitsondering daarin dat dit ook in beklemtoonde posisies optree. Dit sluit egter nie die feit uit nie dat volvokale as sjwa uitgespreek word wanneer dit nie beklemtoon word nie. Vergelyk hiervoor die vokale in die eerste sillabes van byvoorbeeld kanon (die militêre wapen), vakansie en gordyn.

27 Nederlands se /O/-vokaal, soos in pot, is aanmerklik laer as dié van Afrikaans – dit benader soms die /A/ se uitspraak.

28 Dit is bekend dat /E/ voor die konsonante /k, x, l, r/ in veral die uitspraak van noordelike inwoners van die land verlaag tot [{]. Dit gebeur egter veral nie in die spraak van die meeste bruin mense nie, ongeag die streek waarin hulle woon. ’n Baie goeie voorbeeld daarvan dat dit wel die invloed van die daaropvolgende konsonant is wat, in sommige variëteite, weliswaar, /E/ laat verlaag tot /{/, is die volgende: die onderstreepte vokaal voor /x/ in legkaart is [{], maar dié van die verwante woord lê is nie; dis /E/. Dieselfde gebeur met segging teenoor sê. Verder se vokaal (voor /r/) is laag ([{]), maar nie in die vorm van verder waarin /r/ van ver- wegval nie, dus /fEd@r/).

29 Ouderdomsverskille is hier blykbaar ’n belangrike faktor. Die BAAR-vokaal word baie gerond uitgespreek deur veral jong, vroulike sprekers van die noordelike streke van Suid-Afrika (ek verwys voorlopig na hulle uitspraak as “moderne” Afrikaans); hulle BAR-vokaal is weer baie “platter” (Wissing 2006). Meer hieroor word in opvolgartikels gesê.

30 Ander formate, soos *.mp3, kan ook gebruik word, maar moet eers omgewerk word tot *.wav-formaat.

31 Sluijter en Van Heuven (1996) meen dat die bandwydte van F1 veroorsaak word deur glottislek . Rietveld en Van Heuven (2009:126) bekyk die saak van ’n ander kant. Hoe smaller die bandwydte van ’n formant, meen hulle, hoe duideliker is die hoorbare invloed van die betreffende formant op die klankkwaliteit of klankkleur daarvan (Rietveld en Van Heuven 2009:126). Dié twee perspektiewelik is natuurlik aansluitend by mekaar. ’n Gemiddeld van ongeveer 100 Hz geld waarskynlik vir die Afrikaanse vokale.

32 Ek gebruik altyd Statistica.

33 Die persentasie van daling of styging in Hertz per sekonde. Daling word in negatiewe terme uitgedruk; styging is positief.

34 Dit is die bedoeling om hierdie inligting later volledig te publiseer.

35 Die tien parameters is in die studie waarna in eindnota xxxix verwys is: F0, F1, F2, F3, BdW F1, HGV, Totale Intensiteit, Intens BF1, Intens BF2, Duur.

 


LitNet Akademies (ISSN 1995-5928) is geakkrediteer by die SA Departement Onderwys en vorm deel van die Suid-Afrikaanse lys goedgekeurde vaktydskrifte (South African list of Approved Journals). Hierdie artikel is portuurbeoordeel vir LitNet Akademies en kwalifiseer vir subsidie deur die SA Departement Onderwys.


  • 0

Reageer

Jou e-posadres sal nie gepubliseer word nie. Kommentaar is onderhewig aan moderering.


 

Top