Taaltegnologie is bemagtigingstegnologie – Justus Roux vertel

  • 0

Die meeste kitsbanke in die land praat reeds hul gebruikers se taal deur veeltalige keuses te stel. Die Sentrum vir Tekstegnologie (CTexT®) van die Noordwes-Universiteit wil hierdie taaltegnologietoepassings verder voer. Naomi Meyer het Justus Roux, direkteur van die Navorsingseenheid: Tale en Literatuur in die Suid-Afrikaanse Konteks, oor CTexT® se planne gevra.

Hallo Justus, en dankie vir die geleentheid tot gesprek oor ’n nuwe projek by die Sentrum vir Tekstegnologie (CTexT®) van die Noordwes-Universiteit. Ek lees in die inligtingstuk hieromtrent: "Dit sal binnekort makliker word vir navorsers en ontwikkelaars om data te bekom (en te voorsien), wat heelwat kosbare tyd sal spaar. Aangesien baie van die Suid-Afrikaanse tale as hulpbronarm beskou word, streef die HBA daarna om datahulpbronne vir hierdie tale meer geredelik beskikbaar te stel. Moedertaalsprekers van Suid-Afrikaanse tale sal grootliks hierby baat vind, en kan aanstons nuwe deurbrake te wagte wees in gesondheidsorgkommunikasie, opvoedkundige sagteware of besigheidshulpmiddels – alles te danke aan die makliker bekombaarheid van taaltegnologiedata, die essensie van hierdie verwikkelings.

Wat beteken dit in die praktyk?

Taaltegnologie  is ’n bemagtigingstegnologie – dit wil sê ’n tegnologie (of reeks tegnologieë) wat die mens in staat stel:

(a) Om ’n verskeidenheid funksies te verrig deur gewoon in natuurlike taal met ’n rekenaar of gerekenariseerde stelsel te kommunikeer. Dink maar aan die Google-soekenjin wat gebruik word om bepaalde inligting te bekom: die stelsel kan geskrewe taal (teks) of selfs spraak in ’n bepaalde taal as invoer neem en dan ’n soekfunksie verrig en met ’n antwoord (bvyvoorbeeld in teksformaat) te voorskyn kom. In hierdie spesifieke proses is verskeie tipes teks- asook spraaktegnologie (outomatiese spraakherkenning) betrokke. Die meeste slimfone maak byvoorbeeld van spraaktegnologie gebruik om stem-bel (voice dialling) te doen of om ’n teks op die slimfoon hardop uit te lees vir die gebruiker (in welke geval teks-na-spraakomsettingstegnologie gebruik word).

(b) Om taalgebaseerde rekenaarprogrammatuur te gebruik om bepaalde take beter en vinniger te kan verrig; dink maar aan die daaglikse gebruik van spel- en grammatikatoetsers wat as hulpmiddels dien in die skryf van briewe, verslae ens.  Bepaalde vorme van tekstegnologie is so ook byvoorbeeld betrokke by masjienvertalingsisteme wat as hulpmiddels vir vertalers kan dien of gewoon net om veeltalige inligting aan enige gebruiker te gee.

(c) Om hulpmiddels te ontwikkel vir individue wat byvoorbeeld gesiggestrem is – hier dink ons aan "leesmasjiene" vir blindes, waar geskrewe teks direk in spraak omgeskakel word in ’n bepaalde taal en die gebruik van Braille in ’n mate oorbodig raak. Verder bestaan daar alreeds ’n verskeidenheid stelsels vir geletterdheidsopleiding sowel as taalaanleerprogramme waarin taaltegnologie ’n sentrale rol speel.

Die sukses van sisteme wat hierdie tegnologieë gebruik hang in ’n groot mate af van die taalspesifieke data wat gebruik word om die sisteem af te rig. Binne die Suid-Afrikaanse konteks is dit hier waar die nuwe HBA (of Resource Management Agency, soos dit amptelik bekend staan)  inpas: dit is geweldig duur om groot hoeveelhede teks- en spraakdata te versamel en in so ’n formaat te omskep dat dit bruikbaar is in ’n bepaalde toepassing. Hierdie agentskap het gevolglik ten doel om (i) te dien as ’n deponeringspunt van data wat byvoorbeeld in taalnavorsingsprojekte gebruik is, of wat gewoon op daaglikse basis gegenereer word in die skep van koerante, tydskrifte, verslae ens; (ii) hierdie data in bepaalde elektroniese formate te prosesseer; en (iii) veeltalige toepaslike teks- en spraakdata beskikbaar te stel aan studente, navorsers en ontwikkelaars op hierdie gebied. Hoe meer toepaslike teks- en spraakdata vir ’n bepaalde taal versamel en geprosesseer kan word, hoe beter kan die stelsels funksioneer. 

Jul doelwit is dat Suid-Afrikaners toenemend toegang moet verkry tot inligting en dienste in die tale van hul keuse. Waarom?

Ons leef immers in die sogenaamde inligtingsera en in ’n meertalige land, waar nie alle mense Engels of Afrikaans magtig is nie en tog ’n reg het om in ’n taal van hulle keuse bedien te word. Taaltegnologietoepassings in veeltalige outomatiese tellermasjiene is so byvoorbeeld die eerste stap in ’n proses om fasiliteite te ontwikkel waarin die gebruiker met ’n outomatiese stelsel kan kommunikeer, hetsy in teks- of spraakmodus, en die stelsel dan in dieselfde taal kan reageer. 

Laastens, ’n praktiese vraag: geld. Waar kom dit vandaan? En sal alle Suid-Afrikaners op lang termyn bereid wees om te betaal vir dienste en tegnologie in die taal van hul keuse, dink jy? Of is dit julle strewe dat moedertaal op alle terreine nie ekstra hoef te kos nie, maar as ’t ware ’n mensereg in die land behoort te wees (met ander woorde dat dit hand aan hand loop met die tegnologie: as die tegnologie beskikbaar is, dan so ook die vanselfsprekendheid van die tegnologie in die voorkeurtaal)?

Taaltegnologie het alreeds hand aan hand begin loop met bepaalde toepassings:  ’n mens kan byvoorbeeld alreeds vir etlike jare ’n telefoniese “gesprek” voer met ’n stelsel om inligting te bekom oor aankoms- en vertrektye van vliegtuie of treine sonder dat dit noodwendig ekstra koste vir die gebruiker meebring. Hierdie tipe stelsels is alreeds vir jare beskikbaar in groter wêreldtale soos Engels, Duits, Frans, Spaans en Sjinees, en dit is juis die doel van plaaslike taaltegnologienavorsing en -ontwikkeling om sodanige stelsels vir al die amptelike tale in Suid-Afrika te ontwikkel. Hierdie tipe navorsing en ontwikkeling vind normaalweg in spanverband plaas tussen rekenaarwetenskaplikes / elektroniese ingenieurs en taalkundiges.

Lees nog oor die goeie nuus vir Suid-Afrikaanse tale wat hierdie universiteit beplan.

  • 0

Reageer

Jou e-posadres sal nie gepubliseer word nie. Kommentaar is onderhewig aan moderering.


 

Top