Spraak-na-spraak-slimfoonvertaling vir verloskunde

  • 0

Jy het dalk al ’n advertensie vir so iets gesien: ’n toestel wat aan jou oor haak en na bewering jou gespreksgenote se spraak uit ander tale na joune vertaal terwyl hulle aan die praat is. Hoe moeilik kan dit wees?

Taaltegnologie is al sedert die begin ’n integrale deel van die mitologie van kunsmatige intelligensie. Van die bekendste voorbeelde hiervan is HAL 9000 in die film 2001: A Space Odyssey en die idee van ’n “universal translator” in Star Trek, maar wetenskapsfiksie is deurspek met sulke denkbeeldige taaltegnologieë. Die verwagting dat rekenaars soos mense moet kan kommunikeer, of selfs beter as mense, dui miskien in die eerste plek op die mate waartoe taal as een van die vernaamste voorbeelde van intelligensie – en dus kunsmatige intelligensie – geag word, en bevestig ook tweedens mense se groot behoefte om oor taalgrense heen te kan kommunikeer.

Hierdie behoefte is veral groot in die konteks van mediese hulp in Suid-Afrika. Volgens Stats SA se 2018-data1 is Engels die huistaal van 8,1% van Suid-Afrikaners, terwyl dit vir ’n verdere 16,6% die primêre taal is waarin hulle buite die huis kommunikeer. ’n Mens kan moontlik hieruit aflei dat amper driekwart van Suid-Afrikaners nie op ’n gereelde basis Engels gebruik nie, en dus beter in ander tale by klinieke en hospitale gehelp sal kan word. Tans is dit gereeld die geval dat enigiemand op die perseel wat die pasiënt se taal praat, as tolk ingespan word – van skoonmakers tot sekuriteitswagte. Dit het ernstige nagevolge vir privaatheid en die mate van respek waarmee gesondheidsorg gebied kan word.

Is dit moontlik om vir die Suid-Afrikaanse konteks ’n oplossing te bied wat dokters en verpleegsters in staat sal stel om direk met pasiënte in hul eie taal te kommunikeer?

Die tendens wêreldwyd is om op enorme datastelle sogenaamde diepleertegnieke toe te pas, en die resultate is indrukwekkend. Google Translate is ’n industrieleier wat masjienvertaling betref, met ’n groeiende lys van ondersteunde tale, waaronder Afrikaans, Xhosa en Zulu. Google Translate is ’n tegnologie wat hom toespits op breë dekking: Die eerste prioriteit is om op enige invoer ’n resultaat te lewer, selfs al is die kwaliteit nie altyd na wense nie. Vir baie scenario’s is dit ’n nuttige en aanvaarbare vertrekpunt, maar in sekere kontekste, soos die mediese domein en die reg, is gewaarborgde kwaliteit moontlik ’n groter prioriteit as breë dekking. ’n Dokter sal verkies dat ’n vertaalstelsel ’n foutboodskap gee eerder as dat “jy het nie kanker nie” vir een of ander rede as “jy het kanker” vertaal word – sonder dat die dokter dit weet!

AwezaMed is ’n slimfoontoepassing wat gekontroleerde spraak-na-spraak vertaling vir die domein van verloskunde bied, met Engels as brontaal en Afrikaans, Xhosa en Zulu as doeltale. Anders gestel, ’n gesondheidsorgpraktisyn (GSP) gebruik die toepassing in Engels, terwyl die pasiënt uitinge in Afrikaans, Xhosa of Zulu hoor. Wanneer die GSP iets in Engels sê, is die eerste stap dus spraakherkenning van die uiting. Die spraakherkenningskomponent se doel is om die klanksein om te skakel na ’n teksvoorstelling van die uiting. Die teks word dan na die vertalingskomponent gestuur, wat teks in die doeltaal produseer. Dan word die nuwe teks na die spraaksintese-komponent gestuur, wat dit omskakel in ’n klanksein, sodat die toepassing as’t ware die vertaling van die uiting in die pasiënt se taal praat.

Gekontroleerde vertaling het ’n ander fokus as breëdekkingvertaling soos Google Translate, naamlik die betroubaarheid van die vertaling. Hiervoor span AwezaMed veeltalige rekenaargrammatikas via die Grammatical Framework-formalisme2 in. ’n Rekenaargrammatika kan beskryf word as ’n stel reëls wat die konstruksie van uitinge in ’n natuurlike taal beskryf. Byvoorbeeld, volledige sinne bestaan tipies uit ’n onderwerp en ’n predikaat: “Ek sien jou”. Ek is die onderwerp en sien jou is die predikaat. In die sin “Ek kan sien dat jy loop” is kan sien dat jy loop die predikaat. ’n Rekenaargrammatika beskryf die komponente waaruit uitinge bestaan en ook die maniere waarop die komponente gekombineer kan word om uitinge te vorm.

Die sentrale module van ’n veeltalige rekenaargrammatika is ’n stel reëls wat die semantiek van uitinge in ’n domein vasvang, en dus in hierdie geval die domein van verloskunde. Hierdie reëls word dan gebruik om semantiese boomstrukture te skep van uitinge in die domein. Byvoorbeeld, die onderstaande struktuur verteenwoordig die uiting “Het jy tydens ’n vorige swangerskap bloeding gehad?”

Vir elke taal in die veeltalige rekenaargrammatika word taalspesifieke reëls gedefinieer wat seker maak dat die betekenis van die uiting reg vasgevang word. Die grammatika kan ook variasies bevat, sodat die Engels “Did you experience bleeding during a previous pregnancy?” ook as “Did you bleed during a previous pregnancy?” uitgedruk kan word. In Zulu (en Xhosa) word ’n heel ander konstruksie as in Afrikaans en Engels gebruik, naamlik die assosiatiewe kopulatief:

Ingabe             uke      waba nokopha            ekukhulelweni            kwangaphambili?

Miskien           al ooit was jy met bloeding   in ’n swangerskap      van voorheen

Die grammatika hanteer sulke verskille nie direk nie: Elke taal het sy eie stel reëls vir hoe die semantiese strukture uitgedruk word. Hierdie taalspesifieke reëls maak dit moontlik om vanuit ’n semantiese struktuur teks in elke taal van die grammatika te produseer (liniarisering), maar ook om vanuit teks ’n semantiese struktuur te konstrueer (ontleding). Vertaling vind dus in twee stappe plaas: ontleed teks in die brontaal en liniariseer die resulterende struktuur in die doeltaal.

Die taalspesifieke reëls kan só gekies word om idiomatiese taal te verseker. In Afrikaans en Engels behoort daar byvoorbeeld vir elke simptoom ’n toepaslike werkwoord gebruik te word: “Het jy al ooit flitsende ligte gesien?” Zulu en Xhosa toon selfs groter linguistiese variasie vir hierdie soort uiting. Die idiomatiese manier om “Het jy onlangs erge hoofpyn ervaar?” in Zulu uit te druk, is “Ingabe uke waphatwa yikhanda elibuhlungu kungekudala?”, wat direk vertaal kan word as “Miskien is jy onlangs gepla deur ’n kop wat pynlik is?” Hierdie soort variasie word hanteer deur vir elke taal die gepaste konstruksies vir die verskeie simptome te definieer. Dieselfde geld vir enige ander konsepte in die domein.

Om ’n domeinspesifieke grammatika te ondersteun, word daar van meer algemene grammatikas gebruik gemaak. Enige rekenaargrammatika moet beide die morfologie (hoe woorde gevorm word) en die sintaksis (hoe uitinge gevorm word) van ’n taal reg implementeer. Beide morfologie en sintaksis is byvoorbeeld ter sprake wanneer ’n rekenaargrammatika die regte vorm van die byvoeglike naamwoord produseer, afhangende van hoe dit in ’n uiting gebruik word, bv “Die lig is dof” en “Dit is ’n dowwe pyn”. Hierdie soort reëls is nie spesifiek tot enige domein nie, en daarom word sogenaamde hulpbrongrammatikas ingespan, wat fokus op die linguistiese eienskappe van elke taal. Die hulpbrongrammatikas implementeer die algemene morfologie en sintaksis van die tale, en die domeingrammatika definieer die spesifieke woorde en konstruksies wat gebruik moet word om die konsepte in die domein reg uit te druk.

Een van die grootste voordele van so ’n benadering is die verifieerbaarheid van die vertalings. Nie net kan daar op ’n leksikale vlak nagegaan word dat die regte woorde in elke taal vir die konsepte in die domein gebruik word nie, maar kan die reëls waarvolgens konsepte saamgevoeg word om uitinge te produseer ook nagegaan word. Dit beteken eerstens dat die gebruiker ’n groter mate van vertroue in die vertalings kan hê, en tweedens, wanneer foute wel gevind word, die oorsaak daarvan opgespoor en reggemaak kan word. Met vertaalstelsels wat op groot datastelle afgerig word, is dit nie altyd maklik of selfs moontlik om foute so reg te stel nie.

’n Tweede belangrike voordeel van hierdie benadering is dat dit veral die spraakherkenning tot ’n mate vergemaklik. Een van die sentrale komponente van ’n spraakherkenningstelsel is die sogenaamde taalmodel: ’n model van die taal wat voorspellings kan maak oor die manier waarop woorde in die taal op mekaar volg. Sulke modelle kan met statistiese of diepleermetodes op domeinspesifieke data afgerig word, maar dit kan ook van ’n grammatika afgelei word. Die taalmodel van die spraakherkenningskomponent word dan beperk tot presies daardie uitinge wat deur die grammatika vertaal kan word. Enige klanksein wat deur die gebruiker ingevoer word, word herlei na die mees waarskynlike uiting in die taalmodel.

’n Betekenisvolle newe-effek is egter dat die gebruiker beperk word tot die uitinge wat deur die vertaalstelsel ondersteun word, dws uitinge wat konsepte in die domein op gedefinieerde maniere bymekaarvoeg. Hoewel dit nie ’n onredelike beperking is nie, skep dit tog ’n leerkurwe wat die gebruiker moet bestyg om die toepassing ten volle te kan benut. Vir hierdie doel bied die toepassing ’n tweede invoermodaliteit, naamlik die skerm: Die gebruiker kan met enkele klikke uitinge konstrueer om te vertaal. Namate die gebruiker via die skerm die stelsel leer ken, word spraakinvoer die maklikste en vinnigste manier om die toepassing te gebruik.

Die laaste stap in spraak-na-spraak vertaling is spraaksintese. AwezaMed gebruik ses sintetiese stemme, manlik en vroulik in elk van die drie doeltale, om die vertaalde uitinge aan die pasiënt te kommunikeer. Hierdie stemme is beskikbaar via die Qfrency spraaksintesediens.3

Die gebruiker, naamlik ’n gesondheidsorgpraktisyn, kan dus uitinge vanuit Engels aan die pasiënt in haar doeltaal kommunikeer. Maar wat volgende? Hoe reageer die pasiënt?

Hier is dit belangrik om die kommunikasiekonteks van die soort konsultasies waarop AwezaMed toegespits is in gedagte te hou. Die GSP is ’n kenner met tersiêre opleiding wat gesondheidsorg met respek aan die pasiënt wil bied. Tipiese uitinge van die GSP is relatief maklik om te voorspel, soos “Wanneer het die bloeding begin?” Aan die ander kant is die pasiënt ’n leek en boonop, in hierdie geval, nie Engels voldoende magtig nie. Dit is dus baie moontlik dat die pasiënt ’n lae geletterdheidsvlak het. Antwoorde op vrae is ook baie minder beperk: “Net toe ek by die winkel aankom”, “Maandag”, “Ek kan nie presies onthou nie, maar seker al so ’n week of twee”, ens. ’n Reëlgebaseerde spraak-na-spraak stelsel is dus nie die beste benadering om sulke uitinge te hanteer nie, bloot omdat die domein van antwoorde soveel wyer en meer onvoorspelbaar is. Verder berus die verantwoordelikheid primêr op die GSP om verstaanbaar en korrek te kommunikeer, terwyl dieselfde soort verantwoordelikheid nie op die pasiënt berus nie.

Om hierdie redes fokus AwezaMed in die eerste plek op kommunikasie van die GSP na die pasiënt. Die reëls wat uitinge beskryf is só gekies dat die pasiënt slegs met “ja” of “nee”, en hier en daar met ’n getal of ’n jaartal, hoef te reageer. Die toepassing fasiliteer dus nie kommunikasie van die pasiënt na die GSP direk nie, maar maak dit wel tot ’n mate moontlik.

Een van die mees prominente uitdagings vir almal wat aan taaltegnologie vir die Suid-Afrikaanse tale werk, is die tekort aan hulpbronne. In so ’n omgewing is dit van kritieke belang dat die regte tegnieke ingespan word om met die hulpbronne wat daar wel is, soveel moontlik reg te kry om werklike probleme in die samelewing aan te pak. Die tegnieke wat hier beskryf word om spraak-na-spraak vertaling vir die domein van verloskunde te bied, is belowend. Daar word tans loodsstudies gedoen om die gebruik van AwezaMed in klinieke en hospitale regoor Suid-Afrika te toets. Op hierdie manier hoop ons om iets van die mitologie van kunsmatige intelligensie in ons eie konteks te realiseer sodat daar ’n daadwerklike bydrae tot openbare gesondheidsorg in Suid-Afrika gemaak kan word.

Eindnotas

1 Statistiek SA, Algemene Huishoudelike Opname, 2018. http://www.statssa.gov.za/publications/P0318/P03182018.pdf
2 Grammatical Framework. http://www.grammaticalframework.org/
3 Qfrency. http://www.qfrency.com/

 

Hierdie artikel is deel van die miniseminaar "Die Vierde Nywerheidsrevolusie" wat in samewerking met die SA Akademie vir Wetenskap en Kuns, die ATKV en Solidariteit Navorsingsinstituut aangebied word. Lees al die bydraes hier:

Miniseminaar: Die Vierde Nywerheidsrevolusie

  • 0

Reageer

Jou e-posadres sal nie gepubliseer word nie. Kommentaar is onderhewig aan moderering.


 

Top