Google Translate het onlangs 24 nuwe tale bygevoeg, wat (nog) Suid-Afrikaanse tale insluit.
Burgert Senekal vertel meer oor hierdie masjienvertalingsdiens:
Google gee jou vlerke: Google Translate en die afbreek van taalgrense
"... Google Translate [is] ’n gratis diens. Şentürk et al. (2021) argumenteer dat Google Translate ’n nuttige alternatief verskaf wanneer menslike hulpbronne nie beskikbaar is nie. Die outeurs verwys na ’n pasiënt wat by ongevalle opdaag en nie die plaaslike taal magtig is nie, maar deur middel van Google Translate ... die kern van die boodskap [oordra], selfs al is die sinskonstruksie en grammatika nie perfek nie. Dit is nie haalbaar om ’n professionele vertaler in elke hospitaal te plaas wat alle moontlike tale magtig is nie, maar dit is moontlik om ’n slimfoon vir hierdie doel te gebruik."
Inleiding
’n Plakkaat wat voorheen by die Departement Afrikaans en Nederlands, Duits en Frans aan die Universiteit van die Vrystaat opgeplak was, lui: "Tale gee jou vlerke." Dit is nie moontlik vir ’n mens om elke ander taal aan te leer nie, maar daar is kennis, insigte, ervarings en perspektiewe opgeteken in elkeen van die wêreld se meer as 7 000 tale. Een manier om kommunikasie tussen die wêreld se meer as 7 miljard mense te bemiddel, is deur ’n lingua franca te gebruik, wat oor die afgelope eeu Engels geword het. ’n Ander is masjienvertalings.
Masjienvertalingsdienste is sedert die Tweede Wêreldoorlog ontwikkel, maar dit was eers in die laaste twee dekades dat masjienvertalings se akkuraatheid tot so ’n mate verbeter het dat dit wyd gebruik word. Hierdie verbetering is die gevolg van ’n verskuiwing van betekenisgebaseerde vertaling na statistiese waarskynlikhede, die gebruik van groot korpusse tekste wat deur die internet beskikbaar is, en die onlangse bekendstelling van Kunsmatige Intelligensie (KI). Google Translate, wat in 2006 bekendgestel is, is die masjienvertalingsdiens wat wêreldwyd die meeste gebruik word (Kol, Schcolnik en Spector-Cohen 2018; Lunić ea 2020), en waarop die huidige artikel fokus.
’n Vinnige toets
Aangesien Google Translate vir baie mense sinoniem met swak vertaling is, begin ek deur te wys wat hierdie diens se huidige vermoë is. Eerstens ’n voorbeeld van ’n paragraaf wat van Engels in Afrikaans vertaal is (aangehaal later in die huidige artikel uit Kirchhoff ea 2011), sonder korreksies:
Oorspronklike teks |
Google Translate-vertaling |
Although machine translation quality is imperfect, it is sufficiently accurate to be used as the initial step in a human-machine collaborative translation framework that involves error correction and fine tuning by a posteditor. Such a framework would greatly facilitate the process of producing translated materials by reducing the time and financial resources required to generate quality translations for those in need. |
Alhoewel masjienvertalingskwaliteit onvolmaak is, is dit akkuraat genoeg om gebruik te word as die eerste stap in ’n mens-masjien samewerkende vertaalraamwerk wat foutkorreksie en fynverstelling deur ’n naredigeerder behels. So ’n raamwerk sal die proses van die vervaardiging van vertaalde materiaal aansienlik vergemaklik deur die tyd en finansiële hulpbronne te verminder wat benodig word om kwaliteit vertalings vir diegene in nood te genereer. |
Kreatiewe tekste is moeiliker om "mooi" te vertaal, maar kan nietemin die basiese strekking van die oorspronklike teks in die doeltaal weergee. So lui die refrein van Die Heuwels Fantasties se "Klein Tambotieboom" nadat Google Translate dit in Engels vertaal het, sonder dat die teks gekorrigeer is:
Oorspronklike teks |
Google Translate-vertaling |
As die donker my kom haal en die Here |
When the darkness comes to fetch me |
Hierdie vertaling is nie foutloos nie en ook nie hoe ’n literêre vertaler dit sou vertaal nie, maar gee wel die strekking van die oorspronklike teks tot so ’n mate weer dat iemand wat nie Afrikaans magtig is nie, "Klein Tambotieboom" sou kon verstaan. Die res van die artikel bespreek hoe Google Translate ontwikkel het van sy onbeholpe kinderjare tot sy huidige volwassenheid.
Agtergrond tot die ontwikkeling van Google Translate
Aanvanklik het Google Translate ’n frasegebaseerde masjienvertaling- (Phrase-Based Machine Translation of PBMT)-model gebruik, wat frases vertaal het deur aanlyn korpusse deur te soek en te bereken watter woorde waarskynlik in die doeltaal gebruik moet word (Tobin 2015; Wu ea 2016; Kol, Schcolnik en Spector-Cohen 2018). Die vertalings wat deur hierdie metode opgelewer is, is egter in ’n aantal studies ontoereikend bevind (Börner ea 2013; Patil en Davies 2014; Tobin 2015). Ook in ’n Afrikaanse konteks is op die foute van hierdie vertalings gewys (Van Rensburg, Snyman en Lotz 2012; Lotz en Van Rensburg 2014). Dit is in hierdie beginfase dat Google Translate ’n negatiewe reputasie verkry het wat vandag steeds bestaan (sien verderaan).
In 2016 het Google Translate kunsmatige neurale netwerke (Artificial Neural Networks), ’n vorm van KI, in hul vertalings deur ’n Google Neurale Masjienvertaling- (Google Neural Machine Translation of GNMT-) model bekendgestel, wat hulle in besonderhede in Wu ea (2016) bespreek. Stapleton en Leung Ka Kin (2019) verduidelik dat die neurale stelsel groot hoeveelhede mensvertaalde teks neem om die stelsel op te lei, wat ’n digitale voorstelling van die woord of frase en die gepaardgaande konteks skep. Die stelsel kies dan die naaste waarskynlike passing in die doeltaal op grond van ’n statistiese waarskynlikheid.
Google Translate se oorgang van die PBMT- na die GNMT-model word oor die algemeen as ’n aansienlike verbetering beskou (Thamrin ea 2018; Şentürk, Orhan-Sungur en Özkan-Seyhan 2021). In ’n studie van 51 tale het Aiken (2019) gevind dat die GNMT-model die akkuraatheid van vertalings met 34% teenoor die PBMT-model verbeter het. Vertalings tussen Engels en Duits, Afrikaans, Portugees, Spaans, Deens, Grieks, Pools, Hongaars, Fins en Chinees was die akkuraatste vertalings in hierdie studie, en vertalings tussen Engels en Swahili was die onakkuraatste. Benjamin (2019) het 107 tale vergelyk en gevind dat Afrikaans, Duits, Portugees en Spaans die akkuraatste vertalings oplewer.
Die bevindings van Aiken (2019) en Benjamin (2019) rakende Afrikaans is veral interessant, aangesien Suid-Afrikaanse studies wat terugdateer na die gebruik van die PBMT-model (Van Rensburg, Snyman en Lotz 2012; Lotz en Van Rensburg 2014) gevind het dat hierdie vertalings onakkuraat was. Lotz en Van Rensburg (2014) het egter aansienlike verbetering teenoor hul vorige studie gevind, en aangesien hul latere studie die bekendstelling van KI voorafgaan, dui hierdie verbetering in akkuraatheid op vordering wat reeds voor die implementering van KI gemaak is.
Na verdere navorsing rakende die Transformer-model (Vaswani e.a. 2017) het Google in 2020 aangekondig dat die maatskappy die vroeëre GNMT-model vervang het met die beter presterende Transformer-model (Caswell en Liang 2020). Hierdie implementering het nie net die akkuraatheid van masjienvertalings verbeter nie, maar het ook aansienlike verbeterings getoon vir tale waarvoor groot hoeveelhede teks nie beskikbaar is nie (Caswell en Liang 2020). Die verbetering is vergelykbaar met die oorgang van die PBMT- na GNMT-modelle in 2016 (Caswell en Liang 2020). Google Translate verskaf tans toegang tot 133 tale op verskillende vlakke.
Wanneer dit kom by die gebruik van Google Translate, moet in gedagte gehou word dat die stelsel deur middel van Engels vertaal. As ’n mens byvoorbeeld ’n Duitse of Franse teks sou wou lees, sal die resultaat akkurater wees wanneer na Engels vertaal word as na Afrikaans, omdat die vertaling na Afrikaans ’n verdere stap sal insluit.
Ten spyte van die vordering wat gemaak is met die verbetering van masjienvertalings, het menslike vertalers oor die algemeen ’n negatiewe houding hieroor en Google Translate in die besonder (Läubli en Orrego-Carmona 2017). Läubli en Orrego-Carmona noem baie vertalers wat op Google Translate se vertaalfoute fokus en selfs Google Translate as ’n verwysingspunt gebruik om die foute van kollegas te bespot. Soos die outeurs egter argumenteer, help dit niks om bloot foute te kritiseer nie; masjienvertalings is ’n werklikheid en daar moet maniere gevind word om Google Translate se potensiaal te benut.
Koppelvlakke
Google Translate is deur ’n webgebaseerde gebruikerskoppelvlak (https://translate.google.com) beskikbaar, wat gebruikers toelaat om teks te knip en plak en ’n doeltaal te kies, maar die webgebaseerde koppelvlak kan ook hele dokumente of webblaaie vertaal. Google Translate is ook ingebed in Google Docs, Google Sheets en Google Chrome. Deur Google Assistant kan gebruikers ook hul fone as vertalers gebruik, aangesien Google Assistant byna intydse vertalings kan verskaf. Google werk ook aan brille wat onderskrifte verskaf, soos in die demonstrasie gesien kan word:
Google Translate het ook ’n gratis slimfoontoepassing beskikbaar gestel wat op Google Play en op die Apple App Store beskikbaar is. Hierdie toepassing maak dit moontlik om teks of teks op foto's te vertaal, wat byvoorbeeld gebruik sou kon word indien ’n mens reis en inkopies moet doen of kennisgewingborde moet lees. Figuur 1 wys vier voorbeelde uit my alledaagse leefwêreld wat met die slimfoontoepassing vertaal is. In al vier gevalle is die meeste van die vertalings sinvol en verskaf hulle vir die gebruiker die geleentheid om in sy eie taal te sien wat hy koop.
Vir beide die PBMT- en GNMT-modelle is die gebruik van groot korpusse tekste ’n sleutel tot die verbetering van Google Translate se akkuraatheid, want hoe meer voorbeelde Google Translate het, hoe meer geleentheid het dit om die patrone van ’n taal te leer (Lotz en Van Rensburg 2014; Groves en Mundt 2015; Thamrin ea 2018). Hierdie voorbeelde kan tekste wees wat in verskeie tale beskikbaar is, soos artikels op Wikipedia, vertalings van boeke, ens. Dít is een van die redes waarom mense tot Wikipedia-artikels in Afrikaans moet bydra, soos Pretorius (2016) voorheen aangevoer het. Die swakker prestasie van tale waarvan daar nie groot korpusse teks aanlyn beskikbaar is nie, word egter deur nuwe verwikkelinge aangespreek, soos bespreek in Bapna ea (2022). Daar word ook navorsing onderneem om akkuraatheid te verbeter met betrekking tot spesifiek die amptelike tale in Suid-Afrika (Martinus en Abbott 2019).
Die potensiaal van Google Translate
Terwyl menslike vertalings ’n aansienlike koste meebring, is Google Translate ’n gratis diens. Şentürk, Orhan-Sungur en Özkan-Seyhan (2021) argumenteer dat Google Translate ’n nuttige alternatief verskaf wanneer menslike hulpbronne nie beskikbaar is nie. Die outeurs verwys na ’n pasiënt wat by ongevalle opdaag en nie die plaaslike taal magtig is nie, maar deur middel van Google Translate met die dokter kan kommunikeer. In so ’n geval is dit voldoende as die kern van die boodskap oorgedra kan word, selfs al is die sinskonstruksie en grammatika nie perfek nie. Dit is nie haalbaar om ’n professionele vertaler in elke hospitaal te plaas wat alle moontlike tale magtig is nie, maar dit is moontlik om ’n slimfoon vir hierdie doel te gebruik.
Selfs al is masjienvertalings nie perfek nie, kan hierdie tegnologie steeds aanvanklik gebruik word en dan deur ’n menslike vertaler reggestel word, wat ’n aansienlike tydbesparing tot gevolg het (Kirchhoff ea 2011; Trzaskawka 2020). Voor die implementering van KI argumenteer Kirchhoff ea (2011):
Although machine translation quality is imperfect, it is sufficiently accurate to be used as the initial step in a human-machine collaborative translation framework that involves error correction and fine tuning by a posteditor. Such a framework would greatly facilitate the process of producing translated materials by reducing the time and financial resources required to generate quality translations for those in need.
As gevolg van hierdie kostebesparing stel Bowker (2009) voor dat masjienvertalings gebruik kan word om die tale van minderhede te ontwikkel, wat nie altyd oor die hulpbronne beskik om groot getalle menslike vertalers te gebruik nie. Vir Afrikaans hou Google Translate daarom besondere potensiaal in, aangesien daar beperkte fondse vir Afrikaanse vertalings beskikbaar is, maar soos hier bo vermeld, is vertalings in Afrikaans een van die akkuraatste vertalings. Vir Afrikaanse onderriginstellings soos Akademia en Sol-tech kan Google Translate byvoorbeeld die vertaling van handboeke en ander kursusmateriaal in Afrikaans met ’n verminderde hulpbroninset bemiddel.
Daar is soms inligting opgesluit in dokumente wat in tale geskryf is wat ’n mens nie magtig is nie. In ’n studie van slimhuisstelsels (Senekal 2021) het ek byvoorbeeld tegniese inligting oor die een stelsel benodig, en sommige van die bronne was in Oekraïens. Google Translate het hierdie publikasies toeganklik gemaak, terwyl ek andersins nie toegang tot die inligting sou gehad het nie. Google Translate hou groot potensiaal vir die navorser in: Deur bronne te kan raadpleeg sonder om te moet wag vir ’n professionele vertaling, kan insigte en bevindinge heelwat vinniger oor die wêreld versprei. Bygesê, die vertaling moet die oorspronklike teks se betekenis betroubaar weergee.
Aansluitend by die vorige punt kan Google Translate Engels se greep op die wetenskap versag. Daar bestaan heelwat druk op navorsers om in Engels te publiseer ten einde ’n globale gehoor te bereik, maar soos wat Google Translate ’n Oekraïense navorser se publikasies vir my toeganklik maak, kan dit ook Afrikaanse publikasies vir ’n globale gehoor toeganklik maak. Selfs al sou ’n navorser nie die vertaling aan die leser wou oorlaat nie, kan Google Translate aangewend word om ’n eie vertaling met ’n kleiner tydsinset te skep, wat dan parallel met die Afrikaanse teks gepubliseer kan word. Die Suid-Afrikaanse Tydskrif vir Natuurwetenskap en Tegnologie laat reeds sulke parallelle publikasies toe, en ander Afrikaanse (en Suid-Afrikaanse) akademiese joernale sou ’n soortgelyke taalbeleid kon gebruik. Sodoende kan die hoër funksies van Afrikaans binne ’n Engelstalige globale omgewing behoue bly, woordeskat uitgebrei word ens. Sulke parallelle tekste dra boonop by tot die verbetering van Google Translate se akkuraatheid.
Google Translate sal ook ’n vraagteken plaas oor die afskaffing van Afrikaans by voormalige Afrikaanse universiteite. Van die argumente teen Afrikaans is dat parallelmediumonderrig dosente se werkslading verdubbel, en dat Afrikaanse en Engelse klasse ’n rasseskeiding tot gevolg het. Deur Google Translate sal ’n dosent in sy moedertaal klas kan gee, en studente kan in hul eie moedertaal luister, sonder dat daar ’n skeiding van groepe of ’n verdubbeling van klasse hoef te wees. Die tegnologie vir Afrikaans-Engelse vertalings is baie naby aan bruikbaar. Verder is daar geen rede waarom universiteite nie studiemateriaal en korrespondensie in beide Afrikaans en Engels kan vrystel nie, gegewe Google Translate se vermoë om tekste vinnig en akkuraat te vertaal.
Google Translate hou ook aansienlike potensiaal in om mense te help om ’n tweede taal aan te leer, soos in ’n aantal studies geïllustreer (Garcia en Pena 2011; Clifford, Merschel en Munné 2013; Kol, Schcolnik en Spector-Cohen 2018; Khairani, Permana en Permatawati 2020). Hierdie navorsingsveld is nog redelik nuut, maar masjienvertalings kan aangewend word om studente te help om ’n beter begrip van ’n taal se struktuur te kry, asook om hul woordeskat te verbeter.
Slot
Met meer as 7 000 tale wêreldwyd is dit nie moontlik vir ’n mens om alle tale aan te leer nie, maar masjienvertalingsdienste soos Google Translate maak dit moontlik om inligting in ’n groot aantal tale te ontsluit. Die tegnologie ontsluit tans nog net 133 tale, met wisselende vlakke van akkuraatheid, maar die groot verbeterings wat oor die afgelope ses jaar plaasgevind het, dui op ’n belowende toekoms. Boonop maak die uitbreiding van gebruikerskoppelvlakke dit moontlik om vertaaldienste in die alledaagse lewe te integreer, wat dit verder moontlik maak om taalgrense af te breek.
Bibliografie
Aiken, M. 2019. An updated evaluation of Google Translate accuracy. Studies in Linguistics and Literature, 3(3):253. doi: 10.22158/sll.v3n3p253.
Bapna, A, I Caswell, J Kreutzer, O Firat, D van Esch, A Siddhant, M Niu, P Baljekar, X Garcia, W Macherey, T Breiner, V Axelrod, J Riesa, Y Cao, MX Chen, K Macherey, M Krikun, P Wang, A Gutkin, A Shah en M Hughes. 2022. Building machine translation systems for the next thousand languages, arXiv. doi: 10.48550/arxiv.2205.03983.
Benjamin, M. 2019. Empirical evaluation of Google Translate across 107 languages. https://www.teachyoubackwards.com/empirical-evaluation (geraadpleeg op 22 Junie 2022).
Börner, N, S Sponholz, K König, S Brodkorb, C Bührer en C Roehr. 2013. Erste Erfahrungen mit Google Translate in der Neonatologie, Klinische Padiatrie, 225(07):413–17. doi: 10.1055/s-0033-1349062.
Bowker, L. 2009. Official language minority communities, machine translation, and translator education: reflections on the status quo and considerations for the future, TTR: Traduction, terminologie, rédaction, 21(2):15–61. doi: 10.7202/037491ar.
Caswell, I en B Liang. 2020. Recent advances in Google Translate. https://ai.googleblog.com/2020/06/recent-advances-in-google-translate.html (geraadpleeg op 21 Junie 2022).
Clifford, J, L Merschel en J Munné. 2013. Surveying the landscape: What is the role of machine translation in language learning?, @tic. revista d’innovació educativa, 0(10):108–121. doi: 10.7203/attic.10.2228.
Garcia, I en MI Pena. 2011. Machine translation-assisted language learning: writing for beginners, Computer Assisted Language Learning, 24(5):471–87. doi: 10.1080/09588221.2011.582687.
Groves, M en K Mundt. 2015. Friend or foe? Google Translate in language for academic purposes, English for Specific Purposes, 37:112–21. doi: 10.1016/j.esp.2014.09.001.
Khairani, AF, P Permana en I Permatawati. 2020. Google Translate in perceptions of German language students, in Proceedings of the 4th International Conference on Language, Literature, Culture, and Education (ICOLLITE 2020). 4th International Conference on Language, Literature, Culture, and Education (ICOLLITE 2020), Parys, Frankryk: Atlantis Press. doi: 10.2991/assehr.k.201215.011.
Kirchhoff, K, AM Turner, A Axelrod en F Saavedra. 2011. Application of statistical machine translation to public health information: a feasibility study. Journal of the American Medical Informatics Association, 18(4):473–8. doi: 10.1136/amiajnl-2011-000176.
Kol, S, M Schcolnik en E Spector-Cohen. 2018. Google Translate in academic writing courses? The EuroCALL Review, 26(2):50. doi: 10.4995/eurocall.2018.10140.
Läubli, S en D Orrego-Carmona. 2017. When Google Translate is better than some human colleagues, those people are no longer colleagues, AsLing. doi: 10.5167/uzh-147260.
Lotz, S en A van Rensburg. 2014. Translation technology explored: Has a three-year maturation period done Google Translate any good? Stellenbosch Papers in Linguistics Plus, 43(0):235. doi: 10.5842/43-0-205.
Lunić, D, N Stanišić, A Njeguš en I Đerić. 2020. Google translate accuracy evaluation, in Pap, Cvetković, Bačanin Džakula ea (reds). Proceedings of the International Scientific Conference – Sinteza 2020. Sinteza 2020, Beograd, Serbië: Singidunum University. 10.15308/Sinteza-2020-80-85.
Martinus, L en JZ Abbott. 2019. A focus on Neural Machine Translation for African languages, arXiv. doi: 10.48550/arxiv.1906.05685.
Patil, S en P Davies. 2014. Use of Google Translate in medical communication: evaluation of accuracy. BMJ (Clinical Research Ed), 349:g7392. doi: 10.1136/bmj.g7392.
Pretorius, L. 2016. Die rol van die Afrikaanse Wikipedia in die uitbou van Afrikaans, Tydskrif vir Geesteswetenskappe, 56(2–1):371–90. doi: 10.17159/2224-7912/2016/v56n2-1a6.
Senekal, BA. 2021. ’n Bestekopname van slimhuistegnologie vir sekuriteitsdoeleindes in Suid-Afrika, Suid-Afrikaanse Tydskrif vir Natuurwetenskap en Tegnologie, 40(1):149–61. doi: 10.36303/SATNT.2021.40.1.856.
Şentürk, E, M Orhan-Sungur en T Özkan-Seyhan. 2021. Google Translate: Can it be a solution for language barrier in neuraxial anaesthesia? Turkish Journal of Anaesthesiology and Reanimation, 49(2):181–2. doi: 10.5152/TJAR.2021.101.
Stapleton, P en B Leung Ka Kin. 2019. Assessing the accuracy and teachers’ impressions of Google Translate: A study of primary L2 writers in Hong Kong. English for Specific Purposes, 56:18–34. doi: 10.1016/j.esp.2019.07.001.
Thamrin, H, G Ariyanto, EW Pamungkas en Y Sulistyono. 2018. User participation in building language repository: the case of Google Translate. IOP Conference Series: Materials Science and Engineering, 403:012072. doi: 10.1088/1757-899X/403/1/012072.
Tobin, A. 2015. Is Google Translate good enough for commercial websites?: A machine translation evaluation of text from English websites into four different languages. Reitaku Review, 21:94–116.
Trzaskawka, P. 2020. Selected clauses of a copyright contract in Polish and English in translation by Google Translate: A tentative assessment of quality. International Journal for the Semiotics of Law – Revue internationale de Sémiotique juridique. doi: 10.1007/s11196-020-09680-2.
Van Rensburg, A, C Snyman en S Lotz. 2012. Applying Google Translate in a higher education environment: Translation products assessed. Southern African Linguistics and Applied Language Studies, 30(4):511–24. doi: 10.2989/16073614.2012.750824.
Vaswani, A, N Shazeer, N Parmar, J Uszkoreit, L Jones, AN Gomez, L Kaiser en I Polosukhin. 2017. Attention is all you need. CoRR, abs/1706.03762.
Wu, Y, M Schuster, Z Chen ea. 2016. Google’s Neural Machine Translation System: Bridging the gap between human and machine translation, arXiv eprint.
Lees ook:
Wat sou die impak van die Vierde Nywerheidsrewolusie op vertaling en tolking kon wees?
Kommentaar
Baie dankie hiervoor. Ek loop al lank met 'n klippie in my skoen oor gebruikers van Google of Spotify of MS Office (met 'n gratis speltoetser vir Afrikaans) wat nie die opsies, om dit in Afrikaans te gebruik, kies nie. As die aanvraag nie groot genoeg is nie, of bly nie, of groot genoeg word nie, moet dit een of ander tyd 'n impak hê op die beskikbaarheid hiervan. Ek het nog nie een keer 'n artikel wat in dokument-formaat aan my gestuur is deur 'n Afrikaanssprekende, ontvang wat opgemerk is in Afrikaans nie. Die funksie is of uitgeblok, of gebruik Nederlands. Ek het ook onlangs verneem dat die masjienvertaling van Google (gratis beskikbaar) uit Engels na Frans uiters goed en betroubaar is wanneer dit deur eerstetaalsprekers nagegaan word. Dit is beslis nie die geval met Google Translate na Afrikaans nie. Omdat ons dit nie gebruik nie?