Kui hea on masintõlge ülemaailmseks laienemiseks
Tänapäeval, kus IT-arendusi on nii palju, on sellistest edusammudest tulenevate eeliste ärakasutamine ülioluline, et eristada erinevaid saadaolevaid alternatiive. Mitte kaua aega tagasi oli küsimusele „kui hea on masintõlge” ebamäärane vastus ja paljud nõustusid, et „mitte minu tassike teed”.
Kuid tänapäeval on asjad oluliselt teisiti – ja see on nii olnud juba mõnda aega. See ei tähenda, et tõlketarkvara esitatakse vastusena „keelebarjääri ületamise” palvetele, kuid sellel on kindlasti palju praktilisi kasutusvõimalusi, eriti kui see on kombineeritud inimliku jõupingutuse ja oskusteabega.
Põhiküsimus ei seisne enam ainult selles, kas see tööriist on hea, vaid kas see sobib igat tüüpi sisu jaoks. Kui see suudab lahendada kõikvõimalikke keelelisi väljakutseid või on see rahvusvahelise äritegevuse laiendamise ülesande kõrgusel. Õnneks on need küsimused meid selles blogis juhtinud, nii et me pigistame need vastuseid otsides välja.
Kuid on rohkem, palju rohkem. Kas hüppate pardale?
Mis on masintõlge?
Masintõlge ehk MT on tekstide automaatne tõlkimine ühest keelest teise, kasutades selleks tarkvara ja ilma inimese sekkumiseta.
Distsipliinina on see arvutuslingvistika alamkategooria, mis kasutab arvutiteaduse, tehisintellekti, statistika ja muu arengut. Päris täielik, eks?
Ja kuigi see tundub suhteliselt uus tööriist, ulatuvad selle esimesed sammud kaugele tagasi – saate neid jälgida juba 1950. aastatest! Kuid andmetöötlusvõimsuse ja salvestusnõuete tõttu sai see omamoodi moesõnaks alles 2000. aastate alguses.
Ka käesoleva sajandi algul oli veel arvestatav pinnas ja esimesed tõlked olid üsna ebatäpsed ja tohutute kvaliteedivigadega. Seega jääks küsimus, kui hea tõlkemasin on, kaudselt eitav vastus veel mõneks aastaks.
Kas see on ikka nii? Muidugi mitte! Maastik on muutunud ja päris palju! Võime selle suures osas seostada Google’i jõupingutustega (mis sillutas teed ka teistele tõlkemootoritele). Kuid see on ka konkreetselt tänu närvi masintõlkele, mis on üks paremini toimivaid tõlkeid. mudelid (MT jaoks.) Sellega masin mitte ainult ei tõlgi, vaid ka õpib kasutamise ajal, parandades pidevalt kvaliteeti.
#Optimaalne näpunäide. Vastus sellele, kui hea on Google’i tõlge, on pea peale pööratud. Kuigi väljavaade on julgustavam, ei piisa masinast kvaliteedikontrolli standardite täitmiseks, seega peaksite lootma põhjalikule MTPE protsessile.
Kui hea on masintõlge: plussid
Reeglipõhisest (RBMT) statistilise (SMT) ja sealt närvisüsteemi (NMT) juurde: need olid peatused MT teekonnal, et saada selliseks, nagu ta praegu on. Mudelid on nii palju arenenud, et Google’i tõlge on äritegevuse alternatiivina praegu tõeline kandidaat. Selle rakendatavus on aga piiratud ja selle kasutamist tuleks hoolikalt kontrollida.
Kuid enne, kui me sellest räägime (ja näeme välja nagu spoilsport), arutleme selle ilu üle: masintõlke eelised ja eelised.
# 1 Kiirus ja helitugevus
Kui arhitektuur on piisav, suudab MT pakkuda tuhandete sõnade peaaegu kohest tõlget. See tähendab, et kahe inimese vahel saab peaaegu viivitamatult reaalajas vestluse luua, isegi kui keeled on erinevad.
Lisaks võimaldab suur kiirus käsitleda suuri tekstimahtusid, optimeerides aega isegi selliste projektide jaoks, mis esmapilgul võivad tunduda keerulised. Lõpuks, mõned MT-mootorid võimaldavad teil materjalide korrastamiseks ja märgistamiseks töötada sisuhaldussüsteemidega. See on väga kasulik, kui otsustate hiljem tõlkida teistesse keeltesse.
#2 Vähendatud kulud
Enamik masintõlkemootoreid on tasuta. Või vähemalt on neil tasuta valik ja lisatasulised lisafunktsioonid. Seega võime julgelt järeldada, et üldiselt võimaldab see kulusid kokku hoida.
Kuid me räägime kulude vähendamisest ja mitte nende eemaldamisest, sest kõige tavalisema stsenaariumi korral vajate sisu muutmiseks siiski keelepartnerit. Kõige lootustandvamal (kuid harvaesineval) juhul vajate siiski kogenud spetsialisti, kes vaataks väljundi kinnitamiseks üle. Nii saate ilma oma brändi mainet proovile panemata kinnitada, kui hea on tõlkemasin teatud kontekstis ja teatud tüüpi materjali jaoks.
#3 Keelevalikud
Olenevalt MT-mootorist on teil juurdepääs paljudele keeltele, millesse või millest tõlkida. Näiteks Google pakub rohkem kui 100 valikut erinevatest keeleperekondadest. Teised, näiteks DeepL, pakuvad peaaegu 30, kuid lisavõimalustega, nagu sõnastik või keelevariantide valik.
Lühidalt öeldes saate MT-ga tõlkida mitmekeelselt ja iga keele jaoks sama kiiresti. See on eriti kasulik, kui kavatsete tooteid või teenuseid ülemaailmselt ja ühtselt turule tuua.
#OptimationalTip: MT võimaldab tõlkida mitmesse keelde, kuid seda ei ole soovitatav kasutada mitmekeelse SEO tööriistana. Kuigi see võib teid üldiselt tõlkimisel aidata, vajate professionaalset eksperti, kes lisaks sisu redigeerimisele ka kontrollib, kas strateegia töötab (märksõnad, linkide loomine jne).
Kui hea on masintõlge: miinused
Siiani on kõik hästi. Kuid nagu iga tõsise analüüsi puhul, on aeg vaadata selle tööriista nõrkusi. Alles siis on teil täielik pilt, et teha parem otsus oma ettevõtte keeleliste vajaduste kohta.
# 1 Kavatsuse väljajätmine
Nagu me teame, ütleb kavatsus kõne kohta palju. Me ei räägi ainult sõnadega, vaid ka žestide ja väljenditega, kehahoiakuga jne. Ja kuigi kirjalik tekst neid üksikasju alati selgeks ei tee, annab see sageli näpunäiteid, kuidas teavet õigesti tõlgendada. Näiteks iroonia ja liialduse kasutamisega. MT ei tea kavatsusi ja võib väljendit tõlkida sõna-sõnalt, mistõttu see kaotab mõju, mida see peaks edastama.
# 2 Konteksti puudumine
Peamine puudus, mis seda tüüpi tarkvaral on – ja see muudab masintõlke headuse keeruliseks küsimuseks – on kontekstivaba tõlkimine. MT keskendub sõnade ja fraaside tõlkimisele, kuid ei saa arvesse võtta suuremat konteksti, millesse kõne on põimitud. See põhjustab mõnikord viitevigu, tähistuste ebaselgust ja palju muud.
# 3 Samaväärsusega seotud probleemid
MT puhul ei ole tulemuste kvaliteet aus ja ühtlane kõikide keelepaaride puhul. Põhjus on selles, et mõned keeled on morfoloogiliselt rikkamad (eriti käände osas); see on väljakutse, kui tõlge on kahe sellise erineva tüübi vahel. Siin saab inimkeelepartner välja töötada strateegiaid, et kompenseerida (vajadusel) või selgitada, kuid kahjuks ei ole MT oma ülesannete kõrgusel.
#OptimationalTip. Üsna levinud probleem MT puhul on asesõnade ja eitusvormide ebatäpne tõlge. Õnneks märkab seda kogenud keelepartner ja teeb kõik vajalikud kohandused.
Masintõlke parimad kasutusjuhised
Niisiis, millal on nii eeliste kui ka puudustega tõesti soovitatav kasutada automaatset tarkvara? Või mis tüüpi sisu jaoks? Ehk siis tundlikku teavet ohtu seadmata, ettevõtte mainet kahjustamata või raskesti lahendatavatesse olukordadesse sattumata.
Siin on mõned võimalused, kuid kõigepealt lahtiütlus. Kuna Google’i tõlge ettevõttetüübi jaoks puudub tulemuste terviklikkuse tagamiseks, peate läbima ülevaatuse. See ei ole hoiatus; see on lihtsalt nõuanne. (Me ei taha öelda: “Me ütlesime teile nii”.)
- Sisemine side ja meilid: kui kiirus on see, mida vajate, võib masin olla teie liitlane. Eriti ettevõtete jaoks, millel on mitu saiti või globaalsed meeskonnad – kus räägitakse mitut keelt – ja kõige olulisem on see, et kõik saavad teabe peaaegu korraga.
- Tehnilised ja tootedokumendid: Tehniline tõlge sobib suurepäraselt MT-ga, kuna see sisaldab tavaliselt palju teksti, kuid on jagatud lühikesteks loogilisteks segmentideks. Keerukus on sageli madalam kui teistes valdkondades, kuna see püüdleb loetavuse ja arusaadavuse poole.
- Aktuaalne sisu: kui teil on sisu, mis ei ole pidevalt igihaljas, millel on vähem otsene fookus või mille eluiga on lühike, võib MT teid aidata. Veebilehe ülevaated, tootekirjeldused või trendikad postitused sotsiaalmeedias; lihtsalt tee oma valik.
Nende stsenaariumide puhul ei küsiks me enam, kui hea on Google’i tõlge, vaid kui tõhusalt saaksime põhisõnumit edastada.
#Optimaalne näpunäide: parem on jääda sajaprotsendiliselt inimtõlke juurde, kui bränding mängib rolli laval või kunstilise sisendiga tekstide puhul, kus loovus on oluline. Samuti vastupidavate varade ja hästi nähtava sisuga, nagu ajaveebid, kliendile suunatud uudiskirjad, pressiteated, veebisaidi IU jne.
MTPE: inimlik puudutus kvaliteedi tagamisel
Kui soovite tagada, et teie tekstid oleksid selged, grammatiliselt õiged ja vigadeta, ei saa te hakkama ilma järeltoimetamise või MTPE-ta masintõlketa. Õigemini öeldes ei ole te kindel, kui hea masintõlge teie jaoks on, enne, kui olete paigas kvaliteedikontrolli.
Ja see on lihtsalt sellepärast, et inimsilm suudab teha seda, mida masin ei suuda: minna sõnadest kaugemale. Otsige mõtet ja püüdke saavutada järjepidevust toonis ja hääles, mis võivad brändi määratleda või kajastada selle väärtusi.
Ja mitte vähem tähtis, seadke prioriteediks need sõnad, mis kõige paremini sobivad teie tekstiga taotletava eesmärgiga. Me kõik teame, et anda, pakkuda, tarnida ja pakkuda võivad tähendada enam-vähem sama asja, kuid kas need on tõesti ja täpselt samad? See sõltub sellest, kuidas te neid igas konkreetses sisuosas kasutate ja mis eesmärgil.
MTPE hõlmab kahte omavahel seotud protsessi: toimetamist ja korrektuuri. Siin on aspektid, mida keeleteadlased nendel juhtudel analüüsivad, et tagada tipptasemel tulemused ja lähteteksti truudus.
#OptimationalNõuanne. Kui otsustate kombineerida masintõlke kogenud CAT-tööriistaprofessionaali toimetusega, saate kasu tõlkemälude kasutamisest, mis tagab järjepidevuse samade või sarnaste tõlgitud segmentide puhul.
Aspektid mikroskoobi all MTPE ajal
Redigeerimine ja korrektuur võib olla kerge (LPE) või täielik (FPE). See ei sõltu ainult masintõlke väljundi kvaliteedist, vaid ka teie vajadustest ja ootustest.
Hea on see, et kui soovite oma ettevõtte muude materjalide osas saavutada ühtse sisu, saate oma keelepartneritele pakkuda juhisteks töötamiseks sõnastikke, terminoloogiabaase ja stiilijuhiseid.
Läbivaatamise käigus vaatab professionaalne lingvist järgmisi aspekte:
- Grammatiline täpsus
- Õige järjekord ja süntaks
- Vormindamine ja numbrid
- Järjepidevus
- Ladusus
- Spetsiifiline või tehniline terminoloogia
- Kirjutamisstiil
- Sõnastikest ja brändijuhenditest kinnipidamine
- Kaubamärgid ja tootenimed
- Mitmekeelse SEO aspektid (kui sisu veebisaitidele)
- Piirkondlik lokaliseerimine
- Sõnad, mis tuleb jätta tõlkimata
Ja veel! Kõik oleneb sellest, kui sügavale peab professionaalne keeleteadlane minema ja kui suur on teksti eripära.
#OptimationalNõuanne. Pidage meeles, et Google alandab dubleeriva sisu asetust. Sellesse kategooriasse kuuluvad redigeerimata masintõlkematerjalid, mis on renderdatud mis tahes tööriistaga. Ärge jätke oma SEO-d ainult tehnoloogia hooleks.
Viimased mõtted MT kohta: professionaalsetes kätes, laienemise tööriist
Arvestades kõike seda, kui hea tõlkemasin on (või mitte), tuleb seda käsitleda konkreetses kontekstis: teie. See tähendab, kui hea see on teile, teie ettevõttele ja teie projektidele. Selleks peaksite kõigepealt klassifitseerima, millist tüüpi tekste soovite tõlkida, et saaksite kindlaks teha, kas need on hästi või halvasti nähtavad, sisesuhtlus jne.
Seejärel kaaluge olemasolevaid ressursse, eriti aega. Samuti, kui paljudesse keeltesse soovite tõlkida ja kui lähedased need üksteisele on. Hispaania keelest portugali keelde tõlkimine ei ole ju sama, mis araabia või mandariini keelde. Ja viimane, kuid võib-olla kõige olulisem samm: leidke usaldusväärne keelemeeskond, kellega suhelda ja kes suudaks oma kahtlused kõrvaldada ja kes suudab teie strateegiaga kohaneda.
Nad annavad teile tõelist nõu selle kohta, millal võib automaatne tõlge olla kasulik, ning pakuvad teile teravat redigeerimis- ja kvaliteeditagamisprotsessi.
Kas olete valmis alustama oma mitmekeelset strateegiat ja saama kasu tipptehnoloogiast? Võtke meiega ühendust juba täna, et saaksime teid järgmiste sammudega juhendada.