Что из себя представляет новый переводчик «TATSOFT»?

11.11.2019

Rus-ingliz, ingliz-rus telennän süz, cömläne tärcemä itü öçen ber problema yuk. Internet çeltärendä yözlägän tärcemäçe bar. Tik moña kadär rusça-tatarça, tatarça-rusça tärcemä programmaları belän ällä ni maktanıp bulmıy ide. Tik xäzer bu yunäleştä boz kuzgala başladı sıman: “Yandeks” maşina tärcemäçesenä xäzer “TatSoft” rus-tatar-rus maşina tärcemäse dä kuşıldı.

Bügen “Sälät” yortında älege tärcemäçene täkdim ittelär. Bu programma Tatarstan Fännär akademiyaseneñ gamäli semiotika institutı häm Innopolis Uniwersitetı tarafınnan gamälgä aşırılgan. 

Närsä ul “TatSoft”?

“TatSoft” (https://translate.tatar/ ) – rusça-tatarça häm tatarça-rusça maşina tärcemäçese. Eş kına anı süzlek yaki söyläüleklär belän butauçılar küp. Tik maşina tärcemäçese – ber teldän ikençe telgän kompyuter programması yardämendä tärcemä itü. Bu süzlär süzleklärdä yazılgan, programma alarnı ezli häm kullanuçıga kürsätä.

Bügen älege tärcemäçe üzeneñ ähämiyatlelegen assızıklıy. Xäzerge wakıtta dönyada 5 009 510 tatar telendä söyläşüçe keşe bar. Monnan tış, üzläre tatar millätennän bulmagan, läkin tatar telen öyränergä teläüçelär dä şaktıy. Alarnıñ barısı öçen dä maşina tärcemäçese telne öyränü öçen yaxşı mömkinlek bulaçak. Tatarstanda däülät telläre turında zakon bar, şuña da kayber oeşmalar ike telle dokumentatsiya alıp barırga tieş. Bu ölkädä tärcemäçe kadrlarga kıtlık buluı ser tügel. Tik bu programma yardämendä tärcemäçelärne sistema belän alıştırırga cıenmıylar, ä barı tik tizräk häm sıyfatlırak itep eşlärgä mömkinlek biräçäklär.

Maşina tärcemäçesen eşläüne kayçan başlagannar?

2014 el – Gamäli semiotika  ABBYY häm Yandeks şirkätläre belän  xezmättäşlek itä (tatar telendäge kompyuter modelläre yardämendä älege şirkätlärgä maşina tärcemäçesen tözergä bulışa)

2018 el, fewral – rusça-tatarça tärcemä öçen dönyada berençe neyroçeltärle “TatSoft” tärcemäçese buldırıla

2019 el, iyun – «Sälät»neñ isäpläü üzäge oeşa (Yaña ısullar, texnologiyalär, tuplangan mäglümatlar kullanılgan, serwer yardämendä eşlänelgän bula. Elek programma wersiyase üzen-üze 42 kön däwamında öyrätkän, ike tel öçen 84 kön taläp itelgän. Xäzer bu wakıt bik küpkä kıskargan)

2019, iyul – tärcemäçene açık räweştä sınau başlana.

Tärcemäçelärne äzerläüdä öç ısul bar:

1. Rule- based – kagıydälärgä nigezlängän maşina tärcemäçese

2. Phrase-based, yagni statistik ısul – ul frazalarga nigezlängän, bu ısul belän “Yandeks”, “Google” eşlägän

3. Neyroçeltärle – maxsus programma keşe birgän mäglümatnı ukıy (räsem, tekst, tawış). Sistema, tögäl misallar yardämendä öyrätelgäç, ul algoritmnı istä kaldıra. Şulay itep, tärcemäçene buldıruçılar sistemanı, keşe mienä oxşatıp, yasalma neyroçeltär yasarga teli. Anı keşe öyrängän şikelle itep yasıysıları kilä. Bu –  şuşı ukıtu protsessın awtomatizatsiyaläü omtılışı. “TatSoft”  programması da – näk şundıy neyroçeltärle tärcemäçe.

Älbättä, tatarça-rusça, rusça-tatarça süzleklär şaktıy. Tik alar, gadättä, aerım süzlärne genä tärcemä itä. Grammatika, semantik mägnälären bötenläy isäpkä almıy. Älegä rusça-tatarça, tatarça-rusça maşina tärcemäse ikäü genä: “Yandeks” häm “TatSoft”.

Layklı häm dizlayklı tärcemäçe

Bu tärcemäçene kullanuçılar da bäyali ala. Ägär keşe tärcemäneñ tögäl buluın kürsä, ul “layk” bilgesenä basa. Şulay itep, sistema alga taba, üzennän-üze añlap, kamilläşäçäk. Ägär tärcemä tögäl bulmasa, bu oçrakta “dizlayk” kuyarga kiräk. Ägär küp keşe ber ük fraza/süzneñ xatalı tärcemäsen bilgeläp barsa, kiläçäktä tärcemä tögäl bulaçak. Monnan tış, tärcemäneñ niçek yañgıraganın tıñlarga da mömkin. Älege eştä iñ katlaulısı mäglümat, algoritm (programma, sistema), isäpläü köçläre belän bäyle bulgan.

Şuşı rus-tatar, tatar-rus maşina tärcemäçese öçen “Neftegaz” şirkäte yardäme belän maxsus küp külämdäge mäglümatnı saklıy torgan 18 million sumlık serwer alıngan.

– Xäzerge wakıtta “Yandeks”, “Google”  tärcemäçeläre yaxşıra. Bez dä yaña texnologiyalärne kullanıp, üz eşebezgä yañalık kertergä tırışabız. Bezneñ maşina tärcemäsennän tış, tärcemä itelgän süzlärne tawışlandıru, tekstnı ukıganda, kompyuter üze yazu, annarı tärcemä itä torgan funktsiyaläre dä bar. Läkin xäzerge wakıtta bu sayt mondıy funktsiyalärne çıdata almıy. Tik kiläçäktä monıñ bulaçagına ışanabız. Şulay uk bez yaşlär öçen “TatSoft”nıñ mobil kuşımtasın eşlibez. Anı 1-1,5 eldan Android häm iOS platformaları öçen çıgarırga cıenabız, – di Tatarstan Fännär akademiyaseneñ Gamäli semiotika institutınıñ ölkän fänni xezmätkäre Aydar Xösäenow.

Bügen “TatSoft” bazasınıñ rus häm tatar telläreneñ härbersendä 15 million süz formaları kertelgän. Dimäk, alarnıñ härkaysında 1 milion par cömlä bar digän süz. Töp maksat – şuşı maşina tärcemäçesendä 10 million par cömlä tuplau. Läkin anıñ probleması finanslauga törtelep kala ikän. Çönki ber bitne tärcemä itü dä şaktıy kıymmätkä töşä. Gamäli semiotika institutı belgeçläre bu protsessnı buldıra algan kadär awtomatlaştırsa da, barısı da finanslarga bäyle. Şuña da älege programmanı kübräk keşe kullanıp, aña “layk”, “dizlayk”lar kuysa, bu programmanıñ üseşenä yaxşı täesir yasayaçak.

Studentlar niçek yardäm itä ala?

KFUnıñ Filologiya häm mädäniyatara baglanışlar institutı studentları da bu eştä aktiw katnaşa. Ägär Gamäli semiotika institutı xezmätkärläre programmanıñ sıyfatın awtomatik yaktan tikşersä, studentlar uku protsessı wakıtında tärcemäçedä cibärelgän xatalarnı analizlıy, törle tärcemäçelärne tikşerä. Bu mäglümat alga taba institut xezmätkärlärenä maşina tärcemäçeseneñ eşçänlegen yaxşırtırga tagın da bulışa.

Älege programmanı täkdim itü wakıtında studentlar üzläre dä törle misallar äytep, tärcemäçene sınadı. Misal öçen, Aleksandr Sergeewiç Puşkinnıñ “Ya pomnyu çudnoe mgnowene...” şigıren “TatSoft” ber xilafsız tatarçaga tärcemä itte. Ä Gabdraxman Äpsälämownıñ “Ak çäçäklär” äsärennän özektä, tekstta xata kitü säbäple, rusçaga tärcemä itkändä dä kıtırşılık buldı. Studentlar äytkän “Bez koş tele yaratabız” digän cömläne genä tärcemäçe “Mı lyubim ptiçiy yazık”, dip tärcemä itte. Älbättä, bu kölke toelsa da, kullanuçını tupikka kertergä mömkin digän süz bit! Dimäk, tärcemäçene tagın da nıgrak kamilläşterergä kiräk äle.

Härkemgä eş citärlek

– Gomumän alganda, bu – 30 elga yakın däwamında bargan eşçänlek. Ul respublikanıñ däülät programması nigezendä tormışka aşırıldı. Bu eştä bezgä Tatarstan Prezidentı Apparatı, Ministrlar Kabinetı, respublikanıñ Mägarif häm fän ministrlıgı yardäm itte, G. Ibrahimow isemendäge Tel, ädäbiyat häm sängat institutı iganäçe bularak çıgış yasadı. Kiläçäktä dä daimi räweştä bu produktnı kullanuıgıznı telim. Ägär kön saen biredä härkem berär cömlä tärcemä itsä dä, bez tagın 5 million cömlä tärcemä itäbez digän süz , – di  “Sälät” proektları citäkçese Cäüdät Söläymanow.

Alinä Minnewäliewa, «Yalkın»

fotolar Realnoe Wremya saytınnan alındı 


Wozwrat k spisku