Renata Špukienė, kalbos technologijų UAB „Tilde informacinės sistemos“ direktorė. Juditos Grigelytės (VŽ) nuotr.
Darius Verseckas „Verslo žinios“
Kalbos technologijų UAB „Tilde informacinės sistemos“ kuria programinę įrangą, kuri apdoros lietuviškus pokalbius ir juos pateiks raštu.
Bendrovės projektas, pavadintas „Speech Cloud“, – dar gana naujas. Kovo viduryje jam gautas 318.400 Eur finansavimas pagal ES struktūrinių fondų pinigais sukurtą programą „Intelektas. Bendri mokslo-verslo projektai“.
„Esame tik pirmame etape. Po truputį darbai vyksta, turime bandomąją versiją, joje yra įvairių niuansų, kuriuos testuojame“, – pasakoja Renata Špukienė, bendrovės direktorė.
VŽ išmėgino bandomąją versiją. Į ją įkeliami garso įrašai apdorojami realiu laiku ir greičiau. Pavyzdžiui, jeigu jūsų garso įrašas yra 10 min. trukmės, laišką su jo transkripcija į e. pašto dėžutę gausite po tiek laiko arba greičiau.
Iš pradžių sistemai buvo pateikti du anksčiau telefonu atliktų interviu įrašai. Atsiųstuose tekstuose beveik kiekviename sakinyje buvo tam tikrų klaidų: nesuderinti linksniai, kai kurie užrašyti žodžiai nesutapo su ištartais. Tačiau reikia įvertinti ir tai, kad užduotis buvo gana komplikuota: prasta įrašo kokybė, laisvas ir nebūtinai visada rišlus pokalbis, yra įterpinių, žodžių pabaigos nebūtinai aiškiai ištariamos.
„Kai žmonės kalba kaip nori, kartais ir kiti žmonės juos gali sunkiai suprasti. Taigi mašinai juos suprasti dar sudėtingiau“, – aiškina Andrius Marcinkevičius, bendrovės projektų grupės vadovas.
Pasak jo, spontanišką kalbą atpažinti vis dar yra sunkumų. Tačiau su skaitomomis kalbomis ar žinių laidomis sistema susidoroja kur kas geriau. Pavyzdžiui, galite gauti gana sklandų ir aiškų tekstą, jeigu įkelsite prezidentės Dalios Grybauskaitės naujausio metinio pranešimo garso įrašą.
Imasi Seimo
Mašininis kalbų ir pokalbių stenografavimas gali būti aktualus žiniasklaidos ir jos monitoringo bendrovėms, Seimui, įvairioms valstybės įmonėms, kuriose paplitęs protokolavimas, teismams, kitiems verslams ir įstaigoms. Taip pat tai būtų reikalinga, kad skaitmeninis asistentas išmaniuosiuose įrenginiuose galėtų apdoroti lietuvių kalbą.
„Jeigu nori, kad gerai veiktų, tai turi praktiškai pritaikyti konkrečiai sričiai. Todėl mes patys įrašome garsynus, kuriuose būtų ir biuro aplinkos garsų, pavyzdžiui, veiktų kondicionierius, būtų tarškinama klaviatūra. Taip pat įrašome pokalbius važiuodami automobilyje“, – kalba pašnekovas.
Vis dėlto šiuo metu labiausiai koncentruojamasi į Seimą, kur sakoma daug apgalvotų ar ir užrašytų kalbų. Be to, ten iki šiol dirba už stenografavimą atsakingi žmonės, taigi bendrovė gali susirinkti kuriamai sistemai apmokyti reikalingą žaliavą: garso įrašus ir tikslias stenogramas.
„Neuroniniais tinklais paremtoms technologijoms reikia šimtų valandų tokios žaliavos. Kuo daugiau teksto, kuo daugiau to balso, kurį norime atpažinti, kuo daugiau tos srities teksto, tuo geresnė būna kokybė“, – dėsto už projektą atsakingas vadovas.
Sistemai ištobulinti į ją jau sukeltos įvairios praėjusios ir šios kadencijų Seimų kalbos ir jų stenogramos.
Klaidos tikimybė – mažiau nei 20%
Rinkai tinkamą paslaugą bendrovė planuoja pristatyti 2018 m. pabaigoje. Pagal susitarimą tada iš 100 žodžių sistema galėtų neatpažinti 25. Tačiau p. Marcinkevičius sako, kad šis skaičius turėtų būti sumažintas iki 20 ir dar mažiau.
„Yra ir pavyzdžių: kolegos latviai yra tai padarę su 20% klaidų tikimybe, estai padarė su 14,7% klaidos tikimybe, jie sako, kad panaudojus komplikuotus akustinius modelius galima pasiekti ir 10%“, – kalba specialistas.
Tiesa, iki 100% atpažinimo prieiti būtų sunkiai įmanoma, nes kai kurie žmonės stipriai švepluoja, įterpia retai vartojamų tarmiškų žodžių, barbarizmų ir panašiai.
Konkuruoja su didžiaisiais
Kalbos atpažinimo sprendimus plėtoja ir didelės IT kompanijos, pavyzdžiui, IBM ir „Google“. Pastaroji tvirtina, kad išnaudojus 60 minučių mašininio stenografavimo limitą toliau kiekvienos 15 sekundžių kainuoja po 0,006 USD. Ji dirba su 110 kalbų, tarp kurių yra ir lietuvių. O IBM su savo sprendimu „Bluemix“ užsiima 8 kalbų atpažinimu.
„Į konkurenciją žiūrime sveikai, „Google“ yra didelė dalyvė ir mažoms kalboms skiria nepakankamai dėmesio, palyginti su tuo, kiek galime jo skirti. Jie yra konkurentai, bet klientas rinksis tikslesnį ir geresnį“, – apie konkurencinę aplinką kalba p. Špukienė.
Bendrovė „Tilde informacinės sistemos“ savo veiklą yra išskirsčiusi į dvi kryptis: lokalizaciją bei vertimus ir kalbinius projektus.
„Lokalizacija ir vertimai yra sena mūsų veiklos kryptis, iš kurios gaunamos pastovios pajamos. Taip pat yra kalbiniai projektai ir kalbinių įrankių gamyba: vykdome europinius projektus, kai sukuriami prototipai, virstantys į produktus ir paslaugas. Juos parduodame klientams“, – pasakoja vadovė.
• Lietuvos interneto krikštatėvis L. Telksnys – apie tai, kas mūsų laukia po 50 metų
• Mokslo ir verslo tinklas: ko trūksta mums
• Automatinio vertimo programos tobulėja, bet vertėjų dar prireiks
Bene geriausiai žinomas įmonės produktas yra „Tildės biuras“ – programinė įranga, apimanti rašybos ir gramatikos tikrinimą, vertimo įrankius, sinonimų žodyną ir panašius produktus. Likę sprendimai labiau orientuoti į stambius klientus, todėl jie masėms mažiau girdėti.
„Mes iš principo dirbame nišinėje sferoje, kalbiniai įrankiai pas mus nėra tokie populiarūs, esame žinomi tarp tų dalyvių, kurie veikia šioje rinkoje“, – sako p. Špukienė.
Šiuo metu bendrovėje dirba 26 žmonės, darbuotojų skaičiuos paprastai šiek tiek kinta, priklausomai nuo projektų. Įmonės pajamos 2016 m. siekė beveik 900.000 Eur, 2015 m. – 1,25 mln. Eur, rodo „Creditinfo“ pateikiami Registrų centro duomenys.
„Tilde“ įmonių grupė valdoma iš Latvijos. Taip pat ji turi šiek tiek mažiau darbuotojų turinčią antrinę bendrovę Estijoje.
Plačiau: https://www.vz.lt/informacines-technologijos-telekomunikacijos/2017/09/0...