Speech Cloud projektas

Elektroninėje erdvėje yra daugybė garso ir vaizdo informacijos, kurios turinys neindeksuotas. „Speech Cloud“ suteiks galimybę tokią informaciją konvertuoti į tekstinį formatą ir ją lengvai indeksuoti. Tai ypač aktualu valstybinėms institucijoms (Seimui, teismams, Saugumo departamentui ir kt.) bei privačioms įmonėms, turinčioms didelius garso ir vaizdo archyvus ir norinčioms juos indeksuoti, kad būtų galima atlikti tekstines paieškas bei įvairias analizes. Produktai, turintys šnekos įdiktavimo (pavyzdžiui, el. laiško ar tekstinio dokumento rašymas balsu, interviu ėmimas ir pan.) ir protokolavimo (pavyzdžiui, susirinkimų protokolai) funkcijas yra aktualūs tiek privačioms įmonėms ir valstybinėms institucijoms, tiek namų naudotojams. Šneka valdomo kompiuterio bei šnekos sintezės funkcijos taip pat bus labai naudingos neįgaliems naudotojams, turintiems regėjimo ir (ar) motorikos koordinacijos sutrikimų.

Kuriant šiuos produktus pasirinktas techninis sprendimas – daugiakalbė debesies technologija, skirta automatiniam šnekos atpažinimui (automated speech recognition, ASR) ir teksto sintezei (Text-to-speech, TTS) atlikti. Numatoma, kad šios technologijos pagrindu veikianti platforma turės sprendimus, skirtus galutiniams naudotojams, ir taikomųjų programų kūrimo sąsajas (application program interface, API). Galutiniams naudotojams skirti sprendimai suteiks galimybę šnekos technologiją naudoti tinklalapiuose, diktavimo programinėje įrangoje ir mobiliuosiuose įrenginiuose, o API leis programų kūrėjams integruoti šnekos technologijas į trečiųjų šalių programinę įrangą, tinklalapius, mobiliąsias programas ir kitas informacines sistemas.

Numatomą projekto rezultatą sudarys keletas „Speech Cloud“ technologijos pagrindu veikiančių produktų ir paslaugų:

•    mobilioji programa, suteiksianti naudotojams galimybę ASR ir TTS funkcijomis naudotis mobiliuosiuose įrenginiuose,
•    garso failų transkribavimo ir šnekos sintezės paslaugų tinklalapis, į kurį naudotojai galės nusiųsti bet kokį tekstą ir gauti jį ištartą,
•    asmeniniam kompiuteriui skirta diktavimo programinė įranga, suteikianti galimybę diktuoti tekstus naudojantis „Microsoft Windows“ operacine sistema, „MS Office“ programomis ir „Tilde IT“ sukurta programine įranga,
•    paslaugos trečiųjų šalių sistemų kūrėjams ir šnekos technologijų pritaikytojams („Speech Cloud“ platforma, TTS/ASR pritaikymo paslaugos, integracija į jau esamą įmonės produktą „Tildės biuras“).

Projektas vykdomas pagal 2014–2020 m. Ekonomikos augimo veiksmų programos 1 prioriteto „Mokslinių tyrimų, eksperimentinės plėtros ir inovacijų skatinimas“ priemonės „Intelektas. Bendri mokslo–verslo projektai“ kvietimą Nr. J05-LVPA-K-01.

Projekto išlaidų suma: 614 504,45 Eur

Finansavimo suma: 318 465,08 Eur

Projektas finansuojamas iš Europos regioninės plėtros fondo.

 

Daugiau informacijos rasite čia.