Eksperci podkreślają, że ludzie pokochają maszyny, które potrafią nie tylko mówić, ale przede wszystkim słuchać. Taką możliwość daje m.in. najnowszy iPhone, bijący rekordy sprzedaży. W ten trend chcą się wstrzelić twórcy spółki Voice Lab, stawiając na trudniejszą część oprogramowania do konwersacji, czyli rozpoznawanie mowy. Voice Lab od niedawna kapitałowo wspiera Jacek Kawalec, współzałożyciel Wirtualnej Polski.
— Wiążę z nimi duże nadzieje na bliską przyszłość. Spółka właśnie złożyła wnioski patentowe, by chronić swoje rozwiązania — przekonuje Jacek Kawalec, który ma 21 proc. udziałów w firmie.
Bliskość Ivony
Twórcami Voice Lab są w dziedzinie przetwarzania sygnałów mowy Tomasz Szwelnik i Marcin Kuropatwiński. Wiosną tego roku ich spółka dostała przyspieszenia, po tym jak zdobyła inwestora. Ma już za sobą pierwsze wdrożenia.
— Globalnie rynek oprogramowania do rozpoznawaniamowy zdominowany jest przez dużych graczy. Oni mają sztab ludzi pracujący nad poszczególnymi rozwiązaniami. My nie mieliśmy takiego komfortu, pomimo tego stworzyliśmy rozwiązanie efektywne, konkurujące jakością ze światową czołówką — przekonuje Tomasz Szwelnik, prezes Voice Lab.
Biura Voice Lab mieszczą się nieopodal gdyńskiej siedziby Ivona Software, spółki, która postawiła na syntezator mowy i świetnie radzi sobie na zagranicznych rynkach. Szefowie obu firm zastrzegają, że to przypadek i że nie rozważali jeszcze pomysłu ścisłej współpracy.
— Teraz koncentrujemy się na udoskonaleniu polskiej wersji naszego oprogramowania. Zakładam, że już w 2013 r. będzie ono skuteczniejsze niż produkty globalnych liderów — podkreśla Tomasz Szwelnik.
Krzyk Sony
Gdyńska spółka za kilka miesięcy będzie miała już w kieszeni amerykański i polski patent na sposoby przygotowania modeli akustycznych, pozwalających maszynom szybciej uczyć się niuansów wymowy, odmiany i akcentowania w różnych językach. A te pojawią się w ofercie Voice Lab w przyszłym roku. Spółka prowadzi rozmowy z inwestorami mającymi wesprzeć ją przy uczeniu oprogramowania rozpoznawania zawiłości języka angielskiego.
— Nowy język to tysiące nagrań, a te generują znaczne koszty, więc dużą część nagrań zdobywamy od internautów — podkreśla prezes spółki.
Angielski da przepustkę na amerykański rynek urządzeń sterowanych głosem, których przybywa tam w lawinowym tempie. Wczoraj Sony ogłosiło na przykład, że zamierza wyprodukować telewizory, które ominą reklamę, jeśli widz wykrzyknie nazwę reklamowanego produktu. Dostawcą rozwiązań będzie zapewne globalny gigant Nuance i zarobi na tym miliony dolarów.