E-maila będzie można posłuchać

Karol Wieczorek
opublikowano: 2002-06-26 00:00

Zdaniem specjalistów, technologia rozpoznawania i syntezy mowy dla języka polskiego jest już na tyle dojrzała, że można na jej bazie oferować komercyjne usługi. Pierwszą tego typu usługą dostępną na naszym rynku jest serwis „Na granicy”, stworzony przez operatora sieci Era. Z nieoficjalnych informacji wynika, że niebawem oferta sieci Plus GSM i Era poszerzy się m.in. o głosowy dostęp do poczty elektronicznej.

Jak informuje Krzysztof Cegielski, dyrektor marketingu w firmie Wind Telekom, specjalizującej się w tworzeniu telefonicznych centrów obsługi klienta, technologia rozpoznawania mowy (ASR — Automatic Speech Recognition) dla języka polskiego jest już na tyle dopracowana, że można ją wykorzystywać komercyjnie.

— Opracowanie systemu rozpoznawania i syntezy mowy dla języka polskiego sprawiło dostawcom technologii sporo problemów. Niemniej są już dostępne tego typu rozwiązania na platformę Intel-Microsoft i Sun-Solaris. Prawdziwy przełom nastąpił jednak dopiero kilka miesięcy temu, kiedy pojawiła się polska wersja naturalnie brzmiącej technologii syntezy mowy. Dzięki temu stało się możliwe tworzenie portali głosowych w języku polskim, których zawartość budowana jest dynamicznie —mówi Krzysztof Cegielski.

Mimo że systemy rozpoznawania mowy mogą być interesującym rozwinięciem wykorzystywanych powszechnie m.in. przez banki i firmy ubezpieczeniowe telefonicznych centrów obsługi klienta (Call Center) z systemami IVR (Interactive Voice Responce), przykłady z zagranicy pokazują, że w pierwszej kolejności są one wdrażane przez operatorów telekomunikacyjnych.

— Jednym z najciekawszych i zapewniających szybki zwrot z inwestycji przykładów wykorzystania technologii rozpoznawania mowy są serwisy głosowych książek telefonicznych Portugal Telecom czy Telii. Aż 90 proc. ankietowanych twierdzi, że korzystanie z nowej usługi Telii jest bardzo proste — mówi Krzysztof Cegielski.

Innym, płynącym z zagranicy przykładem wykorzystania technologii rozpoznawania i syntezy mowy jest telefoniczny dostęp do poczty elektronicznej i organizera, który oferuje brytyjski Orange. System ten umożliwia odsłuchiwanie przychodzących wiadomości e-mail oraz dostęp do bazy kontaktów i kalendarza za pomocą komend głosowych.

Dzięki udostępnieniu technologii rozpoznawania mowy dla języka polskiego, również działający na naszym rynku operatorzy telefonii komórkowej pracują nad wprowadzeniem usług wykorzystujących tego typu rozwiązania. I choć jako pierwszy system rozpoznawania mowy zintegrowany z systemem IVR wprowadziła parę lat temu firma Polkomtel, pierwszym naprawdę profesjonalnym rozwiązaniem może się poszczycić operator sieci Era. System, który działa w sieci Plus GSM, pozwala bowiem jedynie na głosowe potwierdzanie lub zaprzeczanie wskazaniom automatu (odpowiednik systemu DTMF, w którym użytkownik posługuje się klawiaturą), natomiast w usłudze „Na granicy” sieci Era, system potrafi rozpoznać wypowiadane nazwy przejść granicznych oraz krajów graniczących z Polską, podając informacje o czasie oczekiwania na granicach. Różnica wynika stąd, że w momencie gdy system oparty na technologii rozpoznawania mowy wdrażała firma Polkomtel, nie było jeszcze rozwiązań dla języka polskiego, dlatego wykorzystano nieco przerobiony system angielskojęzyczny.

Na razie przedstawiciele działających w naszym kraju operatorów telefonii komórkowej nie ujawniają swoich planów związanych z nową technologią. Z nieoficjalnych informacji wynika jednak, że zarówno w firmie Polkomtel, jak i PTC trwają testy platform umożliwiających telefoniczny dostęp do poczty elektronicznej, którą oferują telekomy (Eranet, PlusNet). Z naszych informacji wynika, że w ciągu kilku najbliższych tygodni operatorzy mogą zaoferować użytkownikom swoich kont e-mail odsłuchiwanie przychodzących wiadomości.

— Przykłady europejskich operatorów sieci telefonii komórkowej, którzy wprowadzili na rynek usługi odczytywania wiadomości e-mail, pokazały, że usługi wykorzystujące technologię syntezy mowy (text to speach) mają szansę spotkać się ze sporym zainteresowaniem użytkowników — mówi Leszek Smolik, koordynator ds. wdrażania produktów do sprzedaży w Polskiej Telefonii Cyfrowej.

Z kolei na dostęp do bazy kontaktów i kalendarza, tak jak to ma miejsce w przypadku Orange, trzeba będzie jeszcze trochę poczekać. O ile bowiem odczytywanie treści wiadomości ma spore szanse powodzenia, to już w kwestii pełniejszej funkcjonalności, takiej pewności nie ma. Znaczna część naszego społeczeństwa nie przyzwyczaiła się nawet jeszcze do automatycznych systemów telefonicznych, które obsługuje się za pomocą klawiatury telefonu.

— Technologia rozpoznawania mowy może być dobrym rozszerzeniem dla wielu serwisów oferowanych przez operatorów. Początkowo będzie ona pełnić przede wszystkim funkcję uzupełniającą w dotychczasowych systemach IVR. Część klientów może bowiem uznać, że od wciskania klawiszy, wygodniejsze jest dla nich wydawanie komend głosowych — mówi Leszek Smolik.