Sztuczna inteligencja (AI) w ostatnim czasie mocno rozpala wyobraźnię zarówno zwykłych użytkowników internetu, którzy z entuzjazmem zaczęli korzystać np. z aplikacji ChatGPT, jak i inwestorów z sektora venture capital (VC), koncentrujących uwagę na spółkach rozwijających projekty bazujące na tejże technologii. W ostatnim czasie wyobraźnię inwestorów rozgrzał start-up ElevenLabs, który na swoje działania szybko pozyskiwał duży kapitał od międzynarodowych funduszy VC i aniołów biznesu i w półtora roku od pierwszej rundy inwestycyjnej został okrzyknięty jednorożcem (spółka z wyceną powyżej 1 mld USD). Sama spółka daje przykład, jak budować biznes oparty na rozwiązaniach AI.
ElevenLabs koncentruje się na sektorze audio i, w dużym uproszczeniu, pracuje nad rozwojem narzędzi automatycznego przetwarzania tekstów pisanych na wersje dźwiękowe. Syntezator mowy ElevenLabs działa w 29 językach, a spółka szuka rozwiązań, które pozwolą na to, by nagrania generowane przy wykorzystaniu AI były jak najbardziej zbliżone do naturalnej mowy człowieka – artykulacyjnie i intonacyjnie.
Poszukiwanie przewagi konkurencyjnej
Założyciele ElevenLabs, Mateusz Staniszewski i Piotr Dąbkowski, twierdzą, że ich przewagą konkurencyjną jest połączenie dwóch elementów: produktu i prowadzenia własnych działań w obszarze badawczo-rozwojowym (B+R).
– To postępy w badaniach pozwoliły nam zbudować narzędzia wiernie oddające ludzką mowę. Dzięki nim ciągle też poprawiamy jakość dźwięku i opracowujemy zupełnie nowe rozwiązania, jak AI dubbing. Wprowadzamy nowe produkty oparte o własny research i stale szukamy, do czego jeszcze mogą się przydać – mówi Mateusz Staniszewski.
ElevenLabs w pierwszym etapie swojej działalności koncentrował się na odbiorcach indywidualnych, głownie twórcach treści publikowanych na platformach społecznościowych, którzy kreują np. przekazy w wielu językach. Pracował także nad narzędziami umożliwiającymi zamianę długich form pisanych, np. publikacji, książek, na wersję audio. Szybko okazało się, że zapotrzebowanie na automatyczne generatory mowy jest duże także w gamingu, produkcji filmów, aplikacjach konwersacyjnych.
– Firmy chętnie korzystają z naszych narzędzi i dzięki temu możemy szybko rosnąć – dodaje Staniszewski.
Ze wsparciem funduszy venture capital
Kapitał od inwestorów, jak podają założyciele ElevenLabs, jest przeznaczany w dużej mierze na infrastrukturę B+R, która pozwala na testowanie nowych modeli AI i rozwój produktu. Strategia spółki zakłada także rozwój zespołów w poszczególnych pionach działalności i wzmacnianie sprzedaży.
– Chcemy, żeby nasze modele produkowały mowę tak naturalną, że gołym uchem nie da się jej odróżnić od ludzkiej. Rozwijamy też nowe narzędzia do zmieniania sposobu wypowiedzi: od szeptu do krzyku i wszystko pomiędzy. Chcemy, żeby użytkownicy mieli takie same opcje, co reżyser pracujący z aktorem czy lektorem – mówi Piotr Dąbkowski.
W ostatnim czasie po technologię ElevenLabs sięgnęła Audioteka. Na rynek wprowadzono jej pierwszy audiobook w całości przeczytany przez sztuczną inteligencję, bez udziału lektora.
– Przygotowanie tego audiobooka było dla nas dużym testem - książka jest pełna liczb i informacji finansowych. Przy takich projektach musimy być bardziej czujni, ale dzięki nim nasze modele uczą się i stają coraz lepsze. Zawsze też koniec końców słuchamy odbioru użytkowników – mówi Staniszewski.
Na fali rozwoju sztucznej inteligencji
ElevenLabs płynie na fali popularyzacji AI, także wśród firm, które przyglądają się nowym zjawiskom technologicznych i testują je we własnym środowisku. W przypadku ElevenLabs szala zaczyna coraz mocniej przechylać się ze współpracy z klientami indywidualnymi w stronę kooperacji B2B, np. wydawcami, producentami audio/video.
- Zaczynaliśmy jeszcze zanim AI stało się tak popularne jak ostatnio. Wiedzieliśmy, że mamy szansę wypracować przewagę akurat w AI audio, gdzie przy okazji brakowało naprawdę dobrych generatywnych narzędzi. Po pozytywnym wstępnym odbiorze, boom na AI pozwolił nam się jeszcze szybciej rozwijać – zaznacza Mateusz Staniszewski.