Sztuczna inteligencja rozwija się z błyskawiczną prędkością, ciężko nadążyć z adaptacją. Jak przedsiębiorstwa spoza sektora technologicznego mogą ją oswoić i wykorzystać na swoją korzyść?
Technologia AI stwarza mnóstwo możliwości dla przedsiębiorstw i marek, ale istotne jest, żeby zapoznać się z nią i regularnie sprawdzać, jak się zmienia . Robienie tego raz w miesiącu może zapewnić dobre rozeznanie w temacie. Jeśli robisz to co pół roku, możesz być już spóźniony, bo tak szybko zachodzą zmiany. Ważne jest również dostosowanie swojego sposobu myślenia. To może być konieczne, jeśli chcesz się zaadaptować i prowadzisz działalność, na którą może wpłynąć sztuczna inteligencja. Świadomość tego, co jest budowane, co jest dostępne i jak można to wykorzystać, jest kluczowa.
Jakie w tym kontekście możliwości stwarzają generatory głosu? W jakich obszarach będą najbardziej przydatne?
Istnieje wiele firm, które już korzystają z niektórych usług głosowych, na przykład do audiobooków, reklam, filmów dokumentalnych, a także w branży gier, do wciągających interakcji z postaciami. Jeśli chodzi o korzyści, to używanie tego rodzaju technologii jest prostsze i łatwo dostępne, ponieważ nie wymaga studia nagraniowego i godzin przygotowań.
Jak powstaje taki generator głosów?
W Vocodzie szkolimy sztuczną inteligencję do tworzenia własnego modelu językowego. To w praktyce oznacza, że pozwalamy jej słuchać wielu próbek audio, by mogła zrozumieć, czym jest ludzka mowa. Następnie zapraszamy profesjonalnych aktorów głosowych do digitalizacji ich głosów i dalszego ulepszania umiejętności mowy modelu, tak, aby mógł naturalnie generować różne intonacje i emocje.
Mówi pan o współpracy z aktorami głosowymi, jednak jaka przyszłość czeka ich oraz inne profesje, w których kluczowe jest posługiwanie się głosem? Mają się czego bać?
To trudna kwestia, szczególnie w przypadku tłumaczy symultanicznych. Ich praca przecież polega nie tylko na słuchaniu i tłumaczeniu, ale także zapewnianiu słuchaczom zrozumiałego przekładu. A jego jakość jest ważniejsza niż poprawna wymowa, czy idealny akcent. W tym momencie pełna implementacja sztucznej inteligencji byłaby prawdopodobnie zbyt powolna, by przejść od mowy do tekstu, tłumacząc go na inny język, a następnie wrócić z powrotem do mowy.
Weź udział w szkoleniu online “AI dla MŚP” >>
Ale z rozwojem technologii ta przeszkoda może szybko zniknąć.
Biorąc pod uwagę, jak szybko rozwija się sztuczna inteligencja, nie wydaje się wcale niemożliwe osiągnięcie tego w ciągu najbliższych dwunastu miesięcy. Chodzi jednak o coś więcej, niż tylko technologię ponieważ będziemy musieli również rozwinąć zaufanie do tych systemów. Czy możemy ufać im bardziej niż doświadczonemu tłumaczowi?
Bez wątpienia AI znacząco wpłynie na wiele zawodów, sporo z nich zniknie, ale jednocześnie pojawią się nowe. Zawsze tak było, ale różnica polega na prędkości, z jaką ta technologia się rozwija. W niektórych przypadkach powinniśmy dla dobra ludzkości powstrzymać zbyt pochopny rozwój technologiczny i dać sobie czas na dostosowanie się. I właśnie tu kluczową rolę odegrają regulacje, w tym unijna ustawa o sztucznej inteligencji.
Skoro o tym mowa – jak pan ocenia prace nad prawem unijnym o AI?
Cieszę się, że powstaje teraz, szczególnie, że takie rozwiązania prawne zwykle wymagają dużo czasu, żeby się zmaterializować. Projekt ustawy zaczął powstawać na kilka lat przed pojawieniem się generatywnej AI, przed ChatGPT i Midjourney. To oznacza, że jego zakres znacznie się zmienił i cieszę się, trwają dyskusje na ten temat. Jestem jednak ostrożny, jeśli chodzi o przyspieszanie implementacji regulacji pod wpływem strachu. Technologia jest według mnie ogromną siłą napędową do dobrych zmian, a unijne prawo konieczne, by zapewnić, że generatywna sztuczna inteligencja będzie funkcjonowała przy poszanowaniu pracy intelektualnej i twórczej, w którą ludzie włożyli dużo wysiłku. Ograniczenie rozwoju technologii AI doprowadzi jedynie do koncentracji władzy i nie przyniesie korzyści ani użytkownikom końcowym ani artystom.
Czy generatory dźwięku mogą okazać się atrakcyjnymi narzędziami dla cyberprzestępców?
W przypadku każdej nowej technologii pojawiają się okazje do jej niewłaściwego wykorzystywania. Sztuczna inteligencja demokratyzuje wiele narzędzi, bo każdy może z niej korzystać. Ciemną stroną tego jest fakt, że jakość wyników – cyfrowej twarzy, zdjęcia czy głosu – może być bardzo przekonująca, a osoba nierozeznana w temacie może mieć problem z rozróżnieniem, czy są autentyczne, czy wygenerowane. To jest szczególnie problematyczne w erze, w której media społecznościowe często przedstawiają informacje jako absolutną prawdę. Ważne jest żebyśmy jako społeczeństwo nauczyli się zdrowego sceptycyzmu i weryfikowali informacje z wielu źródeł. Firmy korzystające ze sztucznej inteligencji jak Vocoda są odpowiedzialne za odróżnianie generowanych treści od prawdziwych. Wdrożyliśmy u nas znakowanie syntetyzowanych głosów. Oznacza to, że nawet jeśli treść zostanie zmieniona lub zmiksowana, będziemy dalej mogli rozpoznać, czy pochodzi od nas.
Sundar Pichai, prezes Google, powiedział niedawno, że AI wspomoże nie przestępczość, ale walkę z nią. Zgadza się pan z nim?
Tak. Uważam, że sztuczna inteligencja zapewni obu stronom narzędzia do działania szybciej i wydajniej. Niestety będą cenne dla oszustów, którzy np. dzięki ChatGPT mogą generować przekonujące mejle i je rozpowszechniać. Jednocześnie ta sama technologia pomoże organom ścigania ich zwalczać.
Jakie jest ryzyko, że sztuczna inteligencja wymknie się spod kontroli człowieka?
Nie jestem zwolennikiem myślenia, że w najbliższym czasie stanie się ona superinteligencją. Uczenie maszynowe może symulować zachowania podobne do ludzkiego, jednak brakuje mu świadomości czy zdolności do autorefleksji. Niemniej ma niezwykle skuteczny proces szkolenia się. Faktem jest, że sztuczna inteligencja jest największą i najbardziej ekscytującą zmianą, jaką ludzkość widziała do tej pory. Zmienia się sposób, w jaki prowadzimy biznes, jak wchodzimy w interakcje i jak rozwiązujemy problemy. Nie powinniśmy zatrzymywać rozwoju innowacji, ale upewnić się, że jest starannie zarządzany.


