Podczas dwóch prezentacji przeprowadzonych przez badaczy Tongyi Lab z Alibaby pokazano nowy model o charakterze open source R1-Omni. Potrafić ma on rozpoznawać stan emocjonalny osoby na filmie i dodatkowo oferować opisy postaci (w tym ubrań) i otoczenia. To kolejny krok w rozwoju tzw. widzenia komputerowego i ulepszona wersja poprzedniego modelu HumanOmni.
Alibaba w ostatnich miesiącach mocno skupia się nad rozwojem technologii związanych ze sztuczną inteligencją. Giganta skłonił do tego m.in. dynamiczny rozwój technologii, która uznawana jest za przełomową i przyszłościową. Przyspieszenie prac nastąpiło po sukcesie modelu DeppSeek z początku tego roku, który pokazał, że rozwój AI nie musi wiązać się z tak ogromnymi kosztami jak w przypadku amerykańskich firm, jak choćby Nvidii.
Chińskie rozwiązania mają stanowić tańszą alternatywę choćby dla tworzonego i rozwijanego przez OpenAI oprogramowania. Na początku roku firma wypuściła model GPT-4.5. Twórcy chwalą się, że lepiej wychwytuje i reaguje na subtelne wskazówki z pisemnych podpowiedzi użytkowników.