Rosnące amerykańskie ograniczenia eksportowe na zaawansowane układy scalone nie osłabiły rozwoju sztucznej inteligencji w Chinach. Sankcje zmobilizowały wręcz start-upy, takie jak DeepSeek, do innowacji w obszarach efektywności, współpracy i optymalizacji zasobów.
Zihan Wang, były pracownik start-upu DeepSeek i doktorant na Northwestern University, podkreśla, że firma zmodyfikowała proces szkolenia modelu, aby zmniejszyć obciążenie procesorów graficznych — procesory zaprojektowane specjalnie na rynek chiński charakteryzują się bowiem ograniczoną wydajnością.
Model DeepSeek R1 zdobył uznanie badaczy za zdolność do rozwiązywania złożonych problemów, szczególnie w obszarach takich jak matematyka i programowanie. Opiera się na podejściu kolejności myśli (chain of thought), podobnym do stosowanego przez ChatGPT o1 od OpenAI, co pozwala mu rozwiązywać problemy krok po kroku. Dimitris Papailiopoulos z Microsoft’s AI Frontiers Research Lab wskazuje, że kluczową cechą R1 jest prostota inżynieryjna, która pozwala na skrócenie czasu obliczeń przy zachowaniu wysokiej skuteczności.
DeepSeek poważnym konkurentem dla ChatGPT
DeepSeek zaprezentował też sześć mniejszych wersji modelu R1, a niektóre mogą działać lokalnie na laptopach. Według firmy jedna z tych wersji w pewnych testach przewyższa miniaturową wersję o1 od OpenAI.
🚀 DeepSeek-R1 is here!
— DeepSeek (@deepseek_ai) January 20, 2025
⚡ Performance on par with OpenAI-o1
📖 Fully open-source model & technical report
🏆 MIT licensed: Distill & commercialize freely!
🌐 Website & API are live now! Try DeepThink at https://t.co/v1TFy7LHNy today!
🐋 1/n pic.twitter.com/7BlpWAPu6y
DeepSeek pozostaje stosunkowo mało znany. Firma z siedzibą w Hangzhou została założona w lipcu 2023 r. przez Lianga Wenfenga, absolwenta Uniwersytetu Zhejiang. Ma on bogate doświadczenie w inżynierii informacyjnej i elektronicznej oraz zarządzał funduszem High-Flyer, który wcześniej inkubował startuup. Podobnie jak Sam Altman z OpenAI dąży do stworzenia ogólnej sztucznej inteligencji (artificial general intelligence) zdolnej dorównać lub przewyższyć człowieka w szerokim spektrum zadań.
Szkolenie dużych modeli językowych (large language models) wymaga zaawansowanej wiedzy i ogromnej mocy obliczeniowej. Według ekspertów ze względu na ogromne koszty tylko najwięksi gracze na rynku podejmują się budowy modeli bazowych takich jak ChatGPT. Mimo dominacji takich gigantów jak Alibaba i ByteDance firma DeepSeek radzi sobie bez konieczności pozyskiwania dodatkowego finansowania.
Kilka dni temu Jim Fan, starszy kierownik ds. badań Nvidii, napisał na platformie X, że chiński DeepSeek „realizuje pierwotną misję OpenAI, czyli otwarte, przełomowe badania, które służą wszystkim”.
We are living in a timeline where a non-US company is keeping the original mission of OpenAI alive - truly open, frontier research that empowers all. It makes no sense. The most entertaining outcome is the most likely.
— Jim Fan (@DrJimFan) January 20, 2025
DeepSeek-R1 not only open-sources a barrage of models but… pic.twitter.com/M7eZnEmCOY
Chiński model AI dąży do zmniejszenia luki w efektywności obliczeniowej
Liang Wenfeng w jednym z wywiadów podkreślił, że chińskie firmy muszą wykorzystywać więcej mocy obliczeniowej, aby osiągnąć wyniki porównywalne z konkurencją. Wyznaczył sobie za cel zmniejszenie tej różnicy. Pod jego kierownictwem zespół DeepSeek opracował rozwiązania pozwalające ograniczyć zużycie pamięci i przyspieszyć obliczenia, zachowując jednocześnie wysoką precyzję.
DeepSeek R1 wykonuje zadania wymagające rozumowania na poziomie porównywalnym z modelem o1 od OpenAI, a jednocześnie umożliwia badaczom szczegółowe analizowanie jego działania dzięki otwartemu dostępowi do algorytmu. Testy przeprowadzone na modelu R1, które zostały udostępnione 20 stycznia, pokazują, że osiąga on wyniki na poziomie o1 w zadaniach z chemii, matematyki i kodowania.
R1 wyróżnia się również niskimi kosztami użytkowania. Testy wykazały, że eksperyment, który z modelem o1 kosztował ponad 370 USD, z R1 można było przeprowadzić za mniej niż 10 USD. Firma oferuje także mniejsze wersje modelu przystosowane dla badaczy z ograniczonymi zasobami obliczeniowymi.
DeepSeek wyprzedził ChatGPT w amerykańskim Apple App Store
Warto podkreślić, że chiński start-up zdobył w poniedziałek pierwsze miejsce w rankingu najpopularniejszych darmowych aplikacji w amerykańskim Apple App Store, wyprzedzając swojego głównego konkurenta — ChatGPT. Aplikacja oparta na modelu DeepSeek V3, która według jej twórców „osiąga najwyższe wyniki wśród modeli open source i konkuruje z najbardziej zaawansowanymi modelami zamkniętymi na świecie”, zdobyła ogromną popularność wśród amerykańskich użytkowników od momentu swojej premiery 10 stycznia.
Według danych firmy Sensor Tower zajmującej się badaniem rynku aplikacji sukces DeepSeek wpłynął na środowisko Doliny Krzemowej, podważając dominację USA w dziedzinie AI.
DeepSeek wstrząsnął rynkami. Spadki Nasdaq i S&P 500
Sukces chińskiego start-upu wywołał w poniedziałek poruszenie na globalnym rynku technologicznym, co przełożyło się na zmiany w notowaniach giełdowych. Na zamknięciu poniedziałkowej sesji indeks Nasdaq 100 spadał o 3,1 proc., najmocniej od 18 grudnia, a indeks S&P500 stracił 1,5 proc. Akcje Nvidii zanotowały natomiast rekordową obniżkę o 17 proc. Warszawski indeks WIG20 zakończył z kolei sesję spadkiem o 0,1 proc. Chińskie akcje związane z AI zareagowały pozytywnie — w Hongkongu indeks Hang Seng Tech wzrósł o 0,8 proc. (podczas sesji zakończonej we wtorek o godz. 9 czasu polskiego).
Chiny zmniejszają dystans do USA w dziedzinie AI
Chińskie firmy coraz częściej przyjmują zasadę open source. Alibaba Cloud udostępniła ponad 100 modeli AI open source wspierających 29 języków i zaspokajających różne potrzeby, takie jak kodowanie czy matematyka. Podobnie działają start-upy takie jak Minimax i 01.AI. Według białej księgi opublikowanej przez Chińską Akademię Technologii Informacyjnych i Komunikacyjnych Chiny odpowiadają za 36 proc. z 1328 modeli językowych na świecie, zajmując drugie miejsce po USA.
Amerykańskie sankcje wymuszają na chińskich firmach większą efektywność w wykorzystaniu zasobów obliczeniowych, co może doprowadzić do konsolidacji branży AI w Chinach. Już widać pierwsze oznaki tych zmian — Alibaba Cloud rozpoczęła współpracę z 01.AI w celu stworzenia wspólnego laboratorium, które będzie rozwijać zaawansowane modele sztucznej inteligencji dla zastosowań przemysłowych.
Źródła:
W artykule wykorzystano fragmenty z następujących źródeł:
https://finance.yahoo.com/news/the-shadow-of-trump-looms-over-a-cautious-fed-090041612.html
https://www.technologyreview.com/2025/01/24/1110526/china-deepseek-top-ai-despite-sanctions/