Od tradingu do AGI: kto stoi za firmą DeepSeek, która rewolucjonizuje sztuczną inteligencję?
DeepSeek pokazał, że wbrew wcześniejszym przekonaniom inwestorów, amerykańskie firmy nie mają monopolu na sztuczną inteligencję. Historia spółki i jej rewolucyjnego modelu AI zaczęła się jednak nie w sektorze technologicznym, lecz… na giełdzie.
Kluczowe informacje:
- Firma DeepSeek została założona przez chiński fundusz hedgingowy High-Flyer, który wykorzystywał AI do poszukiwania przewag na rynkach finansowych.
- Model od DeepSeek dorównuje wydajnością produktowi od OpenAI, jednak jego stworzenie miało wymagać dużo mniejszych nakładów finansowych.
- Marc Andreessen porównał publikację chińskiego modelu do wystrzelenia Sputnika w okresie Zimnej Wojny, rozumiejąc ją jako początek rywalizacji technologicznej Chiny-USA.
Chiński fundusz hedgingowy, który zmienił branżę AI
Światy tradingu i technologii posiadają istotny punkt wspólny – nauki ścisłe. Dlatego w branży Big Tech znajdziemy kilka przykładów osób, które przeszły drogę z Wall Street do Doliny Krzemowej lub odwrotnie. Najsłynniejszym z nich jest CEO Amazona – Jeff Bezos, który na początku lat 90. pracował dla DE Shaw & Co. – świeżego wówczas funduszu hedgingowego zajmującego się analizą ilościową.
Założyciel spółki DeepSeek, która wywołuje zamieszanie na amerykańskiej giełdzie – 40-letni Liang Wenfeng, poniekąd także wpisuje się w ten schemat. Od dzieciństwa wykazywał talent do matematyki, co doprowadziło go do zdobycia tytułu inżyniera na uniwersytecie w Zhejiang. Jeszcze podczas studiów zainteresował się sztuczną inteligencją i jej zastosowaniem na rynkach finansowych, dlatego w 2016 roku, wraz z kolegami z uczelni, założył High-Flyer – chiński fundusz hedgingowy oparty na algorytmach AI. Firma z sukcesami wykorzystywała zaawansowane modele uczenia maszynowego do rozpoznawania wzorców w danych cenowych i wolumenowych, dzięki czemu do 2021 roku zarządzała majątkiem wartym ponad 100 mld juanów (ok. 11 mld dolarów).
Niekorzystne warunki rynkowe w 2021 roku przysporzyły jej jednak kłopotów – stosowane przez nią algorytmy nie radziły sobie z nagłymi zmianami koniunktury. W odpowiedzi zespół Lianga udoskonalił modele zarządzania ryzykiem, ale prawdziwa rewolucja nastąpiła w 2023 roku, kiedy High-Flyer ogłosił, że rozszerza swoją działalność poza rynki finansowe i skupi się na badaniach nad sztuczną inteligencją ogólną (AGI), zdolną konkurować z ludzkim umysłem. W ten sposób, fundusz stał się spółką-matką, która powołała do życia DeepSeek, prowadzącą research w dziedzinie AI. Ta, w ciągu roku, wykorzystując zgromadzone przez Wenfenga jeszcze przed amerykańskimi restrykcjami eksportowymi chipy Nvidii, opracowała model językowy DeepSeek-V3. Za rekordowo niską kwotę ok. 5.6 milionów dolarów.
Darmowa AI, która dorównuje modelowi od OpenAI
W styczniu 2025 roku udostępniono ulepszoną wersję V3: DeepSeek-R1, który dorównuje możliwościami GPT o1 w zadaniach takich, jak pisanie kodu czy rozwiązywanie zadań matematycznych. Profesor z Wharton – Ethan Mollick stwierdził nawet w jednym z wpisów na X, że śledzenie procesu „myślowego” tego modelu czyni „unikanie jego antropomorfizacji niemożliwym”.
Faktycznie – wgląd w rozumowanie R1 który zyskujemy po zaznaczeniu opcji „Deep Think” na stronie chatbota daje złudzenie, że mamy do czynienia nie z maszyną, a z rozumną istotą. I chociaż gdy skonfrontujemy go z zadaniami takimi, jak np. pisanie rymowanej poezji, jego absurdalny niekiedy tok myślenia przypomina, że to wciąż tylko model statystyczny, tak to, co dostarczyło nam DeepSeek, jest imponujące.
W dodatku R1 jest dostępny na licencji Open Source, co oznacza, że kod źródłowy jest dostępny publicznie i może być wykorzystywany lokalnie (co eliminuje problem z udostępnianiem danych DeepSeek) oraz modyfikowany przez programistów. Z kolei koszt korzystania z modeli hostowanych w chmurze poprzez DeepSeek API wynosi ok. 3% kwoty, którą użytkownik musi zapłacić za korzystanie z GPT o1 z API od OpenAI.
No matter how much you fight it, I find that the visible chain-of-thought from DeepSeek makes it nearly impossible to avoid anthropomorphizing the thing.
The visible first-person „thinking” makes you feel like you are reading a diary of a somewhat tortured soul who wants to help pic.twitter.com/Kyj7Wkhjdb
— Ethan Mollick (@emollick) January 22, 2025
W efekcie, akcje gigantów technologicznych z USA, w tym Nvidii (kluczowego dostawcy chipów do treningu modeli LLM), zaliczyły gwałtowne spadki. Amerykańska hossa żyła z nadziei na dominację firm z Doliny Krzemowej w dziedzinie AI i wzrost ich przychodów w przyszłości, jednak po premierze najnowszego modelu od DeepSeek, inwestorzy zaczęli kwestionować, czy korzystanie z drogich usług spółek takich, jak OpenAI, nadal ma sens. Choć jak wspomina artykuł opublikowany na composio.dev, ChatGPT o1-pro wciąż radzi sobie z niektórymi zadaniami lepiej niż R1, ten drugi oferuje, przynajmniej na razie, nieporównywalnie lepszy stosunek jakości do ceny.
Marc Andreessen określił całe zamieszanie jako “Sputnik Moment”, nawiązując do wystrzelenia satelity Sputnik przez ZSRR w 1957 roku, które rozpoczęło tzw. wyścig kosmiczny, czyli zimnowojenną rywalizację USA i Związku Radzieckiego w eksploracji kosmosu. DeepSeek pokazał, że dominacja Ameryki w sektorze nie musi trwać wiecznie, a rozwój sztucznej inteligencji może być dużo mniej zależny od nakładów finansowych i bardziej demokratyczny niż wcześniej zakładano.
Shorty Nvidii pozwoliły zarobić spekulantom 6.5 miliarda dolarów. Interactive Brokers zablokował krótką sprzedaż
Biorąc pod uwagę doświadczenie Wenfenga w branży finansowej można spekulować czy przed publicznym udostępnieniem R1 nie zbudował on m.in. na rynku Nvidii, pozycji krótkich. Chociaż brak na to dowodów, ci, którzy to zrobili, zarobili krocie.
Podczas poniedziałkowej sesji, Nvidia straciła aż 17% swojej wartości, co pozwoliło spekulantom zgarnąć zysk rzędu 6.56 mld dolarów. Presja sprzedażowa była na tyle duża, że 27 stycznia, popularna platforma Interactive Brokers tymczasowo wstrzymała short selling Nvidii, uruchamiając tzw. “Uptick Rule”. To wprowadzony po kryzysie w 2008 roku mechanizm SEC zapobiegający spiralom spadkowym, uruchamiany wówczas, gdy akcje tracą ponad 10% w ciągu jednego dnia (nie wszystkie platformy zdecydowały się jednak na wstrzymanie short-sellingu: Fidelity, jako jeden z brokerów, nadal pozwalał na otwieranie pozycji krótkich).
Chociaż Nvidia zdołała już odrobić część strat, wejście chińskiej firmy do gry może całkiem zmienić rynkowy krajobraz i utrudnić dalsze wzrosty spółkom z Doliny Krzemowej.