Didieji kalbos modeliai tapo neįtikėtinai pelningu verslu technologijų milžinams. Microsoft investavo net 13 milijardų dolerių į OpenAI, tuo tarpu Amazon skyrė 4 milijardus dolerių Anthropic kompanijai, siekdami užsitikrinti išskirtinę prieigą prie pažangiausių dirbtinio intelekto sistemų.1
Be to, Microsoft ir Amazon kartu valdo daugiau nei 55% pasaulinės debesijos infrastruktūros rinkos, kas suteikia jiems reikšmingą pranašumą LLM vystyme ir tobulinime. Įdomu tai, kad vien OpenAI GPT-4 modelio apmokymas kainavo daugiau nei 100 milijonų dolerių, o skaičiavimo galia, reikalinga tokiems modeliams apmokyti, padvigubėja kas šešis mėnesius.
Šiame straipsnyje nagrinėsime, kaip didieji technologijų gigantai paverčia didžiuosius kalbos modelius pelningomis investicijomis, kokios yra pagrindinės rinkos tendencijos ir kokie iššūkiai laukia ateityje.
Didžiųjų kalbos modelių rinkos apžvalga
Natūralios kalbos apdorojimo (NLP) rinka sparčiai auga, todėl analitikai prognozuoja, kad nuo 11 milijardų dolerių 2020 metais ji išaugs iki daugiau nei 35 milijardų dolerių iki 2026 metų. Šis augimas rodo didėjantį didžiųjų kalbos modelių (LLM) svarbą skaitmeninėje aplinkoje.
Dabartinė rinkos vertė
Pasaulinis bankininkystės sektorius, kuris aktyviai naudoja LLM technologijas, valdo 155 trilijonus dolerių turto. Vien „JPMorgan Chase” kasdien atlieka apie 43 milijonus operacijų, parodydama LLM galimybes gerinti veiklos efektyvumą.
Pagrindiniai žaidėjai
Šiuo metu rinkoje dominuoja keli pagrindiniai žaidėjai. „ChatGPT” išlieka populiariausia pasaulyje DI programa, turinti 200 milijonų vartotojų. Tarp kitų svarbių rinkos dalyvių yra „Claude” – „Anthropic” kompanijos produktas, bei „Google” sukurtas „Gemini”.
Įdomu tai, kad „Gemini” demonstruoja mažiausią klaidų skaičių tarp visų didžiųjų kalbos modelių. Tačiau „Llama 2” ir „GPT-2” išsiskiria tuo, kad yra atviro kodo modeliai, leidžiantys atidžiau išnagrinėti ir spręsti galimas problemas.
Augimo tendencijos
Rinkos augimą skatina keletas svarbių veiksnių. Visų pirma, daugiau nei 75% rinkodaros specialistų ir apie 19% įmonių jau naudoja DI įrankius turinio generavimui. Nestruktūruoti duomenys, tokie kaip el. laiškai, socialinių tinklų įrašai ir klientų atsiliepimai, sudaro 80% įmonės duomenų ir auga 55% kasmet.
Tačiau rinka susiduria ir su iššūkiais. 2025 metais numatoma, kad įmonės pereis nuo bendrų DI įrankių prie specializuotų sprendimų, skirtų konkrečioms užduotims. Šis pokytis padės sumažinti energijos sąnaudas ir pagerinti efektyvumą.
Kinų startuolis „DeepSeek” neseniai sukrėtė rinką, pristatydamas naują ekonomišką LLM modelį, dėl kurio „Nvidia” per vieną dieną prarado pusę trilijono JAV dolerių rinkos vertės. Šis įvykis rodo, kad rinka tampa vis konkurencingesnė, o nauji žaidėjai gali greitai pakeisti jėgų pusiausvyrą.
Sveikatos priežiūros, biotechnologijų, e. prekybos ir logistikos sektoriai vis aktyviau integruoja LLM sprendimus. Šie modeliai ne tik gerina klientų aptarnavimą, bet ir padeda įmonėms efektyviau apdoroti didelius duomenų kiekius, atlikti nuotaikų analizę ir automatizuoti turinio kūrimą.
Įdomūs faktai apie didžiuosius kalbos modelius
Technologinė pažanga atvėrė kelią didžiųjų kalbos modelių (LLM) evoliucijai. Nuo 1990-ųjų, kai neuroniniai tinklai pradėjo mokytis kalbos, šie modeliai padarė milžinišką šuolį į priekį. Tačiau tikrasis proveržis įvyko 2018 metais, kai Google sukūrė transformerių architektūrą.
Vienas įspūdingiausių faktų – LLM parametrų skaičiaus augimas. Pavyzdžiui, GPT-2 turėjo 1,5 milijardo parametrų, tuo tarpu PaLM pasiekė net 540 milijardų parametrų. Nepaisant to, naujesni modeliai, tokie kaip PALM 2, naudoja mažiau parametrų (340 milijardų), bet pasiekia geresnių rezultatų.
Šiandien LLM demonstruoja išskirtines galimybes:
- Geba suprasti kontekstą, emocijas ir net sarkazmą
- Individualizuoja turinį pagal vartotojo poreikius
- Kuria įvairius kūrybinius tekstus, įskaitant eilėraščius ir scenarijus
Tačiau kartu su galimybėmis ateina ir iššūkiai. Nestruktūruoti duomenys, tokie kaip el. laiškai ir socialinių tinklų įrašai, sudaro net 80% įmonių duomenų ir auga 55% kasmet. Todėl LLM tampa vis svarbesni apdorojant šiuos duomenis.
Ypatingai įdomu tai, kad mažesni modeliai kartais pranoksta didesnius. Vienas modelis su 350 milijonų parametrų pralenkė kai kuriuos 100 milijardų parametrų modelius loginės kalbos supratimo užduotyse. Be to, šis modelis pasiekė daugiau nei 90% iCAT balų, kai kiti modeliai svyravo tarp 40-80%.
Lietuvoje taip pat vyksta reikšmingi pokyčiai. „Neurotechnology” sukūrė pirmąjį atviro kodo didįjį kalbos modelį lietuvių kalbai, naudodami LlamaV2 7 ir 13 milijardų parametrų transformerių architektūrą. Šiam modeliui apmokyti buvo panaudota daugiau nei 14 milijardų teksto vienetų lietuvių kalba.
Vis dėlto, LLM vystymasis susiduria su tam tikrais iššūkiais. Vienas jų – šališkumas. Tyrimai rodo, kad modeliai dažnai atspindi visuomenės stereotipus, ypač susijusius su lytimi ir profesijomis. Pavyzdžiui, modeliai linkę sieti „skrydžio palydovės” ir „sekretorės” darbus su moterimis, o „teisininko” ir „teisėjo” – su vyrais.
Dar vienas svarbus aspektas – aplinkosaugos poveikis. CO2 emisija, išsiskirianti apmokant vieną kalbos modelį, gali viršyti viso automobilio išmetamų teršalų kiekį. Todėl mokslininkai ieško būdų optimizuoti modelių dydį ir efektyvumą, nenukentant jų kokybei.
Kaip tech gigantai uždirba iš LLM
Technologijų įmonės atrado įvairius būdus uždirbti iš didžiųjų kalbos modelių, taikydamos tiek tiesioginius, tiek netiesioginius monetizavimo metodus. Šios strategijos padeda ne tik padengti didelius vystymo kaštus, bet taip pat generuoja reikšmingą pelną.
Tiesioginio monetizavimo būdai
Microsoft, viena iš pagrindinių rinkos žaidėjų, sėkmingai integruoja dirbtinio intelekto sprendimus į savo produktus. Įmonė nuolat tobulina „Dynamics AI” funkcionalumą bei plečia dirbtinio intelekto pritaikymą akademiniuose projektuose. Holistinė Microsoft investicijų strategija leidžia paskirstyti išlaidas įvairioms verslo šakoms, išlaikant finansinės padėties kontrolę.
Adobe demonstruoja kitą sėkmingą monetizavimo pavyzdį su „Adobe Sensei” – dirbtinio intelekto platforma, integruota į populiarias programas kaip „Photoshop”, „Lightroom” ir „Premiere Pro”. Perėjimas prie debesijos pagrįstų paslaugų žymiai palengvino dirbtinio intelekto integracijos procesą.
Oracle taip pat išnaudoja LLM potencialą, bendradarbiaudama su „Cohere” ir vystydama specializuotus sprendimus. Pavyzdžiui, sveikatos priežiūros sektoriuje „Oracle Cerner” valdo didelius elektroninių sveikatos įrašų kiekius, kuriuos naudoja kuriant pritaikytus generatyvinius DI modelius.
Netiesioginis pelnas
Shutterstock nuo 2021 m. sėkmingai bendradarbiauja su OpenAI, o neseniai išplėtė savo partnerių tinklą iki 20 kompanijų. Šios partnerystės leidžia monetizuoti turinio vaizdinius duomenis ir metaduomenis, naudojamus dirbtinio intelekto modelių apmokymui.
Įdomu tai, kad AI įgūdžių turintys profesionalai uždirba iki 25% daugiau, o AI darbo vietų skaičius auga 3,5 karto sparčiau nei kitų sričių. Todėl įmonės investuoja į specialistų ruošimą ir kompetencijų kėlimą.
Marketingo specialistai susiduria su naujais iššūkiais – kaip optimizuoti įmonių resursus, kad jie būtų AI „web crawling-friendly” ir kaip efektyviai nukreipti reklamos biudžetus. Nors ChatGPT šiuo metu dar nėra pagrindinis pardavimų įtakos šaltinis JAV rinkoje, technologijų vystymosi tempas rodo augančią šios platformos svarbą.
Prognozuojama, kad iki 2032 m. generatyvinio dirbtinio intelekto rinka pasieks 1,24 trilijonus eurų. McKinsey ataskaita rodo, kad GDI turi potencialą automatizuoti užduotis, kurios sudaro 60-70% viso darbo laiko. Pasaulio ekonomikos forumo duomenimis, iki 72% redaktorių ir 76% vertėjų darbo užduočių bus automatizuota.
Investicijų į LLM atsiperkamumas
Didžiųjų kalbos modelių (LLM) kūrimas reikalauja milžiniškų investicijų, tačiau tinkamai valdant šias investicijas, jos gali atnešti reikšmingą grąžą.
Infrastruktūros kaštai
LLM modelių treniravimas reikalauja itin didelės skaičiavimo galios ir energijos resursų. Šiam procesui būtini tūkstančiai galingų ir brangių procesorių. Todėl didžiulės investicijos į modelių tobulinimą procesorių gamintoją „Nvidia” pavertė viena vertingiausių pasaulio įmonių.
Skaičiavimo infrastruktūros išlaidos nuolat auga, kadangi tolesnis dirbtinio intelekto vystymasis reikalauja vis daugiau skaičiavimo galios, procesorių ir energijos. Pavyzdžiui, realaus pasaulio kaštai svyruoja nuo kelių centų už pagrindines užduotis iki 20,000 USD už sudėtingesnius atvejus debesų platformose.
Vystymo išlaidos
Pagrindinės sąnaudos skiriamos kalbos išteklių kūrimui ir vystymui. Šiam tikslui reikalingi:
- Duomenų tyrėjai ir analitikai
- Kalbininkai
- Specializuoti duomenų specialistai
Vystant LLM būtini didžiuliai tekstinių duomenų rinkiniai, apimantys knygas, straipsnius, kodą ir žiniatinklio turinį. Be to, reikalinga specializuota AI ir mašininio mokymosi patirtis, ypač gilaus mokymosi ir natūralios kalbos apdorojimo (NLP) srityse.
Grąža per laiką
Nepaisant didelių pradinių investicijų, FrugalGPT tyrimai rodo, kad galima pasiekti iki 98% išlaidų sumažėjimą, lyginant su tradicinių LLM API naudojimu. Pavyzdžiui, naudojant Frugal GPT metodą, išlaidos sumažėjo nuo 33 USD iki 6 USD, o bendras tikslumas padidėjo 1.5%.
Efektyvesnis turimų resursų panaudojimas gali būti itin naudingas technologijų milžinų rezultatams. Tačiau svarbu paminėti, kad investicijų grąža priklauso nuo daugelio veiksnių:
- Investicijų laikotarpio
- Kapitalo vertės padidėjimo
- Įvairių išmokų, tokių kaip dividendai ir palūkanos
Investicijų grąžos rodiklis (ROI) tampa esminiu veiksniu verslo sprendimų priėmimo procese. Remiantis ROI duomenimis, įmonių vadovai gali:
- Nustatyti efektyviausias investicijų sritis
- Identifikuoti projektus su didžiausiu pelningumu
- Sumažinti galimus nuostolius
Vis dėlto, pigesni ir protingesni dirbtinio intelekto modeliai ilguoju laikotarpiu labiausiai gali pasitarnauti už technologijų sektoriaus ribų. Todėl investuotojai turėtų atkreipti dėmesį ne tik į tiesioginę finansinę grąžą, bet ir į platesnį technologijos pritaikymo potencialą skirtinguose sektoriuose.
Konkurencijos dinamika rinkoje
Rinkos konkurencija didžiųjų kalbos modelių srityje tampa vis intensyvesnė, skatindama tiek technologijų milžinus, tiek naujus dalyvius ieškoti inovatyvių sprendimų.
Didžiųjų žaidėjų strategijos
Meta, nors dažnai užgožiama Google ir Microsoft, išsiskiria savo unikaliu požiūriu į LLM vystymą. Įmonė neseniai pristatė LLaMA modelį, demonstruodama tvirtą ryžtą stiprinti savo pozicijas rinkoje. Tuo tarpu Baidu planuoja integruoti Ernie pokalbių robotą į daugumą savo operacijų, įskaitant internetinę paiešką, debesijos paslaugas ir autonomines transporto sistemas.
Microsoft, bendradarbiaudama su OpenAI, demonstruoja holistinį požiūrį į dirbtinio intelekto integraciją. Įmonė nuosekliai tobulina savo produktus, ypatingą dėmesį skirdama akademiniams projektams ir verslo sprendimams. Tačiau, nepaisant aiškaus technologijų milžinų dominavimo, dirbtinis intelektas vis dar gali suteikti konkurencinį pranašumą ir smulkesnėms įmonėms.
Naujų dalyvių įtaka
Kinijos startuolis DeepSeek sukrėtė rinką, pristatydamas naują efektyvų LLM modelį. Šis modelis, nors ir nereiškia revoliucinio poslinkio link dirbtinio bendrojo intelekto, žymi reikšmingą pažangą optimizuojant esamas technologijas. DeepSeek pasiekimai daugiausia susiję su LLM greitėjimu ir išlaidų mažinimu, kas turi svarbių padarinių AI modelių ekonomikai ir prieinamumui.
Įdomu tai, kad DeepSeek efektyvumo padidėjimas spartina LLM virtimą įprastomis prekėmis. Todėl investuotojai pradeda žvelgti ne tik į tradicines LLM architektūras, bet taip pat ieško:
- Naujų DI proveržių
- Alternatyvios AI aparatinės įrangos sprendimų
- Neuromorfinių lustų vystymo galimybių
Shutterstock taip pat demonstruoja naują požiūrį į konkurenciją, išplėsdama savo partnerių tinklą iki 20 kompanijų. Šis žingsnis rodo, kad net tradicinės įmonės gali sėkmingai konkuruoti LLM rinkoje, pasirinkdamos tinkamą strategiją.
Vis dėlto, konkurencijos dinamika keičiasi dėl dėmesio privatumui, sąveikumui ir naudotojų valdymui. Decentralizuotas AI mažina priklausomybę nuo didelių, centralizuotų technologijų įmonių, kas yra ypač svarbu siekiant užtikrinti, kad dirbtinis intelektas tenkintų pasaulio gyventojų poreikius.
Oligopolinė rinkos struktūra, būdinga LLM sektoriui, pasižymi kelių stambių įmonių kontroliuojama didžiąja rinkos dalimi bei aukštais įėjimo barjerais. Tačiau naujų žaidėjų atėjimas ir technologijų demokratizacija meta iššūkį tradiciniams rinkos lyderiams permąstyti savo verslo modelius.
Konkurencijos intensyvumą didina tai, kad specializuotų DI įgūdžių reikalaujančių darbo vietų skaičius auga 3,5 karto greičiau nei kitų pozicijų. Be to, DI kompetencijų turintys profesionalai uždirba iki 25% daugiau, kas skatina naujus rinkos dalyvius investuoti į talentų pritraukimą ir vystymą.
Ateities perspektyvos ir iššūkiai
Europos Sąjungos žingsnis link pirmojo pasaulyje dirbtinio intelekto įstatymo atveria naują etapą didžiųjų kalbos modelių (LLM) vystyme. Nors šis reglamentavimas siekia apsaugoti piliečių teises, kartu jis kelia naujų iššūkių technologijų kompanijoms.
Technologiniai barjerai
Sparčiai augantys specifinės ir bendros paskirties dirbtinio intelekto sistemų gebėjimai reikalauja efektyvaus, patikimo ir etiško valdymo. Nestruktūruoti duomenys, tokie kaip elektroniniai laiškai ir socialinių tinklų įrašai, sudaro 80% įmonių duomenų ir auga 55% kasmet.
Pagrindiniai technologiniai iššūkiai apima:
- Duomenų analizės klaidų riziką
- Privatumo problemų sprendimą
- Tiekėjo užrakto prevenciją
- Etikos klausimų valdymą
Reguliavimo rizikos
ES dirbtinio intelekto įstatymas, kuris oficialiai įsigaliojo 2024 m. rugpjūtį, nustato griežtus apribojimus ir galimas dideles baudas už pažeidimus. Įmonėms gresia baudos iki 35 mln. eurų arba 7% jų pasaulinių metinių pajamų – priklausomai nuo to, kuri suma yra didesnė.
Reglamente numatytas dviejų lygių metodas:
- Skaidrumo reikalavimai visiems bendrosios paskirties dirbtinio intelekto modeliams
- Griežtesni reikalavimai galingesniems modeliams
Naujasis ES dirbtinio intelekto biuras prižiūrės įstatymų laikymąsi ir galės taikyti sankcijas pažeidėjams. Tačiau kai kurie technologijų vadovai nerimauja, kad per didelis reguliavimas gali trukdyti inovacijoms. Nyderlandų princas Konstantijnas pažymėjo, kad Europa pernelyg susitelkia į reguliavimą, o ne į technologijų vystymą.
Rinkos prisotinimo ženklai
Lietuvos skaitmeninio progreso indekso duomenys rodo, kad šalis nuo ES vidurkio atsilieka dvigubai. Pagrindinės kliūtys LLM vystymui apima:
- Kvalifikuotų specialistų trūkumą
- Finansinių išteklių stoką
- Nepakankamą piliečių pasitikėjimą dirbtinio intelekto technologijomis
Nepaisant iššūkių, Bulgarijos fintech įmonės „Payhawk” inžinerinio intelekto direktorius Dijanas Bogdanovas teigia, kad aiškios dirbtinio intelekto taisyklės gali suteikti Europai lyderystės pranašumą. „Kol JAV ir Kinija varžosi dėl didžiausių dirbtinio intelekto modelių sukūrimo, Europa rodo lyderystę kuriant patikimiausius modelius”, – pabrėžia jis.
Vis dėlto, McKinsey ataskaita rodo, kad generatyvinis dirbtinis intelektas turi potencialą automatizuoti užduotis, kurios sudaro 60-70% viso darbo laiko. Pasaulio ekonomikos forumo duomenimis, iki 72% redaktorių ir 76% vertėjų darbo užduočių bus automatizuota.
Siekiant spręsti šiuos iššūkius, Lietuvos DI strategija numato penkis pagrindinius tikslus:
- Gerinti piliečių įgūdžius DI srityje
- Stiprinti nacionalinę mokslinių tyrimų ekosistemą
- Didinti DI diegimą visose ekonominės veiklos srityse
- Skatinti tarptautinį bendradarbiavimą
- Kurti etinį ir teisinį pagrindą tvariam DI vystymui
Tačiau Vyriausybinės strateginės analizės centro darbo rinkos tyrimo ataskaita atskleidžia, kad DI problemų visuma suvokiama fragmentiškai, trūksta centrinio koordinatoriaus, kuris rūpintųsi visais su DI susijusiais klausimais.
Top 5 dažniausiai užduodami klausimai apie didžiuosius kalbos modelius:
Kas yra didieji kalbos modeliai?
Didieji kalbos modeliai (angl. Large Language Models, LLM) – tai dirbtinio intelekto sistemos, sukurtos naudojant giluminio mokymosi metodus, gebančios suprasti ir generuoti žmogaus kalbą. Jos mokomos analizuojant didžiulius tekstų kiekius, siekiant atpažinti kalbos struktūras ir kontekstus.
Kodėl didieji kalbos modeliai yra svarbūs technologijų kompanijoms?
Didieji kalbos modeliai leidžia kurti pažangias natūralios kalbos apdorojimo programas, tokias kaip virtualūs asistentai, automatizuoti klientų aptarnavimo sprendimai ir turinio kūrimo įrankiai. Tai padeda įmonėms efektyviau bendrauti su vartotojais ir automatizuoti daugelį procesų, didinant produktyvumą ir mažinant sąnaudas.
Kaip didieji kalbos modeliai veikia programuotojų darbą?
Programuotojams didieji kalbos modeliai suteikia galimybę automatizuoti kodo generavimą, optimizuoti problemų sprendimą ir pagerinti bendrą programavimo efektyvumą. Tai leidžia sutaupyti laiko ir išteklių, skiriant daugiau dėmesio kūrybiškoms ir sudėtingoms užduotims.
Kokios yra naujausios tendencijos didžiųjų kalbos modelių srityje?
Pastaruoju metu didieji kalbos modeliai sparčiai tobulėja ir yra integruojami į įvairias sritis, tokias kaip sveikatos priežiūra, švietimas ir pramogos. Jie tampa vis labiau pritaikomi specifiniams poreikiams, leidžiant kurti specializuotus sprendimus, atitinkančius konkrečių pramonės šakų reikalavimus.
Kokie yra didžiųjų kalbos modelių privalumai verslui?
Didieji kalbos modeliai suteikia verslui galimybę automatizuoti klientų aptarnavimą, analizuoti didelius duomenų kiekius ir generuoti įžvalgas, padedančias priimti informuotus sprendimus. Tai padidina operacijų efektyvumą, sumažina sąnaudas ir pagerina klientų patirtį.
Išvados
Didžiųjų kalbos modelių rinka sparčiai vystosi, tačiau kartu su technologine pažanga atsiranda nauji iššūkiai. Vis dėlto technologijų milžinai demonstruoja, kad tinkamos investicijos į LLM gali atnešti reikšmingą grąžą, nepaisant didelių pradinių kaštų.
Rinkos dinamika rodo, kad konkurencija tampa vis intensyvesnė. Nauji žaidėjai, tokie kaip DeepSeek, meta iššūkį tradiciniams lyderiams, siūlydami efektyvesnius ir ekonomiškesnius sprendimus. Todėl technologijų gigantai privalo nuolat tobulinti savo produktus ir ieškoti naujų konkurencinių pranašumų.
ES dirbtinio intelekto įstatymas žymi naują etapą LLM vystyme, nustatydamas aiškias žaidimo taisykles. Nepaisant to, kad griežtas reguliavimas gali pristabdyti kai kurias inovacijas, jis taip pat sukuria pagrindą tvariam ir etiškai atsakingam dirbtinio intelekto vystymui.
Lietuvai, siekiančiai stiprinti savo pozicijas dirbtinio intelekto srityje, svarbu spręsti kvalifikuotų specialistų trūkumo problemą ir didinti investicijas į technologinę infrastruktūrą. Taigi, artimiausi metai bus lemiami nustatant, kurios įmonės ir valstybės taps LLM revoliucijos lyderėmis.