Ką reiškia apmokyti „ChatGPT“ savo duomenimis?

Ar kada nors susimąstėte apie technologiją, su kuria bendraujama klausimų ir atsakymų metodu? Arba turinio generavimo programos, kurios sukurtos naudojant OpenAI ChatGPT API? Yra sukurta daugiau nei keli tūkstančiai DI įrankių, pvz., klausimų ir atsakymų robotai arba reklaminio turinio generavimo programos, paveiksliukų generavimas.

Visa tai vyksta naudojant ChatGPT API. Kad ir paprastas sprendimas, kai vartotojai gali įkelti savo duomenis kaip PDF, Txt, Docx, XML dokumentus arba net visiškai sutrinkti interneto svetainės informaciją ir sukurti robotą pagal tos svetainės duomenis. Dabar yra daugybė programų, kurios atlieka lygiai tą patį.

Šiandien yra daug panašių programų, tačiau paplitusi klaidinga nuomonė, kad jos apima sudėtingus mašininio mokymosi metodus. Tiesa ta, kad dauguma šių programų remiasi paprasta technika, vadinama greita inžinerija „Embedding”. Tikslus derinimas „Fine tuning” yra dar vienas metodas, naudojamas kai kuriems konkretiems domenams skirtose programose.

Šiame straipsnyje išnagrinėsime, kaip dauguma šių programų, naudoja greitą inžineriją „Embedding”. Norėdami parodyti šios technologijos paprastumą, pažvelkime į „ChatGPT“ veikimą.

Atminkite, kad „ChatGPT“ veikia neprisijungus prie interneto, jis neturi interneto prieigos ir yra apmokytas naudoti ribotą duomenų rinkinį. Tai reiškia, kad jis nežino apie naujausius įvykius. Pavyzdžiui, jei klausiame ChatGPT:

Dėkojame, kad skaitėte „Arindam’s Substack“! Prenumeruokite nemokamai, kad gautumėte naujų pranešimų ir paremtumėte mano darbą.

„Ar Lionelis Messi laimėjo pasaulio futbolo taurę“ per „ChatGPT“.

Klausimas Mesi

„ChatGPT“ informuos mus, kad Messi nelaimėjo Pasaulio taurės, nes tik iki 2022 m. vidurio buvo mokomasi dėl duomenų. Tačiau galime atnaujinti ChatGPT naujausiais įvykiais, pateikdami jam informaciją iš šaltinio, pvz., Vikipedijos. EimeVikipedijos 2022 m. pasaulio taurės puslapis, nukopijuokite pirmąjį skyrių ir naudokite toliau pateiktą raginimą ChatGPT.

Laimejo taure

Turėdamas atnaujintą informaciją, „ChatGPT“ dabar gali teisingai atsakyti į klausimą. Taip iš tikrųjų veikia beveik 90 % programų, teigiančių, kad ChatGPT moka naudotis privačiais duomenimis. Iš esmės šios programos apibendrina ir prašo ChatGPT rasti atsakymus iš konkretaus konteksto.

Nors tai gali atrodyti paprasta, tai ne visada paprasta. Messi pavyzdyje žinojome, kokią informaciją pateikti „ChatGPT“, tačiau taip būna ne visada. Čia praverčia koncepcija, vadinama įterpimais „Embeddings”.

Tarkime, kad vadovaujate verslui, kuriame yra tūkstančiai dokumentų, pagrįstų savo duomenimis. Kai vartotojas užduoda klausimą, turite pateikti ChatGPT duomenis, kuriuose gali būti atsakymas. Tačiau „ChatGPT“ turi ribotą žetonų skaičių (maždaug 3 800–4 500 žodžių), kuriuos jis gali apdoroti vienu užklausimu. Kuo daugiau informacijos apdorojama tuo paslauga yra brangesnė. Nėra galimybės sutalpinti tūkstančių dokumentų į vieną užklausimą, todėl turite strategiškai žiūrėti į pateikiamą informaciją. Čia įterpimai gali būti naudingi. Taigi dabar darbo eiga tampa:

Embedding veikimas

Kol kas galvokime apie įterpimus kaip į galingą AI pagrįstą paieškos įrankį, galintį ieškoti ne tik pagal raktinius žodžius, bet ir pagal pagrindinį žodžių tikslą. Taikydami šį metodą galite efektyviai rasti reikiamą informaciją, kad galėtumėte pateikti „ChatGPT“ ir generuoti tikslius atsakymus į vartotojų užklausas.

Taigi, kodėl įmonės teigia, kad apmoko jūsų duomenis?

Paprastas atsakymas yra tas, kad dažnai lengviau perteikti idėją galutiniam vartotojui, suformulavus ją kaip „apmokinimą jūsų duomenimis“. Šis trumpas paaiškinimas gali padėti netechniniams vartotojams suvokti idėją, nesigilinant į inžinerijos, įterpimo ar kitų techninių proceso aspektų sudėtingumą.

Iš tikrųjų šios programos efektyviai pritaiko „ChatGPT“ patirtį, įtraukdamos į pokalbį atitinkamą informaciją iš vartotojo duomenų. Tai leidžia AI generuoti tikslesnius ir konkrečias aplinkybes atitinkančius atsakymus. Nors tai gali neaprėpti tikrojo mašininio mokymosi mokymo, jis pagerina AI galimybes tvarkant unikalius duomenų rinkinius.

Naudodamos labiau prieinamą paaiškinimą, įmonės gali pritraukti platesnę auditoriją ir padėti vartotojams suprasti savo produktų vertę, neapsunkindamos jų techniniu žargonu. Tikslas yra sukurti patrauklią vartotojo patirtį ir parodyti technologijos efektyvumą neapkraunant vartotojų sudėtingomis detalėmis, kurios gali būti nereikalingos norint suprasti ar naudoti produktą.

Tačiau, nors operatyvios inžinerijos naudojimas norint išgauti informaciją iš dokumentų ir statinio teksto yra galinga galimybė savaime, tai tik pradžia to, ką galima pasiekti. Greitos inžinerijos universalumas suteikia daugybę galimybių, įskaitant API iškvietimą, sąveiką su žiniatinklio naršyklėmis, darbą su terminalu ir daug daugiau.


Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *