Pse inteligjenca artificiale kineze ka mahnitur botën

Pse inteligjenca artificiale kineze ka mahnitur botën

Foto ilustruese

Modeli i parë i arsyetimit në botë, një formë e avancuar e inteligjencës artificiale, u publikua në shtator nga OpenAI, një firmë amerikane. o1, siç quhet, përdor një “zinxhir mendimi” për t’iu përgjigjur pyetjeve të vështira në shkencë dhe matematikë, duke zbërthyer problemet në hapat e tyre përbërës dhe duke testuar qasje të ndryshme, se t’i paraqesë një përfundim përdoruesit. Zbulimi i saj nisi një garë për të kopjuar këtë metodë. Google doli me një model arsyetimi të quajtur “Gemini Flash Thinking” në dhjetor. OpenAI u përgjigj me o3, një përditësim të o1, disa ditë më vonë.

Por Google, me të gjitha burimet e saj, nuk ishte në fakt firma e parë që imitoi OpenAI. Më pak se tre muaj pasi u publikua o1, Alibaba, gjigandi kinez i tregtisë elektronike, lëshoi një version të ri të chatbot-it të tij Qwen, QwQ, me të njëjtat aftësi “arsyetimi”. “Çfarë do të thotë të mendosh, të pyesësh, të kuptosh?” kompania pyeti në një postim. Një tjetër firmë kineze, DeepSeek, kishte publikuar një version të një modeli arsyetimi, të quajtur R1, një javë më parë. Pavarësisht përpjekjeve të qeverisë amerikane, për të frenuar industrinë e inteligjencës artificiale të Kinës, dy firma kineze kishin reduktuar avantazhin teknologjik të homologëve të tyre amerikanë në disa javë.

Firmat kineze nuk janë të vetmet në zhvillimin e modeleve të arsyetimit: në dhjetor, DeepSeek publikoi një model të ri të madh gjuhësor (LLM), një formë e IA, që analizon dhe gjeneron tekst. v3 ishte pothuajse 700 gigabajt, shumë i madh për t’u ekzekutuar në çdo gjë, përveç pajisjeve të specializuara, dhe kishte 685 miliardë parametra, parime individuale që kombinohen për të formuar rrjetin e modelit. Kjo e bëri atë më të madh se çdo gjë e publikuar më parë për t’u shkarkuar falas. Llama 3.1 LLM e Meta, e cila u publikua në korrik, ka vetëm 405 miliardë parametra.

LLM i DeepSeek nuk është vetëm më i madh se shumë nga homologët e tij perëndimorë – ai është gjithashtu më i mirë, i krahasuar vetëm me modelet e Google dhe OpenAI. Paul Gauthier, themeluesi i Aider, një platformë kodimi IA, drejtoi modelin e ri DeepSeek përmes standardit të tij të kodimit dhe zbuloi se ai i tejkaloi të gjithë rivalët e tij, përveç vetë o1.

Inteligjenca artificiale kineze është tani aq afër në cilësi me rivalët e saj amerikanë, saqë drejtuesi i OpenAI, Sam Altman, u ndje i detyruar të shpjegonte ngushtësinë e hendekut. Menjëherë pasi DeepSeek publikoi v3, ai shkroi në Twitter: “Është (relativisht) e lehtë të kopjosh diçka, që e di se funksionon. Është jashtëzakonisht e vështirë të bësh diçka të re, të rrezikshme dhe të vështirë, kur nuk e di nëse do të funksionojë.”

Industria e inteligjencës artificiale të Kinës, fillimisht ishte shfaqur ‘e dorës së dytë’. Kjo mund të jetë pjesërisht sepse i është dashur të përballet me sanksionet amerikane. Në vitin 2022 Amerika ndaloi eksportin e çipave të avancuar në Kinë. Nvidia, një prodhuesi kryesor i çipave, i është dashur të hartojë ulje të veçanta për produktet e saj për tregun kinez. Amerika ka kërkuar gjithashtu të parandalojë Kinën, që të zhvillojë kapacitetin për të prodhuar çipa më të mirë brenda kufirit, duke ndaluar eksportet e pajisjeve të nevojshme dhe duke kërcënuar me ndëshkime për firmat jo-amerikane, që mund të ndihmojnë.

Një pengesë tjetër është zhvillimi brenda kufirit. Firmat kineze erdhën me vonesë në LLM, pjesërisht për shkak të shqetësimeve rregullatore. Ata shqetësoheshin se si censuruesit do të reagonin ndaj modeleve, që mund të japin informacion të pasaktë ose – më keq – të dilnin me deklarata politikisht të rrezikshme. Gjigandi i kërkimit Baidu, kishte eksperimentuar me LLM për vite me rradhë dhe kishte krijuar një të quajtur “ERNIE”, por hezitoi ta vintë në përdorim atë për publikun.

Gjigantët e tjerë të internetit të Kinës, përfshirë Tencent dhe Huawei, po ndërtojnë modelet e tyre. Por DeepSeek ka origjinë të ndryshme. Nuk ekzistonte as kur Alibaba nxori modelin e parë Qwen. Ai rrjedh nga High-Flyer, një fond mbrojtës i krijuar në 2015 për të përdorur IA, për të fituar një avantazh në tregtimin e aksioneve. Kryerja e kërkimeve themelore ndihmoi High-Flyer të bëhej një nga fondet sasiore më të mëdha në vend.

Ashtu si OpenAI, DeepSeek premtoi të zhvillonte IA për të mirën publike. Kompania do të bëjë publike shumicën e rezultateve të saj të trajnimit, në përpjekje për të parandaluar “monopolizimin” e teknologjisë nga vetëm disa individë ose firma. Ndryshe nga OpenAI, i cili u detyrua të kërkonte fonde private për të mbuluar kostot e larta të trajnimit, DeepSeek ka pasur gjithmonë akses në rezervat e mëdha të fuqisë kompjuterike të High-Flyer.

Jo vetëm, që modeli ishte krijuar me çmim të lirë, por edhe funksionimi i tij kushton më pak. DeepSeek i ndan detyrat mbi çipa të shumtë në mënyrë më efikase se kolegët e tij dhe fillon hapin tjetër të një procesi, përpara se të përfundojë ai i mëparshmi. Kjo e lejon atë të mbajë çipat të punojnë me kapacitet të plotë me pak tepricë.

Kërkimi i DeepSeek për efikasitet nuk ka ndalur këtu. Këtë javë, edhe pse publikoi R1 të plotë, kompania publikoi gjithashtu një grup variantesh më të vogla, më të lira dhe më të shpejta, të cilat janë pothuajse po aq të fuqishme sa modeli më i madh.

Alibaba dhe DeepSeek sfidojnë laboratorët më të avancuar perëndimorë edhe në një mënyrë tjetër. Ndryshe nga OpenAI dhe Google, laboratorët kinezë ndjekin drejtimin e Meta dhe i bëjnë sistemet e tyre të disponueshme nën një licencë me burim të hapur. Nëse dëshironi të shkarkoni një Qwen AI dhe të ndërtoni programimin tuaj, mundeni—nuk nevojitet leje specifike.

Jo vetëm anë pozitive

Puna në Kinë ka edhe anët e saj negative. Pyete DeepSeek v3 për Tajvanin, për shembull, dhe modelja me gëzim fillon të shpjegojë se është një ishull në Azinë Lindore “i njohur zyrtarisht si Republika e Kinës”. Por, pasi të ketë kompozuar disa fjali në këto rreshta, ai ndalet, fshin përgjigjen e tij fillestare dhe në vend të kësaj sugjeron shkurt: “Le të flasim për diçka tjetër”.

Laboratorët kinezë janë më transparentë se qeveria e tyre, pjesërisht sepse duan të krijojnë një ekosistem firmash të përqendruar në IA-n e tyre. Kjo ka njëfarë vlere komerciale, në atë që kompanitë, që ndërtojnë mbi modelet me burim të hapur, mund të binden përfundimisht të blejnë produkte ose shërbime nga krijuesit e tyre. Ajo gjithashtu sjell një përfitim strategjik për Kinën, në atë që krijon aleatë në konfliktin e saj me Amerikën mbi IA.

Kjo nuk do të thotë domosdoshmërisht se modelet kineze do të pushtojnë botën. Inteligjenca artificiale amerikane ka ende aftësi, që rivalët e saj kinezë nuk mund t’i përballojnë ende.

Më shumë risi janë në zhvillim, sipas Sam Altman, i cili pritet të njoftojë së shpejti se OpenAI ka ndërtuar “super-agjentë të nivelit të doktoraturës”, të cilët janë po aq të aftë sa ekspertët njerëzorë, për një sërë detyrash intelektuale. / The Economist

SI.E./Shqiptarja.com
Komento

KUJDES! Nuk do të publikohen komente që përmbajnë fjalë të pista, ofendime personale apo etiketime mbi baza fetare, krahinore, seksuale apo që shpërndajnë urrejtje. Në rast shkelje të rëndë të etikës, moderatorët e portalit mund të vendosin të bllokojnë autorin e komentit, të cilit do t'i ndalohet nga ai moment të komentojë te Shqiptarja.com

Komente

  • Sondazhi i ditës: 29 Janar, 13:14

    Strategjia e SPAK për parandalimin e krimit elektoral, a do ketë sukses?



×

Lajmi i fundit

DETAJE nga operacioni/ Dy të arrestuarit ndiqeshin prej një muaji, Metaj i proceduar për pengmarrje më 2013 dhe dhunë në familje e kanosje më 2020-2021

DETAJE nga operacioni/ Dy të arrestuarit ndiqeshin prej një muaji, Metaj i proceduar për pengmarrje më 2013 dhe dhunë në familje e kanosje më 2020-2021