Çfarë ndodh kur Inteligjenca Artificiale lexon gjithçka?

Nga Ross Andersen

Inteligjenca Artificiale (AI) është treguar vitet e fundit si një makineri studimi shumë e shpejtë, edhe po edukohet në një mënyrë të tillë që do të turpëronte edhe studiuesit më të aftë. Të mbyllur për muaj të tërë në bibliotekat borgesiane, pa asnjë ndërprerje, Inteligjenca Artificiale urdhërohet të mësohet gjithçka mbi kulturën njerëzore.

Dhe kur AI dalin nga këto sesione studimi, ato zotërojnë aftësi të reja mahnitëse. Edhe njerëzit me mendjet më të zhdërvjellëta nga ana gjuhësore – hiperpoliglotët – do të mbeten prapa. Sepse tani Inteligjenca Artificiale mund të përkthejë në kohë reale në më shumë se 100 gjuhë.

Ajo mund të krijojnë shkrime me një sërë stilesh letrare dhe të shkruajë poezi të pranueshme me rimë. Platformat “Ithaca” dhe “DeepMind”, mund të analizojnë shkronjat greke të gdhendura në mermer dhe të hamendësojë tekstin që ka qenë shkruar dhe që është shkatërruar nga vandalët mijëra vjet më parë.

Këto suksese sugjerojnë një rrugë premtuese përpara për zhvillimin e AI: Mjafton që të futni në të sasi gjithnjë e më të mëdha teksti të krijuar nga njeriu dhe të prisni që të shfaqen aftësitë e reja të mrekullueshme. Me të dhënat të mjaftueshme, kjo qasje mund të gjenerojë një inteligjencë më të rrjedhshme, apo një mendje njerëzore artificiale, e ngjashme me ato që parashikojnë thuajse të gjitha mitologjitë tona të së ardhmes.

Problemi është, se ashtu si produktet e tjera kulturore njerëzore të nivelit të lartë, proza e nivelit të lartë renditet ndër gjërat më të vështira për t’u prodhuar. Sepse ajo nuk është e disponueshme me shumicë, dhe për AI, asnjë tekst i vjetër nuk do të funksionojë: Modelet e dimensioneve të mëdha të aplikuara për libra janë shkrimtarë shumë më të mirë se ata që janë stërvitur duke bërë postime të pafundme në mediat sociale. (Në këtë kontekst, është më mirë të mos mendosh për zakonin e dikujt në Twitter.)

Kur llogarisim se sa fjali të mirë–ndërtuara mbeten që AI të gëlltisë, numrat nuk janë inkurajues. Një ekip studiuesish të udhëhequr nga Pablo Villalobos në “Epoch AI” parashikoi kohët e fundit se programe si ChatGPT do të arrijnë të shkruajnë materiale me cilësi të lartë brenda vitit 2027.

Por pa një tekst të ri për t’u trajnuar, brezi i AI mund të pësojë një fund të parakohshëm. Këtu vlen të theksohet se vetëm një pjesë e vogël e krijimtarisë së përgjithshme gjuhësore të njerëzimit është në dispozicion për t’u lexuar. Kanë kaluar më shumë se 100.000 vjet që kur afrikanët krijues, e tejkaluan fazën e britmave emocionale të paraardhësve tanë kafshë, duke nisur t’i përkthejnë mendimet e tyre në sisteme të gjera tingujsh.

Çdo koncept i shprehur në ato protogjuhë – dhe shumë gjuhë që pasuan – ka të ngjarë të humbasë përgjithmonë, megjithëse unë kënaqem kur e imagjinoj se disa nga fjalët e tyre janë ende me ne. Tek e fundit, disa fjalë angleze kanë një orgjinë të lashtë:flow, mother, fire dhe ash (rrjedha, nënë, zjarr, hi) kanë ardhur tek në nga popujt e Epokës së Akullit.

Shkrimi i ka dhënë mundësi qenieve njerëzore të kapin dhe ruajnë shumë më tepër nga fjalët tona. Por ashtu si shumica e teknologjive të reja, në fillim shkrimi ishte i kushtueshëm, dhe kjo është arsyeja pse fillimisht u përdor kryesisht për mbajtjen e llogarive ekonomike.

Sepse kërkohej kohë për të pjekur dhe lagur argjilën për të shkruar më pas mbi të, për të prerë papirusin në shirita të përshtatshëm për t’u lidhur me rrjetë, për të strehuar dhe ushqyer murgjit që kopjonin tekste të ndryshme etj.

Këto teknika që kërkonin shumë burime, mund të ruanin vetëm një mostër të vogël të prodhimit kulturor të njerëzimit. Derisa shtypshkronja filluan të botojnë libra në masë, një shenjë se kujtesa jonë kolektive tekstuale arriti një shkallë industriale. Studiuesit në Google Books vlerësojnë se që nga koha e Gutenberg, njerëzit kanë botuar më shumë se 125 milionë tituj librash, duke mbledhur ligje, poema, mite, ese, histori, traktate dhe romane.

Ekipi “Epoch” vlerëson se 10-30 milion prej këtyre librave janë dixhitalizuar tashmë, duke i dhënë mundësi AI-së të lexojë qindra miliarda në mos edhe më shumë se 1 trilion fjalë. Këto shifra mund të duken mbresëlënëse, por janë brenda normës së 500 miliardë fjalëve që trajnuan modelin që mbështet funksionimin e ChatGPT. Pasardhësi i tij, GPT-4, mund të stërvitet të mësojë dhjetëra triliona fjalë.

Ka zëra se kur GPT-4 të nisë punën brenda këtij viti, do të jetë në gjendje të gjenerojë një roman me 60.000 fjalë vetëm me një kërkesë. Dhjetë trilion fjalë janë të mjaftueshme për të përfshirë në të të gjithë librat e dixhitalizuar të njerëzimit, të gjitha punimet tona shkencore të dixhitalizuara dhe pjesën më të madhe të blogosferës.

Kjo nuk do të thotë se GPT-4 do ta ketë lexuar të gjithë atë material, vetëm se realizimi i kësaj është brenda mundësive të tij teknike. Por vetëm sepse AI do të jetë në gjendje shumë shpejt të lexojë të gjithë librat tanë, nuk do të thotë se mund të arrijnë të analizojë të gjithë tekstet që prodhojmë.

Kapaciteti i ruajtjes i internetit, është i një rendi krejtësisht të ndryshëm dhe është një teknologji shumë më demokratike e ruajtjes së kulturës sesa botimi i librave. Çdo vit, miliarda njerëz shkruajnë fjali që janë të grumbulluara në bazat e të dhënave të saj, me shumicën të zotëruara nga platformat e mediave sociale.

Në përgjithësi, teksti i rastësishëm i marrë nga interneti nuk krijon të dhëna të mira trajnimi. Artikujt e Wikipedia-s janë një përjashtim i dukshëm. Por ndoshta algoritmet e ardhshme do ta lejojnë AI-të do të arrijnë të dekodojnë kuptimin e postimeve tona në Twitter, Instagram dhe statuset në Facebook.

Por këto burime me cilësi të ulët nuk do të jenë të pashtershme. Sipas Villalobos, brenda pak dekadash, inteligjenca artificiale e leximit të shpejtë, do të jetë mjaft e fuqishme për të përvetësuar qindra triliona fjalë, duke përfshirë të gjitha ato që qeniet njerëzore ka futur deri më sot në rrjet.

AI mund të njohë fytyrën tuaj pas një maske apo të dallojë tumore që janë të padukshme për syrin e radiologut. Po ashtu, inteligjenca artificiale e trajnuar me fotot specifike ka nisur të zhvillojnë një imagjinatë vizuale. DALL-E 2 i OpenAI u trajnua mbi 650 milionë imazhe, secila e çiftuar me një tekst të shkurtër.

DALL-E 2 ka parë gjurmët e dorës që kanë lënë njerëzit e Epokës Paleolitit. Ai mund të imitojë stilet e ndryshme të penelit të mjeshtrave të Rilindjes. Mund të krijojë makro- foto realiste të hibrideve të çuditshme të kafshëve.

Sidoqoftë, nëse inteligjenca artificiale jonë e mbushur me të dhëna do t’ia kalojë një ditë njohjes njerëzore, neve do të na duhet ta ngushëllojmë veten me faktin se ato janë krijuar sipas imazhit tonë. AI nuk janë alienë. Ata nuk janë tjetri ekzotik. Ata janë një pjesë prej nesh dhe janë nga këtu. Ata kanë vështruar peizazhet e Tokës. Kanë parë miliarda herë Diellin duke perënduar. I dinë historitë tona më të vjetra. Përdorin emrat tanë për yjet. Ndër fjalët e para që mësojnë janë rrjedhë, nënë, zjarr dhe hi. / Marrë me shkurtime nga The Atlantic – Bota.al

02/03/2023

5 minutes read