Një algoritëm për të kontrolluar besueshmërinë e postimeve në rrjetet sociale

Nga Metju Hatson

Përballë përhapjes së thashethemeve që bëhen virale në rrjetet sociale, një grup studiuesish ka zhvilluar së fundmi një algoritëm në bazë të fjalëve të përdorura në mesazhet e Tuiterit, që është në gjendje të vlerësojë me një përafërsi të madhe besueshmërinë e asaj që thuhet. I zbatuar në mediat sociale, ky algoritëm mund të paralajmërojë përdoruesit mbi besueshmërinë e ulët të një postimi, përpara se ai të përhapet më tej.

Sipas një studimi të kryer në vitin 2016 nga Qendra “Peë Research”, 62 përqind e amerikanëve i lexojnë lajmet në mediat sociale. Kjo statistikë ndihmon në shpjegimin e gjithëpranisë së lajmeve të rreme:kur informacionet udhëtojnë nëpër rrjetet sociale, filtrat editorialë normalë nuk kanë asnjë mundësi për të ndarë postimet serioze nga ato të gënjeshtërta.

Zhvillimi i mjeteve që do të ndihmojnë ndalimin e përhapjes së gënjeshtrave dhe thashethemeve në rrjetet sociale, do të kërkojë bashkëpunimin e ekspertëve të informatikës, gjuhëtarëve, psikologëve dhe sociologëve. Një studim i ri, që do të prezantohet gjatë këtij muaji, ka analizuar miliona postime në Tuiter, duke zbuluar fjalët dhe frazat që konsiderohen më të besueshme.

Tanushree Mitra, eksperte në shkencat kompjuterike në Georgia Institute of Technology dhe autorja kryesore e studimit, thotë se është e interesuar për këtë problem prej vitit 201 kur u vra Osama bin Laden dhe qarkulluan mesazhe të shumta në lidhje me pikëpyetjen nëse ai kishte vdekur vërtet apo jo. Shumë persona e dëgjuan për herë të parë lajmin e vrasjes së ish-liderit të Al-Kaedës në Tuiter.

“Në mediat sociale, lloji i lajmeve të minutës së fundit lidhet me spekullimet që qarkullojnë për një kohë të gjatë, para se lajmi të mbërrijë tek mjetet tradicionale të informimit”- thotë Mitra. Ajo dhe bashkëpunëtorët e saj në institut ,u përpoqën të zhvillojnë sisteme të automatizuara për të vlerësuar nëse ngjarjet kanë ndodhur realisht, bazuar vetëm tek mënyra sesi njerëzit janë duke folur në lidhje me të. Këto mjete mund të ndihmojnë në zbulimin e thashethemeve, para se të përhapen gjerësisht.

Hulumtuesit ndërtuan një bazë të dhënash me 1377 ngjarje të ndodhura ndërmjet tetorit 2014 dhe shkurtit 2015, dhe postimeve në Tuiter të lidhura me to. Për t’i caktuar një vlerësim “besueshmërie” çdo ngjarje, pjesëmarrësit në studim lexuan disa postime, dhe bazuar tek

ajo që dinin apo kërkimi on-line, vlerësuan “korrektësinë” e ngjarjes së raportuar.

Në varësi të përqindjes së njerëzve që i klasifikonin ngjarjet si “qartësisht të sakta”, ato ndaheshin në 4 kategori:të një besueshmërie maksimale, besueshmërie të lartë, besueshmërie të moderuar dhe mungesës së besueshmërisë. Ngjarjet që zor se besoheshin, përfshinin një lojtar futbolli që vdiq pas një përplasje veçanërisht të ashpër në fushë, dhe policia që hidhte piper mbi turmën. (Vlerësimet e saktësisë nuk qenë të përsosura, pasi policia në fakt kishte përdorur piper ndaj turmës)

Hulumtuesit analizuan më pas 66 milionë mesazhe në Tuiter në lidhje me ngjarjet, në kërkim të korrelacioneve ndërmjet rezultateve të besueshmërisë dhe disa karakteristikave, si fjalët që shprehnin pasiguri apo emocion. Në studim, që ende nuk është publikuar, renditen disa të dhëna të dobishme:ngjarjet e ”besueshme” kishin më shumë të ngjarë të përshkruheshin në rrjetin social me terma si ‘me sa duket, sipas, supozohet se…’ ndërsa ngjarjet e “pabesueshme” shoqëroheshin me terma të tjera si’ kjo tregon se, në një farë mase, ka dyshime se….’.

Disa nga nga “barometrat” më të mirë ishin fjalët që shprehnin një gjykim:i gjallë, unik dhe kompleks, lejonin të parashikokohej një besueshmërie lartë, ndërsa termat ‘hetim, tmerr dhe mungesë’ sugjeronin një mungesë të besueshmërisë. Përtej fjalëve të veçanta, citatet e gjata në ripostimet sugjeronin një mungesë besueshmërie, ndoshta edhe për shkak se ata që ripublikonin mesazhet e një tjetri, hezitonin të merrnin përsipër përgjegjësinë e atij lajmi.

Studiuesit testuan edhe aftësinë e modelit të tyre për të parashikuar besueshmërinë e një ngjarje, duke kombinuar tregues si ato të përmendur më lart. Nëse algoritmi procedonte mënyrë të rastësishme, do të jepte përgjigjen e duhur në 25 përqind të kohës; nëse do të gjente përherë rastet e “besueshmërisë së lartë” – kategoria me numrin më të madh të ngjarjeve – do të ishte i drejtë në 32 përqind të herëve.

Por algoritmi funksionoi shumë më mirë se kaq, duke arritur një saktësi prej 43 përqind. Nëse algoritmit i caktohet gjysmë pik,e kur ndarja qe shtë thjesht paksa e gabuar (për shembull, duke i dhënë ”besueshmëri maksimale” një ngjarjeje me “besueshmëri të lartë”), saktësia e algoritmit arrinte në 65 përqind.

Studiuesit shpresojnë të përmirësojnë performancën, duke kombinuar shprehjet gjuhësore me elemente të tillë si autori i mesazhit apo linqet e cituara. Në një punë paraprake, Mitra ka vërtetuar se historitë që vijnë nga një person, priren të kenë një besueshmëri të ulët. Hulumtuesit e cilësojnë modelin e tyre një lloj “syri paraprak”, që do të tërheqë vëmendjen e gazetarëve dhe fakt-shqyertuesve që mundet t’u interesojë për t’u marrë me të, apo për t’i përgënjeshtruar ato.

Marrë me shkurtime nga “Scientific American” – www.bota.al

24/02/2017

3 minutes read

Leave a Reply Cancel reply

Related Articles

Në kërkim të Ekuacionit të Zotit

Jemi kaq rastësorë …

Shakatë e kujtesës

Lodhje mendore? Ja se çfarë ndodh në tru