Adatok, tweetek és vírusvideók

2016.09.28.
Adatok, tweetek és vírusvideók
„Az atomoktól a csillagokig” ismeretterjesztő sorozat idei második alkalmán 2016. szeptember 22-én Vattay Gábor, az ELTE TTK Komplex Rendszerek Fizikája Tanszék tanszékvezető egyetemi tanára tartott előadást „Szociális hálózatok, virális videók meg minden” címmel.

Vattay Gábor előadása elején Enrico Fermi szállóigévé vált mondatára hivatkozva – „A fizika az, amivel a fizikus késő este foglalkozik” – feltette a kérdést, vajon a  szociális hálózatok kutatása sorolható-e a természettudományok, ezen belül is a fizika körébe? A válasz egyértelműen igen, hiszen az utóbbi évtizedekben a szociológia, amelyet kezdetben a bölcsész- és társadalomtudományok részeként tartottak számon, módszertana miatt ma már a természettudományok közé is tartozik. A lassú adatgyűjtés évszázados hagyományát az internet-korszak információrobbanásának köszönhetően felváltotta a virtuális térben hagyott nyomok összegyűjtése és elemzése. Ezek a nyomok bizonyos közösségi portálokon könnyen és nagy mennyiségben kutathatók, a vizsgálat spektruma pedig a felhasználók milliós száma miatt sokkal szélesebbé vált, mint korábban. A kutatók feladata pedig az, hogy az összegyűjtött adatok alapján feltegyék a jó kérdést, melyre – előzetes kérdőívek hiányában – maguk az adatok válaszolnak. A kutatások során matematikai modellek számítógépes szimulációjával bizonyítható vagy épp cáfolható eredmények keletkeznek, melyek hasonlóan a fizika módszertanához, a szociológiában is tesztelhető végeredményekhez vezetnek.

A Föld különböző pontjain a közösségi oldalakra (Facebook, Skype, Twitter, Instagram, thumblr, Google+ és ezek kínai megfelelői) mobilokról és számítógépekről érkező adatok kirajzolják a világ geoszociális térképét. Vattay Gábor számos grafikával illusztrálta a közösségi oldalakat használók számának növekedését 2010 és 2016 között: a statisztikák alapján évente egymilliárd új felhasználóval gyarapodott a legnépszerűbb közösségi oldalak usereinek száma.

Az egyes közösségi oldalak különböző szabályozási rendszere más és más, a kutatók számára a Twitter az, ami elérhetővé teszi adatai egy részét, ha azokat tudományos célra vagy alkalmazások fejlesztésére használják fel. A napi adatok – ami az USA-ban naponta közel félmilliárd tweetet jelent 320 millió felhasználótól – 1%-át teszik ingyenesen hozzáférhetővé. Vattay Gábor és az ELTE-s kutatócsoport 2012 óra gyűjti az adatokat egy olyan adatbázisban, ahol ezek a tartalmak visszakereshetők és utólag is elemezhetők.

Az elmúlt évek során több mint négymilliárd tweetet gyűjtöttek össze, melyek közül 1,6 milliárd pontos GPS-koordináták alapján lokalizálható, a 122 millió aktív felhasználó között mindegy 6 millió kapcsolódási pont (csúcs) mutatható ki.

Az adatokat ezt követően a Milgram-féle hány lépés távolságra vannak egymástól az emberek a Földön kísérletre alapozva vizsgálták meg. Míg az 1967-es kísérlet eredményei azt mutatták, hogy átlagosan A-ból B-be, azaz Kansasből Bostonba 6 lépés alatt jut el egy csomag, addig az internet korszakban ez drasztikusan megsokszorozódik. Habár a vezető kísérlet algoritmusa mindvégig ugyanaz volt, az információ mégis más formában érkezett meg: a korábbiaktól eltérően 1-2 lépés alatt eljutott Bostonba, azonban ott a felhasználók magas száma miatt ide-oda vándorolt, és szinte ugyanannyi alkalommal nem talált célba, mint az évtizedekkel korábban végrehajtott kísérlet alkalmával.

A terjedési jelenségek vizsgálatának következő állomása a vírusvideók szociális hálózatokon való mozgásának elemzése volt. Vattay Gábor a közösségi oldalakat alig pár nap alatt elárasztó, híres-hírhedt videó, PSY Gangnam Style című videóklipjének terjedési sajátosságait mutatta be az összegyűjtött Twitter-adatok alapján.  

A Gangnam-pandémia – hasonlóan a járványszerű fertőzések működéséhez – világviszonylatban szinte pillanatok alatt lepte el az internetet. A videó Dél-Korából indult, majd Dél-Kelet-Ázsiából a Fülöp-szigetekről érkező, de Nagy-Britanniában élő vendégmunkásoknak köszönhetően Európában is elterjedt. A tengerentúlon pedig a robbanásszerű terjedését az váltotta ki, amikor a mai napig a legtöbb Twitter-követővel rendelkező Katy Perry amerikai énekesnő megosztotta saját oldalán.

Egy másik érdekes kutatás, melyről Vattay Gábor előadása során szó esett, szintén a Twitter-felhasználók posztjait vizsgálja. A begyűjtött adatok alapján különböző társadalmi csoportok rajzolódnak ki az USA területén, melyekre pusztán az adott felhasználó tweetjeiben használt szavakból lehet következtetni. Ezek alapján pontosan lokalizálhatók az Egyesült Államok afro- vagy latin-amerikai többségű területei, vagy épp azok az országrészek, ahol nagyobb arányban élnek munkanélküliek.

Vattay Gábor előadását a kreatív destrukció gazdaságra tett hatását szemléltette néhány példával: Joseph Schumpeter a fogalmat első alkalommal a robbanómotor gazdaságra gyakorolt hatásának vizsgálatakor alkalmazta. A fogalom tulajdonképpen arra világít rá, hogy egy adott fejlesztés milyen hatást gyakorol az iparra: habár megszületésével sok korábbi iparág megszűnik, mégis ugyanennyi vagy még több születését is elősegíti. Ez többe esetben komplett, korábban sikeres és rendkívül nyereséges vállalatok megszűnését is jelentheti: többek között ilyen volt a digitális fényképek megjelenésekor a Kodak, vagy a bakelitek, kazetták és CD-lemezek kvázi eltűnésekor csődbe ment számos nagy amerikai lemezforgalmazó cég. Ez a tendencia pedig Vattay Gábor szerint arra világít rá, hogy az atomok helyét a fizikában is egyre inkább átveszi az adatok, melyek az atomokkal ellentétben gyakorlatilag korlátlan tárhelyet biztosítanak.

Az atomoktól a csillagokig következő előadását 2016. október 6-án Pásztor Gabriella tartja „Új Fizika: az ismeretlen nyomában a Nagy Hadronütköztetővel" címmel.