Nyelv, mesterséges intelligencia, na meg felsőtest strandszezon utánra

nyelvek_kulturakTöbbször érintettük azt a témát, hogy a keresés hogyan változtatott meg minden területen mindent, ahol információ előfordul: azaz mindenhol. Hamarosan elmagyarázzuk azokat az algoritmusokat, amikről gyakorlatilag sosem esik szó, amikor egy rendezvényen valaki a big data, data science, legújabban pedig az artifical intelligence buzzwordköket zúdítja ránk egy előadás keretében félpercenként. Előtte viszont hozunk példát a keresés olyan típusú alkalmazására és annak hátterére, amilyennel eddig még kevésbé foglalkoztunk.

Konkrét példaként vegyünk egy minden férfi képzeletét megmozgató valamit, amire  példánkban “kétségbeesetten” keresni fogunk. Igen, a férfi felsőtest fényképét deltássá változtató fotómanipuláló appról van szó! Találjuk meg a legjobbat ebből!

Világos, hogy a nagy-nagy keresőmotorok már értelmezik, amit olvasnak a weben, ahogyan az is, hogy ez az egyik, ami lehetővé teszi, hogy egy-egy teljesen emberszerűen megfogalmazott kérdést a legpontosabban értelmezzen a kereső, sőt az keresési találatok által mutatott tartalmak igazságtartalma, tényszerűsége is lassan, de javul.

Mindegy, hogy egy mobileszközön mennyi alkalmazást telepítettünk, úgyis csak 6-8-at használunk napi rendszerességgel. Nem lennénk meglepve, ha a telepített, aztán ténylegesen használt alkalmazások használati gyakoriság szempontjából skálafüggetlen eloszlást mutatnának, azaz a legritkábban használt alkalmazásról már alighanem azt sem tudjuk, hogy mik is eredetileg, míg összesen egy maréknyi lenne, amit naponta használunk. Megint mások annyi alkalmazással tömik ki a tabletjüket és a mobiljukat, amennyi ráfér.

Amikor nem valamilyen konkrét alkalmazást szeretnénk letölteni, hanem egy igényre keresünk megoldást akár a Google Play-ben, akár az App Store-ban, mindkettő keresője egész nagy pontossággal meg tudja jósolni, hogy mire van szükségünk, annak ellenére – itt jön a lényeg – hogy mobileszköznél máshogy, alapvetően rövidebben adjuk meg a keresőkifejezést, ami alapján a háttérben a keresés majd megtörténik. A kérdés, hogy hogyan?

Azzal most ne foglalkozzunk, hogy mindkét platformnak megvannak a lehetőségei arra, hogy személyre szabottan, nem csak a korábbi letöltéseink alapján tudja a jóslatot pontosítani, hogy minél inkább személyre szabott találatot adjon.

Igaz, hogy mindkettő keresőjében lehet szűrni kategória, értékelés, népszerűség szerint, ezek azok a lehetőségek, amikhez a felhasználóknak nem is nagyon kell nyúlniuk.

Lehetne rajta vitatkozni, de amikor alkalmazást keresünk, ez alapvetően nem más keresés, mint amikor a nekünk leginkább megfelelő tartalmat igyekszünk kiválasztani. Az a gondolat itt is megállja a helyét, hogy ha jó választ szeretnénk kapni, jobban kell kérdezni. Viszont minél többet szeretnénk tudni, annál jobb korábbi válaszokra van szükségünk. Azaz sokat szeretnél tudni? Tudj jól kérdezni! Jól akarsz kérdezni? Ahhoz sokat kell tudni.

Egyszerű kísérletet végeztünk azzal kapcsolatban, hogy az egyik alkalmazásbolt mennyire találja el, hogy milyen alkalmazásra lenne szükségünk olyan esetben, ha hasonló témával korábban még nem foglalkozunk. Még csak nem is olyannal kapcsolatban kerestünk alkalmazást, ami egzotikus ételek elkészítésének fortélyaival foglalkozik, azokkal kapcsolatban kínál recepteket. Belátható, hogy aligha van annyira specializált vagy elborult téma, amire már ne lenne mobilapp – értelmes alkalmazás persze már jóval kevesebb.

Most jön az a pont, amikor a szerző tudományos kísérletnek álcázza, hogy ő valójában tényleg ki szeretne tenni a Facebookra egy dögös, deltás felsőtestet önmagáról, de ez annyira ciki, hogy inkább ír egy hatalmas cikket, amivel elfedi az ilyen tíupsú appok  keresésének valódi motivációját. Ki az a marha, aki ilyen appot keres? Valaki más!

Tehát tételezzük fel, hogy valaki, azaz valaki egészen más bármilyen okból elhízott, túl vékony, vagy nemtől függetlenül nem elégedett valamilyen szempontból a kinézetével. A felvetés kellően komplex ahhoz, hogy ha a nagy és okos Google-be írjuk valamilyen világnyelven, azaz angolul vagy spanyolul,

“Mik azok az alkalmazások, amikkel vonzóbbá tehetem az alakom fotók manipulációjával?”

még ilyen esetben is égtelen mennyiségű testépítéssel kapcsolatos cikk jön ki, ami jelen példában irreleváns. Aztán sokadik találatként megjelenik egy cikk, ami azzal foglalkozik, hogy mik azok az alkalmazások, amikkel a legjobb ilyen irányú fotóhakkolás lehetésges anélkül, hogy érteni kellene a grafikához.

A Google Playben és az App Store-ban azokat a kulcsszavakat adjuk meg, amik a mi ismerethalmazunk, gondolkodásmódunk szerint a leginkább kifejezik az igényt, amire szüksége lenne valaki egészen másnak. Még ha valaki eléggé jól tud angolul, akkor sem biztos, hogy ebben a környezetben jól meg tudja fogni a lényeget, hogy minél több jó értékelést kapott, sokak által letöltött alkalmazást kapjon a találatok közt, és elfogadhatóan kevés olyan alkalmazás jelenjen meg, ami irreleváns vagy éppen használhatatlan.

Nem nehéz belátni, hogy mindkét alkalmazásboltnak olyan mértékben elemi érdeke, hogy a keresőjük valóban okoskereső legyen, hogy egyszerű keresés mellett nem sokáig maradnának talpon. Alighanem a háttérben az alkalmazásboltok keresői is értelmezik az alkalmazások leírását, figyelembe veszik a konkrét feedbackeken kívül azt is, hogy az alkalmazást a letöltés után mennyien törölték és így tovább.

izmosito_appok.PNG

Ezzel még nem jutottunk sokkal közelebb ahhoz, hogyan is keressünk, ha kimondottan olyan alkalmazásra van szüksége valaki másnak, amivel a leggyorsabban és legjobban pattinthatja ki magát egy fürdőgatyás fotón. A probléma tehát az, hogy nem tudunk kellően jó kérdést megfogalmazni, az pedig igencsak a jövő zenéjének tűnik, hogy még azt is nagyrészt a gépagy találja ki helyettünk, hogy mire vagyunk kíváncsiak.

Tehát ha valaki ilyen appokkal nem szokott vicceskedni, azt sem tudja, hogy hogyan fogalmazza meg a kérdést a legjobban. Több módszert is kipróbáltunk és megfigyeltük, hogy hogyan változik a találatok sorrendje és összetétele, bár azt nem, hogy ezek az alkalmazások mennyire alkalmasak arra, amire kitalálták őket, hisz nekünk nem kell ilyen, csak valaki másnak.

Az első gondolat, hogy naiv megközelítésben mik azoknak a kulcsszavaknak az angol nyelvű megfelelője, ami a legjobban passzolhatnak. Például

body editor

vagy éppen

gym body editor

Ezeket a teljesség igénye nélkül megnézve az editor elé nyilván nem kell odabökni, hogy photo editor, természetesnek vesszük, hogy ez azért a kereső tudja.

Így is kijön néhány találat, viszont nagyon sok olyan, ami konkrét edzésterveket kínál.

A teljesen laikus megközelítés megbukott, ha itt megtorpanunk. Noam Chomsky legyen a talpán, aki meg tudja mondani, hogy még ha a fogalomrendszerünk hasonló is, egy adott témával kapcsolatos gondolkodásmódunk nyelvtől és kultúrától függően eltérhet, azaz egy spanyol, kínai vagy ausztrál, angolul hasonlóan tudó felhasználók is ugyanezeket a keresőkifejezéseket dobálták volna-e be. Alighanem nem.

Pontosabban nyilván nem, a vitákat az képzi, hogy miért. Az elgondolás persze szigorúan hipotetikus, hiszen nincs három olyan felhasználókból álló minta – spanyol, kínai és ausztrál – akinek egy az egyben hasonló lenne a gondolkodása, és csak és kizárólag az anyanyelvükben és az idegennyelv használat terén térnének el.

A témára visszatérve a body editor és a gym body editor, szinte ad hoc kitalált keresőkifejezésekkel nem voltunk túl sikeresek, viszont ha találtunk akár egyetlen appot is, ami azt ígéri, hogy valaki másnak a sörhasát vagy gebe felsőtestét hatékonyan fotoshoppolja, már kattinthatunk is “You might also like”, “Similar apps” lehetőségekre, nyilván korábbról tudja a szolgáltatás, hogy az alkalmazás iránt érdeklődő felhasználók milyen más alkalmazásokat néztek meg, valamint töltöttek le. Hogy mindezt hogyan? A társítási szabályok bányászatáról, használatáról, predikciós és osztályozó módszerekről, klaszterelemzésről és hasonló feketemágiáról hamarosan éppen blogunkon lehet olvasni hamarosan.

Visszaugorva az App Store-ba: megjelenik előttünk néhány további alkalmazás, amik tényleg nagyon hasonlítanak ahhoz, amire rátaláltunk. Ez sokat segíthet, de még mindig nem biztos, hogy éppen a leghatékonyabba fogunk belebotlani. Írtuk, számunkra minél ismeretlenebb a téma, annál nehezebben tudunk jól kérdezni, aztán ennek megfelelően hasznos információkhoz jutni, másrészt jelen esetben egy alkalmazás minél specializáltabb feladatra van kitalálva, annál nehezebb rákeresni, megtalálni.

A leírások ebben az esetben legalább olyan információértékkel bírnak, mint a screenshotok, ugyanis ezeket elolvasva botlunk olyan kifejezésekbe, amik nagyon jellemzőek a keresett alkalmazásra nézve, viszont csak a passzív, ráadásul idegennyelvi passzív szókincsükben léteznek, ezért nem jutott eszünkbe keresőkifejezésként használni őket. Szövegkörnyezetében eléggé világos, hogy mit jelent a boost kifejezés. Szövegkörnyezetében! De ha valaki korábban nem ismerte, és bedobja a Translate-be, rá nem jön, hogy ez a szó valójában mit is jelent. Amit látunk a jobb panelen, mind szótári alak:

Translations of boost
noun
túltöltés
boost, supercharge
emelkedés
climb, lift, raising, raise, uptrend, boost

verb
felemel
lift up, raise, exalt, elevate, uplift, boost
fellendít
boost
reklámoz
publicize, boost

Az értelmezés már világosabbá teszi, ekkor a tudásunkban a megfelelő helyre tesszük, bővítjük vele a saját fogalmi keretünket:

Definitions of boost
noun
a source of help or encouragement leading to increase or improvement.
the cut in interest rates will give a further boost to the economy
synonyms: uplift, lift, spur, encouragement, help, inspiration, stimulus, pick-me-up, shot in the arm
verb
help or encourage (something) to increase or improve.
a range of measures to boost tourism
synonyms: improve, raise, uplift, increase, enhance, encourage, heighten, help,

Az igen gyakran előforduló abs esetén az agyunk nem fordítja le abdominal muscles kifejezésre, hogy aztán még egy lépésben hasizommá fordítsa, ez is világos. A következő kifejezés, amivel viszont egyrészt kellően ritkán találkozunk, másrészt még inkább igaz, hogy csak környezetében van bármiféle értelme is, a pecs, ami a pectoral muscle-t jelentené. Az utóbbi érdekessége, hogy köznyelvi értelemben “új szó”, néhány évvel ezelőtt jóformán senki sem használta.

A Google Trendsből kiderül, hogy a kifejezés gyakran fordult elő olyan fogalmak keresésekor, amikor a felhasználók testépítéssel, zsírral és gyakorlatokkal kapcsolatos információkat keresnek a neten.

Az USA-beli adatoktól nem térnek el markánsan az Egyesült Királyságban mért adatok, azaz nagyon pongyolán fogalmazva, hasonló a helye a a brit és amerikai angol nyelvben.

Annak megállapításában, hogy egy mennyire új kifejezésről van szó, sokat segíthet a Google Ngram Viewer, ami pedig teljesen világos felfutást mutat.

A Trends-re és az Ngram View-re különösen igaz, hogy kellő háttérismeretet és gyakorlatot igényel, hogy megfelelő következtetéseket vonjunk le abból, amit kapunk. A Trends csak 2004-től jegyzi az adatokat, míg a Ngram Viewer a 19. század eleje óta megjelent, szinte összes könyv digitalizált szöveganyagát veszi alapul, egy-egy Ngram felfutása pedig nem jelenti feltétlenül, hogy a kifejezés gyakoribbá vált volna.

Néhány keresést követően kiderül, hogy valószínűleg mik a legjobb, valaki teljesen más céljának megfelelő mobilalkalmazások, viszont vegyük észre hogy például fogalmi osztályozást sem kellett egyedül végeznünk, annak egy részét elvégezte a a gép, ezért találtuk meg gyorsabban a valaki másnak kellő, tényleg jó alkalmazást! Természetesnek vesszük, mert a mindennapi élet részévé vált, merész kísérletezőknek viszont érdemes lehet néha benézni a kulisszák mögé.

A kulisszák mögött

Ha nem is megyünk akadémiai magasságokba, jó, ha van egy szemléletes képünk minél több olyan algoritmusról, amit újabban rendkívül megtévesztő módon a mesterséges intellgencia tárgykörébe sorolnak. Példaként emelnénk ki ismét a látens Dirichlet-allokációt ami eléggé ügyesen alkalmazva, “elolvasva” megfelelő mennyiségű szöveget, “tudni” fogja, hogy a tej, a nyávogás a macskához, míg az ugatás és a csont fogalmilag a kutyához kapcsolható. Jó adag hasonló módszer létezik még, az igazi kihívás eltalálni az adott feladatnak megfelelőt.

Az okos gépek ott vannak az élet minden területén. Ha hirtelen meg kellene mondani, hogy az artifical intelligence hogyan lett teljesen félreértett, a kelleténél gyakrabban használt buzzword, eléggé valószínű, hogy azért, mert a kimenet, legyen az bármi is, a Siri válasza vagy egy chatbot tartalmas megjegyzése, akár egy keresés eredménye, olyan minőségű, mintha gondolkozó embertől származna.

A másik súlyos félreértés, hogy a mesterséges intelligencia kutatásának célja lenne, hogy belső működésmód szempontjából minél jobban hasonlítson az emberi gondolkodáshoz, holott már a 60-70-es években rájöttek, hogy ez a csapásirány nettó ostobaság.

Amit ma sokan mesterséges intelligenciának neveznek, valójában olyan megoldások egyvelege, ami adott feladatokat tud megoldani minél jobban és gyorsabban, emberi értelemben úgy, hogy azt a benyomást keltse, mintha a gép értelemmel rendelkezne, gondolkozna.

A MATLAB-ra nem úgy gondolunk, mint a mesterséges intelligencia eszközére, pláne nem úgy, mint olyan rendszerre, ami gondolkodna helyettünk, de ha például jól formalizálva megadunk benne egy másodfokú egyenletet, azt a MATLAB, hasonlóan gyakorlatilag az összes jól formalizált egyenlethez megoldja, kiadja az eredményt, ami gyorsan ellenőrizhető is.

Ha először látnánk, akkor esetleg azt gondolhatnánk, hogy a MATLAB okosan megtanulta a másodfokú egyenlet általános megoldóképletét, aztán annak megfelelően oldotta meg. Ha erre nem volt felkészítve, akkor egyszerűen fogott egy numerikus analízisből ismert közelítő módszert, abba behajigálta az értékeket, végig nagyon-nagyon sok tizedesjegy pontossággal számolt, a végén pedig kiadta a helyes eredményt. Azaz azt a benyomást keltette, mintha értelemmel oldotta volna meg az egyenletet, holott erről szó sincs.

(Ha esetleg éppen a MATLAB már fel van készítve rá, hogy a másodfokú egyenlet felismerje, mint olyan egyenletet, amire van megoldóképlet, és azt alkalmazta, akkor elnézést.)

Lényeg, hogy az esetek többségében közelítő módszerrel kapott közelítő eredmény is megfelel, ami nem jelenti azt, hogy a numerikus módszerek mellett már nem lehetne tévedni, sőt, adott esetben nagyon durván mellé is lehet nyúlni.

Valaminek az okos megoldása nem jelenti azt, hogy a gép okos!

A másik, ami érdekes példa lehet, az automatikus tételbizonyítás, ahol az felhasználó csak formalizál, bizonyítási módszert állít be, a gép pedig bizonyít. Erről úgy gondolnánk, hogy kimondottan emberi leleményességet igénylő tevékenység.

Minden olvasót arra bátorítanánk, hogy amint egy beszélgetés közben felmerül nagy vehemenciával a mesterséges intelligencia, nézzen a beszélgetőpartnere szemébe, és kérdezze meg, hogy szerinte a felügyelt vagy a nem-felügyelt gépi tanulás jobb sok esetben, és miért. Mindkettővel kapcsolatban különböző példákon keresztül lehet érvelni amellett, hogy miért hatékonyabb az adott esetben. Ha az Olvasó még nincs képben a két fogalommal és módszereivel kapcsolatban, érdemes lehet hamarosan ismét a blogra nézni.

Mert ez az elemzés itt és most véget ért. Folyt. köv.!

Buborékeffektus: hogyan írjuk és olvassuk a webet? És hogyan kellene? 

Ez a cikk technikai és filozófiai oldalról is feszegeti a buborékeffektusnak hívott jelenséget. Leegyszerűsítve: mindenki azt olvas a neten, amivel már korábban is egyetértett, mert a gépi ajánlócuccok, legyen az egy kereső, híraggregátor, vagy egy social site, “kedveskedni” akarnak nekünk. Vajon tényleg baj-e, hogy a neten szinte sohasem futunk bele olyan tartalmakba, amik a saját világképünkkel összeegyeztethetelenek? Nos, lássuk!

netacademia_tanfolyamkereso.png

A web olvasására általános recept nincs. Viszont az ideális eszközök és források ismérvei eléggé világosak: valóban friss cikkek címeit dobják elénk, lehetőleg olyan független forrásokból, amik lényegében a hitelességükből és alaposságukból élnek, ugyanakkor figyelnek a tartalmaik előállításánál a közérthetőségre is.

Alighanem nagyon sokan nem tudják, de a világ két, jóideje legpatinásabb tudományos folyóirata, a Science és a Nature szerkesztőbizottságai több esetben Nobel-díjas kutatók cikkeit akár többször is visszadobják a cikk formába hozásához, mielőtt kiadnák. Másrészt mindkettőnél van egy olyan feltétel, amire alighanem ritkán gondolnánk. Igaz, a Nature és a Science több cikke olyan, ami nem, vagy csak nagyon nehezen érthető azon olvasók számára, akik nem kimondottan az adott szakterületen mozognak, viszont mindkettőnél az alapítása óta kőbe vésett elvárás, hogy a cikknek olyannak kell lennie, ami a tudományos közösség érdeklődésére számot tart, függetlenül attól, hogy milyen tudomány művelője.

Ennek megfelelően pattant már vissza olyan cikk is, ami aztán egy olyan munkásság része volt, amiért Nobel-díjat ítéltek oda, de a cikk túlspecializált volt, nem felelt meg az előbbi feltételnek.

A felvezető olyan módon kapcsolódik ide, hogy sajátos módon azok az online lapok élték túl vígan a dotcom-lufi kidurranását, na meg konkrétabb, sokkal komolyabb behatásokat, és maradtak a legmeghatározóbb hírforrások, amik ha nem is koppintják a Nature és a Science mintáját, nem tudományos lapok, viszont alapelveikben nagy mértékben hasonlítanak azokhoz: az olvasóközönség érdeklődésének fenntartása fontos cél.

Természetesen hacsak valaki nem végtelen sok idővel rendelkezik, vagy unalmában böngészik a neten, nem nézegethető végig az összes meghatározó portál összes rovatának összes cikkje a leaddel, erre találták ki a feedolvasókat.

Amint egy oldalon megjelenik egy új cikk, annak elkészül egy feedolvasó által olvasható kivonata, ami a legegyszerűbb esetben csak a cikk címe és URL-je, esetleg emellett a lead, ami lehet a cikk első néhány mondata. Emellett annak sincs akadálya, hogy a cikk írója egyfajta excrept-et írjon, ami esetleg nem is szerepel a szövegben, kimondottan a feedolvasónak szánt néhány szavas kivonat, ami a cikk tartalmát minél jobban leírja.

Világos, hogy a jól eltalált címadás és az első néhány mondat mekkora jelentősséggel bír, hiszen az olvasó a mai információs kavalkádban ez alapján dönt egyáltalán arról, hogy kattint-e vagy sem, akár egy hírportál webes felületén jelenik meg, akár a feedolvasóban. Sokáig többen, közülük néhányan statisztikai alapon, megint mások egyszerűen empirikus alapon azon az elven voltak, hogy a cím nem lehet hosszabb 6 szónál, megint mások erre alaposan rácáfoltak, míg a komolyabb írásoknál nem ritkák az ennél sokkal hosszabb címek sem.

A tartalomfogyasztó, aki akár kimondottan hivatásos tartalomgyáros egy szerkesztőségben, akár olyan tartalomfogyasztó, aki egy-egy szakterület híreivel kapcsolatban szeretne előbb képbe kerülni, mint a többiek, akár hagyományos újságolvasó, bizonyos értelemben egyre jobban elkényelmesedett az évek során, amiben semmi meglepő nincs, elvégre tartalommal tele a padlás, unikális tartalomból már jóval kevesebb van. Az újonnan megjelent, kimondatlan igények kielégítésére több technikai eszköz is keletkezett, amiket ha hirtelen kötelező lenne nagy, ámde nem feltétlenül markánsan különböző csoportokba lehet sorolni, a következők lennének:

  • buta hírolvasók – a feedolvasó mintájára előre összegereblyézi a híreket, de nem különösebben veszi figyelembe a tényleges tartalomfogyasztási igényeket
  • curated content – a felhasználó beállíthatja, hogy milyen Twitteres, Google Plus-os, LinkedIN-es influencerek, vagy éppen az adott szolgáltatás editor’s pick-jéből választott források kerüljenek elé
  • gépi tanulással támogatott, intelligens hírolvasók vagy híraggregátorok – a kategória nagy öregje, a Flipboard és klónjai, ami a regisztrációt követően feldob számos cikket, amiről feltételezi, hogy érdekelhet mindket, majd minden mozzanatunkat figyeli és meglepően rövid gépi tanulást követően már csak kimondottan minket érdeklő cikkeket fog ajánlani. Mondani sem kell, hogy minden ilyen megoldás több mint addiktív lehet, de más hatásai is vannak, aminek a tárgyalására kicsit később térünk vissza. Flipboard-klónból pedig ugyancsak van bőven.

A gépi tanuláson keresztül ajánlgató szolgáltatások persze annál precízebbek, minél több adattal etetik őket, azaz ők maguk minél gyorsabban indexelik az újonnan megjelent cikkeket a web minden tájáról, valamint minél több felhasználó használja őket, minél több ízléséből tudnak tanulni.

A korábban hagyományos formájában sok-sok év után kinyiffantott, majd más formában ismét megjelentetett Google Readert  kezdetben azzal támadták a legnagyobb lapkiadók, hogy a Google az üzleti érdekeiket sértik azon keresztül, hogy a Google saját felületén jeleníti meg azokat, ilyen módon tartalomszolgáltatóként jelenik meg. Nem telt bele sok idő, amikor már azért lobbiztak a legnagyobb lapok, hogy kerülhessenek fel a Google Reader/NEWS által ajánlgatott részbe valamilyen módon.

A Google Readert hiába használták napi rendszerességgel és szerették felhasználók tízmilliói, a cég a szolgáltatást a hagyományos formában ki is végezte, igaz, utána újraindította más formában. A Google által kinyírt szolgáltatások sorába tökéletesen beleillik: nem tudtak olyan mennyiségű, több köztes lépésben hirdetéstargetálásra használható információt kinyerni a felhasználók olvasási szokásaiból, ami alapján gazdaságos lett volna életben tartani a szolgáltatást, holott többek szerint ehhez önmagában csak Gmail-ből, Google Analytics-ből, Chrome-ból és a keresőből származó információk automatizált kinyerése is elegendő lenne a Google több száz szolgáltatása közül.

A Google mint sok más területen, itt is komolyan kockáztatja a hasonló szolgáltatást kínáló vetélytársainak talpon maradását. A vetélytársaknak tehát valami olyat kell villantaniuk a felhasználóik felé, amit a Google hasonló szolgáltatása éppen nem tud vagy valahogy eltérő módon tudja.

Láttunk már példát a legkorszerűbb machine learning technikákra építő szolgáltatásokra, amik nem is világos, hogy miért buktak el. Többen napi rendszerességgel használták a Prismatic-ot amibe valósággal öntötték az adatokat, a befektetők a pénzt, a legpatinásabb oldalak az egekbe magasztalták, mégsem tudott megmaradni a piacon.

Ha valaki életében először használna internetet, és mondanunk kellene valamit azzal kapcsolatban, hogy melyik oldalt nézze meg életében először, a Flipboard mellett alighanem a RightRelevance lenne az.

Némileg más logika mentén ugyan, de a Flipboardhoz hasonlóan a felhasználó ízlésére, tartalomfogyasztási szokásaira épít, másrészt meg lehet jelölni olyan influencereket, akiknek a tartalmaira biztosan kíváncsiak vagyunk.

Megjegyzendő, hogy a világ a tartalomszolgáltatás piacán globális színtéren sem igazságos: a Business Insider, a Mashable és sok-sok más news outlet szinte mást sem csinál, csak tőlük patinásabb lapoktól csen át híreket, amiket aztán hülyeségig egyszerűsít, rövidít, ennek megfelelően sokkal nagyobb olvasói bázishoz jut el, persze összehasonlíthatatlanul nagyobb árbevétellel és összehasonlíthatatlanul kisebb hozzáadott értékkel. Az egyediség, az érték és az eladhatóság gyakorlatilag sosincs egymással összhangban.

Jól ismert sajátosság, hogy a tartalomfogyasztási szokások nem nagyon változnak. A nagyon sok ok közül kiemelendő, hogy az olvasó nyilván azokat a forrásokat fogja preferálni, amik egybehangzanak a véleményével, mi több, megerősítik egy témával kapcsolatos hitében, ilyen módon az önképében is. Természetesen nem csak politikai tartalmakról van szó. Ez az egyszerűsített magyarázata annak is, hogy a legelborultabb konteók, mint amilyen a lapos Föld hívők  vagy éppen az oltásellenesség miért tartja magát olyan stabilan.

Azaz javarészt olyat olvasunk és nézünk, amivel általában egyetértünk, ez viszont bizonyos értelemben buborékba, méghozzá minden korábbinál áttörhetetlenebbnek tűnő intellektuális buborékba zár minket, és persze az újonnan megszerzett információk befolyásolják a vélekedésünket nemcsak egy adott terület kapcsán, hanem olyan területeken is, amire nem is gondolnánk. (A jelenséget egyébként először a netes kereséskor észlelték és kezdték kutatni.)

Példaként egy igen szűk szakterület magasszintű képviselői közt sincs egyetértés abban, hogy Edward Snowden inkább hős vagy inkább hazaáruló. De a jelenség megfigyelhető olyan területeken is, amik úgymond sokkal kisebb mértékben hitkérdések, hanem akár tisztán szakmai kérdésnek tűnnek, ahol látszólag nincs helye egymásnak szögesen ellentmondó véleményeknek. Ha valaki rendszeresen arról olvas, hogy a Java-s technológiák jobbak összességében, mint a C#-on alapulók, sokkal inkább fog hajlani arra a véleményre, hogy a Java alkalmasabb valaminek a megvalósítására, amikor valójában nem.

Az elmúlt néhány évben totálisan feje tetejére állította a biotechnológiát és a molekuláris biológia egészét a CRISPR/Cas9 technika, amivel lényegében ugyanúgy génmanipuláció végezhető, mint számos más módszerrel, viszont a korábbiakhoz képest sokkal pontosabban, gyorsabban és olcsóbban. Olyannyira, hogy a világ biztonságáért felelős csúcsszervek korábban  és nemrég ismét összeültek a lehetséges kockázatok elemzésére, amit a piac is megérzett, de ahhoz sem kellett sok idő, hogy megszülessenek az első gyerekek, akiknek a génállományába még embrionális korukba nyúltak bele, így megelőzve egy súlyos megbetegedést.

Ez utóbbi azért sajátos, mert az emberi génállományba való beavatkozás a világ minden országában nagyon súlyos bűncselekménynek számít, hacsak nem gyógyászati célú. Gyógyászati cél ide vagy oda, korábban kivételszámban fordultak elő az olyan esetek, amikor ivarsejtek, egy születendő vagy már felnőtt beteg testi sejtjeinek génállományát próbálták megváltoztatni, és sikerrel is jártak.

A CRIPSR-technika olcsósága és egyszerűsége miatt felmérhetetlen lehetőségek nyíltak meg, ennek megfelelően logikus lenne arra gondolni, hogy erre tér át mindenki, ehhez képest viszonylag lassan kezdték-kezdik alkalmazni a gyakorlatban, különösen az alapkutatásban. Ez pedig aligha vezethető vissza arra, hogy a biológusok inkább használják az általuk már megszokott, jól bejáratott módszereket. Ugyan minden racionális érv amellett szól, hogy a kőbalta helyett a kalapács az alkalmasabb, a megszokások mégis lassan változnak.

Egy lehetséges magyarázatunk az, hogy tengernyi mennyiségű cikk jelent meg azzal kapcsolatban, hogy az új módszer mekkora kockázatokat rejthet, ha azt konkrétan terroristák kezdik el használni. Ha pedig egy-egy biológus jókora dózisú cikket olvasott a témában, ettől aligha tud teljesen elvonatkoztatni, még ha racionálisan úgy is gondolja, hogy igen.

Akár egy intelligens híraggregátort használunk, akár egy buta, de user friendly hírolvasót, szükségszerűen buborékba zárjuk magunkat. A feedolvasónál eléggé világos a helyzet: kézzel válogatjuk be azoknak a lapoknak a rovatait, aminek az újonnan megjelenő cikkeiről azonnal szeretnénk értesülni, nem szeretnénk lemaradni semmi fontosról. Ugranak fel ugyan olyan címek is, amikről feltételezzük, hogy a mögöttük lévő írás minket kevésbé érdekel, ezért nem kattintunk rá. De lényegében egy véges számú hírforrás fogja alakítani tehát nemcsak a tájékozottságunkat, hanem a szakmai véleményünket és a világról alkotott véleményünket is!

Az intelligens híraggregátoroknál némileg más a helyzet, hiszen elénk kerülhet olyan webhely is, ahol esetleg korábban még egyáltalán nem jártunk, de alkalomadtán éppen ott lelünk valamilyen igencsak értékes információra.

Ennek a posztnak a szerzője nem ritkán be szokta dobni, hogy a civilizáció motorjának egyik kulcseleme volt maga az egyet-nem-értés. Viszont most egy szingularitással kell szembenéznünk, lévén, hogy a mindket érintő információ egyre nagyobb arányban kerül a webre, ami önmagában első olvasásra nettó közhely. Ha néhány évtizeddel ezelőtt ment be valaki a munkahelyére, véletlenül belehallhatott két hajléktalan beszélgetésébe, miközben reggelit vett az utcai büfében, esetleg szóba elegyedett a villamoson valami kapcsán teljesen idegen emberekkel, amik apróságoknak tűnnek ugyan, valójában ez tette lehetővé, hogy megkerülhetetlen és spontán módon olyan információkhoz jusson, olyan gondolkodásmóddal találkozzon, amitől ma szinte biztos, hogy elesne.

Manapság, hacsak valaki nem hivatásszerűen foglalkozik külöböző emberekkel napi rendszerességgel, szinte az összes információ a net felől jut el hozzá. Emellett sokkal nagyobb arányban olyan személyekkel érintkezik bármilyen módon, akik hozzá hasonló elveket vallanak, tudáshalmazzal rendelkeznek. Egy-egy közösségbe tartozó emberek még jobban fognak hasonlítani egymásra, mint korábban bármikor, aminek a következményei sokkal messzebbre mutatnak, mint elsőre tűnik. Mivel technológiai szingularitásról van szó, a jövőbeli hatásáról semmit sem tudunk, leszámítva azt, hogy a jelenség alól senki sem vonhatja ki magát.

A különböző csoportosulások közti információáramlás korábban sem volt kimondottan jellemző, a szociológusok által szegregációnak nevezett jelenséget már alaposan darabokra szedte a hálózattudomány.

Nem nehéz belátnunk, hogy egy módosabb elitgimnázium diákja korábban is sokkal kisebb valószínűséggel került bármiféle kapcsolatba egy szegényebb sorból származó, gyengébb középiskolába járó tanulóval, ami megteremtette volna a lehetőségét annak, hogy az elitgimnázium tanulója megismerje a másik gondolkodásmódját, megismerjen egy, számára addig nem látható világot. Azután ennek megfelelően alakuljon a szociális érzékenysége, közben pedig a merőben eltérő kultúrális és intellektuális környezetben élő másik fél impulzusokat kapjon azzal kapcsolatban, hogy hogyan alakítják az életüket azok, akik később magasabb társadalmi státuszra számíthatnak, és mindenre, ami ezzel jár.

Az ilyen, izolált szigetek közti információs átszivárgást nevezik a hálózat-szakik perkolációs pontoknak is.

Ahogy a net használatával mindenkinek az egyéni buborékja és az őt környezető ismerősei buborékja is egyre rigidebb lesz, érthető, hogy drámaian csökken az információ átszivárgásának még az elvi lehetősége is, a témát egyébként már egy korábbi posztban érintettük.

A korábbi posztban is szóba került talán, hogy látszólag paradox módon minden lehetőségünk meglenne ahhoz a net korában, hogy alaposan tanulmányozzuk egy-egy, kimondottan gazdagok vagy mélyszegénységben élők jellemzőit szinte mindenre kiterjedően, kapcsolatba léphessünk velük, stb. Világos, hogy életszerűtlen, hogy szóba elegyedjünk valamilyen webkettes felületen csak úgy az ország túloldalán lévő, sokkal kevésbé iskolázott felhasználóval. Ahogy annak az esélye is nagyban csökkent, hogy akár egy másik kontinensen élő milliárdossal lépjünk kapcsolatba spontán módon.

Az egyének és közösségek különbözősége volt a civilizáció hajtómotorja. Most is az. Ideértve a tudományos diskurzusokat, egy szervezeten belüli vitákat és persze a legkülönbözőbb okra visszavezethető háborús összecsapásokat.

Az egyének és a közösségek eltérőek voltak ugyan egymástól, viszont közel sem olyan mértékben, mint most! Az ezzel járó jövőbeli hatásokra, azok határsaira pedig senki sem lehet felkészülve. Ami tudott, hogy a társadalmi rendszerek stabilitását nagyban veszélyezteti, ha az ideológiai, politikai, intellektuális, értékrendbeli, stb. eltérések egy bizonyos szintűnél nagyobbá válnak.

Nem véletlenül az egyik legkomolyabb kihívás az exobiológusok és a döntéshozók számára kidolgozni arra egy forgatókönyvet, hogy hogyan kellene eljárni olyan esetben, ha a Földre tévedne valamilyen korábban nem ismert intelligens életforma az univerzumból – jelentsen bármit is az, hogy “intelligens”, na meg “civilizáció”. Mert semmilyen tárgyilagos kiindulópont nem lenne azzal kapcsolatban, hogy hogyan kellene viselkedni ilyen helyzetben.

exobiologia.png

Mindenki, akinek van valamiféle képe a buborékeffektusról, egyvalamiben biztosnak kellene lennie: hogy nem húzhatja ki magát a hatás alól. Másrészt érdemes úgy összeválogatni az érdeklődésének megfelelő, napi rendszerességgel használt forrásokat, hogy azok minden szempontot nézve minél kevésbé legyenek egyoldalúak, ugyanakkor minimalizálni szeretnénk az információs zajt.

Feedolvasóból annyi van, hogy azzal aztán tényleg BIX-et lehetne rekeszteni. Ahogy az más területen is megfigyelhető, itt sem feltétlenül a legelterjedett a legjobb. Hogy melyikre esik a választásunk, nem kis mértékben függ az áttekinthető UI/UX-től, függetlenül attól, hogy asztali gépes, tabletre vagy mobilra szánt változatról van szó.

feedly_legjobb_feed_olvaso

A gondolkodó paranoiája….

Nem kell különösebben elmerülnünk az összeesküvés-elméletekbe, de az intelligens híraggregátorok esetén sosem lehetünk benne biztosak, hogy azok kisebb vagy nagyobb mértékben valamilyen módon nincsenek-e manipulálva, valóban függetlenek-e. Közel sem triviális megállapítani, hogy egy-egy híraggregátor szolgáltatás mögött milyen üzleti, esetleg politikai érdekek rejtőzhetnek.

Vagy éppen a Google! Már megint. Alaposan beleásva magunkat a web történetébe arra juthatunk,  hogy a Google pusztán hirdetésközvetítő cég, mert még akkor is ezt találjuk a láncolat a különböző ingyenesen használható szolgáltatásaik végén, amikor végképp nem számítanánk rá. A web giantek társadalmi felelősségével kapcsolatban számtalan ostoba és kevésbé ostoba vélemény jelent meg, amik közül kettőt emelnénk ki. Nem is olyan rég történt, hogy a normális ember által aligha olvasott Daily Stormer lapot a Twitter, a Facebook, a Cloudflare, a GoDaddy és az összes hosztingszolgáltató után a Google is kirúgta az indexből való teljes eltávolítással. Ha pedig valaki a revenge porn kifejezésre keres rá, nem bosszúpornó oldalakat kap találatként, az teljesen biztos.

Egy pillanatig se felejtsük el, hogy mindezt a véleményszabadság mintaállamában, az USA-ban lépték meg, anélkül, hogy erre törvényileg kötelezték volna a céget! Nagyon nehéz kérdés, hogy a kőkeményen törvénybe ütköző, akár uszító tartalmak ellen fel kell-e lépniük a tech cégeknek, ha pedig igen, akkor hogyan. Többek közt azért, mert a szólásszabadság lényege, hogy bármikor visszakereshető legyen, hogy kik mennyire idióta, igazságtalan, beteg, kártékony tartalmat terítettek a neten, aztán ennek megfelelően lehessen őket megítélnie a többségi társadalomnak.

Azt, hogy a különböző dehumanizáló tartalmak vagy a bosszúpornó ellen bölcs dolog-e fellépniük a legnagyobb keresőmotoroknak, e cikk írójában már a Debreceni Egyetem katedráján is felvetődött. Az előző indokláson túl azért, mert paradox módon ezzel hosszú távon több kárt tehetnek, mint amennyivel biztonságosabb hellyé teszik a netet, jelensen a biztonság bármit is.

A hallgatók nagyon gyorsan megértették, hogy a kétezres évek derekán megjelent szórakoztató, másrészről gyűlöletbizniszben utazó oldalaknak, ahol kidobott exek küldtek be és tettek közzé képeket a volt párjukról – hogy is mondjuk – a legkülönbözőbb testnedvektől átitatott képeknek egyfajta népnevelő hatása is volt. Nyilván nem szándékoltan. Ha a 14 éves Pistike azt látta, hogy a 21 éves Móricka nővére hagyta magát lefotózni egy száll semmiben, Pistike, ha volt egy kis esze, egy életre megtanulta, hogy őt soha, senki ne fotózza le olyan helyzetben, amilyen helyzetben nem szeretné a neten viszontlátni önmagát, hogy aztán rajta röhögjön az egész falu heteken keresztül.

Csak sejtéseink lehetnek azzal kapcsolatban, hogy a magyar törvények által végülis üldözendő tartalmak miatt miért nem léptek fel sosem különösebben. Ami viszont biztos, hogy ezek az oldalak, még ha gyomorforgatóak is voltak, de mindenképpen népnevelő szerepet töltöttek be, a netezők kevésbé buta része megtanulta, hogy nem az a kérdés, hogy egy fotó, amit valaki készített, kikerül-e a netre, hanem az, hogy hogyan, mikor, miért, kitől. Egyszóval a néhány évvel fiatalabb generáció elővigyázatosabb, ha a magánszférája védelméről van szó, ami nem a technika, nem is a jog eszközei miatt alakult így, hanem mert az internet alaptermészete erre szocializálta őket.

Arról viszont szó sincs, hogy bármelyik webes óriás is pusztán jófejségből küzdene az elfogadhatatlannak tartott tartalmak ellen. Ha a Facebookon, amire 13 éves kort betöltve bárki regisztrálhat, mindenféle, a dark webről előhúzott állatkínzásos és kivégzős tartalmak jelennének meg és maradnának fenn, a Facebookot nem az érdekelné, hogy mindez egy 13 éves gyerek fejlődésére veszélyt jelent, az már sokkal jobban, ha a szülők emiatt eltiltanák a gyereket a szolgáltatás használatától, aminek következményeként a hirdetők máshova mennének hirdetni, ezzel sokmilliárd dolláros veszteséget okozva a cégnek.

A Google-nél teljesen hasonló a helyzet: a hirdetők nem hirdetnének olyan helyen, aminek a keresőfelületén keresztül olyan tartalmak jelennek meg, amik a legfinomabban fogalmazva a nyugalom megzavarására alkalmasak. A Google tehát odacsap, nem is kicsit és alighanem csak a jéghegy csúcsát látjuk ennek.

Ezek fényében kérdéses, hogy a Google és a Facebook karitatívnak kikiáltott lépései mennyire tekinthetők őszintén karitatívnak.

Az viszont nagyon valószínűtlen, hogy a Google hírolvasó szolgáltatása teljesen mentes legyen a részrehajlástól, ami persze gyakorlatilag bizonyíthatalan. Ha egy mobilok iránt intenzíven érdeklődő felhasználóról van szó, aligha történik közvetlenül olyan, hogy azokat a cikkeket, amik az Androidot szidják, háttérbe szorítsa a hírolvasó. Nem. Ennél sokkal kifinomultabb módszerek viszont már valószínűsíthetők, amik lényege, hogy amit a felhasználó lát, a Google brandjét erősítsék.

Általánosságban tényleg nem lehet nagyon mit mondani azon túl, hogy ha kicsit ki szeretnénk látni a saját buborékunkból, időnként keressünk fel olyan forrásokat is, amik alapvetően olyan tartalmakat terítenek, amivel akár egyáltalán nem értünk egyet, de így legalább lehetőségünk nyílik rá, hogy például a legvadabb ideológiák milyen belső logika szerint szerveződnek. Azt pedig főleg érdemes elkerülni, hogy mindig csak ugyanazokat a szolgáltatásokat használjuk. Könnyen lehet, hogy egy adott felületen egy átvett, lebutított cikk hivatkozik olyan forrásra, amire átkattintva számtalan hasznos információt találhatunk.

Szó sincs róla, hogy kiszolgáltatottak lennénk a dezinformációval vagy manipulációval szemben. A cikk jórészt holisztikusan közelítette meg a web és a civilizáció kapcsolatát, azonban ne felejtsük el, hogy mennyi online is elsajátítható tudás és eszköz áll rendelkezésre ahhoz, ha ki szeretnénk szúrni, kutatni szeretnénk a dezinformációt vagy utánanéznénk egy-egy kétes szolgáltatás működésének. A teljesség igénye nélkül:

  • a fejlesztés terén – a kódolási stílus ugyan kisebb mértékben, de hasonlóan eléggé egyedi, mint amikor valaki természetes nyelven fogalmaz meg valamit – valaki minél több forráskódot látott, belekóstol a nyelvtechnológiába is, annál nagyobb eséllyel szúrja ki, ha két oldal üzemeltetője közt kapcsolat van
  • a legtágabb értelembe vett e-commerce lehet szakszerű és etikus egyszerre, szintén nem megtanulhatatlan
  • az üzemeltetés terén – a DNS és a historikus DNS aranybánya, nem véletlenül. Senkinek nem adnánk tippeket, de annyit elárulunk, hogy valaki hiába használ whois masking-et egy webhely domainjénél, és dugja a teljes webhelyet az első pillanattól Cloudflare mögé, számtalan esetben tisztán technikai úton akkor is azonosítható marad.

Azaz: tanulni érdemes! Az online tanulás lehetősége pedig mindenki számára adott. A blog történetében először közvetlenül linkeljük a NetAcademia tanfolyamkeresőjét, ami számos érintett területet lefed.

kép: triarchypress.net