ismét itt

Néhány év kihagyás után ismét a bloghu-n is! Lesz itt kérem hír, nanogrammban mért vélemény, okosságok, minden, mint a búcsúban! Tessék, csak tessék!

See also...

About

 

bardóczi ákos CV site

 

 

daily tweets from bardóczi Follow me @bardoczi

 

 

LinkedIN - ákos bardóczi LinkedIN

 

 

My stuff on the web

 

 

bardoczi.blog.hu bardóczi in da bloghu

 

 

bardóczi ákos postr áko.s @Post.r

 

 

blog.bardoczi.net bardóczi Tumblarity

 

 

science.bardoczi.net I'm, the bookworm

 

 

ákos*Blog*Spotting ákos*Blogspotting

 

 

bardóczi on Wordpress bardóczi on Wordpress

 

 

My Quora blog My Quora blog

 

 

LiveJournal brainstroms from me ákos Journal

 

 

Stay connected!

 

 

ákos on Google+ follow me on Google+

 

 

ákos VKontakte ákos VKontakte

 

 

ask me anything! Ask difficult questions on InnoCentive

 

 

My Quora blog Ask me anything on Quora

 

 

 

ResearchGate sciencific network Researchgate connect

 

 

More great stuffs

 

 

Are you ELEQT member? Feel free to connect me! ELEQT

 

 

BoaW my BestOfAllWorlds profile

 

 

bardóczi ákos on ASW my ASW profile

 

 

Expatriate Community for Expats worldwide InterNations.org

 

 

Old school contact:
akos@cerp.ch
PGP-fingerprint:
B29C CF16 B1AA 13FC 54E4 A912 D720 4E1C 899A 6E0C





Hirdetés


Nyelvek, kultúrák, globális biztonság és a nyílt-forrású információszerzés

2017.08.21. 13:54 | bardóczi ákos | Szólj hozzá!

Címkék: agymenés nyelv tudat deep web OSINT hidden services

osint-nyelv-kultura.jpgMár korábban írtam róla, hogy a deep webbel kapcsolatban, főleg a méretével kapcsolatban micsoda zavar van a fejekben.

Abba most nem megyek bele, hogy miért a nehezebben vagy valamilyen módon költségesebben elérhető információ élvez mindig előnyt, természeténél fogva miért lesz mindig értékesebb, mint a könnyen kitúrható, akit érdekel, nézzen után a "miért vonzó, ami ritka?" vagy hasonló kérdésnek az evolúciós pszichológia területén.

Ha felteszem a kérdést, hogy a legtöbb, kereshetetlennek hitt, hidden servicekben létező, értelmes tartalmat fedő link az alábbiak közül honnan kukázható ki, alighanem a legtöbben azoknak a beidegződéseknek megfelelően válaszolnának, amiket kulturálisan a felhasználóba klopfoltak a web általános felhasználói szokásai. Szóval honnan is?

1. sehogy, de tényleg!
2. Google-ben nem indexelt, alternatív keresőkkel elérhető motorok
3. nagy keresőkben nem indexelt, de surface weben lévő blackhat fórumok
4. a deep web belső keresőmotorjai
5. kőkeményen fizetős adattárházak
6. Facebook

Jó, jó, konkrétan a nagyon-nagyon nehezen kivájható információ kereshetőségével foglalkoztam az elmúlt pár hónapban, mert végülis azelőtt is csak más technikával, aztán a napokban szembesültem pár kínos ténnyel.

Az egyik, hogy amit kikutattam, már megtalálta más, igaz, nem pontosan azt, nem pontosan annyit, nem úgy, nem is olyan régen, de mégis.

A másik, hogy mindez szép és jó, viszont kérdés, hogy mennyire használható ténylegesen a recon fázisban, ha etikus hekkelésről, ehh bocsánat, szóval szoftvertesztelésről, na meg threat intelligenceről van szó. Amiben biztos vagyok, hogy a módszer univerzálisan használható, bármilyen irányú OSINT-vájárkodásról legyen is szó.

A harmadik dolog pedig egy tudományfilozófiai természetű kérdés. Azt kiméricskélték, hogy a teljes univerzum tömege 10 az 55-edik hatványon, mármint grammban. A Nagy-Fermat-sejtést bebizonyították, ugyan teljes egészében még senki sem olvasta el, leszámítva azt a figurát, aki a fél életét feltette rá és megfelelően belőtte, hogy hogyan lehetne a legjobban alkalmazni az automatikus /*gépi*/ tételbizonyítást a probléma megoldására, a párezer oldalas bizonyítás ma már nem is számít olyan nagynak (!!). Amikor az ökológus megpróbálja megállapítani, hogy mennyi verőköltő bodobács él konkrétan a Hortobágyi Nemzeti Parkban nemzeti parkban, akkor nyilván nem számolja meg az összeset, hanem alkalmaz egy kis trükköt, amiből aztán ki lehet matekozni, hogy négyzetkilométerenként mennyi, ennek megfelelően összesen mennyi. /*Ha most valaki úgy gondolná, hogy az extrapolációs módszerek mindig a legjobbak, nem feltétlenül, amúgy meg én sem tudom, mert nem vagyok sem ökológus, sem statisztikus.*/ Az eredeti témához visszatérve mi a nagy helyzet akkor, amikor tehát meg kell állapítani, hogy a legtöbb _értelmes_ információ ebben, abban vagy amabban a térben létezik? Jó esetben nem szúrtam el sem a mintavételezés módját, sem pedig a kiválasztott technikákat és a munkahipotézissel kapcsolatos előfeltevés sem zavart be nagyon. Viszont egy hipotézis állítása elfogadható-e tényként, ha konkrétan bizonyítani nem lehet, viszont minden, adott pillanatban rendelkezésre álló információ azt támasztja alá, hogy igen, tényleg az adott helyen van a legtöbb ilyen infó és semmi sem cáfolja azt érdemben?

A termodinamika 0. főtételét sem lehet bizonyítani olyan módon, mint a többi fizikai összefüggést, viszont feltétel nélkül elfogadjuk, mivel sosem találtunk még kivételt a természetben, ami ellentmondana nekik, a rá épülő modellek pedig működnek. /*elméleti fizikusok, szedjetek szét!*/

Lényeg, hogy az információ, na meg a kereshető információ mennyisége ha véges, akkor nyilván mérhető is. De kellően sok ahhoz, hogy ne lehessek benne 100+1%-ig biztos, hogy semmit sem csesztem el. A kutatás kezdetekor pedig a kérdésfeltevés nem is az volt, hogy "hol mennyi kilóra?", hanem az, hogy egy elfeledett módszer mennyire és hogyan használható, mik annak a korlátai, az pedig egy mellékes megfigyelés volt, hogy ott találjuk a legtöbb _értelmes_ deep webes hivatkozást, ahol ember nem gondolta volna.

Semmilyen természetfölötti izében' nem hiszek, de ma reggel komolyan arra gondoltam, hogy olyan, mintha valamilyen természetfölötti erő alakította volna úgy, hogy a tényleges, kereshető adat illetve információ megmaradjon, ha értelmes, a többit meg elnyelte volna egy neutroncsillag vagy fekete lyuk. Vagy csak ez a benyomásom! Ahogy a mainstreamben lehetett olvasni, hogy bizonyos országokban az emberek azt hiszik, hogy a Facebook maga az internet, az átlag felhasználó meg abban a tudatban él, hogy a web maga a teljes internet, az advanced user meg azt gondolja, hogy a web és a P2P hálózatok tartalma az internet, én most azt gondolom, hogy a teljes internet kiegészül egy olyan darabbal, amit kereshetetlennek hittek, viszont ez is csak illúzió, ami végülis abból adódik, mint bárki másnál: alapvetően azt hiszem létezőnek, amit látok.

Kicsit hasonló a jelenség ahhoz, hogy amikor valaki információt keres a neten, akkor nem is nagyon próbálkozik az anyanyelvén és az angolon kívül mással, annyira természetesnek veszi, hogy ami információ, az csak ilyen nyelvű lehet. Holott jól belőtt becslés szerint ami a webet illeti, annak csak 49%-a angol nyelvű, én ezt még kevesebbre saccolom, mert az interneten a nyelvek eloszlásával kapcsolatos kutatásokat angol nyelvterületen élő kutatók végezték, ami bejátszhatott abba, hogy végül milyen eredményt kaptak. Szóval nem lennék meglepve, ha még kisebb lenne az angol nyelvű tartalmak aránya, joggal feltételezhetjük, hogy akkor nem csak a weben, hanem a teljes neten is.

Tévedés lenne úgy gondolni, hogy az, ami fontos, idővel úgyis megjelenik angol, orosz vagy spanyol nyelven úgy, hogy az könnyen kereshető is, mert esetleg az adott doksi szerzője nem is foglalkozik vele, hogy amit leír, annak más nyelven is elérhetőnek kellene lennie. Ahol pedig remekül tetten érhető, hogy a keresőmotorok igenis diszkriminálnak, ha a Google/Bing/Yahoo-szenthátomsággal vagy éppenséggel a Yandex-szel keresünk valamit, az milyen tragikusan teljesít olyan nyelvek esetén, amik nem latin vagy cirill betűs írásrendszert használnak. Ennek pedig nem pusztán az az oka, hogy a nagy, jól ismert keresőmotorok fejlesztői in english, en español valamint на русском gondolkoznak, hanem az is, hogy a legnagyobb motorok milyen nyelveken kapják a bemenő adatok legnagyobb részét, ami teljesen világos, hogy kihat a kereső későbbi használhatóságára, éppen azért, mert nyilván egyik sem tisztán izomból megy, hanem hatékony szemantikus keresőeszközként való működésre tanítja önmagát.

Jól ismert, hogy vannak amolyan baráti jellegű nyelvpárok, amikre hatékonyan lehet normális fordítást végző algoritmust írni, megint más nyelvpárokra meg kevésbé, ami ráadásul sokszor nem függ még attól sem, hogy a két nyelv mekkora.

Eléggé gyorsan eljutottunk a nyelvészet egy izgalmas területéhez, a nyelv és kultúra izoláló hatásához, amiről annyit tudok, hogy létezik, a hatása pedig óriási, amúgy meg annyira értek hozzá, mint a harangöntéshez. Hogy szemléletes példát hozzak, ha behajítjuk a keresőbe, hogy

chocolate cake recipes

igencsak releváns találatokat hozunk, ezt akármilyen jól fordítjuk japánra vagy arabra, majd dobjuk be a keresőbe, ugyanaz a kereső már sokkal rosszabbul fog teljesíteni, holott itt egy totál egyszerű keresésről van szó, csokoládétortát meg készítenek arab és japán nyelvterületen is. A piacvezető keresőmotorokat persze annyira nem érdekli, hogy más nyelveken is legyenek nagyon hatékonyak, nem is érdekük, tömegigényt kell kiszolgálniuk. Ez még csak nem is a legjobb példa volt, mert a Google jól felzabálta a közelkeletet is az utóbbi néhány évben, már lassan a http://yoolki.com/, a http://www.eiktub.com/ és a http://www.yamli.com/ is csak amolyan jópofa érdekesség lesz lassan, de hogy kínai tartalmat zsigerből a http://www.baidu.com/ , a https://www.sogou.com/ avagy https://www.360.cn/ motorral fognak keresni többen globálisan nézve, az biztos.

Nem újdonság, elvben egy szorosan összedrótozott világban élünk, gyakorlatilag meg ugyanúgy jelentkezik egyfajta nyelvi és kulturális buborék effektus és naivitás lenne azt gondolni, hogy ez el fog tűnni csak úgy. Ugyanakkor jó tudni, hogy vannak olyan keresőeszközök, amik a hagyományos keresőszolgáltatásokkal összemérve szemantikus keresés terén sokkal butábbak, viszont hatékonyabbak ha kultúrafüggetlen keresésről van szó.

A nyelvi- és kulturális izoláció, mint a kutatást hátráltató tényező, már rég ismert. Abban meg aztán semmi meglepő, hogy mindez jelentkezett az interneten is. Hogy hogyan lehetne feloldani a jelenséget - és egyáltalán fel kell-e oldani? - persze nem tudom. Amit viszont igen, hogy mindenki jobban járna, ha a nyelvtechnológus nem lenne rá lusta, hogy megértse az etikus hekker, a szociológus és a pszichológus gondolkodásmódját, az etikus hekker szánna rá időt, hogy _hogyan__gondolkoznak_ a világ túloldalán, na meg mindezek összes permutációja. Nem csak a tudomány, úgy mindenestől járna jól vele, de a globális biztonsági kockázatok, informatikai biztonsági kockázatok vagy trendibben fogalmazva a globális kiberbiztonsági kockázatok kezelése is hatékonyabbá válna, márpedig ezek egyre inkább a klasszikus biztonsággal összefonódva léteznek, nem pedig amellett. Ki tudja? Legrosszabb esetben ennek elmulasztásával a civilizáció kihalását okozzuk - amit minő manír, éppen a nyelvhasználat megjelenése tett lehetővé.

Ha már ennyire elkanyarodtam az eredeti topiktól: vérprofi bugvadász és fejlesztő kollégák! Tegyétek a szivetekre a kezeteket és valljátok be, hogy nem is gondoltátok, hogy programozási nyelvek közt is vannak olyanok, amikben a teljes szintaxis nem a megszokott latin írásrendszert követik, de szóhasználatukban is hajaznak kicsit arra a kultúrára, amiben keletkeztek! Nem kevés ilyen van. Mindez valamit gyönyörű szépen megmutat, de előtte egy kis kitekintést kell tennem. Ahogy az Arrival c. Amy Adams filmben úgy kábé minden bevezető szintű nyelvészeti kurzuson felmerül több kérdés - meg biztos a kocsmában is - az pedig a nyelv és a tudat viszonya. Az univerzalizmus szerint a gondolkodás meghatározza a nyelvet, a nyelvek közt csak felszínes eltérések vannak. A determinizmus szerint az anyanyelv meghatározza a beszélő gondolkodását. A relativizmus szerint a jelentéstani kategóriák kihatnak a gondolkodásra, de nem határozzák azt meg teljesen. Minddel kapcsolatban pár remek és egyszerűen magyarázó példát találhatunk Trón Viktor és Kálmán László Bevezetés a nyelvtudományba c. könyvében:

Ma is sokan azt gondolják, hogy az egyes nyelvek szóhasználati, grammatikai különbségei egyértelműen a yelvek beszélőinek sajátságos gondolkodását tükrözik. Annyi bizonyos, hogy szoros összefüggés van aközött, hogy milyen kifejezések vannak egy nyelvben, és hogy milyen fogalmak, megkülönböztetések vannak a beszélők fejében. A szakembereknek is sok olyan szavuk van, amelyet mások nem használnak. Hiszen azokat a dolgokat szeretjük megnevezni tudni, amelyek fontosak az életünkben; ez nem túl meglepő állítás. A halászok sok halat ismernek és neveznek meg, napjaink számítógépes gurui szintén sok olyan fogalmat ismernek (és ezért nevet is adnak nekik), amelyet a közönséges halandó nem.

Nézzünk egy példát arra, hogy az egyes nyelvek milyen dolgok között tesznek különbséget. A francia parmi
és entre elöljárószót magyarul egyaránt között-nek kell mondani, jelentésbeli különbségüknek a magyarban nincs megfelelője:
(1)
A között két francia megfelelője

a.
Mon arbre est parmi les autres arbres.
az én . . . -m fa van között a többi fák
’Az én fám a többi fa között van’

b.
Jean est entre les deux arbres.
János van között a két fák
’János a két fa között van’

Tehát a parmi azt jelenti, hogy ’közülük az egyik’, míg az entre azt, hogy 'közöttük elhelyezkedő'. Vagy vegyük az álmosság különböző kifejezéseit:

(2)
Az álmosság két különböző kifejezése

J’ai sommeil.
nekem van álmosság
’Álmos vagyok’

Ezek a különbségek tényleg azt takarnák, hogy a francia és magyar beszélők másképp gondolkodnak a dolgok térbeli elhelyezkedésével, illetve az álmossággal kapcsolatban? Távolról sem. Az, hogy mindkét nyelvben ugyanúgy gondolkodnak, leginkább ott érhető tetten, hogy ugyanazon tényekből azonos következtetésekre jutnak.

valamint

Eleanor Rosch (?–) kísérletei bizonyították, hogy a dani nyelv beszélői, akik csupán két színnevet különböztetnek meg a nyelvükben, ugyanolyan teljesítményt nyújtanak a tizenegy ún. fokális szín azonosításában, mint azok, akiknek nyelvében mind a tizenegy színnév szerepel (a dani nyelvet mintegy 180 ezer pápua beszéli Új-Guinea nyugati részén). A nyelvi relativizmus még enyhébb változata viszont, miszerint a nyelvi kategorizáció hatással van az emlékezetre, és így közvetve kihat a gondolkodásra, számos kísérlet fényében valószínűnek tűnik.

/*kiemelés tőlem*/

Röviden azt is mondhatnám, hogy mondjuk a polinéziai kannibálok nem azért nem beszélnek határozott integrálról, mert nem tudnák mentálisan reprezentálni azt, hanem azért, mert nincs benne a kultúrájukban és kész, de ha benne lenne, tudnának róla beszélni.

Na de most hogyan kapcsolódnak ide a nem latin írásrendszerű programozási nyelvek? Hogy bizonyos alapkoncepciók egyeznek az olyan jól ismert nyelvekkel, amik akár a jól ismert procedurális vagy éppen funkcionális programozási nyelvekben ismertek.

kép: allthingslearning.wordpress.com

A deep web szerepe a nyílt forrású információszerzésben

2017.07.20. 01:30 | bardóczi ákos | Szólj hozzá!

Címkék: webkettő social media deep web TOR OSINT nyílt forrású információszerzés hidden services ONION

deep_web_iceberg.jpgSzámtalan, a deep webbel alap szinten foglalkozó írásban és előadáson találkozhatunk azzal a kijelentéssel, hogy a deep web méretét tekintve a hagyományos web több százszorosa. Amellett, hogy én ezzel kapcsolatban mindig szkeptikus voltam, olyat még nem láttam, ahol valaki ezt egy komoly forrásmegjelöléssel igazolta volna, így felvetődik több fontos kérdés. [UPDATE: forrás persze van, de az egy 2001-es, azaz laza 16 évvel ezelőtti, extrapolációs modellre alapozott kutatás.] A kérdés, hogy netes a kontextusban mit értünk egyáltalán információ alatt. Ugyanis teljesen mindegy, hogy ilyen-olyan akadémiai kutatások mekkorára becsülik a teljes deep web információtartalmát, abban az esetben, ha ezek gyakorlati szempontból nem érhetők el a deep web híres-hírhedt kvázi kereshetetlensége miatt, ha nincs olyan eszköz a kezünkbe, amin keresztül a számunkra szükséges információ gyorsan és hatékonyan kereshető, elérhető, akkor inkább hidden serviceket működtető szerverek adathordozóin lévő adatról helyes beszélni, nem pedig információról.

Azaz, hogy ne menjek messzire, ha valaki azzal kapcsolatban szeretne tájékozódni, hogy a legfrissebb kutatások szerint a TOR-on vagy a Freeneten lévő hivatkozások mekkora része döglött link, mennyi lehet azoknak az oldalaknak az aránya, amire konkrétan csak egy-két másik oldal mutat, a Google Scholaron keresztül vagy a SciHubon rogyásig talál ezzel kapcsolatban cikkeket, aztán az már a témában való jártasságán múlik, hogy azokat a cikkeket nézze meg, amire ténylegesen szüksége van, míg például a TOR-on sokszor relatív egyszerű tartalmak megtalálása is akadályokba ütközik. /*Azzal most ne kekeckedjünk, hogy a SciHub is hidden service végülis.*/

Azaz ha nagyon szemléletesek szeretnénk lenni, akkor azt is mondhatnánk, hogy egy hatalmas könyvtárban is csak az az adathalmaz tekinthető információnak, ami katalóguson keresztül kereshető, egyébként kvázi nem létezik.

Ráadásul a mai világban az információnak nem elég kereshetőnek lennie, közhelyesnek tűnik, de gyorsan és hatékonyan kereshetőnek is kell lennie olyan értelemben, hogy a nem kimondottan információkinyerésre szakosodott kutatónak, na meg úgy egyáltalán bárkinek ne kelljen túl sokat foglalkoznia a keresés mikéntjével, a kereső mégis adjon releváns találatokat. A digitális írástudás része kellene, hogy legyen a Google haladó operátorok ismerete, hogy mi az, amit éppen a piacvezető keresőmotorokkal kevésbé érdemes keresni, mit keressünk Shodannal, Google Scholarral, Duckduckgoval, azaz nem arról van szó, hogy egyáltalán ne kelljen értenie az átlag felhasználónak a kereséshez, de az elvárható, hogy ne kelljen nagyon trükköznie és agyalnia ahhoz, hogy releváns forrásokra találjon.

A gyorsaság és a hatékonyság mellett még kiemelném azt, amit én közel valós idejűségnek nevezek, azaz, hogy egy megjelent tartalom ne ezer év után kerüljön fel egy webes kereső indexébe, egy közösségi médiában, felkerülő, de a web felől nem látható tartalmat, így például egy Facebookon vagy VK-n megjelenő posztot a rendszer indexelje is, amilyen gyorsan csak tudja, hogy az mások számára kereshető legyen.

Ezeknek a feltételeknek a legnagyobb deep web hálózatok keresőinek egyike sem tesz eleget, azaz inkább adatot tárol, de nem információt, ebben pedig belátható időn belül nem is várható változás, hiszen egy hatékony keresőszolgáltatás működtetése erőforrásigényes, ennek megfelelően drága, jelen esetben túl drága ahhoz, hogy egy hatékony keresőszolgáltatást önkéntesekre támaszkodva, crowdfunding alapon építeni lehessen. Röviden,  nem várható egy onionos google megjelenése.

Szó sincs róla, hogy a deep web értéket el akarnám bagatellizálni, csak a deep web ezen félreértett jellegére hívnám fel a figyelmet.

Adja magát a kérdés, hogy a nyílt-forrású információszerzésben milyen eszközként tekinthetünk a deep webes világra? A deep web számos esetben fontos forrás lehet, de ne legyenek illúzióink, egy olyan világban, ahol még az is hatalmas információs lábnyomokat maga után, aki nem vagy csak alig használ közösségi szolgáltatásokat, a weben, a web felől nem indexelt, de a közösségi szolgáltatásokban elérhető és más, hagyományos netes szolgáltatásokban rendszerint elérhetőek a számunkra fontos információk, valamint az azok közti relációk olyan mennyiségben, amennyire szükségünk van, még ez is bőven elég. Ráadásul úgy, hogy bizonyos tartalmakat a Bing-Google-Yahoo-szentháromság, de akár még a Yandex Search is szándékosan nem tesz kereshetővé, a közösségi weben sokszor még a jól megtervezett keresési technikákkal is falnak megyünk, lévén, hogy azokban kevésbé prioritás, hogy minden azonnal, mindenki számára kereshető legyen.

Hogy az utóbbi gondolat érthetőbb legyen: ha én a Facebookon kiteszem mondjuk egy általam kitalált eperpuding receptjét posztként és annak láthatóságát publikusra állítom, gyakorlatilag biztos lehetek benne, hogy az ismerőseim, valamint ismerőseim ismerősei számára a pudingrecept azonnal kereshető a Graph Search-ön keresztül. Adott például egy Kolumbiában élő felhasználó, akivel nincs közös ismerősöm, sosem váltottam vele üzenetet, úgymond semmilyen interakció nem volt köztünk, nem vagyunk semmilyen közös csoportban, ahogy még csak olyan oldal sincs, amit mindketten lájkolnánk és más nyelven használjuk a Facebookot és más nyelv van megadva azok közt a nyelvek közt, amiket a Settings alatt általunk értett nyelvekként jelöltünk meg. A Facebook keresője mögötti logika van olyan intelligens, hogy nem ész nélkül próbál mindent kétpofára felindexelni, majd az mindenki számára kereshetővé tenni. Előnyben részesíti azokat, akik valószínűleg az adott tartalomra kíváncsiak lesznek és számukra korábban válik kereshetővé egy-egy tartalom leggyorsabban, míg a képzeletbeli Kolumbiai felhasználó hiába keres a képzeletbeli posztra például úgy, hogy olyan eperpuding receptek leírását szeretné látni, amiket ebben a hónapban posztoltak, az én képzeletbeli posztom esetleg egyáltalán nem fog előtte megjelenni! Azaz ebben a kontextusban a netsemlegesség keresés szempontjából túl drága lenne és persze nincs is rá olyan szintű igény, ami indokolná, hogy ezen változtassanak, hiszen nem nyílt-forrású információszerzéssel foglalkozik a világ összes felhasználója.

Visszatérve a deep webre, nagyon meg lennék lepve, ha kiderülne, hogy egy átlagos use caseben - már ha egyáltalán létezik ilyen - a deep weben keresve valaki gyorsabban végezne egy teljes kutatással, mint a hagyományos weben keresztül. Természetesen más a helyzet, ha valaki tipikusan olyan ügyben folytat kutatást, amivel kapcsolatban a deep webről várható használható információ, ilyen például a fegyverkereskedelemmel, drogkereskedelemmel kapcsolatos információk, bérgyilkos-rendelő szolgáltatások, kiskorúak sérelmére elkövetett erőszakos bűncselekmények bizonyítékai, meg úgy általában olyan, ami minden államban tiltott, normális ember pedig nem szivesen lát a képernyőn.

Nemrég felröppent, hogy az ISIS saját közösségi szolgáltatást hozott létre, miután a mindenki által jól ismert webes óriások hangzatosan bejelentették, hogy fellépnek a radikalizálódó tartalmak és az azokat terítő felhasználók ellen - aminél nagyobb ostobaságot, mi több, bűnt nem is követhettek volna el, ahogy arról korábban beszéltem. Ami az ISIS közösségi szolgáltatását illeti, olyan, mint Columbo felesége, beszél róla mindenki, de alighanem még senki sem látta. Abban az esetben viszont, ha van ilyen, meg lennék lepődve rajta, teljes egészében vagy nagyrészt a deep webre támaszkodna egy bizonyos méret fölött, lévén, hogy a terrorista is ember. Ennek megfelelően életszerűtlen, hogy olyan egy ilyen feltételezett közösségi szolgáltatás egy - valljuk be - igencsak fapados, a 80-as évek netjének megoldásaira emlékeztető infrastruktúrát használjon. A terrorizmus amellett, hogy egy igencsak "réteg műfaj" avagy "underground", de nem annyira, hogy egy terrorizmussal foglalkozó csoportot túl nehezen lehessen elérni, túl bonyolult legyen a velük való kapcsolatfelvétel és kommunikáció, hiszen ez eleve a toborzást és a mai világban elvárt információáramlás sebességét tenné elégtelenné Dzsihád Dzsoni és csapata számára.

Több éves empirikus tapasztalat, hogy kimondottan OSINT téren a deep webes hálózatok egyáltalán nem kiugróan értékes források. Sem az OSINT-tel foglalkozó nyilvános anyagok, sem pedig a szürkezónába tartozó magánkiadások nem foglalkoznak a deep webbel különösebben nagy súllyal, márpedig ez nem az a diszciplína, ahol gyakoriak lennének a méltatlanul elhanyagolt források és technikák. Ahogy azt sincs okunk feltételezni, hogy a világ vezető hírszerző csúcsszerveinél valamiféle szent grálként tekintenének a hidden service-ekre, természetesen arról szó sincs, hogy nem kutatnák és ne foglalkoznának vele, számtalan példát lehetne hozni azzal kapcsolatban, amikor egy-egy bűncselekmény nyomozásának a deep webnek kiemelt szerepe vagy konkrétan fő terepe volt, de szó sincs róla, hogy például a szervezett bűnözés vagy a terrorizmus egyszerűen átköltözött volna mindenestől a deep webre. Holott első blikkre logikusan azt várnánk, hogy az ő esetükben aztán tényleg indokolt. Kevésbé nyakatekerten fogalmazva, ha mondjuk egy teljes drogkartell, amelyik nagytételben tolja pszichotróp szerekkel a bizniszt olyan információs közegbe költözik, ahol kevésbé utolérhető, ugyanakkor kevésbé kereshető is a hatóságok számára, világos, hogy nem csak a hatóságok számára lesz nehezebben elérhető, hanem az ügyfélköre számára szintén, amivel nyilván hátrányba kerül a másik drogkartellel szemben.

Persze, több esetben a deep web tipikus eszköze egy-egy bűnözői szolgáltatás igénybevételének, ha például valaki bérgyilkost vagy emberi szervet rendelne, de ehhez nem kell a deep webre menni. Hirtelen az a néhány évvel ezelőtti eset jutott eszembe, amikor egy embercsempész bandát kapcsoltak le, ahol konkrétan fejlődő országokból lehetett gyerekeket vásárolni, ekkor azt gondolnánk, hogy csak-csak figyelnek a diszkrécióra, ehhez képest annyira idióták voltak az ügyfelek és az embercsempészek egyaránt, hogy mindezt egy Facebook-csoportban beszélték meg. Ahogy az is eléggé erős volt, amikor az Egyesült Királyságban két idióta terrorista nyitott Twitter-csatornán kért ötleteket azzal kapcsolatban, hogy mikor és hol robbantson, mert azt hitték, hogy a twiteket csak a követőik látják.

Távoli asszociáció: jól ismert, hogy a szervezett bűnözés és a terrorizmus sokszor olyan virágnyelvet használ, ami miatt még akkor sem világos, hogy miről beszélnek, ha egyébként technikailag sikeresen lehallgatják őket. Ugyanakkor ha ez eszelősen bonyolult lenne egy ilyen nyelv, egyszerűen nem használnák. A deep webbel, mint információs tereppel hasonló a helyzet. Persze, van működő feketepiaca a drogoktól a szervcsempészeten keresztül a 0day szoftveres sebezhetőségekig már mindennek, ezek egyike sem lehet egy bizonyos fokúnál jobban eldugva, mivel ilyen esetben konkrétan senki vagy túl kevesen tudnák egyáltalán megtalálni.

Összefoglalva, amikor egy kutatásban a hidden servicek nem jutnak különösebb szerephez a nyílt forrású információszerzésben, nem azért van, mert akik végzik, nem lennének kompetensek a használatában, hanem azért, mert sok esetben egyáltalán nincs rá szükség. Nagyon sok esetben a bűnügyi nyomozásoknál is erről van szó, suta analógiaként említeném, hogy a büntetőeljárások többségében titkos adatszerzés és titkos információgyűjtés és hasonló varázslatok nélkül is sikeresek vagy éppen amikor a gyanusított nem hajlandó semmit mondani. Hasonlóan a nyílt forrású információszerzéshez, a bűnügyi nyomozás is akkor professzionális, ha minél ötletesebben és minél egyszerűbben van egészében megtervezve.

kép: Wikipedia