Barion Pixel
+36302147515
2234 Maglód, Lövéte u. 30/4.
08:30 - 16:30

Információ vagy adat? Avagy a megtévesztő statisztika…

GeriSoft Stúdió Kft.ÁltalánosInformáció vagy adat? Avagy a megtévesztő statisztika…

Soron kívüli cikkelemzésünk apropóját egy friss hír adta, miszerint az Apple OSX a legsebezhetőbb operációs rendszer. Ezt a cikket az Index.hu átvette egy angol forrásból, és nyers fordításban közzétette, így nem őket szapulnám, hanem az eredeti írót. Sajnos a cikk erős megtévesztés kategóriába tartozik. A cikk abba a kategóriába tartozik, ahol sok igazság mellé betesznek valami szenzációs, persze hamis hírt, így azt is elhiszi az ember, azonnal.

Az operációs rendszerek szégyen-toplistáján egészen meghökkentő módon az Apple-féle OSX, az iOS, és a Linux szerepel a dobogón, messze megelőzve a különféle Windows-verziókat. Ez erősen szembemegy a közhiedelemmel, ami szerint a Windows biztonsági szempontból lyukas, mint az ementáli sajt, bezzeg az Apple szoftverei milyen jók, a Linux pedig maga a tökély. (forrás: index.hu)

Nos, első körben tegyünk tisztába valamit: adat, vagy információ? Sokan esnek abba a hibába, hogy ránéznek egy látogatottság grafikonra (pl. google analitika), egy havi bevétel/kiadás adattáblára, vagy bármi hasonló adatfolyamra, és közlik, ebben mennyi információ van! NEM! Sajnos nem. Az adat nem információ. Az információ egy adott adathalmazból kinyert rész vagy egész halmaz megfelelő rendezéséből kinyert (előállított) “történet“, amit esetleg más adathalmaz rész vagy egészével összehasonlítva bizonyos információ összehasonlítható valamivel, de nem nyerhető ki belőle!
Húha, ez most lehet, hogy kicsit erős, meg száraz, de tény, az adat nem hordoz információt, tehát nem nyerhető ki információ az adatokból. Az információ az adatok helyes felhasználásával állítható elő, és emiatt az előállított információ tartalmáért az felel, aki előállította.

Lássuk a fenti példát, és idézek egy képet a cikkből:

application-chart

Ez egy nyers adathalmaz. Ebből sok ember arra a következtetésre juthat, hogy az IE veszélyes, ezért mást használ. Én azt mondom, nem biztos. Miért? Mert nem mindegy, mit látunk, és mit olvasunk. Igen, nagyon gáz a toplista élén lenni, de meg kell nézni, mennyi a “piaci részesedése”, avagy mekkora potenciális veszélyt hordoz? Ma már az IE alig 25-30% részesedéssel bír a piacon, tehát az összes internetező alig negyede használja ezt a sérülékeny valamit. Ellenben a Chrome és a Firefox összesen a piac ~50%-át fedi le, és a kettő összes potenciális veszélyforrása magasabb mint az IE-é, tehát több ember van veszélynek kitéve összesen, mint az IE felhasználók! Ugye milyen érdekes? Ugyanaz az adat, más a kinyert információ!

És akkor beszéljünk két apró csalásról: nincs benne az Opera böngésző. Miért is? Ne mondják már, hogy az 100%-os, és nem kerül ide.
Csalás #2: Apple TV. Ez miez? Kérdezhetnénk… Ugye, ez nem egy alkalmazás, ez egy hardver, amin az iOS egy módosított verziója fut. Mit keres az alkalmazások közt?
Ugye milyen könnyű elrejteni valami kis csalást?

És akkor lássuk a fő problémát, ezt a táblát, amiből a következtetést levonták:

OS-chart

Houston, we have a problem… A francba, OSX-em van, és mindjárt megsérülök!!!!
Hmm, nézzük, minek nevezzük? Nettó hazugság, vagy csak kozmetikázás? Legyünk rendesek, kozmetikázás. A száraz adatok láthatóak. Nagyon is. Mi a hiba?

Nos, a kedves cikkíró egy halom csalást bújtatott el itt, lássuk sorról sorra:

  1. A tábla nem tartalmazza valamiért az android platformot (1.927 sérülékenység! [forrás: NVD adatbázis]). Itt a fő gond az, hogy messze első lenne, mert rengeteg elavult (2-es főverziós akár) verzió fut olyan készüléken, amire nem jelent meg frissítés, és a Play storeba bármit feltölthetek, amíg valaki észre nem veszi a beépített keyloggert/malwaret, nem törlik. iOS esetén előzetes vizsgálat van delegálás előtt ugye…
  2. Emberünk kijelenti: A linux, Az OSX, Az iOS. Nos, ha ezzel szembe állítjuk a windows szétdarabolását főverziókra (amiből kedvesen kihagyjuk a windows phone verziót, 27 sérülékenység [forrás: nvd adatbázis]!), akkor miért nem tesszük meg a többivel is? iOS 6.x 7.x 8.x, Linux (Ubuntu, Debian, Suse, Redhat, Slackware, stb, és ezek random fordított kernelei?), OSX 10.5.x, 10.6.x, 10.7.x, 10.8.x, 10.9.x és az aktuális Yosemite 10.10.x (ja, ez kihagyható, friss 2015 Security update óta 2 [kettő] sérülékenység). Miért fontos ez? Lásd következő pont.
  3. Ha az összes windowst összeadjuk, ugyanúgy, mint tette ezt az OSX és Linux verziókkal, akkor 248 sérülékenység jön ki! Azta….. Hát ez durván toplistás! És még egy gond! A Win7 SP1-ig ugye az IE kötelezően érkezett a rendszerekhez, most ugye választható, de a rendszermagba be van drótozva pár része. És egy átlagos Windows-on 80-90% hogy fel van telepítve, csak nem mindig használják. (Vállalati környezetben sokszor viszont kötelezően egyetlen böngészőként szerepel, mert sok VIR csak ezzel kommunikál távoli eléréshez, vagy ASP fejlesztés van központi szerveren, stb) És mi a gond? Az IE 242 sérülékenysége hozzáadódik a bármely verzió 36-38 sérülékenységéhez! Hoppá, ne csaljunk, ne csaljunk.

Ezt az android dolgot kiteszem nagyban:

Search Results
There are 1,926 matching records.
Search Parameters: Keyword (text search): android
Search Type: Search All
Contains Software Flaws (CVE)

Wow… Kér valaki egy Androidos telefont? Persze ebben benne van a core system és az android appok összes sérülékenység, ugyanilyen keresésre (iphone) 322 találat jön ki, sajnos keveredik benne a kínai SIPhone találat is, tehát a kettő együttes halmaza ennyi, tovább szűrni nincs kedvem most.

Ugye, milyen könnyű adatokkal megtéveszteni? És még csalni sem kell, csak megfelelően köríteni a tányéron.

Eszembe jut egy kézzelfoghatóbb sztori, egy értékesítés elemzésről, mikor mindketten ugyanazt a halmazt néztük, kolléga szerint “…va jó hónap” volt, szerintem meg átlag alatti. És ezen elindult a vita, a végére kiderült, hogy ha az aktuális hónapot megdobó nagyértékű beruházást (a havi forgalom 18%-a volt egy vevő részére) nem vesszük figyelembe, mert ebből 2 évente jön be egy, tehát havi standardba nem tehető be, akkor a maradék összeg szerint 10%-al kisebb a bevételünk az éves átlagnál, és 15%-al több számlát adtunk ki, tehát súlyosan fragmentálódtunk, és nőtt a munkateher, és csökkent a munkaóra arányos bevételünk, akkor csak hápogtak. Ugyanaz az adat, más információ, attól függ, hogyan használjuk.

Konklúzió: ne féljünk az adatelemzést olyan szakemberre bízni, aki megfelelő módon tud információt előállítani a nyers adatokból! Nagyon fontos, hiszen így válik adatból történet, így lehet elolvasni, mi van az adathalmazban! Mint az idegen nyelv. Az angol ABC és a magyar ABC az ékezetes betűket eltekintve (hozzáadott információ) azonos, mégsem tudunk angolul olvasni, főleg beszélni, ha nem tanuljuk. Az adatok elemzése külön szakág, legalább 6-8 speciális képességet igényel, ha nem szeretnénk, hogy félrevezessük olvasóinkat.

Leave a comment

Your email address will not be published. Required fields are marked *