Vissza az előzőleg látogatott oldalra (nem elérhető funkció)Vissza a tananyag kezdőlapjára (P)Ugrás a tananyag előző oldalára (E)Ugrás a tananyag következő oldalára (V)Fogalom megjelenítés (nem elérhető funkció)Fogalmak listája (nem elérhető funkció)Oldal nyomtatása (nem elérhető funkció)Oldaltérkép megtekintése (D)Keresés az oldalon (nem elérhető funkció)Súgó megtekintése (S)

Üzleti és közpolitikai alkalmazások, marketing, adatbányászat, szociális intelligencia / Valós idejű, valós adatok, adattárházak, lekérdezések

Tanulási útmutató

Összefoglalás

Hogyan változtatja meg a Big Data az életünket?

Információ és adat

Az információ szó szerint véve hír, üzenet, tájékoztatás, melynek eredményeként a nem tudás tudásba fordul. Az információ nyom, mely formálja a lelket. Az információ csökkenti a bizonytalanságot. Az információt az anyagi világ részei, a jelek hordozzák. Az információ a jelek megfejtése, dekódolása, interpretációja révén hasznosul. Az információelmélet megalkotója, Shannon, egy egyenlettel írta le a jelek által hordozott információ tartalmat:

Shannon-törvény

(k a jelkészletből felhasznált jelek száma, p a jelkészletből 1 jel kiválasztásának valószínűsége)

A posztmodern társadalomban az információ érték, melynek birtoklása előnyt jelent az egyének és a csoportok között folyó gazdasági és politikai versenyben. A tudás társadalom alapja az információ, mely azoknak a munkaköröknek biztosít előnyt, amelyek betöltői információt termelnek, továbbítanak.

Az adat közölhető, feldolgozható, ábrázolható, interpretálható információ, mely számoknak megfeleltethető. Minden jel elvileg adatnak tekinthető. Az adat a valóság interiorizált és operacionalizált mása, mely lehetővé teszi az ésszerű cselekvést. Az információ négy féle módon jelenik meg az adatban. Az egyes megjelenési módok a valóság mérési szintjei szerint különböznek.

1. Nominális adat, melynek csak 0 és 1 értékei lehetségesek.

2. Ordinális adat, mely a mértéket is mutatja az azonosság mellett.

3. Az intervallum skála adatai számszerűen megmutatják, hogy mennyivel nagyobb vagy kisebb az egyik érték a másiktól (pl. Celsius fokban mért hőmérséklet)

4. Az arány skála segítségével mért adat abszolút pontos információt szolgáltat a tárgyról vagy folyamatról, melyre vonatkozik (pl. kilogramm, Kelvin fok, méter)

Az infokommunikációs eszközök terjedésével, az internet és a számítógép használat bővülésével, illetve egyes társadalmi folyamatok digitalizálásával a mindennapi életben, mind a kormányzat, mind az üzleti élet területén egyre több adat keletkezik. A keletkezik szó használata ebben az esetben nem véletlen: sokszor az adat, mint melléktermék jelenik meg, nem szándékoltan gyűlik, az elemzésre való igény csak később merül fel.

Az adatok rögzítése, tárolása, feldolgozása, továbbítása, kijelzése csak akkor lehetséges, ha adatbázisba kerülnek. Az adatok tárolása gépi úton ugyanúgy történik, mint az emberi elme esetében: az adatbázis az adatokat rövid távú és hosszú távú (nem felejtő) memóriában tárolja, pl. DVD, felhő). Vannak adatokat leíró adatok is (metaadatok).

Adatmennyiségek jelölései

Az adatok hordozói sérülékenyek. Az adathordozó anyagok kopnak, pusztulnak. A régészet, a történettudomány, a kriminológia, az oknyomozó újságírás számára komoly kihívás az eltűnt (vagy eltűntetett) adatok okozta hiány kipótlása. Az adatmennyiség változatai a következők:

1 Byte = 8 Bit

1 Kilobyte = 1024 Byte

1 Megabyte = 1024 Kilobyte

1 Gigabyte = 1024 Megabyte

1 Terabyte = 1024 Gigabyte

1 Petabyte = 1024 Terabyte

A kép (nagyobb változata) külön ablakban is megtekinthető.mozy_full.jpgMennyi is egy petabye? (forrás: http://www.mozy.com)

Nagy adatbázisok

Az adat információt hordoz. Az infokommunikációs technológiák a XXI. században oly mértékben hatoltak be a gazdaságba és a társadalomba, hogy az élet minden területéről megállíthatatlan ütemben bővül az adattömeg. Ez a folyamatosan bővülő adattömeg kincs mindazok kezében, akik sok ember számára kínálnak termékeket és szolgáltatásokat. A nagy adatbázisok (Big Data) elemzésére épülő piaci szolgáltatások, az elemzés eredményeire épülő fejlesztések, az IKT szektor legdinamikusabban növekvő ágazatát képezik. E piaci szegmens jelenleg legnagyobb szereplője, az IBM, melynek a Big Data szolgáltatásokkal kapcsolatos forgalma 2013-ban meghaladta a 1.3 milliárd dollárt.

A galéria a jobb és bal oldalon megjelenő nyilakkal lapozható

Flash lejátszó letöltése

Az IBM szuperszámítógépei az évek során

A nagy és egyre nagyobb adattömeg elemzése új távlatokat nyit az ügyfél elérés előtt a kereskedelemben, a szolgáltatásokban, a politikában. A „Big Data”, melyről a későbbiekben még sok szó lesz, messze több mint a Facebook vagy a Google által rögzített adathalmaz, melynek elemzése persze ugyancsak hasznos lehet, mint arra majd egy későbbi előadásban utalunk. Az adatbázisok révén a tényleges viselkedést követhetjük nyomon. A tényleges viselkedések megismerése lehetőséget ad a várható viselkedések előre jelzésére. Ez a nagy adatbázisokkal kapcsolatos analitika lényege. Fontos eleme az elemzésnek a kapcsolat rendszer bevonása, melynek révén a viselkedések a hatások és kölcsönhatások terében kerülnek elemzése.

Ezekből az adatokból azonban csak akkor jön létre hozzáadott érték, ha a szervezetek elemzik a rendelkezésükre álló hatalmas adatmennyiséget, és az így nyert információk birtokában kihasználják a lehetőségeket. Ugyanakkor nem egyszerű biztosítani, hogy a megfelelő információ, a megfelelő helyen, a megfelelő időben rendelkezésre álljon. Akkor beszélünk Big Data jelenségről, amikor az adatok meghaladják egy szervezet hagyományos adatbázis-tárolási vagy feldolgozási képességét.

A 2012-es olimpiai játékokon generált adatmennyiség (forrás: http://www.narendranaidu.com/)

Vissza a tartalomjegyzékhez

Új Széchenyi terv
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszirozásával valósul meg.

A Társadalominformatika: moduláris tananyagok, interdiszciplináris tartalom- és tudásmenedzsment rendszerek fejlesztése az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával, az ELTE TÁMOP 4.1.2.A/1-11/1-2011-0056 projekt keretében valósult meg.
A tananyag elkészítéséhez az ELTESCORM keretrendszert használtuk.