Vissza az előzőleg látogatott oldalra (nem elérhető funkció)Vissza a tananyag kezdőlapjára (P)Ugrás a tananyag előző oldalára (E)Ugrás a tananyag következő oldalára (V)Fogalom megjelenítés (nem elérhető funkció)Fogalmak listája (nem elérhető funkció)Oldal nyomtatása (nem elérhető funkció)Oldaltérkép megtekintése (D)Keresés az oldalon (nem elérhető funkció)Súgó megtekintése (S)

Üzleti és közpolitikai alkalmazások, marketing, adatbányászat, szociális intelligencia / Az üzleti intelligencia és alkalmazásai

Tanulási útmutató

Összefoglalás

Szöveganalízisben rejlő lehetőségek az üzleti életben

Története

Az üzleti intelligenciának komoly története van ahhoz képest, hogy viszonylag új fejlemény a gazdasági életben. Mindenekelőtt azonban érdemes a fogalmat tisztázni, mert az intelligencia magyar fogalma egy kicsit eltér az angolnak attól a jelentésétől, ami ebben az esetben dominál: voltaképpen hírszerzésről van szó, ha nem is (mindig) a klasszikus kémkedés értelmében. Azaz, különféle adatbázisokból, pl. dokumentumok korpuszából miként lehet üzletileg hasznos információt kinyerni. Egy olyan vízióból indul ki, amely nagyon hasonlít ahhoz a modellhez, amit a kognitív idegtudomány az emberi elméről felállít. Az üzleti intelligencia „feltalálójaként” számon tartott H.P. Luhn előre vetítette a mai óriási adattömeget termelő világunkat, s úgy képzelte, hogy automatikus, intelligens rendszerek fogják a szervezetek számára hasznos információt ebből az adattömegből kinyerni, kicsit hasonlóan ahhoz, ahogyan az emberi elme adaptív tudattalanja kinyeri az őt folyamatosan érő óriási adathalmazból a rendszer számára hasznos információt. Érdemes idézni az 1958-ban (!) megjelent cikkéből:

„Manapság egyre fokozódó ütemben állítjuk elő és hasznosítjuk az információt az emberi tevékenységek felgyorsult üteme és kitágult horizontja miatt, valamint az átlagos iskolázottsági szint emelkedése miatt. Ugyanakkor a szervezetek növekedése és egyre speciálisabbá és megosztottabbá válásuk új akadályokat állított az információ áramlása elé. Ugyancsak egyre nagyobb az igény a gyors döntések iránt a felelősség jóval alacsonyabb szervezeti szintjein, mint az a múltban megszokott volt. Kétségtelen, hogy a leginkább ijesztő kommunikációs probléma maga az információ hatalmas tömege, amivel kezdeni kell valamit. A jelenlegi tendenciákat tekintve az automatizálás kínálja a leghatékonyabb módszereket ennek az információnak a visszaszerzésére és terjesztésére.”

Ám egészen 1989-ig kellett várni, amíg Howard Dresner jóvoltából bekerült az üzleti gondolkodás főáramába. Ő így definiálta az üzleti intelligenciát: „elgondolások és módszerek az üzleti döntéshozatal tényalapú támogatórendszerekre támaszkodó javítására.” Az üzleti intelligencia tehát ma már egy ernyőfogalom, ami alá egy sor technológia tartozik, így

De magában foglalja ez a fogalom a döntéstámogató rendszereket (Decision Support System, DSS), a vezetői információs rendszereket (Management Information System, MIS) és a felsővezetői információs rendszert (Executive Information System, EIS) is.

Összefoglalva tehát az üzleti intelligencia szoftverek a döntéshozókat számos területen segítik a munkájukban, így például a gyártó cégeket a termékek célba juttatásában és a vevőszolgálatban segítik; a kiskereskedelmi cégeket abban, hogy kuponos akcióikat finoman tudják a célcsoportokra hangolni; a pénzügyi szolgáltatókat a követelések elemzésében és a csalások kiszűrésében; a szállítmányozó vállalatokat a flottamenedzselésben; a telekommunikáció vállaltokat annak megállapításában, hogy a fogyasztók miért morzsolódnak le; a közszolgáltatásokban az energiafelhasználás vizsgálatára; az egészségügyben a kezelések kimenetelének elemzésére.

Strukturálatlan adatbázisok elemzése

Eredetileg azonban elsősorban szövegek elemzése lebegett Luhn szeme előtt, s mivel a fentebb felsorolt technológiák jelentős mértékben átfednek más adatbázis elemzési módszerekkel, a szöveges adattömegek elemzésére fogunk fókuszálni, amibe belevesszük az ilyen forrásokból leszűrhető érzelmek elemzését is. Ez a megközelítés viszonylag újnak számít, ami nem véletlen. Amikor az üzleti intelligencia, mint szoftver kategória megjelent a 80-as és 90-es években, akkor elsősorban a számszerű adatokat tartalmazó adatbázisok elemzésére fókuszált, ami érthető, hiszen ezek elemzése viszonylag jól algoritmizálható, lévén többnyire strukturált adatbázisok. A szövegszerű adatbázisok ezzel szemben definíciószerűen nem strukturáltak, ami sokkal nehezebb feladat elé állítja az elemzőket.

A szövegelemzés egyszerűbb, könnyebben automatizálható változatai azok a szoftverek (ETL – Extract, transform, load), amelyek személyneveket, földrajzi neveket, dátumokat, telefonszámokat és e-mail címeket különítenek el a szövegekben, majd alkotnak belőlük rendszerezett adatbázisokat. Az ilyen adatbázisok nyilván nagy gyakorlati hasznot hajtanak, de igen korlátozott a belőlük kinyerhető minőségi információ. Komoly igény van összetettebb dokumentumok, pl. hírek automatikus feldolgozására is. A mai technológiákkal ez már nem olyan lehetetlen, mint a mesterséges intelligencia kutatások hőskorában volt. Még a 60-as, 70-es években próbálkoztak az MIT-n ilyen szoftverrel. Egy tanulságos történet érzékelteti Marvin Minskytől, hogy milyen nehézségekbe ütközött ez a feladat. Olyan szoftvert próbáltak alkotni, amely képes természeti katasztrófákról szóló rövid újsághíreket kategorizált adatbázisba rendezni. Íme, egy bájos bakija a programnak. A hír lényege, hogy egész Olaszországot megrendítette a pápa halála. Ebből a hírből a szoftver az adatbázis számára a következő „extract, transform, load”-ot készítette: Földrengés volt Olaszországban. Áldozatok száma: 1.

A legkorábbi szövegbányász alkalmazások: hírszerző elemzők, biomedikális összefüggések kutatói, akik tűt kerestek a szénakazalban. Ismert vagy ismeretlen terroristákat, egy fehérjét, amelynek jelenléte aktivál vagy gátol egy genetikai útvonalat, ami rákhoz vezethet, és ami felismerhető lehet a biomedikai szakirodalom bányászásával.

Közhelynek számít, hogy az üzleti élet számára fontos információ 80 százaléka strukturálatlan formában, leginkább szövegek formájában létezik. Épp ez volt a fő motiváció, hogy meghaladják az egyszerűbb ETL megoldásokat. A feladat tehát az, hogy ezt az értékes, az automatikus feldolgozás hagyományos formái számára mégis áthatolhatatlan adattömeget informatívvá tegyük.

A szövegbányászat számára nyilvánvalóan az első és meghatározó lépés a dokumentumok gyűjtése. Elvileg bármilyen szöveges dokumentumgyűjtemény megteszi, de a korpusz mérete rendkívül fontos tényező az ilyen szoftver rendszerek számára. Ezek a korpuszok lehetnek statikusak, ami azt jelenti, hogy a kiinduló halmaz változatlan marad, de nyilván jóval életszerűbbek a dinamikus korpuszok, ahol rendszeres a gyarapodás és a frissülés. Az egyik legrégibb és legnagyobb korpusz a PubMed, ami biomedikai kutatási beszámolókat tartalmaz, és 1966 óta gyűlik, 10 millió fölötti számban tartalmaz cikkeket, és havonta kb. 40.000 cikkel bővül.

Noha az üzleti intelligencia irodalom az ilyen szöveges korpuszokat „strukturálatlannak” nevezi, ez túlzás. A szövegek természetesen rendelkeznek nyelvtani szerkezettel, amit számítógépes nyelvészeti eszközökkel valamennyire kezelni tudnak a szövegbányász szoftverrendszerek; ezen kívül sok olyan tipográfiai és egyéb jellegzetesség van, ami támpontul szolgálhat durva strukturálás számára. A tipikus szövegeket, amilyen a legtöbb üzleti beszámoló, tudományos cikk, jogi szöveg, vagy újsághír, szabadformátumú vagy gyengén strukturált dokumentumoknak szokás inkább nevezni. Az ennél erősebben strukturált dokumentumokat – pl. szabványos e-mail-eket, HTML dokumentumokat, web oldalakat, PDF állományokat – szokás félig strukturált dokumentumoknak nevezni.

Maas szintű szövegbányászat
Példa

Az FDB dán szövetkezeti szupermarket csoport 2009 óta gyűjt 143 véletlenszerűen kiválasztott embertől információt a táplálkozásáról. Azt kérik tőlük, hogy minden nap írják le a saját szavaikkal, mit ettek az előző napon. Beszerzik egy sor személyes adatukat is: testmagasság, testtömeg index, jövedelem, iskolai végzettség, nem, életkor és lakóhely. 2012 novemberében már bő egy millió bejegyzés volt az adatbázisukban, s ezek szövegelemzése érdekes eredményekre vezetett, amiket a szupermarketlánc jól hasznosít. Kiderült például, hogy a szénsavas üdítőitalok nagy hatással vannak a BMI-re 50 év alattiaknál, míg az idősebb emberekre főleg annak van hatása, ha bort isznak és sajtot esznek késő este.

Korábban a szupermarketlánc abból indult ki, hogy a táplálkozás szempontjából Dánia kicsi és homogén. Az elemzés azonban mást mutatott. Nyugat-Jütlandban a rántott csirke népszerűbb, mint másutt. A német határ közelében élő emberek 20 százalékkal több káposztát esznek, mint a Dánia más részein élők. Egészségesebben táplálkoznak a Koppenhágától északra elterülő jobb módú régióban, ahol több halat és gyümölcsöt fogyasztanak, és 30 százalékkal több bort isznak. A rozskenyeret széles körben fogyasztják Dániában, ezt eddig is tudták az FDB-nél, de az elemzés arra is rávilágított, hogy az idősebb emberek kevesebb rozskenyeret esznek, mint a fiatalabbak, és különösen a férfiak körében nő a fogyasztása. Az FDB ezeket az adatokat a marketing munka pontosabb célzásához használja, de javaslatokat is tesz a kormánynak közegészségügyi kérdésekben.

Ez az adatbázis elemző módszer a szöveganalitika (text analytics), amely olyan eljárásokból áll, amelyek üzleti értéket tárnak fel strukturálatlan szövegben statisztikai, nyelvészeti, gépi tanulási valamint adatelemzési is adatvizualizációs technikák alkalmazásával.

Egy érdekes vizsgálatban azt vetették egybe, hogy miként alakult a fogyasztók bizalma a gazdaságban a Lehman Brothers összeomlásától a tőzsde talpra állásáig a Gallup felmérések és a Twitteren az „állás” (job) szó említése közötti korreláció tükrében. A korrelációs együttható 0,794 volt! Ami nagyon szép együtt járás, de azért nem árt az óvatosság, mert a Twitter adatok egy erőteljes kiugrást is mutattak – amikor Steve Jobs útjára indított egy új iPhone-t 2009 júniusában.

A szöveg analitika legfontosabb üzleti alkalmazásai:

  • Márka, termék, hírnév menedzselése
    • Piackutatás és társas médiafigyelés; azaz, mit mondanak az emberek a márkámról vagy termékeimről
  • A fogyasztó tapasztalatainak megismerése
    • Közbe kell lépnem és felajánlanom vevőszolgálatot?
    • Hányan ajánlják a márkámat vagy beszélnek le róla másokat?
  • Keresés, információ elérés, vagy kérdések megválaszolása
    • Melyik blogíró ad hangot negatív véleménynek a rezsicsökkentéssel kapcsolatban?
    • A Szállásajánlón melyik szállodák kapnak kiváló értékelést a szobaszervizükre?
    • Mely cikkek hasonlóak ehhez?
  • Hírszerzés versenytársakról
    • Milyen rivális termékek vásárlását fontolgatják az emberek, és miért?
    • A versenytárs médiaköltése generál vásárlási szándékot?

Egy furcsaság, ami ugyancsak óvatosságra int: valahányszor Anne Hathaway neve megjelent a hírekben, a Berkshire Hathaway A (Warren Buffet befektetési cége) részvényeinek értéke emelkedett.

Vissza a tartalomjegyzékhez

Új Széchenyi terv
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszirozásával valósul meg.

A Társadalominformatika: moduláris tananyagok, interdiszciplináris tartalom- és tudásmenedzsment rendszerek fejlesztése az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával, az ELTE TÁMOP 4.1.2.A/1-11/1-2011-0056 projekt keretében valósult meg.
A tananyag elkészítéséhez az ELTESCORM keretrendszert használtuk.