Business Intelligence analyse: nye produkter

Skrevet av Wanda Presthus, Høyskolelektor og doktorgradsstudent, Norges Informasjonsteknologiske Høgskole. Tidligere publisert i NextBridges BIblogg, 15.06.2012.

Lær av skuespilleren Will Smith: gjør nytte av dine data. Oppdag mønstre. Bruk den informasjonen som du synes passer. Som det sto i Computerworld fredag 1. juni: I dag er datamengden så enorm at det gjør ikke noe om kvalitetssikringen ikke er helt på topp, hovedtrekk og trender vil komme tilsyne likevel. Tradisjonelt har Business Intelligence (BI) handlet om beslutningsstøtte for ledelsen i en bedrift ved å tilby pålitelige data. Dette innlegget eksemplifiserer BI analyse på en mindre traust måte, og skaper et rammeverk med ni design for BI produkter.

BI kan være prosess, teknologi eller produkt. Prosessen handler om å gjøre om data til informasjon, så til beslutning og handling. Teknologiene er mange, fra Microsoft Excel, programmeringskode eller applikasjoner fra de store selgere som SAS Institute, IBM, Microsoft og SAP. Produktene spenner fra enkle spørringer, via rapporter og grafer, til visuelle dashboards med avanserte analysemuligheter ved hjelp av data mining. Figur 1 under viser ulike analyseteknikker helt til høyre (Business Analytics, OLAP, dashboards og mer).

Figur 1: Hovedkomponentene i Business Intelligence (Turban et al. 2007, s. 201)

Jeg har en god nyhet: det mangler ikke på data. Figur 1 illustrerer med fem «databøtter» til venstre: fra «POS» (Point of Sale = salgstransaksjoner) øverst til «External Web documents» nederst. Så var det den dårlige nyheten: data må analyseres for å skape verdi. (Davenport et al. 2010) har påpekt dette i årevis, og har en morsom kommentar fra en leder i en stor matvarekjede:

Davenport: “Hva gjør dere med alle dataene dere har fra bank- og salgstransaksjonene, kundeloyalitetsprogrammene og clickstream fra websidene deres?”

Lederen: “Vi lagrer dem på disk. Så overfører vi dem til tape. Tilslutt legger vi dem under et fjell slik at de overleverer atomangrep.”

Davenport: “Men analyserer dere data slik at dere kan ta bedre beslutninger?”

Lederen: “Ikke mye, nei. Men vi vil bli bedre, det er derfor jeg snakker med deg.”

Davenports løsning er å begynne i det små. Prøv å analysere noen data, og se om det fører til bedre beslutninger. Min kollega Bendik Bygstad og jeg har laget ni små design for analyse, med spesielt fokus på data som kan hentes inn fra sosiale medier slik som blogginnlegg og Facebook, clickstream data fra websider, eller mobiltelefoner via hotspots (Presthus and Bygstad 2011). Data kan trekkes ut ved å bruke nettsidens API (Application Programming Interface), som enten ligger på nettsiden (for eksempel Facebook) eller kan fåes ved å kontakte firmaet (som ser på dette som kvalitetssikring av sine data). Google Analytics er gratis, enkel og kan legges inn på enhver nettside som lar deg få lov.

Løselig basert på dimensjonene til Gorry and Scott Morton (1971) og Brobst and Rarey (2003), har vi laget et rammeverk med grad av datastruktur og tidsperspektiv som spenner fra hendelse som har skjedd («I går»), til nåtidshendelse («I dag») og hendelser som kan skje («I morgen»), som vises i figur 2.

Datastruktur/Tid Skjedde i går Skjer i dag Kan skje i morgen
Ustrukturerte data (ingen meta data) 1. Analyse av blogg og rapporter 4. Real time overvåking på sykehus 7.  Smittsom virus prediksjon
Semistrukturerte data (meta data forekommer) 2. Sosiale media analyse 5. “Reality mining” 8. Salgsprediksjon og markedsføring
Strukturerte data (høy grad av meta data og kategorier) 3. Click-stream analyse 6. Dashboard og visualisering 9. Statistisk prediksjon

Figur 2: Ni design for analyse med BI

Til å begynne med (les: 60-70 tallet) var rapportering det enerådende BI produktet, som kun fortalte noe omhva, og til en viss grad hvorfor, om noe som allerede hadde skjedd. «I går» kolonnen har data som samles inn etter at hendelsen har funnet sted. I følge Gartner Group er rapportering fremdeles det største produktet, og har fremdeles stor verdi (se design 1 lenger ned), men i mange tilfeller ønsker man å ha real-time informasjon, slik at vi kan undersøke situasjonen akkurat nå og forhåpentligvis gjøre noe med det: det typiske eksempelet er flyselskapet som ikke vil ta av med tomme seter. Alle som har sett filmen «Back to the Future 2» eller eid aksjer vet hvilken enorm makt det ligger i å vite hva som kommer til å skje. I dette tilfellet fabrikkeres data for å forsøke å spå hva som vil skje, slik at vi kan 1) forhindre at det skjer, eller 2) være forberedt når det skjer. Dette gir oss ni ulike analysedesign, som vises i figur 2. Design nummer 1, 5 og 9 utdypes med eksempler:

Design 1: Analyse av blogg og rapporter

En blogg består av ustrukturerte data, typisk tekst (Inmon and Nesavich 2008), og forteller om noe som har skjedd. Det er likevel mye informasjon og lærdom man kan få ved å trekke ut og studere data fra blogger. Hvis det er mye tekst, kan data lastes inn i et regneark eller i dedikerte tekstminingsverktøy som RapidMiner eller Leximaner. Det vites ikke hva den amerikanske skuespilleren Will Smith (nå aktuell med filmen «Men in Black III», se figur 3), brukte av teknologi, men han forklarte sin megasuksess ved «å lytte til data». Sammen med sin manager studerte han de mest suksessfulle filmene gjennom historien, og gjorde en enkel analyse.

Figur 3: Poster fra International Movie Database (2012) (http://www.imdb.com/title/tt1409024/)

De fant ut at for å bli berømt burde han spille i filmer med 1) action og spesialeffekter 2) noe overnaturlig 3) en kjærlighetshistorie. På bakgrunn av dette valgte han å spille i filmene «Independence Day» og «Men in Black», som begge ble store kassasuksesser. Mr. Smith studerer fortsatt blogger og rapporter på ukentlig basis (Davenport et al. 2010). Skal du ikke bli filmstjerne, men IT-konsulent? Da kan du analysere hva andre mener om det firmaet du har lyst til å søke jobb i, eller hva et firma egentlig ser etter i sine medarbeidere.

Design 5: Reality mining

Reality mining muliggjøres av teknologi i familien automatisk identifikasjon, slik som RFID (Radio Frequency Identification – du har en slik i bompengebrikken i frontruten på bilen din), strekkoder og signaler fra mobiltelefoni (Turban et al. 2011). Varehandel og distribusjon lar sine produkter og pakker “kringkaste sin identitet og tilstedeværelse” (Davenport et al. 2010). Personer med en påslått mobiltelefon eller iPad kringkaster telefonsignaler som kan spores og gjøres om til informasjon. Eksempelvis, hvis du befinner deg i en ukjent by, kan du laste ned en app og få real-time bevegelser fra andre turister, som illustrert i figur 4.

Figur 4: App’en CitySence (Turban et al. 2011, side 642)

Kartet viser hvor du står og hvor andre personer har stått tidligere, samt to steder hvor disse har beveget seg etterpå. Et firma eller et bystyre kan forbedre turisttilbudet ved en slik analyse, og turisten får i større grad skreddersydde forslag.

Design 9: Akademisk prognose

Studenter som velger feil karrière eller avbryter utdannelsen er kostbart både for studenten og samfunnet. På Harvard har forelesere tatt i bruk data mining applikasjonen “Learning Catalytics” (figur 5) som skal hjelpe studenten ved å foreslå medstudenter til å diskutere et matematikkproblem med.

Figur 5: Applikasjonen «Learning Catalytics» (Parry, 2011)

Studentenes museklikk på prøver blir logget og analysert til konkrete forslag som: «Diskutér svaret ditt med Alexis som sitter foran deg, og Emily som sitter til venstre» (Parry 2011). Videre diskuterer artikkelen hvordan data mining kan forutse hvorvidt studenten kan klare å bli sykepleier eller lege. Dette er yrker som noen studenter kanskje velger fordi andre familiemedlemmer har valgt det, og ikke på bakgrunn av studentens egen interesse eller ferdighet. Applikasjonen kan på et tidlig tidspunkt detektere at avgjørende karakterer i et studium vil ikke bli gode nok for å kvalifisere til det valgte studiet, og kan foreslå andre yrker. Kanskje studenten ikke viser tegn på å kvalifisere til lege, men heller til psykolog. En annen mulighet er at studenten viser store kunstneriske ferdigheter og bør heller penses inn på en helt annen retning enn helsevesenet. Som i design 5 bruker applikasjonen her mønstre fra tidligere studenter med tilsvarende emnevalg, karakternivå og hvilke yrker de har valgt seg.

Forhåpentligvis kan dette innlegget motivere til mer analyse av data. Hent frem data som ligger på regneark, i kasseapparatet, under fjellet eller på websider. Forsøk å tenke «utenfor boksen» og se etter trender og mønstre. Det er ikke alltid nødvendig å se hele skogen og alle trærne – for Will Smith holdt det med 10 (ti!) rapporter.

Referanser:

Brobst, S., and Rarey, J. (2003). «Five Stages of Data Warehouse Decision Support Evolution».DSSResources.COM, 01/06/2003. Tilgjengelig på: http://dssresources.com/papers/features/brobst&rarey01062003.html.

Davenport, T. H., Harris, J. G., and Morison, R. (2010). Analytics at Work: Harvard Business Press.

Gorry, G. A., and Scott Morton, M. S. (1971). «A Framework for Management Information Systems.»Sloan Management Review, 13(1), 55-70.

Inmon, W. H., and Nesavich, A. (2008). Tapping Into Unstructured Data: Prentice Hall.

Parry, M. (2011). «Colleges Mine Data to Tailor Students’ Experience». Tilgjengelig på:

http://chronicle.com/article/A-Moneyball-Approach-to/130062/?utm_source=twitterfeed&utm_medium=twitter

Presthus, W., and Bygstad, B. (2011). Conducting Research with Business Intelligence: NOKOBIT, Gjøvik. Tapir Akademisk Forlag.

Turban, E., Aronson, J. E., Liang, T.-P., and Sharda, R. (2007). Decision Support and Business Intelligence Systems: Pearson Prentice-Hall.

Turban, E., Sharda, R., and Delen, D. (2011). Decision Support and Business Intelligence Systems: Prentice Hall.

Advertisements

Legg igjen en kommentar

21. juni 2012 · 07:11

Legg igjen en kommentar

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut / Endre )

Twitter picture

Du kommenterer med bruk av din Twitter konto. Logg ut / Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut / Endre )

Google+ photo

Du kommenterer med bruk av din Google+ konto. Logg ut / Endre )

Kobler til %s