Analytiikkapakki

Analyyttisen mallin valinta

Ratkaistaessa liiketoiminnallista kysymystä datan avulla on oleellista, mikä analyyttinen malli valitaan. Jokainen ratkaistava tapaus vaatii omanlaisensa mallinnusmenetelmän ja tietynlaisen muuttujajoukon. Oheisen kaaviokuvan kysymyspolku havainnollistaa, mitkä mallit soveltuvat käytettäväksi missäkin ratkaistavassa tapauksessa.

Datan taltiointiin, käsittelyyn ja hyödyntämiseen tarkalla tasolla tarvitaan oikeat työkalut, tietokannat ja tietovarastot. Erilaisia tiedon keruuseen, taltiointiin, raportointiin, visualisointiin ja analysointiin liittyviä teknologioita on paljon. Uusia teknologioita ja termejä syntyy jatkuvasti niin tiiviiseen tahtiin, että asiaan vihkiytyneidenkin on vaikeaa pysyä perässä. Tiedolla johtamisen kannalta kulloisellekin teknologialle on kuitenkin olemassa selkeät roolit. Alla tärkeimpiä tietojen keruun, taltioinnin, synkronoinnin, analysoinnin ja hyödyntämisen keskeisimpiin teknologioihin liittyviä termejä kuvauksineen.

Kun on saatu aikaan yhtenäinen, ehyt ja oikea-aikainen tietopohja, voidaan edetä varsinaiseen analytiikan hyödyntämiseen. Edistyneellä analytiikalla tarkoitetaan tiedon käyttöä tapahtuneiden ilmiöiden selittämiseen (descriptiivinen analytiikka) tai tulevien tapahtumien ennustamiseen (prediktiivinen analytiikka). Eli kun perinteinen raportointi katsoo historiaan, nykyajan analytiikkavälineet antavat näkymän tulevaisuuteen. Analytiikka perustuu erilaisten matemaattisten mallien hyödyntämiseen. Malleilla on erilaisia teoreettisia lähtökohtia ja käyttötarkoituksia. Alla olevassa analytiikan sanastossa on lista tunnetuimmista analytiikkaan liittyvistä termeistä kuvauksineen.

Teknologian sanasto

API (Application Programming Interface)
AWS (Amazon Web Services)
Big Data
BO
CDW (customer data warehouse)
Cognos
DataStage
EDW (enterprise data warehouse)
ERStudio
ERWin
ETL (extraction, transformation and loading)
GitHub
Hadoop
IaaS (Infrastructure as a service)
IBM SPSS Modeler
Informatica
Java
Javascript
Map reduce
NodeJS
NoSQL (Not only SQL)
ODBC, JDBC
OLAP
OLTP
PaaS (Platform as a service)
Pentaho
Python
Qlik
R
RapidMiner
Relaatiotietokannat
SaaS (Software as a Service)
SAS
Spark
SQL
Tableau
Tietokantateknologiat
Tietomallit
Web crawling

Analytiikan sanasto

Aikasarja-analyysi
Algoritmit
Asiakasanalytiikka
Assosiaatioanalyysit
Bayes-menetelmät
Business intelligence, BI
Cross-over tutkimusasetelma
Data science
Elinaika-analyysit
Ennustemalli
Frekvenssijakauma
Hypoteesien testausmenetelmät
Juurisyy-analyysi
Keskihajonta
Koeasetelma
Kohina
Koneoppiminen
Korrelaatio
Kuvaileva analytiikka
Liiketoiminta-analytiikka
Liukuva keskiarvo
Luokittelumenetelmät
Luottamusväli
Merkitsevyystaso
Monimuuttujamenetelmät
Neuroverkko
Optimointi (matemaattinen)
Ostoskorianalyysi
Otos
Outlier
Päätöksentekoikkuna
Pisteytys (scoring)
Polkuanalyysi
Prediktiivinen analytiikka
Preskriptiivinen analytiikka
Puuttuva tieto
Regressioanalyysit
Ristiintaulukointi
Ryhmittelymenetelmät (segmentointi, klusterointi)
Sekoittava tekijä
Selitettävä muuttuja (vastemuuttuja)
Selitysaste
Simulointimenetelmät
Survey, kyselytutkimus
Tekstianalyysi
Teollinen internet (Internet of things)
Tiedon synkronointi
Tiedonlouhinta
Variaatiokerroin
Varianssianalyysi
Verrokkiryhmä (kontrolliryhmä)
Web-analytiikka


HOUSTON ANALYTICSIN EDUSTAMAT IBM:N TUOTTEET

Predictive and Descriptive analytics
IBM SPSS Modeler
IBM SPSS Modeler Server
IBM SPSS Collaboration and Deployment Services

Optimization / Prescriptive analytics
IBM ILOG CPLEX Optimization Studio
IBM Decision optimization Center

Reporting and Business intelligence
IBM Cognos

Business planning
IBM Cognos TM1

IBM Predictive Customer Intelligence
IBM Predictive Maintenance and Quality
IBM Counter Fraud Management

Bluemix

Softlayer

Watson