Sisällysluettelo:
- Tietojen kaivaminen tietyissä liike-elämässä
- Tietojenkäsittely ja tekoälytys
- Tiedonlaskenta ja tilastot
Video: Data Mining: How You're Revealing More Than You Think 2025
Tietomyynnin erottamiskyky, verrattuna kyselyyn, raportointiin tai jopa OLAPiin, on, että saat tietoja ilman, että tarvitset erityisiä kysymyksiä.
Tietojen kaivostoiminnassa on kaksi ensisijaista tehtävää liiketoimintatiedustelussa:
-
"Kerro minulle mitä voi tapahtua": Tietojen louhinnan ensimmäinen rooli on ennustava, jossa olet periaatteessa sanonut: "Kerro minulle saattaa tapahtua. "Käyttämällä piilotettua tietojasi lukittuna datavarastossa todennäköisyydet ja todennäköisyys tulevista trendeistä ja esiintymistavoista fretoituvat ja esitellään sinulle.
-
"Kerro minulle jotain mielenkiintoista" roolia: Mahdollisten tulevien tapahtumien ja tapahtumien lisäksi tiedonlouhinta yrittää myös vetää mielenkiintoisia tietoja, joista luultavasti pitäisi tietää, epätavallinen suhde kahden eri tuotteen myynnin välillä ja miten tämä suhde vaihtelee vähittäismyymälöissänne sijoittamisen mukaan.
Vaikka monet näistä mielenkiintoisista tidbiteistä ovat todennäköisesti olemassa, mitä kysymyksiä kysyt, olisiko käytössä kysely- tai OLAP-työkalu ja miten tulkitsette tuloksia? Tietojen kaivostoiminta auttaa sinua tässä vaikeassa tehtävässä selvittää mitä kysymyksiä haluat tehdä tekemällä suuren osan murskata työtä sinulle.
Tietojen kaivaminen tietyissä liike-elämässä
Tietojen kaivaminen sopii erityisesti näihin erityyppisiin liike-elämän tehtäviin:
-
Petosten havaitseminen
-
Markkinointiohjelman tehokkuuden määrittäminen
-
sinun on kohdistettava osana markkinointiohjelmaa
-
Asiakkaan elinkaaren hallinta, mukaan lukien asiakkaan säilytysmatka
-
Suorittaa kehittyneitä liiketoimintaprosessimallinnus ja mitä-if-skenaarioita
Mieti, mikä on edellisen luettelon jokaisen edustustojen takana:
-
Suuri määrä tietoja
-
Suurempi eri tietomäärien yhdistelmien lukumäärä
-
Intensiivisten tulosten määritysanalyysi, johon yleensä liittyy monimutkaisia algoritmeja ja kehittyneitä tilastollisia tekniikoita
Ajattele nyt, mitä sinun pitäisi tehdä, jos käytät raportointi- tai OLAP-työkalua näiden tehtävien suorittamiseen. Sinun olisi lähes mahdotonta suorittaa perusteellisesti jokin edellisistä tehtävistä, jos sinun tarvitsee esittää kysymys ja saada tulos, kysyä toinen kysymys ja saada toinen tulos, ja jatka sitten näitä vaiheita.
Tietojenkäsittely ja tekoälytys
Jos olet ollut tietotekniikan alalla vähintään kymmenen vuotta, jotkin edellisistä termeistä saattavat kuulosta melko tuttuilta.Piilotettujen tietojen vapauttaminen? Ennakoiva toiminto? Odota hetki - se on tekoäly!
Kaupallisen tietojenkäsittelyn varhaisimmista päivistä on ollut valtava kiinnostus kehittää "ajattelevia koneita", jotka pystyvät käsittelemään suuria määriä tietoja ja tekemään päätöksiä tämän analyysin perusteella.
Kiinnostus keinotekoiseen älykkyydestä (AI) osui sen zenithiin 1980-luvun puolivälissä. Tietokannan toimittajat työskentelivät tuolloin tietokantahallintajärjestelmien (KBMS) tuottamiseksi; muut myyjät saivat asiantuntijajärjestelmän kuoret, tai AI-pohjaiset sovelluskehityskehykset, jotka käyttivät tekniikoita, kuten eteenpäin ketjuttamista ja taaksepäin ketjuttamista, neuvomaan käyttäjää päätöksistä; ja neuraaliset verkot sijoitettiin seuraavan suuren AI: n kehityksenä.
Kiinnostus AI: han heikkeni 1990-luvun alussa, kun odotukset ylittivät käytettävissä olevat valmiudet ja muut haasteet, kuten asiakas- / palvelinmuutto ja (tietenkin) datavarastointi.
Nyt AI on palannut!
Tiedonlouhinnan korkeimman profiilin AI-tekniikka on neuroverkkoja. Neuraaliverkot alun perin kuviteltiin prosessimalliksi, joka jäljittelisi sitä, miten ihmisen aivo ratkaisee ongelmat, käyttämällä neuroneja ja hyvin rinnakkaista käsittelyä mallin ratkaisemiseksi.
Neuroverkkoalgoritmien soveltaminen liiketoimintatiedon aloihin, jotka käsittelevät tiedonhankintaa (uudelleen, ennustavat ja "kertovat minulle mielenkiintoisimmille"), näyttävät luonnolliselta ottelulta.
Vaikka tietojen louhinta / hermosovelluspeli on ehdottomasti syytä tarkistaa, sinun pitäisi tehdä se huolellisesti. Löydät paljon mielenkiintoisia ja jännittäviä tekniikoita, jotka käsittelevät niitä, jotka eivät ymmärrä algoritmeja, todennäköisesti epäonnistuvat.
Oikealla tietämyksellä ja koulutuksella voit kuitenkin tehdä täyden mittakaavan sitoutumisen tämäntyyppisen käsittelyn tekemiseen liiketoimintatiedon kehykseksi OLAP-keskittymisen analysoimiseksi.
Tiedonlaskenta ja tilastot
Tiedonlouhinnan kehittyneempi alue on kehittyneiden tilastollisten tekniikoiden soveltaminen tietokantasi suuria tietomääriä vastaan. Eri työkalut käyttävät erilaisia tilastollisia tekniikoita, räätälöityjä niille aloille, joihin he yrittävät käsitellä.
Ilman tilastotietoa, saatat löytää paljon tiedonlouhinnasta hämmentävää. Sinun täytyy tehdä paljon työtä harjoittelemaan algoritmeja ja rakentaa sääntöjä, jotta varmistetaan oikeat tulokset suuremmilla tiedoilla. Olettaen kuitenkin, että olet tyytyväinen tähän käsitteeseen tai sinulla on kollega, joka voi auttaa, tässä on joitain laajemmin käytössä olevia algoritmeja:
-
Luokittelualgoritmit: Ennusta yksi tai useampi erillinen muuttuja, joka perustuu toiseen attribuutteja. Käyttämällä luokittelualgoritmeja tiedonlouhintatyökalu voi tarkastella suuria määriä tietoja ja kertoa teille esimerkiksi, että "Asiakkaat, jotka säilytetään vähintään kahden sukupolven tuotehankinnoilla, ovat yleensä ominaisuuksia: Heillä on tulot vähintään 75 000 dollaria, ja he omistavat omat koteihinsa."
-
Regressioalgoritmit: Ennusta yksi tai useampi jatkuva muuttuja, kuten voitto tai tappio, joka perustuu aineiston muihin ominaisuuksiin. Regressioalgoritmeja ohjataan ajan myötä tiedonsiirto-työkalulle esitetyille historiallisille tiedoille, jotka tunnetaan paremmin nimellä aikasarjat .
-
Segmentaatioalgoritmit: Jaa tiedot ryhmiin tai klusteihin kohteista, joilla on samankaltaiset ominaisuudet.
-
Association algoritmit: Etsi tietojoukon eri attribuuttien väliset korrelaatiot. Tällaisen algoritmin yleisin sovellus luo assosiaatiosäännöt, joita voit käyttää markkinakori-analyysissä. Huomaa esimerkiksi, että jos asiakas ostaa tietyn ohjelmistopaketin, hänellä on 65 prosentin mahdollisuus ostaa vähintään kaksi tuotekohtaista lisäosaa kahden viikon kuluessa.
-
Sekvenssin analyysin algoritmit: Yhteenveto usein esiintyvistä sekvensseistä tai jaksoista datassa, kuten web-path -virrassa.
Useita muita menetelmiä on olemassa. Pudota pois vanha tilastokirja ja aloita lukeminen.