data mining examples
Deze tutorial behandelt de meest populaire voorbeelden van datamining in het echte leven. Meer informatie over dataminingtoepassingen in financiën, marketing, gezondheidszorg en CRM:
In deze Gratis datamining-trainingsserie , we hebben de Dataminingproces in onze vorige tutorial. Datamining, ook wel bekend als Knowledge Discovery in Databases (KDD), is een proces van het ontdekken van patronen in een grote set data en datawarehouses.
Diverse technieken zoals regressieanalyse, associatie en clustering, classificatie en uitbijteranalyse worden toegepast op gegevens om bruikbare resultaten te identificeren. Deze technieken maken gebruik van software en backend-algoritmen die de gegevens analyseren en patronen laten zien.
waarmee json-bestanden worden geopend
Enkele van de bekende dataminingmethoden zijn analyse van de beslissingsboom, analyse van de Bayes-theorema, frequente mijnbouw van itemsets, enz. De softwaremarkt heeft veel open-source en betaalde tools voor datamining, zoals Weka, Rapid Miner en Oranje datamining-tools.
Het dataminingproces begint met het geven van een bepaalde gegevensinvoer aan de dataminingtools die statistieken en algoritmen gebruiken om de rapporten en patronen te tonen. De resultaten kunnen worden gevisualiseerd met behulp van deze tools die kunnen worden begrepen en verder kunnen worden toegepast om zakelijke aanpassingen en verbeteringen door te voeren.
Datamining wordt veel gebruikt door organisaties bij het ontwikkelen van een marketingstrategie, door ziekenhuizen voor diagnostische tools, door e-commerce voor cross-selling van producten via websites en vele andere manieren.
Enkele voorbeelden van datamining worden hieronder ter referentie gegeven.
Wat je leert:
- Voorbeelden van datamining in het echte leven
- Voorbeelden van datamining in de financiële wereld
- Toepassingen van datamining in marketing
- Voorbeelden van dataminingtoepassingen in de gezondheidszorg
- Datamining en aanbevelingssystemen
- Datamining voor CRM (Customer Relationship Management)
- Datamining met behulp van een voorbeeld van een beslissingsboom
- Populairste voorbeeld van datamining: marketing en verkoop
- Grote bedrijven die datamining gebruiken
- Gevolgtrekking
- Aanbevolen literatuur
Voorbeelden van datamining in het echte leven
Het belang van datamining en -analyse wordt in ons echte leven met de dag groter. Tegenwoordig gebruiken de meeste organisaties datamining voor analyse van Big Data.
Laten we eens kijken hoe deze technologieën ons ten goede komen.
# 1) Mobiele serviceproviders
Mobiele serviceproviders gebruiken datamining om hun marketingcampagnes te ontwerpen en om te voorkomen dat klanten naar andere leveranciers gaan.
Op basis van een grote hoeveelheid gegevens, zoals factureringsinformatie, e-mail, sms-berichten, gegevensoverdracht via internet en klantenservice, kunnen de dataminingtools het 'verloop' voorspellen dat de klanten vertelt die van leverancier willen veranderen.
Met deze resultaten wordt een kansscore gegeven. De mobiele serviceproviders zijn dan in staat om prikkels te geven, aanbiedingen aan klanten die een groter risico lopen op karnen. Dit soort mijnbouw wordt vaak gebruikt door grote serviceproviders zoals breedband-, telefoon-, gasleveranciers, enz.
[beeld bron
# 2) Detailhandel
Datamining helpt de eigenaren van supermarkten en detailhandel om de keuzes van de klanten te kennen. Kijkend naar de aankoopgeschiedenis van de klanten, tonen de dataminingtools de koopvoorkeuren van de klanten.
Met behulp van deze resultaten ontwerpen de supermarkten de plaatsingen van producten in de schappen en brengen ze aanbiedingen uit op artikelen zoals kortingsbonnen voor bijpassende producten en speciale kortingen op sommige producten.
Deze campagnes zijn gebaseerd op RFM-groepering. RFM staat voor recentheid, frequentie en monetaire groepering. De acties en marketingcampagnes zijn op maat gemaakt voor deze segmenten. De klant die veel maar heel minder vaak uitgeeft, zal anders worden behandeld dan de klant die elke 2-3 dagen koopt, maar voor minder.
Datamining kan worden gebruikt voor productaanbevelingen en kruisverwijzingen van artikelen.
Datamining in de detailhandel vanuit verschillende gegevensbronnen.
[beeld bron
# 3) Kunstmatige intelligentie
Een systeem wordt kunstmatig intelligent gemaakt door het te voeden met relevante patronen. Deze patronen zijn afkomstig van datamining-output. De outputs van de kunstmatig intelligente systemen worden ook geanalyseerd op hun relevantie met behulp van dataminingtechnieken.
De aanbevelingssystemen gebruiken dataminingtechnieken om gepersonaliseerde aanbevelingen te doen wanneer de klant interactie heeft met de machines. De kunstmatige intelligentie wordt gebruikt op gedolven gegevens zoals het geven van productaanbevelingen op basis van de eerdere aankoopgeschiedenis van de klant in Amazon.
# 4) E-commerce
Veel e-commercesites gebruiken datamining om cross-selling en upselling van hun producten aan te bieden. De winkelsites zoals Amazon, Flipkart tonen 'Mensen bekeken ook', 'Vaak samen gekocht' aan de klanten die interactie hebben met de site.
Deze aanbevelingen worden gedaan met behulp van datamining over de aankoopgeschiedenis van de klanten van de website.
# 5) Wetenschap en techniek
Met de komst van datamining verschuiven wetenschappelijke toepassingen nu van statistische technieken naar het gebruik van “data verzamelen en opslaan” -technieken, en vervolgens mining op nieuwe data, output nieuwe resultaten en experimenteren met het proces. Er wordt een grote hoeveelheid gegevens verzameld uit wetenschappelijke domeinen zoals astronomie, geologie, satellietsensoren, globaal positioneringssysteem, enz.
Datamining in de informatica helpt om de systeemstatus te bewaken, de prestaties ervan te verbeteren, softwarefouten op te sporen, plagiaat te ontdekken en fouten op te sporen. Datamining helpt ook bij het analyseren van de gebruikersfeedback over producten, artikelen om meningen en gevoelens van de meningen af te leiden.
# 6) Misdaadpreventie
Datamining detecteert uitschieters in een enorme hoeveelheid gegevens. De strafrechtelijke gegevens bevatten alle details van het misdrijf dat heeft plaatsgevonden. Data Mining zal de patronen en trends bestuderen en toekomstige gebeurtenissen nauwkeuriger voorspellen.
De agentschappen kunnen achterhalen welk gebied meer vatbaar is voor criminaliteit, hoeveel politiepersoneel er moet worden ingezet, op welke leeftijdsgroep moet worden gericht, voertuignummers die moeten worden gecontroleerd, enz.
# 7) Onderzoek
Onderzoekers gebruiken Data Mining-tools om de verbanden te onderzoeken tussen de parameters die worden onderzocht, zoals omgevingsomstandigheden zoals luchtvervuiling en de verspreiding van ziekten zoals astma onder mensen in de beoogde regio's.
# 8) Landbouw
Boeren gebruiken datamining om de opbrengst van groenten te bepalen met de hoeveelheid water die de planten nodig hebben.
# 9) Automatisering
Door datamining te gebruiken, leren de computersystemen patronen te herkennen tussen de parameters die worden vergeleken. Het systeem slaat de patronen op die in de toekomst nuttig zullen zijn om zakelijke doelen te bereiken. Dit leren is automatisering omdat het helpt bij het behalen van de doelen door middel van machine learning.
# 10) Dynamische prijzen
Datamining helpt de serviceproviders, zoals taxidiensten, om de klanten dynamisch in rekening te brengen op basis van vraag en aanbod. Het is een van de belangrijkste factoren voor het succes van bedrijven.
# 11) Vervoer
Datamining helpt bij het plannen van het verplaatsen van voertuigen van magazijnen naar verkooppunten en bij het analyseren van de laadpatronen van producten.
# 12) Verzekering
Datamining-methoden helpen bij het voorspellen van de klanten die de polissen kopen, analyseren de medische claims die samen worden gebruikt, ontdekken frauduleus gedrag en risicovolle klanten.
Voorbeelden van datamining in de financiële wereld
beeld bron
De financiële sector omvat banken, verzekeringsmaatschappijen en investeringsmaatschappijen. Deze instellingen verzamelen enorm veel data. De gegevens zijn vaak volledig, betrouwbaar en van hoge kwaliteit en vereisen een systematische gegevensanalyse.
Om financiële gegevens op te slaan, worden datawarehouses gebouwd die gegevens opslaan in de vorm van datakubussen. Om deze gegevens te analyseren, worden geavanceerde gegevenskubusconcepten gebruikt. Datamining-methoden zoals clustering en uitbijteranalyse, karakterisering worden gebruikt bij financiële data-analyse en mijnbouw.
Hieronder worden enkele financiële gevallen gegeven waarin datamining wordt gebruikt.
# 1) Voorspelling van leningbetalingen
Datamining-methoden zoals attribuutselectie en attribuutrangschikking analyseren de betalingsgeschiedenis van de klant en selecteren belangrijke factoren zoals de verhouding tussen betaling en inkomen, kredietgeschiedenis, de looptijd van de lening, enz. De resultaten zullen de banken helpen bij het bepalen van het kredietverleningsbeleid, en verstrek ook leningen aan de klanten volgens factoranalyse.
# 2) Gerichte marketing
Dataminingmethoden voor clustering en classificatie helpen bij het vinden van de factoren die de beslissingen van de klant ten aanzien van bankieren beïnvloeden. Identificatie van klanten op basis van vergelijkbaar gedrag zal gerichte marketing vergemakkelijken.
# 3) Financiële misdrijven opsporen
Bankgegevens zijn afkomstig uit veel verschillende bronnen, verschillende steden en verschillende banklocaties. Er worden meerdere tools voor gegevensanalyse ingezet om ongebruikelijke trends zoals transacties met grote bedragen te bestuderen en te detecteren. Datavisualisatietools, uitschietersanalysetools, clusteringstools, enz. Worden gebruikt om de relaties en actiepatronen te identificeren.
De onderstaande figuur is een onderzoek van Infosys waaruit blijkt dat de klant bereid is om in verschillende landen online te bankieren. Infosys heeft voor dit onderzoek Big Data Analytics gebruikt.
[beeld bron
Toepassingen van datamining in marketing
Datamining stimuleert de marketingstrategie van het bedrijf en bevordert de bedrijfsactiviteiten. Het is een van de belangrijkste factoren voor het succes van bedrijven. Er wordt een enorme hoeveelheid gegevens verzameld over verkopen, winkelen door klanten, consumptie, enz. Deze gegevens worden met de dag groter door e-commerce.
Datamining helpt om het koopgedrag van klanten te identificeren, de klantenservice te verbeteren, te focussen op klantbehoud, de verkoop te verbeteren en de kosten van bedrijven te verlagen.
Enkele voorbeelden van datamining in marketing zijn:
# 1) Marktvoorspelling
Om de markt te voorspellen, zullen de marketingprofessionals dataminingtechnieken zoals regressie gebruiken om klantgedrag, veranderingen en gewoonten, klantrespons en andere factoren zoals marketingbudget, andere oplopende kosten, enz. Te bestuderen. In de toekomst zal het gemakkelijker zijn voor professionals om de klanten te voorspellen in geval van factorwijzigingen.
# 2) Detectie van afwijkingen
Dataminingtechnieken worden ingezet om eventuele afwijkingen in de gegevens op te sporen die een fout in het systeem kunnen veroorzaken. Het systeem scant duizenden complexe vermeldingen om deze bewerking uit te voeren.
netwerkapparaten en hun OSI-lagen
# 3) Systeembeveiliging
Data Mining-tools detecteren indringers die de database kunnen schaden en bieden meer beveiliging voor het hele systeem. Deze inbraken kunnen de vorm hebben van dubbele vermeldingen, virussen in de vorm van gegevens door hackers, enz.
Voorbeelden van dataminingtoepassingen in de gezondheidszorg
[beeld bron
In de zorg wordt datamining steeds populairder en essentieel.
De gegevens die door de gezondheidszorg worden gegenereerd, zijn complex en omvangrijk. Om medische fraude en misbruik te voorkomen, worden dataminingtools gebruikt om frauduleuze items op te sporen en zo verlies te voorkomen.
Ter referentie vindt u hieronder enkele voorbeelden van datamining uit de gezondheidszorg.
# 1) Gezondheidszorgmanagement
De datamining-methode wordt gebruikt om chronische ziekten te identificeren, risicovolle regio's te volgen die vatbaar zijn voor verspreiding van ziekten, en programma's te ontwerpen om de verspreiding van ziekten te verminderen. Beroepsbeoefenaren in de gezondheidszorg zullen de ziekten, regio's van patiënten met maximale opnames in het ziekenhuis analyseren.
Met deze gegevens gaan ze de campagnes voor de regio ontwerpen om mensen bewust te maken van de ziekte en te kijken hoe ze deze kunnen voorkomen. Dit zal het aantal patiënten dat in ziekenhuizen wordt opgenomen, verminderen.
# 2) Effectieve behandelingen
Met datamining kunnen de behandelingen worden verbeterd. Door continue vergelijking van symptomen, oorzaken en medicijnen kan data-analyse worden uitgevoerd om effectieve behandelingen te maken. Datamining wordt ook gebruikt voor de behandeling van specifieke ziekten en de associatie van bijwerkingen van behandelingen.
# 3) Frauduleuze en beledigende gegevens
Datamining-applicaties worden gebruikt om abnormale patronen te vinden, zoals laboratoriumresultaten, doktersresultaten, ongepaste recepten en frauduleuze medische claims.
Datamining en aanbevelingssystemen
Aanbevelingssystemen geven klanten productaanbevelingen die mogelijk interessant zijn voor de gebruikers.
De aanbevolen items zijn ofwel vergelijkbaar met de items die de gebruiker in het verleden heeft opgevraagd, ofwel door te kijken naar de andere klantvoorkeuren die dezelfde smaak hebben als de gebruiker. Deze benadering wordt op passende wijze een op inhoud gebaseerde benadering en een op samenwerking gerichte benadering genoemd.
Veel technieken zoals het ophalen van informatie, statistieken, machine learning, enz. Worden gebruikt in aanbevelingssystemen.
Aanbevelingssystemen zoeken naar trefwoorden, gebruikersprofielen, gebruikerstransacties, gemeenschappelijke kenmerken van items om een item voor de gebruiker te schatten. Deze systemen vinden ook de andere gebruikers met een vergelijkbare koopgeschiedenis en voorspellen items die die gebruikers zouden kunnen kopen.
Deze aanpak biedt veel uitdagingen. Het aanbevelingssysteem moet in realtime miljoenen gegevens doorzoeken.
Er zijn twee soorten fouten gemaakt door Recommender Systems:
Valse negatieven en valse positieven.
Valse negatieven zijn producten die niet door het systeem werden aanbevolen, maar de klant zou ze wel willen. Vals positief zijn producten die zijn aanbevolen door het systeem, maar niet gewenst zijn door de klant. Een andere uitdaging is de aanbeveling voor de nieuwe gebruikers zonder aankoopgeschiedenis.
Een intelligente techniek voor het beantwoorden van vragen wordt gebruikt om de vraag te analyseren en algemene, bijbehorende informatie te verstrekken die relevant is voor de vraag. Bijvoorbeeld: De beoordeling van restaurants weergeven in plaats van alleen het adres en telefoonnummer van het gezochte restaurant.
Datamining voor CRM (Customer Relationship Management)
Customer Relationship Management kan worden versterkt met datamining. Goede klantrelaties kunnen worden opgebouwd door geschiktere klanten aan te trekken, betere cross- en up-selling en betere retentie.
Datamining kan CRM verbeteren door:
- Datamining kan bedrijven helpen gerichte programma's te maken voor een hogere respons en een betere ROI.
- Bedrijven kunnen via up-selling en cross-selling meer producten en diensten aanbieden zoals gewenst door de klanten, waardoor de klanttevredenheid toeneemt.
- Met datamining kan een bedrijf detecteren welke klanten op zoek zijn naar andere opties. Met behulp van die informatie kunnen bedrijven ideeën bedenken om te voorkomen dat de klant weggaat.
Datamining helpt CRM bij:
- Database marketing: Met marketingsoftware kunnen bedrijven berichten en e-mails naar klanten sturen. Deze tool kan samen met datamining gerichte marketing doen. Met datamining, automatisering en planning van taken kunnen worden uitgevoerd. Het helpt bij het nemen van betere beslissingen. Het zal ook helpen bij technische beslissingen over wat voor soort klanten geïnteresseerd zijn in een nieuw product, welk marktgebied goed is voor productlancering.
- Campagne voor klantenwerving: Met datamining kan de marktprofessional potentiële klanten identificeren die niet op de hoogte zijn van de producten of nieuwe kopers. Ze zullen de aanbiedingen en initiatieven voor dergelijke klanten kunnen ontwerpen.
- Campagneoptimalisatie: Bedrijven gebruiken datamining voor de effectiviteit van de campagne. Het kan de reacties van klanten op marketingaanbiedingen modelleren.
Datamining met behulp van een voorbeeld van een beslissingsboom
Beslissingsboomalgoritmen worden CART (classificatie- en regressiebomen) genoemd. Het is een begeleide leermethode. Er is een boomstructuur opgebouwd op basis van de gekozen kenmerken, de voorwaarden voor het splitsen en wanneer te stoppen. Beslissingsbomen worden gebruikt om de waarde van klassevariabelen te voorspellen op basis van het leren van eerdere trainingsgegevens.
Het interne knooppunt vertegenwoordigt een attribuut en het bladknooppunt vertegenwoordigt een klasselabel.
[beeld bron
De volgende stappen worden gebruikt om een beslissingsboomstructuur op te bouwen:
- Plaats het beste attribuut bovenaan de boom (wortel).
- Subsets worden zo gemaakt dat elke subset gegevens vertegenwoordigt met dezelfde waarde voor een attribuut.
- Herhaal dezelfde stappen om de bladknooppunten van alle takken te vinden.
Om een klassenlabel te voorspellen, wordt het kenmerk van het record vergeleken met de wortel van de boomstructuur. Bij het vergelijken wordt de volgende tak gekozen. De interne knooppunten worden ook op dezelfde manier vergeleken totdat het bereikte bladknooppunt de klassevariabele voorspelt.
Sommige algoritmen die worden gebruikt voor Decision Tree Induction zijn onder meer Hunt's Algorithm, CART, ID3, C4.5, SLIQ en SPRINT.
Populairste voorbeeld van datamining: marketing en verkoop
Marketing en Sales zijn de domeinen waarin bedrijven grote hoeveelheden gegevens hebben.
# 1) Banken zijn de eerste gebruikers van dataminingtechnologie omdat het hen helpt bij kredietbeoordeling. Datamining analyseert welke diensten van banken door klanten worden gebruikt, welk type klanten gebruikmaakt van pinpassen en wat ze doorgaans met hun pinpas kopen (voor cross-selling).
Banken gebruiken datamining om de transacties die de klant doet te analyseren voordat ze besluiten van bank te veranderen om het klantenverloop te verminderen. Ook worden enkele uitschieters in transacties geanalyseerd voor fraudedetectie.
# 2) Mobiele telefoon Bedrijven gebruik dataminingtechnieken om karnen te voorkomen. Churning is een maatstaf die aangeeft hoeveel klanten de diensten verlaten. Het detecteert patronen die laten zien hoe klanten kunnen profiteren van de services om klanten te behouden.
# 3) Marktkorfanalyse is de techniek om de groepen items te vinden die samen in winkels worden gekocht. Analyse van de transacties laat de patronen zien, zoals welke dingen vaak samen worden gekocht, zoals brood en boter, of welke items op bepaalde dagen een hoger verkoopvolume hebben, zoals bier op vrijdag.
Deze informatie helpt bij het plannen van de winkellay-outs, biedt een speciale korting op de items waar minder vraag naar is, maakt aanbiedingen zoals 'koop 2 krijgt 1 gratis' of 'ontvang 50% bij tweede aankoop' enz.
[beeld bron
Grote bedrijven die datamining gebruiken
Enkele online bedrijven die dataminingtechnieken gebruiken, worden hieronder gegeven:
- AMAZONE: Amazon gebruikt Text Mining om de laagste prijs van het product te vinden.
- MC Donald's: McDonald’s gebruikt big data mining om de klantervaring te verbeteren. Het bestudeert het bestelpatroon van klanten, wachttijden, grootte van bestellingen, etc.
- NETFLIX: Netflix leert met zijn datamining-inzichten hoe je een film of serie populair kunt maken bij de klanten.
Gevolgtrekking
Datamining wordt gebruikt in diverse toepassingen, zoals het bankwezen, marketing, gezondheidszorg, telecomindustrieën en vele andere gebieden.
Dataminingtechnieken helpen bedrijven om goed geïnformeerde informatie te verkrijgen, hun winstgevendheid te vergroten door aanpassingen in processen en operaties. Het is een snel proces dat bedrijven helpt bij het nemen van beslissingen door middel van analyse van verborgen patronen en trends.
Bekijk onze aanstaande tutorial om meer te weten te komen over het beslissingsboom-datamining-algoritme !!
PREV-zelfstudie VOLGENDE zelfstudie
Aanbevolen literatuur
- Datamining: proces, technieken en grote problemen bij gegevensanalyse
- Dataminingtechnieken: algoritme, methoden en toptools voor datamining
- Dataminingproces: modellen, processtappen en uitdagingen
- Datamining versus machine learning versus kunstmatige intelligentie versus diep leren
- 10+ beste tools voor gegevensbeheer om in 2021 aan uw gegevensbehoeften te voldoen
- Top 14 BESTE testgegevensbeheertools in 2021
- Top 15 beste gratis tools voor datamining: de meest uitgebreide lijst
- Top 10 Big Data-conferenties die u moet volgen in 2021