types machine learning
In deze tutorial worden de soorten machinaal leren uitgelegd, d.w.z. gesuperviseerd, niet-gecontroleerd, bekrachtigend en semi-supervised leren met eenvoudige voorbeelden. U zult ook de verschillen leren tussen begeleid en onbewaakt leren:
In de Vorige tutorial hebben we geleerd over Machine Learning, de werking en toepassingen ervan. We hebben ook een vergelijking gezien van Machine Learning versus Artificial Intelligence.
Machine Learning is een wetenschapsgebied dat zich bezighoudt met computerprogramma's die leren door ervaring en de output voorspellen.
Het belangrijkste kenmerk van ML is leren van ervaring. Het leren gebeurt wanneer het systeem dat wordt gevoed met trainingsinputgegevens, wijzigingen aanbrengt in de parameters en zichzelf aanpast om de gewenste output te geven. De output is de doelwaarde die is gedefinieerd in de trainingsgegevens.
welke mp4 video-downloader compatibel is met youtube
Lees de complete serie Machine Learning-trainingen door
Wat je leert:
- Soorten machine learning
- Voorbeeld uit de praktijk van begeleid en onbewaakt leren
- Verschil tussen begeleid versus onbewaakt leren
- Semi-begeleid leren
- Gevolgtrekking
Soorten machine learning
Machine Learning-programma's zijn onderverdeeld in 3 typen, zoals hieronder wordt weergegeven.
- Begeleid
- Ongecontroleerd
- Versterkend leren
Laten we elk van deze in detail begrijpen !!
# 1) Begeleid leren
Begeleid leren gebeurt in de aanwezigheid van een begeleider, net als leren dat wordt uitgevoerd door een klein kind met de hulp van zijn leraar. Omdat een kind wordt getraind in het herkennen van fruit, kleuren en cijfers onder toezicht van een leraar, wordt deze methode begeleid leren.
Bij deze methode wordt elke stap van het kind gecontroleerd door de leraar en leert het kind van de output die hij moet produceren.
Hoe werkt begeleid leren?
In het supervised ML-algoritme is de output al bekend. Er is een mapping van input met de output. Om een model te maken, wordt de machine daarom gevoed met veel trainingsinvoergegevens (waarvan de invoer en de bijbehorende uitvoer bekend zijn).
De trainingsgegevens helpen bij het bereiken van een nauwkeurigheidsniveau voor het gemaakte gegevensmodel. Het gebouwde model is nu klaar om te worden gevoed met nieuwe invoergegevens en om de uitkomsten te voorspellen.
Wat is een gelabelde gegevensset?
De dataset met outputs die bekend zijn voor een bepaalde input, wordt een Labeled Dataset genoemd. Bijvoorbeeld, een afbeelding van fruit samen met de vruchtnaam is bekend. Dus wanneer een nieuwe afbeelding van fruit wordt getoond, vergelijkt deze met de trainingsset om het antwoord te voorspellen.
Begeleid leren is een snel leermechanisme met een hoge nauwkeurigheid. De begeleide leerproblemen omvatten regressie- en classificatieproblemen.
Enkele van de leeralgoritmen onder supervisie zijn:
- Beslissingsbomen,
- K-naaste buur,
- Lineaire regressie,
- Ondersteuning van Vector Machine en
- Neurale netwerken.
Voorbeeld van begeleid leren
- In de eerste stap wordt een trainingsdataset naar het machine learning-algoritme gevoerd.
- Met de trainingsdataset past de machine zichzelf aan door wijzigingen aan te brengen in de parameters om een logisch model te bouwen.
- Het gebouwde model wordt vervolgens gebruikt voor een nieuwe set gegevens om de uitkomst te voorspellen.
Soorten begeleide leeralgoritmen
- Classificatie: Bij dit soort problemen voorspellen we de respons als specifieke klassen, zoals 'ja' of 'nee'. Als er slechts 2 klassen aanwezig zijn, wordt dit een binaire classificatie genoemd. Voor meer dan 2 klassenwaarden wordt dit een classificatie met meerdere klassen genoemd. De voorspelde responswaarden zijn discrete waarden. Bijvoorbeeld, Is het het beeld van de zon of de maan? Het classificatie-algoritme verdeelt de gegevens in klassen.
- Regressie: Regressieproblemen voorspellen de respons als continue waarden, zoals het voorspellen van een waarde die varieert van -infinity tot oneindig. Het kan veel waarden vergen. Bijvoorbeeld, het lineaire regressie-algoritme dat wordt toegepast, voorspelt de kosten van het huis op basis van vele parameters zoals locatie, nabijgelegen luchthaven, grootte van het huis, enz.
# 2) Ongecontroleerd leren
Leren zonder toezicht gebeurt zonder de hulp van een begeleider, net zoals een vis uit zichzelf leert zwemmen. Het is een zelfstandig leerproces.
Aangezien er in dit model geen output is toegewezen aan de input, zijn de doelwaarden onbekend / niet gelabeld. Het systeem moet zelf leren van de gegevens die erin worden ingevoerd en de verborgen patronen detecteren.
Wat is een gegevensset zonder label?
Een gegevensset met onbekende uitvoerwaarden voor alle invoerwaarden wordt een niet-gelabelde gegevensset genoemd.
Hoe werkt onbewaakt leren?
Aangezien er geen bekende uitvoerwaarden zijn die kunnen worden gebruikt om een logisch model tussen de invoer en uitvoer te bouwen, worden sommige technieken gebruikt om dataregels, patronen en groepen gegevens met vergelijkbare typen te minen. Deze groepen helpen de eindgebruikers om de gegevens beter te begrijpen en om een zinvolle output te vinden.
De gevoede inputs hebben niet de vorm van een goede structuur, net als trainingsgegevens (bij begeleid leren). Het kan uitschieters, data met ruis enz. Bevatten. Deze invoer wordt samen naar het systeem gevoerd. Tijdens het trainen van het model worden de inputs georganiseerd om clusters te vormen.
De leeralgoritmen zonder toezicht omvatten cluster- en associatie-algoritmen zoals:
- Apriori,
- K-betekent clustering en andere algoritmen voor het minen van associatieregels.
Wanneer nieuwe gegevens aan het model worden toegevoegd, zal het de uitkomst voorspellen als een klassenlabel waartoe de invoer behoort. Als het klassenlabel niet aanwezig is, wordt een nieuwe klasse gegenereerd.
Tijdens het proces van het ontdekken van patronen in de gegevens, past het model zijn parameters zelf aan, daarom wordt het ook zelforganiserend genoemd. De clusters worden gevormd door de overeenkomsten tussen de inputs te achterhalen.
Bijvoorbeeld, als er tijdens het online kopen van producten boter in de winkelwagen wordt gedaan, dan stelt het voor om brood, kaas, enz. te kopen. Het onbewaakte model kijkt naar de datapunten en voorspelt de andere attributen die aan het product zijn gekoppeld.
Voorbeeld van leren zonder toezicht
Soorten onbewaakte algoritmen
- Clustering-algoritme : De methode om de overeenkomsten tussen gegevensitems te vinden, zoals dezelfde vorm, grootte, kleur, prijs, enz. En om ze te groeperen om een cluster te vormen, is clusteranalyse.
- Uitbijterdetectie : Bij deze methode is de dataset de zoektocht naar elke vorm van ongelijkheden en anomalieën in de gegevens. Bijvoorbeeld, een transactie met een hoge waarde op een creditcard wordt gedetecteerd door het systeem voor fraudedetectie.
- Associatieregel Mijnbouw : Bij dit type mijnbouw worden de meest voorkomende itemsets of associaties tussen elementen ontdekt. Verenigingen zoals 'producten die vaak samen worden gekocht', enz.
- Autoencoders: De invoer wordt gecomprimeerd tot een gecodeerde vorm en opnieuw gemaakt om gegevens met veel ruis te verwijderen. Deze techniek wordt gebruikt om de beeld- en videokwaliteit te verbeteren.
# 3) Versterkend leren
Bij dit type leren leert het algoritme door middel van feedbackmechanismen en ervaringen uit het verleden. Het is altijd gewenst dat elke stap in het algoritme wordt genomen om een doel te bereiken.
Dus wanneer de volgende stap moet worden gezet, ontvangt het de feedback van de vorige stap, samen met het leren van de ervaring om te voorspellen wat de volgende beste stap zou kunnen zijn. Dit proces wordt ook wel een proces van vallen en opstaan genoemd om het doel te bereiken.
Reinforcement learning is een iteratief proces op de lange termijn. Hoe meer terugmelders, hoe nauwkeuriger het systeem wordt. Elementair leren van bekrachtiging wordt ook wel Markov-beslissingsproces genoemd.
Voorbeeld van leerversterking
Voorbeeld van Reinforcement Learning zijn videogames, waarbij de spelers bepaalde niveaus van een game voltooien en beloningspunten verdienen. De game geeft feedback aan de speler door middel van bonusbewegingen om zijn / haar prestaties te verbeteren.
Reinforcement Learning wordt gebruikt bij het trainen van robots, zelfrijdende auto's, automatisch voorraadbeheer, etc.
Enkele populaire algoritmen van Reinforcement Learning zijn onder meer:
- Q-leren,
- Diepe vijandige netwerken
- Temporeel verschil
De onderstaande figuur beschrijft het feedbackmechanisme van Reinforcement Learning.
oracle sql interviewvragen en antwoorden pdf
- De invoer wordt waargenomen door de agent die het AI-element is.
- Deze AI-agent handelt op het milieu volgens de genomen beslissing.
- De reactie van de omgeving wordt als feedback naar de AI gestuurd in de vorm van een beloning.
- Staat en actie die op het milieu wordt uitgevoerd, worden ook opgeslagen.
(beeld bron
Voorbeeld uit de praktijk van begeleid en onbewaakt leren
Voor begeleid leren:
# 1) Laten we een voorbeeld nemen van een mand met groenten met ui, wortel, radijs, tomaat, enz., En we kunnen ze in de vorm van groepen rangschikken.
#twee) We maken een tabel met trainingsgegevens om Begeleid Leren te begrijpen.
De tabel met trainingsgegevens karakteriseert de groenten op basis van:
- Vorm
- Kleur
- Grootte
Vorm | Kleur | Grootte | Groente |
---|---|---|---|
Het is nauwkeuriger dan leren zonder toezicht, aangezien de invoergegevens en de bijbehorende uitvoer algemeen bekend zijn en de machine alleen voorspellingen hoeft te doen. | Het heeft minder nauwkeurigheid omdat de invoergegevens ongelabeld zijn. De machine moet dus eerst de gegevens begrijpen en labelen en vervolgens voorspellingen doen. | ||
Ronde | Bruin | Groot | Ui |
Ronde | Netto | Medium | Tomaat |
Cilindrisch | Wit | Groot | Radijs |
Cilindrisch | Netto | Medium | Wortel |
Wanneer deze trainingsdatatabel naar de machine wordt gevoerd, zal deze een logisch model bouwen met behulp van de vorm, kleur, grootte van de groente, enz., Om de uitkomst (groente) te voorspellen.
Als er een nieuwe invoer naar dit model wordt gestuurd, analyseert het algoritme de parameters en voert het de naam van het fruit uit.
Voor leren zonder toezicht:
Bij onbewaakt leren creëert het groepen of clusters op basis van attributen. In de bovenstaande voorbeelddataset is de parameter van groente:
# 1) Vorm
De groenten zijn gegroepeerd op basis van vorm.
- Ronde: Ui en tomaat.
- Cilindrisch: Radijs en wortel.
Neem een andere parameter, zoals grootte.
# 2) Grootte
hoe iets te verwijderen uit een array java
De groenten zijn gegroepeerd op grootte en vorm:
- Middelgrote en ronde vorm: Tomaat
- Groot formaat en ronde vorm: Ui
Bij onbewaakt leren hebben we geen trainingsdataset en uitkomstvariabele, terwijl bij begeleid leren de trainingsgegevens bekend zijn en worden gebruikt om het algoritme te trainen.
Verschil tussen begeleid versus onbewaakt leren
Begeleid | Ongecontroleerd |
---|---|
Bij algoritmen voor leren onder supervisie is de output voor de gegeven input bekend. | Bij leeralgoritmen zonder toezicht is de uitvoer voor de gegeven invoer onbekend. |
De algoritmen leren van een gelabelde set gegevens. Deze gegevens helpen bij het evalueren van de nauwkeurigheid van trainingsgegevens. | Het algoritme is voorzien van niet-gelabelde gegevens waar het probeert om patronen en associaties tussen de gegevensitems te vinden. |
Het is een Predictive Modeling-techniek die de toekomstige resultaten nauwkeurig voorspelt. | Het is een beschrijvende modelleringstechniek die de echte relatie tussen de elementen en de geschiedenis van de elementen verklaart. |
Het bevat classificatie- en regressie-algoritmen. | Het bevat algoritmen voor het leren van clustering en associatieregels. |
Enkele algoritmen voor begeleid leren zijn lineaire regressie, naïeve Bayes en neurale netwerken. | Sommige algoritmen voor leren zonder toezicht zijn k-betekent clustering, Apriori, enz. |
Dit soort leren is relatief complex omdat het gelabelde gegevens vereist. | Het is minder complex omdat het niet nodig is om gegevens te begrijpen en te labelen. |
Het is een online proces van gegevensanalyse en vereist geen menselijke interactie. | Dit is een realtime analyse van gegevens. |
Semi-begeleid leren
De semi-begeleide leerbenadering neemt zowel gelabelde als niet-gelabelde trainingsgegevensinvoer. Dit soort leren is nuttig wanneer het moeilijk is om nuttige kenmerken te extraheren uit niet-gelabelde gegevens (benadering onder supervisie) en data-experts het moeilijk vinden om de invoergegevens te labelen (benadering zonder toezicht).
Slechts een kleine hoeveelheid gelabelde gegevens in deze algoritmen kan leiden tot de nauwkeurigheid van het model.
Voorbeelden van semi-supervised learning omvatten CT-scans en MRI's waarbij een medisch expert een paar punten in de scans kan labelen voor elke ziekte, terwijl het moeilijk is om alle scans te labelen.
Gevolgtrekking
De machine learning-taken worden globaal ingedeeld in taken onder supervisie, niet-gesuperviseerd, semi-supervised en versterkend leren.
Begeleid leren is leren met behulp van gelabelde data. De ML-algoritmen worden gevoed met een trainingsdataset waarin van elke inputdata de output bekend is, om toekomstige uitkomsten te voorspellen.
Dit model is zeer nauwkeurig en snel, maar vereist veel expertise en tijd om te bouwen. Ook moeten deze modellen opnieuw worden opgebouwd als de gegevens veranderen. ML-taken zoals regressie en classificatie worden uitgevoerd onder een begeleide leeromgeving.
Ongecontroleerd leren vindt plaats zonder de hulp van een begeleider. De invoergegevens die naar de ML-algoritmen worden gestuurd, zijn niet gelabeld, d.w.z. voor elke invoer is geen uitvoer bekend. Het algoritme ontdekt zelf de trends en patronen in de invoergegevens en legt een verband tussen de verschillende attributen van de invoer.
Dit soort leren is handig voor het vinden van patronen in gegevens, het maken van clusters van gegevens en voor real-time analyse. Taken zoals clustering, KNN-algoritmen, etc. vallen onder onbewaakt leren.
Semi-gesuperviseerde leertaken hebben het voordeel van zowel gesuperviseerde als niet-gesuperviseerde algoritmen door de resultaten te voorspellen met behulp van zowel gelabelde als ongelabelde gegevens. Reinforcement learning is een soort feedbackmechanisme waarbij de machine leert van constante feedback uit de omgeving om zijn doel te bereiken.
Bij dit soort leren voeren de AI-agenten enkele acties uit op de gegevens en geeft de omgeving een beloning. Reinforcement learning wordt gebruikt door multiplayer-games voor kinderen, zelfrijdende auto's, enz.
Blijf op de hoogte van onze aanstaande tutorial om meer te weten te komen over machine learning en kunstmatige neurale netwerken!
Bezoek hier voor de exclusieve Machine Learning-serie
Aanbevolen literatuur
- Datamining versus machine learning versus kunstmatige intelligentie versus diep leren
- 11 populairste softwaretools voor machine learning in 2021
- Zelfstudie voor machine learning: inleiding tot ML en de toepassingen ervan
- Python-gegevenstypen
- C ++ gegevenstypen
- Soorten risico's in softwareprojecten
- Typen migratietests: met testscenario's voor elk type
- 15 beste leerbeheersystemen (LMS van het jaar 2021)