Voor de beste ervaring schakelt u JavaScript in en gebruikt u een moderne browser!
Je gebruikt een niet-ondersteunde browser. Deze site kan er anders uitzien dan je verwacht.
Wil je je verdiepen in Machine Learning, maar weet je niet waar je moet beginnen? Het open source statistiekprogramma JASP is een uitstekend startpunt. Met een intuïtieve interface die doet denken aan SPSS (maar dan beter), helpt JASP je bij het maken en toepassen van statistische modellen zonder dat je één regel code hoeft te schrijven.

JASP begeleidt je stap voor stap bij geavanceerde analyses, zoals Bayesiaanse statistiek en voorspellende modellen. De resultaten worden overzichtelijk en begrijpelijk gepresenteerd. Het programma splitst je dataset bovendien automatisch in trainingsets (om het model te bouwen) en testsets (om de prestaties te beoordelen).

💡 Voordelen van JASP ten opzichte van SPSS

JASP is ontwikkeld aan de Universiteit van Amsterdam en wordt inmiddels wereldwijd gebruikt. Het programma ondersteunt standaard analysemethoden in zowel de klassieke (frequentistische) als de Bayesiaanse vorm. JASP biedt enkele belangrijke voordelen ten opzichte van SPSS, zoals geavanceerde meta-analyses en automatische opmaak volgens APA-richtlijnen.
Een van de belangrijke drijfveren voor het ontwikkelen van JASP was het toegankelijk maken van Bayesiaanse statistiek: een flexibele analysemethode waarmee je eerder opgedane kennis kunt verwerken in je model. De uitkomsten worden bovendien geïnterpreteerd in termen van waarschijnlijkheid, vooral handig wanneer je werkt met beperkte of onzekere data.

Waarom JASP gebruiken voor Machine Learning?

De Machine Learning-module in JASP stelt je in staat om:

  • Met echte datasets te werken via een gebruiksvriendelijke klikinterface
  • Verschillende modellen te verkennen: classificatie, regressie en clustering (zie uitleg hieronder)
  • De resultaten te interpreteren zonder ingewikkeld vakjargon 

Voorbeeld: Voorspellen van klantverloop

Stel je werkt bij een telecombedrijf en je wilt voorspellen welke klanten hun abonnement waarschijnlijk gaan opzeggen. Dit noemen we een classificatietaak. Het JASP-team heeft een voorbeeld uitgewerkt waarin de Telco Customer Churn-dataset wordt gebruikt om een model te trainen dat voorspelt of een klant zal vertrekken (“Yes” of “No”) op basis van hun contractgegevens en demografische kenmerken.

De Machine Learning-module maakt dit verrassend eenvoudig. Een veelgebruikte methode is K-Nearest Neighbors (KNN), waarbij een geval wordt geclassificeerd op basis van hoe sterk het lijkt op andere gevallen in de dataset. Een alternatief is Random Forest, een techniek die meerdere beslisbomen bouwt en combineert om de nauwkeurigheid te verhogen, bij uitstek geschikt voor complexe of rommelige data.

Stap-voor-stap: Train een classificatiemodel in JASP

Het JASP-team biedt goede handleidingen om je op weg te helpen. Dit voorbeeld is gebaseerd op hun tutorial How to Train a Machine Learning Model in JASP: Classification.

  1. Open JASP
    Download en start JASP. Het programma is gratis en open source.
  2. Laad de dataset
    Ga naar File > Open > Data Library
    Navigeer naar 10. Machine Learning en open de dataset Telco Customer Churn.
  3. Verken de data (optioneel maar aanbevolen)
    Gebruik de analyse Descriptives om te bekijken hoeveel klanten zijn vertrokken (“Yes”) versus gebleven (“No”). Dit geeft je snel een idee van de dataset en toont of er sprake is van een class imbalance.
  4. Ga naar de Machine Learning-module
    Klik op de tab Machine Learning in het bovenste menu.
    Kies K-Nearest Neighbors Classification (of een andere classificatieanalyse zoals Random Forest).
  5. Stel de target en predictors in
    • Target: Selecteer Churn (dit wil je voorspellen)
    • Features: Selecteer alle variabelen behalve customerID.
  6. Configureer data splitting
    In Data Split Preferences kun je het percentage instellen van de testdata die wordt apart gehouden (holdout test data). Dit is het percentage ongeziene data waarop de kwaliteit van je getrainde classificatiemodel wordt geëvalueerd.
  7. Stel modelparameters in (optioneel)
    Onder Training Parameters kun je een vaste waarde kiezen voor het aantal nearest neighbors (bijvoorbeeld 3).
  8. Draai het model
    Zodra je de target en features hebt geselecteerd, voert JASP automatisch de analyse uit en toont de resultaten in tabellen en grafieken.
  9. Evalueer de prestaties van je model
    Scroll naar beneden om kernstatistieken te bekijken zoals accuracy, sensitivity, specificity en de confusion matrix. Gebruik deze cijfers om te beoordelen hoe goed je model het klantverloop voorspelt.
  10. Sla je resultaten op, of exporteer ze
    Klik op File > Save As om je JASP-bestand op te slaan, of exporteer je outputs als PDF, HTML of LaTeX.

Probeer het zelf!

Volg de stappen hierboven om je eerste classificatiemodel te bouwen en vertrouwd te raken met JASP. Zodra je de basis onder de knie hebt, kun je experimenteren met andere algoritmes of een regressie- of clusteringanalyse proberen. Veel analyseplezier! En vergeet niet om ook de andere handige blogposts van JASP te bekijken. Gewoon om lekker te oefenen, of misschien zelfs een expert te worden!

Welkom bij de ‘Library Research Hack’, de rubriek van de Bibliotheek die jouw onderzoek verder brengt. Of je nu student of onderzoeker bent, elke maand ontdek je hier een nieuwe tool of toepassing die jouw onderzoek efficiënter, effectiever én leuker maakt. Van databases die je horizon verbreden, tot onmisbare onderzoeks-identifiers, of essentiële software voor datavisualisatie – wij leggen uit waarom je niet zonder kunt en helpen je direct op weg.

Stay tuned: in mei zijn we terug met een nieuwe hack over Think.Check.Submit.!