Het doel van een predictiemodel is de kans op een bepaalde uitkomst zo goed mogelijk te schatten (voorspellen). Predictiemodellen worden vaak met het oog op de klinische praktijk ontwikkeld, waarbij voor individuele personen de kans op ziekte of herstel door het combineren van informatie over patiënten kan worden berekend. Het model kan dan in de vorm van een predictieregel (clinical prediction rule) worden gepresenteerd. Daarnaast is de generaliseerbaarheid, de prestatie van het predictiemodel bij nieuwe toekomstige patiënten, van groot belang.
De cursus Klinische predictiemodellen en Machine learning is en 5-daagse cursus waarbij theorie en practica worden afgewisseld.
De cursus wordt 2 maal per jaar aangeboden. Eenmaal in het Nederlands en eenmaal in het Engels als onderdeel van het EpidM Winter Course programma. Alle informatie over Clinical Prediction Models (WK80) kunt u vinden op de website www.epidm.nl/wintercourses.
Als bij een cursus [vol] staat, kunt u zich wel aanmelden, maar wordt u op een wachtlijst geplaatst. Zodra er een plek vrijkomt nemen we contact met u op. Op dat moment kunt u nog besluiten of u wilt deelnemen aan de cursus.
Tegenwoordig wordt het steeds makkelijker om toegang te krijgen tot veel gegevens, waardoor datasets steeds groter worden. Dit brengt nieuwe uitdagingen met zich mee wanneer men deze data wil analyseren en voorspellende modellen wil ontwikkelen o.a. dat het vaak lastig is uit een groot aantal variabelen de meest belangrijke voorspellers te kiezen. Naast grotere datasets, blijven non-lineaire verbanden, collineariteit, interacties, en de noodzaak om robuust om te gaan met “overfitting” altijd uitdagingen bij het bouwen van statistische modellen.
De cursus heeft als doel om kennis en inzicht te bieden in de ontwikkeling van voor de praktijk relevante predictiemodellen. Er wordt aandacht besteed aan verschillende methoden voor het ontwikkelen van predictiemodellen, zowel methoden waarbij logistische als Cox regressie modellen gebruikt worden als meer geavanceerde (supervised) Machine learning methoden als Lasso regressie en Random Forest methoden. Daarnaast wordt er aandacht besteed aan de voor- en nadelen van deze methoden. Als eenmaal het predictiemodel ontwikkeld is, is het belangrijk om een idee te krijgen over de kwaliteit van het predictiemodel. Verschillende maten voor discriminatie en kalibratie zullen hiervoor behandeld worden. Een vraag die daarbij aandacht krijgt is of voorspellingen van het model nauwkeurig zijn en of het model bruikbaar is voor de klinische praktijk. Daarnaast is er aandacht voor de toepassing van het model in nieuwe (toekomstige) patiënten. Belangrijk daarbij is om te onderzoeken of het predictiemodel niet in prestaties achteruit gaat als het toegepast wordt in nieuwe patiënten. Dit onderdeel wordt het valideren van het predictiemodel genoemd. Technieken om het predictiemodel zowel intern als extern te valideren zullen behandeld worden en ook technieken om het model te testen en te trainen via bootstrapping en cross-validation.
Machine Learning (ML) methoden bieden krachtige alternatieven voor traditionele methoden (zoals Logistische of Cox regressie) en zijn geschikt voor: 1) efficiënt omgaan met een groot aantal variabelen (waarbij ze automatisch helpen de belangrijkste voorspellers te selecteren). 2) Het detecteren van complexe en non-lineaire patronen in data. 3) Het optimaliseren van de voorspellende prestaties door middel van geavanceerde training- en validatiestrategieën. Machine Learning is wordt daarom veelvuldig gebruikt om predictiemodellen te ontwikkelen. Bovendien kunnen de principes van Machine Learning in de klinische praktijk worden toegepast voor andere cruciale stappen in data-analyse, zoals missing data imputatie, propensity score estimation, enzovoorts.
De cursus bestaat uit een intensief programma van deels interactieve colleges afgewisseld met computerpractica. Tijdens de computerpractica zal gewerkt worden met voorbeelden uit de klinische praktijk.
Dag 1
De ontwikkeling en kwaliteit van predictiemodellen met o.a.:
Dag 2
Het intern en extern valideren van predictiemodellen met o.a.:
Dag 3
Het verbeteren en uitbreiden van predictiemodellen met o.a.:
Dag 4
Introductie in en theoretische basis voor Machine learning
Meest gebruikte Machine Learning methoden binnen de epidemiologie; diepgaande uitleg over de herkomst, werking, en toepassing:
Andere veel gebruikte methoden; toepassingsgerichte aanpak – Hoe de methoden in de praktijk te implementeren en te interpreteren.
Korte introductie in unsupervised methoden; verkennen van de basisprincipes van methoden voor patroonherkenning.
Het betreft een cursus die voor een breed publiek toegankelijk is, waaronder gezondheidsprofessionals en PhD studenten in de gezondheidszorg.
De cursus is bedoeld voor iedereen die meer wil weten over predictiemodellen en Machine Learning, bijvoorbeeld omdat men beter een onderzoeksvoorstel of artikel wil kunnen beoordelen of omdat men zelf een predictiemodel aan het ontwikkelen is of wil gaan maken. Ook is het belangrijk een goede afweging te kunnen maken van de waarde van een predictiemodel voor de praktijk.
Voor het volgen van deze cursus is vereist dat de cursus Regressietechnieken (V30) is gevolgd, of dat u beschikt over aantoonbare kennis op dit niveau.
Het lesmateriaal (o.a. presentaties, opdrachten en antwoordsleutels) voor deze cursus is beschikbaar op Canvas, onze digitale leeromgeving. De documenten blijven minimaal één jaar beschikbaar op Canvas.
Het meenemen van een laptop naar de cursus is dus noodzakelijk om het lesmateriaal in te zien en de practica te maken.
U heeft de volgende software nodig op uw laptop nodig voor het volgen van de computerpractica:
1. SPSS– indien u geen SPSS op uw laptop heeft, kunt u gebruik maken van de gratis proefversie (30 dagen) van IBM: zie SPSS Software | IBM. Het is ook mogelijk om SPSS via Surfspot aan te schaffen.
2. R en R Studio: deze software kunt u downloaden via https://cran.r-project.org/.
Het hele practicum kan in R worden gedaan. Sommige analyses kunnen ook in SPSS worden gedaan (wat fijn kan zijn voor de SPSS gebruikers, die nog nieuw zijn in R).
Literatuur volgt via Canvas.
Deelnemers die deze cursus volgen als onderdeel van de Masteropleiding Epidemiologie ronden de cursus altijd af met een tentamen.
Deelnemers die deze cursus als een afzonderlijke cursus volgen kunnen facultatief de cursus afsluiten met een tentamen. De kosten bedragen in dit geval €160,- per tentamen of hertentamen.
Alleen wanneer de cursus met een voldoende resultaat bij het tentamen wordt afgerond worden de studiepunten (EC’s) toegekend en een tentamenverklaring uitgereikt.
Een verklaring van deelname wordt aan iedereen uitgereikt die minimaal 80% aanwezig is geweest. Op de verklaring van deelname worden alleen contacturen vermeld.
Voor deelname aan het tentamen moet zich men altijd aanmelden. Zie voor informatie en aanmelding: Tentamens
Deze cursus is geaccrediteerd voor:
De cursus ‘Klinische predictiemodellen en Machine learning’ (K80) is geaccrediteerd voor 20 uren.
Om in aanmerking te komen voor de accreditatie-uren van deze cursus dient u de gehele cursus aanwezig te zijn geweest.
N.B. Met ingang van 1-1-2020 kan aan een arts die deelneemt aan verschillende cursussen van EpidM, maximaal 40 uren/punten per jaar worden toegekend.Deze nieuwe regeling is door het AccreditatieOverleg van de KNMG op 16 oktober 2019 bepaald. Voor meer informatie verwijzen wij naar de KNMG: https://www.knmg.nl/opleiding-herregistratie-carriere/aban.htm
Opleidingsdirecteur Masteropleiding Epidemiologie, EpidM, Epidemiologie en Data Science, Amsterdam UMC
Epidemiologie en Data Science, Amsterdam UMC