Ben je klaar om de ruggengraat van de Nederlandse AI Factory te bouwen en te beheren, waar high-performance computing, cloud-native technologieën en AI samenkomen? Bij SURF speel je een sleutelrol bij het ontwerpen en opschalen van een AI-platform van de volgende generatie dat baanbrekend onderzoek en innovatie in heel Nederland mogelijk maakt. Klinkt het opzetten van de infrastructuur achter de Europese AI-ambities als een uitdaging die bij je past? Solliciteer dan nu.
SURF is de ict-coöperatie van Nederlandse onderwijs- en onderzoeksinstellingen. Samen met hen werken we aan digitale diensten en complexe innovatievraagstukken om de kwaliteit van onderwijs en onderzoek te verhogen.
Werken bij SURF betekent deel uitmaken van een unieke en open organisatie. Dat merk je aan alles: de organisatiestructuur, de samenstelling van de projectteams, de cultuur op onze kantoren en de sfeer onder collega’s. SURF biedt uitstekende arbeidsvoorwaarden en hanteert een flexibele benadering van de balans tussen werk en privé. Medewerkers werken graag zelfstandig en iedereen krijgt de ruimte en vrijheid om zijn of haar talenten zo effectief en breed mogelijk in te zetten en te ontwikkelen.
Je komt terecht in het AI Systems-team binnen de afdeling Advanced Solutions for Research. Je collega’s houden zich bezig met het trainen van taalmodellen zoals OpenEuroLLM en GPT-NL, en adviseren onderzoekers over het optimale gebruik van de Snellius-supercomputer voor AI-taken.
Je werkt met Python aan een snelgroeiend AI-platform. Het team kenmerkt zich door een open en samenwerkingsgerichte cultuur, met een sterke focus op kennisdeling en onderlinge ondersteuning.
Als AI Platform / AIOps Engineer bij SURF bouw en beheer je de diensten en de orchestration-laag van de Dutch AI Factory. Je werkt aan de integratie van Slurm en Kubernetes, implementeert MLOps-tools en infrastructuur voor het aanbieden van modellen, en zorgt ervoor dat onderzoekers, bedrijven en overheidsorganisaties AI-workloads betrouwbaar en op schaal kunnen uitvoeren. Je werkt op het snijvlak van high-performance computing, cloud-native technologieën en AI-infrastructuur.
Je verantwoordelijkheden omvatten:
- Het ontwerpen en implementeren van sandbox-omgevingen op gecontaineriseerde HPC/Kubernetes-infrastructuur
Het bouwen van de Slurm- Kubernetes-integratie, inclusief IAM, accounting/quotas, logging, monitoring en gebruikersinterfaces.
- Het implementeren en beheren van MLOps- en runtime-services, zoals het bijhouden van experimenten, CI/CD-pijplijnen en model serving (Triton, vLLM, TensorRT-LLM, ONNX Runtime)
- Het ontwikkelen van portabiliteitstools om workflows te verplaatsen tussen AI Factory-omgevingen, institutionele systemen en cloudplatforms
- Implementeren van LLM/GPAI-sandboxes met veiligheidsfilters, logboekregistratie, rate limiting en monitoring
- Implementeren van energiebewuste planning en duurzaamheidsdashboards
- Ondersteunen van de EuroHPC-federatie en interoperabiliteit met andere AI Factories
- Verstrekken van infrastructuur voor co-creatie en toegang (bijv. Jupyter, VS Code, projectruimtes)
Je bent een ervaren engineer met een sterke technische basis en een duidelijke focus op schaalbare, toekomstbestendige oplossingen. Je brengt structuur in complexe situaties, communiceert helder en werkt zelfverzekerd in hoogwaardige, gedistribueerde infrastructuuromgevingen.
We zijn op zoek naar een nieuwe collega met:
- BSc/MSc-niveau in informatica, software engineering of gelijkwaardig
- Ruime ervaring met Kubernetes (operators, Helm, namespaces, RBAC, netwerken)
- Ervaring met containertechnologieën (Docker/Podman, containerregisters, CI/CD)
- Kennis van of ervaring met HPC-schedulers (Slurm) en Linux-systeembeheer
- Ervaring met monitoring en observability (Prometheus, Grafana, ELK/Loki)
- Een Infrastructure-as-Code-mentaliteit (Terraform, Ansible, SaltStack, GitOps)
- Goede beheersing van Python en/of Go; Bash-scripting
- Uitstekende beheersing van het Engels; Nederlands is een pluspunt
Sterke pluspunten
- Ervaring met GPU-scheduling en NVIDIA-tools (CUDA, MIG, MPS, GPU Operator)
- Kennis van model-serving frameworks (Triton, vLLM, TGI, Ray Serve)
- Ervaring met MLOps-platforms (MLflow, Kubeflow, Weights & Biases)
- Kennis van identiteitsfederatie (SRAM, eduGAIN, OIDC, LDAP)
- Ervaring met high-performance opslag (parallelle bestandssystemen, S3/objectopslag)
- Bijdragen aan open source
Aanvullende informatie
Kandidaten voor deze functie moeten reeds over een geldige werkvergunning voor Nederland beschikken.
Helaas kunnen wij voor deze functie geen visumsponsoring aanbieden.
Een antecedentenonderzoek kan deel uitmaken van het wervingsproces.
Bij SURF doen we onze werving met veel plezier zelf, acquisitie stellen we daarom niet op prijs.
1
Nadat je je sollicitatie hebt ingestuurd, ontvang je direct een bevestigingsmail.
2
Na de sluitingsdatum ontvang je een reactie van ons recruitmentteam.
3
We nodigen je uit op ons kantoor, want we willen je leren kennen.
4
We nodigen je nogmaals uit voor een gesprek met anderen die jou ook willen leren kennen.
5
Eventueel vragen we je om een opdracht (assessment) te doen.
6
Dan ontvang je een salarisaanbod van één van onze HR-adviseurs.
7
Je sluit aan bij onboardingactiviteiten met andere nieuwe collega’s.