Gemini-AI behaalt goud op Internationale Wiskunde Olympiade
In dit artikel:
Google DeepMind heeft met zijn nieuwste AI-systeem, Gemini met Deep Think, de gouden medaille behaald op de Internationale Wiskunde Olympiade (IMO) van 2025. Dit is een doorbraak omdat het de eerste keer is dat een autonoom AI-model zelfstandig op Olympiadeniveau redeneringen en volledige wiskundige bewijzen kan genereren binnen dezelfde tijdslimieten als menselijke deelnemers. Gemini loste vijf van de zes problemen succesvol op en behaalde 35 van de 42 punten, wat volgens het IMO-bestuur ruim voldoende was voor goud.
In tegenstelling tot eerdere AI-systemen die langdurige berekeningen en meerdere technieken vereisten, werkte Gemini volledig zelfstandig en binnen de standaard 4,5 uur per sessie. Het gebruikte een zelfontwikkeld “deep thinking”-vermogen, waarbij het parallel verschillende oplossingsroutes verkent en vergelijkt. Daarbij ontving het de opgaven in natuurlijke taal, zonder hulp van formele bewijssystemen, externe hulpmiddelen of symbolische algebra, net als menselijke deelnemers.
De training omvatte reinforcement learning en een uitgebreide dataset met wiskundige problemen en strategieën, waardoor Gemini ook creatieve en onverwachte oplossingen kon vinden op het uitdagende IMO-niveau. De voorzitter van het IMO-comité prees de AI voor de helderheid en precisie van de gegenereerde bewijzen en benadrukte dat het de eerste keer was dat een AI volledig meedeed aan het hoogste niveau van pre-universitair wiskundig redeneren.
Hoewel het menselijke denkvermogen nog steeds unieke kwaliteiten bezit, toont deze prestatie de groeiende capaciteit van AI om abstracte problemen in moeilijk automatiserende vakgebieden aan te pakken. DeepMind geeft Gemini voorlopig alleen vrij aan selecte academische en onderzoeksinstellingen; een bredere beschikbaarheid zal afhangen van toekomstige evaluaties en onderzoek naar de impact. Deze mijlpaal markeert een nieuwe fase voor geavanceerde taalmodellen en opent perspectieven voor AI-toepassingen in theoretische wiskunde, onderwijs en fundamenteel onderzoek.