Wat is een taalmodel?

Begrijp hoe AI-taalmodellen werken, zonder technische voorkennis.

Beginner15 minuten

Wat is een groot taalmodel (LLM)?

Een groot taalmodel (Large Language Model, of LLM) is het type AI dat achter tools als ChatGPT, Claude en Gemini zit. Het is een computerprogramma dat is getraind op enorme hoeveelheden tekst om menselijke taal te begrijpen en te genereren.

Hoe leert een taalmodel?

Stel je voor dat je een kind een miljard boeken laat lezen. Na al die boeken heeft het kind een goed gevoel voor hoe taal werkt: welke woorden vaak samen voorkomen, hoe zinnen zijn opgebouwd, en welke antwoorden logisch zijn op welke vragen. Zo werkt een taalmodel ook, maar dan op een veel grotere schaal.

Het trainingsproces werkt in grote lijnen zo:

1. Data verzamelen: Het model wordt gevoed met enorme hoeveelheden tekst van het internet, boeken, artikelen en andere bronnen

2. Patronen herkennen: Het model leert statistische patronen: welke woorden volgen vaak op welke andere woorden?

3. Finetuning: Het model wordt verfijnd door menselijke feedback. Mensen beoordelen antwoorden en het model leert welke antwoorden beter zijn

4. Afstemming: Het model wordt afgestemd op veiligheid, behulpzaamheid en eerlijkheid

Wat doet een taalmodel eigenlijk?

In essentie doet een taalmodel een ding: het voorspelt het meest waarschijnlijke volgende woord. Als je typt "De hoofdstad van Nederland is...", dan berekent het model dat "Amsterdam" het meest waarschijnlijke volgende woord is. Door steeds het volgende woord te voorspellen, genereert het complete zinnen, alinea's en documenten.

Wat een taalmodel NIET is

Het is belangrijk om te begrijpen wat een taalmodel niet is:

  • Geen zoekmachine: Het zoekt niet op internet (tenzij die functie is ingeschakeld). Het put uit zijn trainingsdata
  • Geen database: Het slaat geen feiten op in een tabel. Het "weet" dingen doordat het patronen heeft geleerd
  • Geen denker: Het redeneert niet zoals mensen. Het is heel goed in het nabootsen van redenering, maar het werkt fundamenteel anders
  • Geen expert: Het kan klinken als een expert, maar het kan ook overtuigend onjuiste informatie geven

Belangrijke begrippen

| Begrip | Uitleg |

|--------|--------|

| Prompt | De instructie of vraag die je aan de AI geeft |

| Token | Een stukje tekst, ongeveer driekwart van een woord |

| Context window | Hoeveel tekst de AI tegelijk kan "onthouden" in een gesprek |

| Hallucinatie | Wanneer AI zelfverzekerd onjuiste informatie geeft |

| Parameter | Een instelbaar gewicht in het neurale netwerk. Meer parameters = krachtiger model |

| Temperature | Een instelling die bepaalt hoe creatief/willekeurig het model reageert |

Waarom is dit belangrijk voor jou?

Als je begrijpt hoe een taalmodel werkt, kun je het beter inzetten:

  • Je snapt waarom context geven zo belangrijk is (het model heeft jouw informatie nodig om goede voorspellingen te doen)
  • Je begrijpt waarom het soms fouten maakt (het voorspelt het meest waarschijnlijke antwoord, niet per se het juiste)
  • Je weet waarom specifieke prompts beter werken (ze beperken de mogelijke antwoorden tot wat relevant is)
  • Je kunt beter inschatten wanneer je AI wel en niet moet vertrouwen

Klaar met deze module?

Markeer als voltooid om je voortgang bij te houden

Terug naar alle modules