Hvor mange ord jeg lærte på et år

Mange danske voksne har et ordforråd på ca. 50.000–70.000 danske ord. Et barn i første klasse kender ca. 5.000–10.000 danske ord.

sproget.dk

For et år siden, den 9. september 2017, begyndte jeg en daglig aktivitet, som jeg har udført hver eneste dag siden. Hver dag, uden nogen ferier eller pauser, lærte jeg nye danske ord.

For at gøre det skrev jeg en lille app, der tilfældigt viser mig et dansk ord, og så skal jeg huske, hvad ordet betyder:

Derudenfor

Derefter åbner jeg beskrivelsen og tjekker, om jeg huskede ordets betydning korrekt:

Derudenfor 2

Hvis jeg havde ret, udskydes ordet til gentagelse om nogle dage. Jo flere gange jeg gætter betydningen, jo længere interval til næste gentagelse. Jeg bruger Fibonacci-tallene til at beregne den næste dato.

Hvis jeg glemte betydningen, nulstiller jeg antallet af vellykkede gentagelser, og ordet skal gentages igen senere samme dag.

Denne teknik kaldes spaced repetition. Den mest populære algoritme på dette område er SM2 fra den tidlige SuperMemo. SM2-implementeringen ligner Fibonacci-tallene meget, så til mine formål holdt jeg mig bare til sidstnævnte.

Jeg begrænsede også antallet af gentagelser til 10, så et ord efter den 10. vellykkede gentagelse betragtes som lært og dukker aldrig op igen. Med Fibonacci-tal får et ord sin 10. gentagelse på den 143. dag efter den første:

Excel

Og her er jeg så:

Ordbogen, jeg bruger, indeholder 94.137 danske ord.

På et år har jeg set 3.881 ord og lært 2.556 af dem.

Her kan man se, hvordan min læring forløb. Den øverste kant af det røde område er sete ord, og den nederste kant er de lærte:

Progress

Her er, hvordan mængden af "working set" (sete − lærte) har ændret sig over tid:

Working Set

Sådan er antallet af gentagelser fordelt over alle ordene i min database:

Repetitions

Og her er, hvor mange ord der er planlagt til hver dag fremover. Jo grønnere, jo lavere er det gennemsnitlige antal vellykkede gentagelser for hvert ord den pågældende dag:

Forecast

I næste skridt planlægger jeg at tage ordenes popularitet i betragtning, så de mest brugte ord vil dukke op med højere sandsynlighed.