Förra veckan började en kurs för våra datavetenskapsstudenter om neurala nätverk. Min plan är att gå från de tidiga klassikerna (McCulloch–Pitts, Rosenblatt), genom utvecklingen kring alla banbrytande artiklar, upp till Attention Is All You Need. Vi bygger förståelse genom en mycket detaljerad matematisk analys av koncepten, många numeriska experiment och praktisk erfarenhet av varje begrepp vi definierar. Jag måste erkänna att jag inte förväntade mig att ha så roligt med att pilla med nätverkens vikter, internalisera kärnprinciperna och bara experimentera rent ut. Jag har redan byggt den första omgången anteckningar och appar för den första månaden av experiment. Förslag och idéer är mycket välkomna. Jag kommer att hålla mina anteckningar öppna för alla, så jag är nyfiken på om det finns några felaktigheter eller uppenbara punkter jag kan ha missat.