Perusjoukko. Perusjoukko normiaineistonkeruuseen oli määritelty siten, että se sisälsi suomeksi opetusta antavat koulut, joilla oli 3−6 vuosiluokalla oppilaita läsnä koulussa tutkimuksen suorittamisajankohtana keväällä 2021. Koulut poimittiin vuoden 2020 keväällä julkaistusta Tilastokeskuksen oppilaitosrekisteristä, jonka tiedot olivat ajankohdasta 31.12.2019. Perusjoukosta jätettiin pois erityiskoulut ja -luokat, Ahvenanmaan koulut, ruotsinkieliset koulut sekä kielikoulut, joissa opetuskielenä oli jokin muu kieli kuin suomi. Rajauksen jälkeen perusjoukon koko oli 1768 koulua, joissa oli oppilaitosrekisterin mukaan yhteensä 229 548 oppilasta. Perusjoukosta poistettiin tarkistuksen jälkeen vielä koulut, joissa oppilaitosrekisterin mukaan ei ollut oppilaita tutkimukseen mukaan otettavilla luokilla (101 koulua). Pieniä kouluja ei rajattu perusjoukon ulkopuolelle. Otoskehikkoon jäi 1667 koulua. Alkuperäisen suunnitelman mukaan normiaineisto oli tarkoitus kerätä kokonaan keväällä 2021, mutta keruun jälkeen osoittautui, että aineistoa oli täydennettävä ja sitä kerättiin lisää keväällä 2022. Täydennysotannasta kerrotaan lisää jäljempänä.
Otoskoko. Opetusryhmän keskikooksi arvioitiin 20 oppilasta. Tilastokeskuksen kevään opettajakyselyn 2016 mukaan alakouluissa 3.−6. vuosiluokkien opetusryhmien keskimääräinen koko oli 20,6 oppilasta. Vuoden 2019 tietoja ei vielä tätä tutkimusta suunniteltaessa oltu julkaistu. Tavoiteotoskooksi määriteltiin 4 000 oppilasta/luokkataso. Tämän saavuttamiseksi kouluja otostettiin 200 siten, että jokaisesta koulusta otostettiin mukaan yksi opetusryhmä kaikilta 3−6 luokilta. 200 koulun otoksella oli mahdollista saada otokseen yhtensä 16 000 oppilasta, käsittäen 4 000 oppilasta kultakin neljältä luokkatasolta 3−6. Koska kysymyksessä oli kansallinen normiaineiston otanta ja sekä koulujen että oppilaiden osallistuminen oli vapaaehtoista, oli odotettavissa, että tavoitemäärät eivät täyttyisi kuten koulujen omaan toimintaan liittyvissä hankkeissa.
Osittaminen ja ositteet. Perusjoukon osittamisella saadaan enemmän informaatiota kuin yksinkertaisella satunnaisotannalla. Osittamisessa otoskehikko jaettiin toisensa poissulkeviksi osajoukoiksi suuralueisiin ja kuntaryhmiin. Kukin osajoukko toimi itsenäisenä otoskehikkona otoksen poiminnassa. Osittaminen takasi koulujen edustettavuuden ositteittain ja mahdollisti tulosten vertailtavuuden ositteiden kesken. Perusjoukon osittamisperusteina olivat EU:n ja Tilastokeskuksen yleisesti käyttämät suuralueet ja kuntaryhmät. Suuralueita olivat Helsinki-Uusimaa, Etelä-Suomi, Länsi-Suomi, Pohjois-Suomi ja Itä-Suomi sekä Ahvenanmaa. Suuralueet jaettiin vielä ositteen sisällä kaupunkimaisiin ja maaseutumaisiin kuntiin. Kaupunkimaiset kunnat käsittivät myös taajaan asutut kunnat. Kun Ahvenanmaa jätettiin pois ja Helsinki-Uudenmaan maaseutukoulut (2 kpl) yhdistettiin samaan ositteeseen kaupunkikoulujen kanssa, ositteita saatiin yhteensä seitsemän. Suunnitellun otoksen koulu- ja oppilasmäärät ositteittain kuvataan taulukossa 3.1.
Taulukko 3.1 Otantakehikon koulu- ja oppilasmäärät sekä suunniteltu otos ositteittain
Otantamenetelmä. Otantamenetelmäksi valittiin kaksivaiheinen ryväsotanta. Otannan ensimmäisessä vaiheessa koulut valittiin käyttäen systemaattista ositettua PPS-otantaa (probability-proportional-to-size), jossa koulun kokotekijäksi oli määritelty oppilaiden lukumäärä tutkimuksen kohteena olevilla luokka-asteilla. Samanaikaisesti kullekin otoskoululle pyrittiin poimimaan vähintään 1–2 varakoulua mahdollisten poisjääntien vuoksi. Otannan toisessa vaiheessa kustakin poimitusta otoskoulusta valittiin yksi opetusryhmä systemaattisella satunnaisotannalla. Tässä tutkimuksessa kouluja ohjeistettiin valitsemaan ensisijaisesti A-luokka ja jos sitä ei ollut, B-luokka jne.
Ensimmäiseksi varakouluksi nimettiin varsinaista otoskoulua seuraava koulu osituksen ja koulujen koon mukaan lajitellusta aineistosta. Toiseksi varakouluksi nimettiin 1. varakoulua seuraava koulu vastaavasti osituksen ja koulujen koon mukaan lajitellusta aineistosta. Koulun korvaaminen seuraavalla, samaa kokoluokkaa ja samalla alueella sijaitsevalla koululla ei oleteta olennaisesti vahingoittavan satunnaisuutta. Kaikille varsinaisille otoskouluille saatiin määriteltyä vähintään kaksi varakoulua. Varakoulua tavoiteltiin, jos varsinainen otoskoulu kieltäytyi tutkimuksesta riittävän aikaisessa vaiheessa.