Kui suurt kasu toovad välisüliõpilased Eestile?

Viimase kolme aasta jooksul on suurenenud nende välisüliõpilaste hulk, kes õppimise kõrvalt töötavad. Kui suurt kasu toovad need tudengid Eestile?

Kadri Rootalu, statistikaameti andmeteadur

Sihtasutuse Archimedes tellimusel statistikaametis valminud värskes analüüsis uuriti, kui suurt maksutulu toovad välisüliõpilased Eestile siin töötades.

Õppeaastal 2018/19 maksid välisüliõpilased ja välisvilistlased Eestile tulu- ja sotsiaalmaksuna üle 10 miljoni euro. Pooled välisüliõpilased jäävad Eestisse tööle ka pärast õpingute lõpetamist.

Üle poolte välistudengitest töötab

Eesti kõrgkoolide haridus paistab maailma kõrgharidusturul üha rohkem silma. Siinsed ülikoolid liiguvad rahvusvahelistes kvaliteediedetabelites järjest ülespoole, meelitades aasta-aastalt siia rohkem välisüliõpilasi  ja -teadlasi.

Viimase kümne aasta jooksul on Eestis õppivate välisüliõpilaste arv viiekordistunud, kuid samal ajal on vähenenud kohalike üliõpilaste arv. Millised on meile saabunud välisüliõpilased ja kuivõrd nad võiksid siinsel tööturul leevendada tööjõupõuda?

Eesti hariduse infosüsteemi ning maksu- ja tolliameti töötamiste ja sissetulekute andmete analüüsi käigus selgus, kui paljudel välisüliõpilastel on Eestis õppimise ajal ja pärast õpinguid kokkupuuteid Eesti tööturuga ning kui suur osa neist on vähemalt korra Eestis registreeritult töötanud ja millist tasu on nad töötamise eest saanud.

Õppeaastal 2016/17 oli õpingute ajal vähemalt ühel korral registreeritult töötanud 48% välisüliõpilastest, 2018/19. õppeaastal oli neid juba 53%. Kohalikest üliõpilastest on töötanud 85%. Seejuures maksid 2018/19. õppeaastal välisüliõpilased Eestis töötamiselt tulu- ja sotsiaalmaksu 8 miljonit eurot ehk 2 miljonit eurot rohkem kui eelneval õppeaastal.

Joonisel on õppeaastal 2017/2018 lõpetanud välisvilistlaste Eestis makstud tulumaks õppevaldkondade järgi. Näidatud pole valdkondi, kus töötab alla 20 välislõpetaja.

Kes maksid kõige rohkem tulumaksu?

Õpingute lõppedes õppeaastal 2017/2018 jäi Eestisse tööle veidi üle poole (51%) välisüliõpilastest ning rohkem kui 90% kohalikest vilistlastest. Kõige rohkem jääb välisüliõpilasi tööle info- ja kommunikatsioonitehnoloogiate ning tehnika ja tootmise valdkonda. Kaks kolmandikku neist oli lõpetamisele järgneva õppeaasta jooksul töötanud Eestis vähemalt ühe korra. 

Eestis töötamise pealt maksid lõpetamisele järgneval aastal kõige suurema summa tulumaksu ehk kokku veerand miljonit eurot info- ja kommunikatsioonitehnoloogia välisvilistlased. Ärinduse, halduse ja õiguse valdkonnas oli välisüliõpilastest lõpetanuid üle kahe korra rohkem ja tulumaksuna panustasid nad peaaegu sama suure summa.

Kas meile tulevad talendid, keda vajame?

Välisvilistlased töötavad võrreldes kohalike koolilõpetajatega harvemini avalikus sektoris ja tervishoius. Suurema tõenäosusega lähevad välisvilistlased tööle ka välisomanikuga ettevõtetesse. Pooled välisvilistlastest ning vaid 18% kohalikest koolilõpetajatest töötasid välisomanikuga ettevõttes.

Kohalike lõpetajatega võrreldes töötavad välisvilistlased sagedamini ettevõtetes, mis tegutsevad info ja side ning töötleva tööstuse alal, aga ka majutuse ja toitlustuse ning haldus- ja abitegevustega seotud ettevõtetes (sh töövahendusfirmade kaudu tehtud tööd).

Lühiajaliste tööde ja platvormitööde (tööd, mida hallatakse digiplatvormil, nt kullerteenused, tõlke- ja kujundusteenused, lapsehoiu ja majapidamistööde vahendamine) hulk on suurenenud just viimasel aastal, seda eriti välisüliõpilaste seas.

Õppeaastal 2018/19 oli töötamise registris registreeritud tööepisoodide arv kohalikel üliõpilastel keskmiselt 2,1 ning välisüliõpilastel 3,2. Veel kaks aastat tagasi olid need keskmised näitajad kohalikel ja välisüliõpilastel sarnased. Samas ei saa öelda, et lühikesed tööotsad oleksid ka välisüliõpilaste seas valdavad. Kokku rohkem kui kolm kuud oli õppeaasta jooksul töötanud 85% välis- ja 87% kohalikest üliõpilastest. Selles osas on välisüliõpilased kohalike üliõpilastega sarnased.

* Töötamise ja sissetulekute analüüs on tehtud Eesti hariduse infosüsteemis isikukoodidega tuvastatavate üliõpilaste andmete põhjal. Töötamisena arvestatakse olukorda, kus inimesel on töötamise registris õppeaasta jooksul registreeritud vähemalt üks tööepisood.

Mida edukam mees, seda rohkem lapsi

Statistika paljastab, et isad saavad paremini hakkama kui lastetud mehed. Nad on targemad, edukamad, teenivad rohkem ja elavad kauem.

Alis Tammur, statistikaameti juhtivanalüütik

Statistikaameti käsutuses olevad registrid ja andmekogud võimaldavad üsna kerge vaevaga panna kokku erinevat statistikat, mis aitab selgitada ühiskonnas toimuvate protsesside tagamaad. Seekord vaadeldakse Eestis elavaid mehi nende laste, hariduse, ameti ja sissetuleku järgi. Selgus, et Eesti isad saavad võrreldes lastetute meestega paremini hakkama. Nad on targemad, edukamad, teenivad rohkem ja elavad kauem.

Isaks saadakse hiljem kui emaks

Demograafilises mõttes ei anna sündimuse uurimine meeste järgi erilist väärtust. Lapsed saab küll paar, kuid analüüs tehakse siiski vaid ema järgi, sest tema saab alati üheselt kindlaks teha ja tema isik on teada. Isad on vahel teadmata, vahel jällegi selgub info nende kohta alles hiljem.

Perevääruste muutumist aga ei soodusta see, kui jätta mehed sündidest ja lastest rääkides tähelepanuta. Mehel on ju tähtis ja asendamatu roll pereelus ja laste saamisel.

Mehed saavad isaks enamasti natuke hilisemas eas kui naised emaks. Keskmiselt on isad lapse sünnihetkel kolm aastat vanemad kui emad. Viimaste sünniandmete põhjal on kõige rohkem isasid, kes on lapse sünnihetkel 31-aastased. Alla 17-aastaseid isasid on võrdlemisi vähe. Varasematel aastatel on väga noori isasid olnud mõnevõrra rohkem, millest võib järeldada, et laste teadlikkus ja seksuaalharidus on paranenud. Viimase nelja aasta jooksul on sündinud kokku 16 last, kelle isa oli 14–16 aastat vana. Samal ajal on suurenenud nende isade hulk, kes on lapse sünni ajal üle 50 aasta vanad, kuus last on sündinud isegi vähemalt 70-aastasele isale.

Vähem kui pool (seitsmest mehest kolm) 30. eluaastates meestest on lastetud. Igal neljandal 40-ndates mehel pole lapsi. Vanemas eas enam väga palju isaks ei saada, kuid lastetuid mehi jääb järjest vähemaks (umbes 15%). Sellest võib järelda, et isad elavad lastetutest meestest kauem. Lastetuid vähemalt 45-aastaseid naisi on 10% kandis. Vähemalt kolm last on igal viiendal (20%) vähemalt 40-aastasel mehel.

Mehed vanuse ja laste arvu järgi, 2019

Kõrgharidusega meestel on rohkem lapsi

Lapsi on rohkem kõrgharidusega ja eesti rahvusest meestel. Neil on 0,1–0,2 last keskmisest rohkem (arvestatud vähemalt 45-aastaseid mehi). Kõigepealt hakkavad 20. eluaastates lapsi saama põhiharidusega mehed, kuid juba 30-ndate teisest poolest on kõrgharidusega meestel laste arv kõige suurem. Alates 40. eluaastast on kõrgharidusega meestel üle 0,3 lapse rohkem kui põhiharidusega meestel.

Naistel on olukord vastupidi. Kõige rohkem on lapsi põhiharidusega naistel. Neil on keskmine laste arv isegi üle 2,1, mis on rahvastiku taastest rääkides väga oluline. Samal ajal on 40-. eluaastates kõrgharidusega naistel lapsi keskmiselt mõnevõrra rohkem kui vanemate vanuserühmade kõrgharidusega naistel. Põhiharidusega naised saavad aga varasemate põlvkondadega võrreldes nüüd vähem lapsi. See on oluline muutus Eesti sündimuses.

Pereloomiseas (25–39-aastaste hulgas) on kõrgharidusega mehi 28%, kõrgharidusega naisi aga 34%. Tundub, et just selline paar on võti, et ühes Eesti peres kasvaks rohkem lapsi. Kahjuks jääb osa naisi üle. Kindlasti ei välista haridustaseme erinevus pere loomist, kuid vähendab naistel võimalust leida endale partner. Seda eriti Tallinnas ja Tartus, kus on noori naisi meestest rohkem.

Lasterikkad tippspetsialistid ja juhid

Haridus annab ameti ja palga. Statistika näitab, et isad teenivad rohkem kui lastetud mehed. Kolmandik 40–59-aastastest isadest teenis maksuameti andmetel 2017. aastal brutotulu vähemalt 1500 eurot kuus. Lastetutest meestest teenis sellist tulu vaid viiendik.

Isadel on seega kõrgem haridus ja palk. Selle põhjal võiks järeldada, et kõrgharidust nõudvatel töökohtadel töötavatel meestel on keskmisest rohkem lapsi. On loogiline, et see ametite kaupa erineb. Et võrdlus oleks adekvaatne (mõnele ametikohale saamiseks on vaja varasemat karjääri ja osa ameteid on populaarsed noorte seas), on siin vaadeldud ainult 40–59-aastaseid mehi neis ametirühmades, kus on vähemalt 100 meest ametiala kohta.

Selgus, et kõige rohkem lapsi on religioonivaldkonna tippspetsialistidel (eriti pastoritel). Neile järgnesid seadusandjad (ennekõike volikogu komisjonide esimehed ja riigikogu liikmed). Üldiselt on aga kõige rohkem lapsi tippspetsialistidel ja juhtidel. Nendel ametikohtadel kokku töötab 30% meestest.

Ametirühmad, kus on meestel keskmiselt kõige rohkem lapsi, mehed vanuses 40–59, 2019

Kõige vähem on lapsi lihttöölistel, näiteks köögiabilistel, koristajatel, pakkijatel ja jäätmesorteerijatel, keda on 6% kõigist ametialade esindajatest.  

Ametirühmad, kus meestel on keskmiselt kõige vähem lapsi, mehed vanuses 40–59, 2019

Miks on nii, et isad on keskmistest meestest paremad? Kas naised valivad mehi, kes on juba enne edumeelsemad või muudab isaks olemine mehed püüdlikumaks? Ilmselt nii seda kui ka teist.

Varasematest uuringutest on selgunud, et laste saamine sõltub peamiselt turvalisusest – pere majanduslikest võimalustest, mõlema vanema olemasolust ja laiemalt riigi majanduslikust olukorrast. See analüüs näitas, et lapse isaks valitakse elus paremini hakkama saavaid mehi. Järelikult soodustab sündimust turvalisus.


REGREL. Isehakanud Norra kuningatest ja sellest, miks registreid võib usaldada

Igal loendusel tekivad vead ja need on vältimatud. Registreid kasutades ja neis olevaid vigu parandades saavad andmed ajas korda ega kerki enam esile isehakanud Norra kuningaid ja olematuid presidente.

Diana Beltadze, Statistikaameti rahva ja eluruumide registripõhise loenduse projektijuht

Igasuguse meetodiga saadud loendustulemused on väärtuslikud, kuid loendusel tekkivatest vigadest eriti ei räägita, sest statistikaamet korrastab andmed kellelegi kurtmata ära ja teeb kõik selleks, et need oleksid kenasti statistikas kasutatavad.

Viimasel ajal on palju tähelepanu juhitud sellele, et registrites esineb ebatäpsusi ja puuduvaid väärtusi. Vigade esinemise sagedust registrites on hinnatud uut loendust ette valmistades alates aastast 2007, lisaks esimese ja teise prooviloenduse käigus. Kokkuvõtlikult võib tõdeda, et registrite andmed on kvaliteetsemad ja lisaks on ülevaade vigadest registripõhise loenduse korral parem kui tavaloendusel. Miks?

Haihtunud presidendid ja polüglotid

Tavaloendusel on vigu keerulisem ette näha. Vigaseid ja puuduvaid väärtusi esines ka 2011. aasta rahvaloenduse tulemustes ja nende parandamisele kulus kümme kuud.

Enamasti parandatakse loendusel saadud vead statistilisi meetodeid kasutades. Nii saavad valeandmete esitajad alles loenduse andmestikku uurides teada, et vaatamata nende ütlustele, ei ole meil Norra kuningaid, igat masti presidente, maailmale tundmatuid usundeid, rahvuseid, uskumatult andekaid polüglotte ja teisi imepäraseid nähtusi.

Kõige levinum meetod loendusandmete kvaliteedi tagamiseks on imputeerimine, mille käigus täidetakse puuduvad andmelüngad sobivate väärtuste või objektidega. Näiteks otsus lugeda Eesti elanike hulka isik, kes elab ühes, kuid on registreeritud teise elukohta, tehakse registri andmete põhjal, mitte selle järgi, et ta keeldus enda loendusest või ei lubanud loendajat koju.

Andmelüngad võivad tekkida eri põhjustel, näiteks jäi e-loendusel vastajal ankeet pooleli või andis vastaja andmeid teise isiku kohta ega teadnud kõikidele küsimustele vastust.

Aastal 2011 kasutati loenduse andmete töötlemisel andmeallikatena ja eeltäitmiseks registreid (rahvastikuregistrit, Eesti hariduse infosüsteemi, REL2000 andmebaasi), mille kvaliteeti oli analüüsitud. Näiteks isikukoodi, kodakondsuse või perekonnaseisu kohta andis andmed rahvastikuregister; rände, rahvuse, inimeste eluruumide kohta sai lisateavet REL2000 andmebaasist; hariduse ja õppeasutuste kohta aga Eesti hariduse infosüsteemist.

Kuidas tagada andmete täpsust?

Kindlasti tuleb hinnata iga loenduse täpsust. Eelmisel loendusel jäi loendamata umbes 2,3% rahvastikust. Teise prooviloenduse tulemuste põhjal 2019. aastal võib väita, et registritest saame püsielanike info nüüd paremini kätte. Loendamata isikute arv on olulisel määral väiksem.

On mitu võimalust hinnata loenduse andmekvaliteeti, näiteks võrrelda tavaloendusel kogutud andmeid registriandmetega või kasutada valikuuringute andmeid. Sellepärast on tavaline, et statistikaamet korraldab kontrolluuringuid või lisab mõne tunnuse uuringusse testimiseks, et teha otsuseid andmete kvaliteedi kohta. Eestis kui väikeriigis on seni õnnestunud loenduste andmekvaliteeti hinnata, kuid see on olnud väga keeruline töö. Aastal 2000 korraldati loenduse kvaliteedi uuring ja 2011 hinnati loenduse kvaliteeti registrite andmeid kasutades ning korraldati tagasiside uuring e-vastajate aadressiandmete kontrolliks.

Rahvaloendustel tuleb üle lugeda kõik püsielanikud riigi territooriumil. Loenduse andmete kvaliteedi hindamisel kasutatakse mõisteid alakaetus (loendamisele kuuluvaid inimesi ei saada kätte) ja ülekaetus (inimesi loetakse rohkem kui peaks ehk loendatakse ka neid, kes on küll riigi territooriumil, kuid ei ole püsielanikud). Ala- ja ülekaetus on loenduste kvaliteedi hindamisel maailmas põhinäitajad. Seepärast otsivadki riigid võimalusi loendustel registreid kasutada, sest üha rohkem on neid inimesi, keda ei saa kätte ja teiseks on keeruline teha kindlaks, kes on püsielanik.

Mured tavaloendusega

Tavaloenduse suurim probleem on alakaetus, see tähendab, et loendusest jäävad välja püsielanikud, mistõttu loendusandmed  alahindavad rahvaarvu. Alakaetuse põhjused on erinevad, näiteks Euroopa Liidu viisarežiimi kaotamine, vaba tööjõu liikumine, õpilaste ja üliõpilaste vahetusprogrammid, elukoha registreerimise nõude liberaalsus (pole sunnimehhanismi ja poliitilist tahet olukorda lahendada), meedia võimendused isikukaitse teemal, mille tõttu võivad mõned inimesed loendusest pigem eemale hoiduda.

Tavaloendusel võivad tekkida vead kolmes etapis

Loendust ette valmistades võivad tekkida juhuvead teadmatusest, mis võivad muutuda töö käigus süstemaatilisteks vigadeks. Näiteks pole võimalik ankeedi koostamisel ette näha vajalikke kontrolle, mis takistaksid sisestada valesid vastuseid. On olnud olukordi, mil kogemata on märgitud isa nooremaks kui poeg või on kirjas, et eluruumis elab püsivalt vähemalt üks Eesti elanik, kuid samal ajal on vastaja märkinud, et leibkondade arv eluruumis on 0.  

Selliste vigade põhjuseks on toimingute ebapiisav eeltestimine ning nende ärahoidmiseks korraldatakse prooviloendusi, kus uuritakse, kuidas inimesed küsimustest aru saavad ja neile vastavad, kui palju tehakse nalja, kui kaua küsimustiku täitmine aega võtab jne.

Loenduse andmete kogumise etapis võivad tekkida vead, kui inimesed saavad ankeediküsimustest erinevalt aru. Eelmisel loendusel näiteks kirjutati väga palju valesid aadresse, mille tegid hiljem korda andmekorrastajad.

Esines ka olukordi, kus loendaja ei leidnud üles inimese elukohta, sest aadressi eelinfo oli puudulik või ei elanud inimene eluruumis, vaid suvilas või pooleli olevas ehitises. Seetõttu pidid loendajad läbi käima kogu loendusjaoskonna, mitte piirduma vaid töönimekirjas märgitud isikute ja asutuste aadressidega.

Tegime tihedat koostööd kohalike omavalitsustega, et täpsustada elukohti. Sellest hoolimata tuli loenduse kvaliteedi tagasiside küsitluselt iga viies kiri tagasi postiljoni teatega, et inimene ei ela sellel aadressil. Sageli ei saadud inimest kätte, sest ta viibis küsitluse ajal kodust eemal ja keegi teine ei saanud esitada tema andmeid.

Andmete töötlemise ja andmetabelite koostamise ajal võivad tulla vead valesti sisestatud ametinimetuste koodide või isiku andmekaitse piirangutest tulenevate nõuete täitmise tõttu. Näiteks samasoolisi paare on vaid mõnisada, mistõttu peab statistikaamet olema eriti hoolas ning arvestades andmekaitse piiranguid, ei tohi me esitada andmeid täpsemalt, sest isikud oleksid tuvastatavad.

Tavaloenduse olulisemad mõjutajad

Kõige rohkem mõjutavad tavaloenduse andmekvaliteeti küsimustik ja loenduse juhend. Küsimustiku vorm, täpne sõnastus ja ka küsimuste paigutamine nõuavad suurt tähelepanu. Rahvusvaheliselt soovitatakse teha küsimustik nii lühike kui võimalik. Seetõttu ei saa kõikide huvigruppide sooviavaldusi loenduse programmi koostamisel arvesse võtta, näiteks küsida loendusel küsimusi selle kohta, kui palju on kellelgi koduloomi või kas keegi on vegan jne.

Küsimused peavad olema ühemõttelised ega tohi solvata. Kui on vaja tõlkida küsimusi kohalikesse keeltesse (Eestis on loendusel olnud kasutuses kolm keelt, aga Horvaatias oli 2011. aasta loendusvoorus üheksa), tuleb täpselt jälgida, et tõlked ei moonutaks küsimuste tähendust.

Tavaloenduse loendusandmete kvaliteedi tagamiseks pööratakse erilist tähelepanu loendajate töö korrale. Selleks koostatakse selged juhised, kirjutatakse lahti mõisteid, koolitatakse töötajaid, sest ka loendajate arusaamad oma tööst ja missioonist aitavad tagada loendustulemuste paremat kvaliteeti.  

Võitlus tuuleveskitega

Loendustöö kujutab endast vigadega võitlemist. Vähem kulukamalt ja  mitte nii emotsionaalselt on võimalik vigadest võitu saada registrite andmeid kasutades, sest vigadest on ülevaade olemas nii registripidajal kui ka statistikutel. Mõlema võimuses on vigu parandada ja nende töövõitudest saab osa kogu ühiskond.

Tavaloendusel vastutab vigade eest loenduse korraldaja, kes võitleb justkui tuuleveskitega, sest tekkivaid vigu pole võimalik ametil ära hoida ning parandatud andmeid ei tohi kellelegi edastada.

Registreid kasutades ja neis olevaid vigu parandades saavad andmed ajas korda. Tavaloendustel seda aga ei juhtu, sest igal loendusel on vaja taas kulutada ressursse, et vigu parandada.

REGREL-ile pühendatud artiklite sari tutvustab rahva ja eluruumide loenduse ettevalmistust ja metoodikat. REGREL-i kohta on rohkem infot Statistikaameti veebilehel.


REGREL. Andmete kvaliteedi tõstmine on kui maratonijooks

Majandus- ja kommunikatsiooniministeerium on võtnud põhjalikult käsile ehitisregistri andmete kvaliteedi parandamise, et olla valmis 2021. aasta registripõhiseks rahva ja eluruumide loenduseks.

Taavi Jakobson, majandus- ja kommunikatsiooniministeeriumi ehitisregistritalituse projektijuht

Põhjamaalastena veedame ligi 90% oma elust hoonetes – korterites või eramutes, kontorites ja koolides, kaubanduskeskustes. Needsamad hooned tarbivad umbes poole toodetavast energiast. Hoonete teenindamiseks on ehitatud pikki maa-aluseid ja maapealseid torustikke, teede ja kaablivõrgustikke. Ehitiste turvalisusest ja mugavusest sõltub meie heaolu ja tervis. Isegi elu.

Tänapäeva turvalises keskkonnas on kerge unustada, et ehitust reguleerivad seadustikud on juba aastasadu keskendunud sellele, et hooned iseenesest kokku ei variseks või tiheasustuse piirkondades põlema süttides poolt linna maha ei põleks.

Täpsete andmete vajalikkus

Et maksumaksja raha võimalikult mõistlikult investeerida, näiteks keskkütte või kanalisatsioonitaristu rajamiseks või prügiveo piirkondade optimeerimiseks, on vaja andmeid. Andmeid on vaja ka näiteks tarbijakaitse ja tehnilise järelevalve ametilt selleks, et kontrollida just kõige riskantsemas vanuses hoonete rõdupiirdeid. Teadmine, et hoone katusel on elektrit tootvad päikesepaneelid, võib päästa tuletõrjuja elu. Kuna päikesepaneelidega hoonetes pole võimalik elektrit täielikult välja lülitada, ei ole veega kustutada turvaline.

Hoonete (lähitulevikus ka rajatiste) andmeid hoitakse Eestis ehitisregistris. Register on olnud aastaid alarahastatud ja alamehitatud, kuid majandus- ja kommunikatsiooniministeerium on viimase poolteise aasta jooksul võtnud selle arendamise põhjalikult käsile ning lähikuudel jõuavad esimesed töö viljad ka kasutajate ette.

Aja ja raha sääst

Lisaks andmekogule korraldab ehitisregister ka kasutus- ja ehituslubade menetlusi. Hoolimata raskest algusest on pabermenetluselt elektroonilisele üleminek säästnud lugematul hulgal aega ja raha. Ühe arhitektuuribüroo hinnangul oli nende sääst ühe projekti pealt keskmiselt lausa 100 tundi.

Õnneks on juba üsna sügavale unustusehõlma vajunud, kuidas A1 formaadis trükitud ja paljundatud projektidega valla ehitusspetsialisti ukse taga järjekorras istuti. Parandamise ja lihtsustamise ruumi on siin muidugi veel palju. PriceWaterhouseCoopersi hinnangul (2018) on menetluskeskkonna uuendamisega võimalik kokku hoida igal aastal üle 90 000 tunni omavalitsuste ja kooskõlastavate asutuste ametnike aega.

Sääst erasektoris on hinnanguliselt vähemalt sama suur. Erinevalt näiteks lähinaabritest Soomes, kel igas vallas on oma hoonete andmekogu, on meil õnneks üks ehitisregister üle riigi, mis hõlbustab nii andmete analüüsi kui ka süsteemi arendusi ja käimas hoidmist.

Nii nagu ehitisregistri tarkvara vajab arendustöid, vajab parandamist ka selle andmekvaliteet. Meie andmeparandustööd on ennekõike keskendunud sellele, et 2021. aasta registripõhise rahva ja eluruumide loenduse (REGRELi) ajaks on tagatud vajalik andmekvaliteet.

Mis on pildil: puukuur või kurgilava?

Praeguse suurema andmekvaliteedi parandamise projekti käigus korrastame registri andmebaasi, loome kvaliteedi hindamise vahendid ja viime andmebaasi masskannetena sisse parandused, mida on võimalik automaatselt teha. Need kanded lähevad andmebaasi selle aasta novembris ja detsembris, mistõttu ei kajastunud viimases prooviloenduses.

Registri andmete parandamisel peame olema tähelepanelikud, sest andmed peavad olema usaldusväärsed nii üldistatult (statistiliselt) kui iga korteri ja hoone kohta. Seetõttu oleme enne andmebaasis paranduste tegemist andmete õigsust korduvalt kontrollinud ja nüüd valmis neid sisse viima.

Koostöös maa-ametiga kanname registrisse puuduvaid hooneid. Selle aluseks on ülelendudega tehtud ortofotod, mis abistavad omavalitsuse ametnikel registrist puuduvate hoonete tuvastamist. Ehkki andmeid on ka maa-amet puhastanud, on ka siin käsitööd veel päris palju, sest ülalt vaadates näevad eluhoone, katusega puuriit ja kurgilava üsna sarnased välja.

Otsused andmete, mitte kõhutunde toel

Aastal 2020 käivitub projekt, millega tuvastame, millal on hinnanguliselt hooned esmaselt kasutusele võetud. See on REGRELi nõuetest hetkel kõige problemaatilisem tunnus. Siingi on abiks ortofotod ja ajaloolised kaardid. Lihtsalt selgitades võrreldakse selleks kaht samast kohast ülelennuga saadud fotot ja kui vahepeal on hoone tekkinud, saabki ligikaudse ehitamise aja.

Teiseks kogume infot omavalitsustelt ja teenusepakkujatelt olemasoleva pesemisvõimaluse ja WC kohta. Mõistagi on andmete õigsuse tagamisel oluline roll ka koduomanikel. Selleks, et andmete parandamine oleks võimalikult kiire ja mugav, oleme automatiseerinud ja lihtsustanud andmete esitamise teatise. Seda hakkab uuenenud ehitusregister 2020. aasta alguses pakkuma.

Andmekvaliteedi tõstmise töö ei ole sprint, vaid maraton. Seda maratoni jookseme ikka uuesti ja uuesti ning iga korraga seame ja saavutame uusi ja täpsemaid andmekvaliteedinõudeid. See ei ole lihtne, aga kui tahame, et meie riigis otsustatakse andmetele, mitte kõhutundele tuginedes, on see hädavajalik.

REGREL-ile pühendatud artiklite sari tutvustab rahva ja eluruumide loenduse ettevalmistust ja metoodikat. REGREL-i kohta on rohkem infot Statistikaameti veebilehel.


 [

REGREL. Kas lugeda rahvast savitahvlite või taimejuurte abil?

Eelmine statistikaameti suurprojekt 2011. aasta rahvaloendus lõppes edukalt, muuhulgas püstitati isegi internetis vastanute maailmarekord (u 2/3 vastanutest). Rekordivääriline oli ka küsimustik – nii pikalt ja põhjalikult polnud seni kogu rahvastikult andmeid küsitud. Kuhu suunda tüürib järgmine loendus?

Ene-Margit Tiit, statistikaameti rahvastikustatistika ekspert

Üks keerukamaid kohti tänapäeva loenduste juures on kaetus, sest inimesed liiguvad palju ringi ega viibi kaugeltki kogu aeg oma püsielukohas. Tihtipeale ei tea nende lähedasedki (kui neid on), kui kauaks nad ära on reisinud.

Teine probleem loendajate jaoks on inimeste privaatsuse soov. Igati ontlikud ja muidu seaduskuulekad inimesed ei soovi loenduses (ja ka muudes uuringutes) osaleda ja oma andmeid riigiga jagada. Nii näiteks selgus pärast eelmist loendust loendusandmeid rahvastikuregistri andmetega võrreldes, et registri järgi elab Eestis umbes 65 000 inimest (5% rahvastikust) rohkem kui loendati.

Olukorra selgitamiseks töötati välja mitmete riiklike registrite ristkasutusele tuginev nn elumärkide metoodika andmestiku hindamiseks, mis näitas viga mõlemas andmekogus. Rahvastikuregistris oli kirjas mitukümmend tuhat välismaale lahkunud isikut, kes ei olnud oma lahkumist rahvastikuregistris registreerinud, loendusel aga oli jäänud puudu ligi 30 000 isikut ehk 2,3% loendamisele kuuluvatest isikutest.

Segadused elukohaga

Väikese pettumuse valmistasid ka mõne teise tunnuse täpsuse näitajad, neist olulisim Eesti andmekorralduse valulaps – registreeritud elukoht, mis ei ühti tegeliku elukohaga viiendikul elanikest. Kas seda õnnestus täpsustada? Vastus on jah ja ei. Nende vastajate elukohad, kuhu läksid loendajad, said küll enam-vähem täpselt kirja. Seevastu nendest internetis vastajatest, kelle tegelik ja registreeritud eluruum lahknesid, märkisid ligemale pooled loendusankeeti oma elukohaks registreeritud elukoha, mis tekitas kohe mõnesugust segadust leibkondade arvestuses. Halvem oli aga see, et loenduse andmetest moodustatud statistilise registri elukoha-andmed hakkasid kiiresti halvenema (kuigi neid registreeritud elukohamuutuste põhjal täiendati), sest endiselt ei täidetud elukoha-muutuste registreerimise nõuet ja ekslikke elukohaandmeid on jätkuvalt 20% ringis.

Ülejäänud tunnustes jäi puuduvate väärtuste osa loendusandmestikus alla 1%, mis on rahvaloenduste kontekstis väga hea tulemus.

Tööd järgmiseks loenduseks

Registripõhise rahva ja eluruumide loenduse idee liikus valitsuse ringkondades juba enne 2011. aasta rahvaloendust. Sellega loodeti toetada e-riigi kuvandit ja ilmselt ka ressursse säästa. Statistikaamet oli sellele ideele siis vastu, sest polnud välja töötatud vajalikku metoodikat ja ka kõigi registrite kvaliteet ei vastanud vajadustele.  Puudus aadresside standard, mis võimaldanuks muid andmeid geograafiliste kohtadega siduda, samuti süsteemne ja kõikehõlmav andmevahetuskeskkond. Küll aga nõustus statistikaamet otsusega viia järgmine 2021. aasta rahva ja eluruumide loendus läbi registripõhiselt.  

Tööga alustati kohe ning selles osalesid mitu ministeeriumi ja eri asutusi. Mida tehti?

  • Loodi vajalikud juriidilised alused ­– riikliku statistika seadus;
  • kontrolliti ja korrastati vajalikud riiklikud registrid;
  • loodi universaalne andmevahetussüsteem X-tee;
  • statistikaamet tegi ulatuslikku metoodilist tööd, sh töötas välja registripõhise rahva ja eluruumide loenduse kontseptsiooni, mida testiti koostöös teiste riikide registripõhise loenduse meeskondadega; tutvustas Eesti originaalmetoodikat muuhulgas ka Eurostati ja ÜRO loenduskogudes; kavandas kaks registripõhist prooviloendust (2016 ja 2019) ning ühe kontrolluuringu, mis praeguseks on tehtud; töötas välja kvaliteedi hindamise süsteemi, mis aitaks otsustada, kas registripõhist loendust on võimalik 2021. aastal teha piisava kvaliteediga.

    Miks teha registripõhine loendus?

  • Registripõhine loendus vastab tänapäeva info kogumise ja kasutamise nõuetele. Riigis luuakse järjest rohkem registreid, mille eesmärk on saada teavet riigi või ühiskonna juhtimiseks. Kui on ühtne registrite süsteem, on võimalik teha tõhusaid otsuseid.
  • Registripõhisel loendusel ei teki andmelünki inimeste liikumiste või loendusest hoidumise tõttu.
  • Registripõhine loendus tagab kõrgema kvaliteediga andmestiku, sest andmevigu ei teki unustamise või leibkonnaliikmete vähese informeerituse tõttu. Samuti välistab see n-ö nalja pärast või enesehinnangu tõstmiseks antud sihipäraselt ekslikud vastused. Registripõhise loenduse korral on võimalik mõne registri ebatäpsusi korrigeerida teiste registrite andmete abil.
  • Registripõhine loendus on operatiivne ja seda on võimalik korraldada kas või igal aastal.
  • Registripõhine loendus vähendab tuntavalt vastamiskoormust ja säästab nii inim- kui ka materiaalseid ressursse.

Tunnused loendusprogrammis

Rahva ja eluruumide loenduselt saadud teave on suurepärane algmaterjal teadus­uuringuteks ja seetõttu on arusaadav, et teadlased ja muud huvigrupid soovivad lisada küsimustikku oma uuringute tegemiseks vajalikke küsimusi. Sõjaeelses Eestis lükkas loenduskomisjon kõik ettepanekud karmikäeliselt tagasi, viimastel loendustel on aga loendusankeetidesse lisatud suur hulk lisaküsimusi inimeste päritolu, usu, keelteoskuse ja tervise kohta.

Riikides, kus selliseid tunnuseid soovitakse uurida, korraldatakse tavaliselt valikuuring. Valikuuringu usaldusväärsus ja eelised kõikse uuringu ees said statistikutele ja ühiskonnateadlastele selgeks juba sadakond aastat tagasi, kui uuringud muutusid mitmekesisemaks ja sügavamaks võrreldes loendusega, kus küsimuste ja vastusevariantide arv on piiratud. Valikuuringut võib teha loendusega samal ajal. Sel juhul on kaks küsimustikku: lühem on kõikne ja sisaldab rahvusvaheliselt kohustuslikke tunnuseid ning pikemas on konkreetse riigi ja huvirühmade soovitud küsimused välja valitud küsitletavatele.

Eestis on seis hea

Analüüsid on näidanud, et üldjuhul on registrite andmed ütlustest täpsemad. Skeptikutele, kes soovitavad loendamisel pöörduda tagasi ajalooliste meetodite juurde, on paslik meenutada, et ühiskonda ja inimeste käitumist ei ole võimalik tagasi minevikku pöörata. Minevikus hästi töötanud vahendid ei sobi tänapäeva maailma.

Eestis on uurijate olukord parem kui enamikus teistes riikides, sest meil toimib registrite süsteem hästi. Suure osa uuringuteks vajalikku teavet saab kätte riiklikest andmekogudest.

Savitahvleid kasutati rahvaloenduse andmete talletamiseks umbes  5000 aastat tagasi Lähis-Idas ja taimejuurte kimpe tuhatkonna aasta eest Peruus.     

REGREL-ile pühendatud artiklite sari tutvustab rahva ja eluruumide loenduse ettevalmistust ja metoodikat. REGREL-i kohta on rohkem infot Statistikaameti veebilehel.


REGREL. Elukoht garaažis või alajaamas. Aga päriselt?

Aadressiandmete süsteemis (ADS) registreeritakse kõigi maaüksuste, hoonete ja korterite aadressid, mis on registripõhise rahva ja eluruumide loenduse (REGREL) alus. Aadressiandmeid korrastatakse ka edaspidi, sest veel praegugi võib ette tulla juhtumeid, kus inimene elab registri järgi garaažis või alajaamas.

Mall Kivisalu, maa-ameti aadressiandmete osakonna juhataja

Keskne ADS loodi maa-ametis 2007. aastal. See oli hädavajalik samm, et tagada registrite andmevahetus ja ühtlasi toota algandmeid 2011. aasta rahva ja eluruumide loenduseks.

Varem toodeti iga 10 aasta järel loendusteks eraldi loenduskaarte. Kaartidele kanti kõik teadaolevad elumajad nummerdatuna, sest süsteemselt korrastatud ja kaardiga seotud aadressiandmeid ei olnud kuskilt võtta.

Kui aadressid registrites ei klapi

Enne ADS-i loomist kirjutati igasse registrisse aadresse nii nagu andmeandjad (nt kliendid) ütlesid või oli dokumentides. Paraku tekitas see palju segadust, sest inimesed kippusid registritesse andma oma aadresse erinevalt. Mõnel juhul võidi esitada ka valeandmeid, kuid kontrollida ei olnud kuskilt.

Segadusi tekkis näiteks sellest, et aadresside kirjapilt ei olnud standarditud ning need lihtsalt ei klappinud. Näiteks rahvastikuregistri aadress Kuuse tn 2 võis ehitisregistris olla Kuuse tee 2, äriregistris aga hoopis Kuuse 2. Kas silmas oli peetud sama aadressi, ei olnud teada, sest samas asulas võis olla nii Kuuse tee, Kuuse tänav kui ka Kuuse talu.

Samuti on arusaamatusi põhjustanud aja jooksul tehtud aadressimuudatused ning haldus- ja asustusepiiride ümberkorraldused. Osades registrites kasutati vanu ja osades uusi aadresse.

Varasemate andmeapsude ilmekaid näiteid leiab praegugi veel. Näiteks on inimeste elukohana registreeritud nii garaaže kui ka alajaamu.

Andmed eri kohtades

Eestis on kokku umbes 100 avaliku sektori andmekogu, kus aadresse kasutatakse. Peale selle on erasektori andmekogud (energia-, side-, logistika-, kütte- ja vee-ettevõtted, pangad jne).

Igasse andmekogusse on andmed jõudnud eri moel. Aeg-ajalt on kodanikul kohustus teatada andmekogu pidajale, et aadress on muutunud. Seda nõuet pole alati siiski täidetud.

ADS-i peaeesmärk on tagada, et maaüksuste, hoonete ja hooneosade (korterite, äriruumide) andmed oleks olemas nii nende asukohas kui ka andmekogudes. Samuti tagab ADS eri ajal tehtud aadressimuudatuste kättesaadavuse. Selleks

  • on kogutud ADS-i kõik aadressiandmed;
  • on loodud aadressi standard (sh õigusaktid, nõuded ja juhised);
  • pakutakse kvaliteetseid ja kiireid teenuseid nii andmete tootmiseks, seostamiseks, alla laadimiseks kui ka igapäevaseks andmete uuendamiseks.


Avaliku sektori andmete kvaliteedi parandamiseks telliti aastal 2009 andmekorrastustööd AS-ilt Regio ja Eesti Post. Nii saadi 2010. aasta loenduse alusandmed, mida kasutati ka ADS-i korrastamisel.

Kihilised andmevead

Andmevead on kihilised. Suurematest vigadest võivad kooruda uued vead, mida ei ole kohe näha.

Eluhoonele nõuetele vastava aadressi määramisel võib selguda, et hoone on lagunenud ja selle kasutamine tuleks pigem lõpetada ning leida selle hoonega seotud inimeste tegelik elukoht. Seejuures on abiks ka maa-ameti üha kvaliteetsemad orto- ja kaldaerofotod.

Andmekvaliteedi huvides on võimalik uurida, kas rahvastikuregistris elukohana registreeritud hoones (nt sõnnikuhoidla kõrval asuva lauda küljes olevas väikeses ehitises) on tõepoolest võimalik elada.

Andmete korrastamise käigus on järjest tulnud välja uusi nüansse, mille põhjal andmeid korda seada. Iga uus andmekasutaja on näidanud, kuidas on võimalik andmekvaliteeti veel parandada.

Aastal 2013 eraldas Vabariigi Valitsus aadressiandmete korrastamiseks omavalitsustele ja maa-ametile raha. Maa-amet valmistas ette andmetabelid, mille alusel asusid omavalitsused andmeid korrastama. Praeguseks on korda tehtud 527 000 objekti andmed. Jäänud on veel 50 000 objekti. Omavalitsused peavad saama  aastaks 2020 enamiku REGREL-ile vajalikest andmetest korrastatud, kuna see on loenduse õnnestumiseks hädavajalik.

Millised on korrastatud andmed?

Hoonel peab olema ruumikuju kaardil. Eesti topograafia andmekogus on hooned kaardistatud, kuid alati ei ole neil vastet ehitisregistris. Ehitisregistris oli kuni aastani 2012 lubatud hoonet registreerida ka ilma ruumilise asukohata. Ehitisregistrist aga võetakse REGREL-iks vajalik hoone info (nt kütte liik, tubade arv, veevarustuse olemasolu jne). Kaardil oleva kujutisega andmete seostamine annab kindluse, et erinevates andmekogudes käib jutt ikka samast hoonest.

Elukondlikul hoonel (eluhoonetel ja ettevõtete tegevusega seotud hoonetel) peab olema unikaalne aadress. Näiteks kui samal maaüksusel on mitu eluhoonet, siis on neid vaja aadressi järgi eristada. REGREL-i käigus tehakse kindlaks leibkondade arv  (koos elavad inimesed). Kui hoonetele unikaalseid aadresse ei määrata, võidakse lugeda koos elavateks ka täiesti võõrad perekonnad. Unikaalsed aadressid peavad olema ka korteritel.

Seosandmed teiste registritega peavad olema õiged. Kui näiteks rahvastikuregistris on aadress, mida ADS-is ei ole, on vaja see aadress kas ADS-i luua või leida isikule selline aadress, mis juba on ADS-is. Nii korrastatakse ka ettevõtete aadresse äriregistris ja korteriomandite andmetega kinnistusraamatus.

Lisateave ADS-i ja teenuste kohta

REGREL-ile pühendatud artiklite sari tutvustab rahva ja eluruumide loenduse ettevalmistust ja metoodikat. REGREL-i kohta on rohkem infot statistikaameti veebilehel.


REGREL. Rahvastikuregister on nagu Tallinn, mis ei saa kunagi valmis

Rahvastikuregister on märkamatult muutnud Eesti elanike suhtlust eri ametiasutustega. Veel paarkümmend aastat tagasi pidi näiteks passi või pensioni saamiseks esitama sünnitunnistuse. Praegu on riigil inimeste andmed olemas ja neid ei pea paberil ühest asutusest teise kandma.

Enel Pungas, siseministeeriumi rahvastiku toimingute osakonna juhataja

Rahvastikuregister võeti kasutusele 2000. aastate alguses ja selle eesmärk on tagada kogu riigile ühesugused korrektsed isikuandmed. Nende alusel saavad kohaliku omavalitsuse ja riigiasutused ning eraettevõtted pakkuda inimestele teenuseid või suhelda nendega dokumente küsimata.

Rahvastikuregistrisse kantakse kõikide Eestis või välismaal elavate Eesti kodanike andmed. Välismaalaste andmed on registris Eestis elamise ajal. Registris on iga inimese kohta märkimisväärselt suur hulk andmeid, näiteks nimi, sünniaeg, isikukood, sünnikoht, kodakondsus, perekonnaseis, teovõime, hooldusõigused, elukoha- ja kontaktandmed, suhted (vanem, laps, abikaasa, eestkostja, eestkostetav). Registris on ka dokumendid, mille põhjal andmed rahvastikuregistrisse tekivad või mille põhjal muutuvad.

Register kui elusorganism

On suur töö tagada sellise hulga andmete õigsus ja usaldusväärsus. Rahvastikuregister on keerukas infosüsteem ja toimib nagu elusorganism. Sellel on justkui ainevahetus: pidevalt tuleb uusi andmeid juurde, neid töödeldakse ja jagatakse jälle välja. Rahvastikuregistrile toodab ja esitab iga päev andmeid sadakond asutust, ametnikke on neis omakorda tuhandeid. Tekkinud andmehulgaga tegelemiseks on vaja väga selgeid kvaliteedireegleid ja iga tegija peab teadma, mille eest ta vastutab.

Rahvastikuregister on ka rahvaloenduste tegemise alus. Ajalooliselt tähendas loendus inimeselt andmete küsimist. Elektroonilise info maailmas on osasid andmeid inimeselt õigesti kätte saada keeruline ja andmed on kvaliteetsemad registrites, näiteks juriidiline perekonnaseis. Inimesed vastavad loendajale tavaliselt oma enesetunde järgi, näiteks kui ei olda enam abikaasaga koos, siis tuntakse, et ollakse lahutatud, kuigi lahutust ei ole vormistatud. Sama on ka kodakondsusega: Eesti kodakondsuse kohta on riigil dokumenteeritud andmed sõltumata sellest, mida inimene loendajale ütleb.

Peresündmuste andmed

Pea 15 aasta jooksul on loenduste õnnestumise nimel paberarhiivist rahvastikuregistrisse kantud enne registri loomist koostatud Eesti perekonnaseisudokumentide (nt sünnid, abielud) andmeid. See tagab, et registris on inimese õige sünniaeg ja -koht, õiged andmed abikaasade, vanemate ja laste suhete kohta, samuti korrektne perekonnaseis. Püüame võimalikul palju kätte saada ka välismaal meie inimestega toimuvaid sündmusi. Paraku sõltub see paljuski inimestest endist. Eriti keeruline on kätte saada surmainfot nende Eesti kodanike kohta, kes on kaotanud sideme Eestiga ja omavad teise riigi kodakondsust.

Register on vajalik kõigile

Palju on räägitud, kui oluline on elukohaandmete kvaliteet rahvaloendusel. Värske rahvastikuregistri seadus annab uued võimalused tagada andmete parem kvaliteet. Näiteks kui korteri- või majaomanik teatab, et inimene ei ela tema ruumis, jääb elukohaandmete väli tühjaks. Seega suureneb vajadus hoida andmeid korras.

Peale selle on loodud uusi andmevälju, mille täitmine ei sõltu sellest, kas inimene andmeid esitab, vaid andmete olemasolu peavad tagama asutused, kes inimese kuhugi suunavad või paigutavad (nt tööle, hooldele, vanglasse).

Rahvastikuregister on oluline kõigile: inimesele, omavalitsusele, riigile ja erasektorile. Kuid register on nagu Tallinn, mis ei saa kunagi valmis, sest alati saab andmeid efektiivsemalt koguda, parandada nende kvaliteeti ja suurendada selle kaudu andmete usaldusväärsust.

REGREL-ile pühendatud artiklite sari tutvustab rahva ja eluruumide loenduse ettevalmistust ja metoodikat. REGREL-i kohta on rohkem infot Statistikaameti veebilehel.