Tag Archives: REGREL

REGREL. Kas lugeda rahvast savitahvlite või taimejuurte abil?

Eelmine statistikaameti suurprojekt 2011. aasta rahvaloendus lõppes edukalt, muuhulgas püstitati isegi internetis vastanute maailmarekord (u 2/3 vastanutest). Rekordivääriline oli ka küsimustik – nii pikalt ja põhjalikult polnud seni kogu rahvastikult andmeid küsitud. Kuhu suunda tüürib järgmine loendus?

Ene-Margit Tiit, statistikaameti rahvastikustatistika ekspert

Üks keerukamaid kohti tänapäeva loenduste juures on kaetus, sest inimesed liiguvad palju ringi ega viibi kaugeltki kogu aeg oma püsielukohas. Tihtipeale ei tea nende lähedasedki (kui neid on), kui kauaks nad ära on reisinud.

Teine probleem loendajate jaoks on inimeste privaatsuse soov. Igati ontlikud ja muidu seaduskuulekad inimesed ei soovi loenduses (ja ka muudes uuringutes) osaleda ja oma andmeid riigiga jagada. Nii näiteks selgus pärast eelmist loendust loendusandmeid rahvastikuregistri andmetega võrreldes, et registri järgi elab Eestis umbes 65 000 inimest (5% rahvastikust) rohkem kui loendati.

Olukorra selgitamiseks töötati välja mitmete riiklike registrite ristkasutusele tuginev nn elumärkide metoodika andmestiku hindamiseks, mis näitas viga mõlemas andmekogus. Rahvastikuregistris oli kirjas mitukümmend tuhat välismaale lahkunud isikut, kes ei olnud oma lahkumist rahvastikuregistris registreerinud, loendusel aga oli jäänud puudu ligi 30 000 isikut ehk 2,3% loendamisele kuuluvatest isikutest.

Segadused elukohaga

Väikese pettumuse valmistasid ka mõne teise tunnuse täpsuse näitajad, neist olulisim Eesti andmekorralduse valulaps – registreeritud elukoht, mis ei ühti tegeliku elukohaga viiendikul elanikest. Kas seda õnnestus täpsustada? Vastus on jah ja ei. Nende vastajate elukohad, kuhu läksid loendajad, said küll enam-vähem täpselt kirja. Seevastu nendest internetis vastajatest, kelle tegelik ja registreeritud eluruum lahknesid, märkisid ligemale pooled loendusankeeti oma elukohaks registreeritud elukoha, mis tekitas kohe mõnesugust segadust leibkondade arvestuses. Halvem oli aga see, et loenduse andmetest moodustatud statistilise registri elukoha-andmed hakkasid kiiresti halvenema (kuigi neid registreeritud elukohamuutuste põhjal täiendati), sest endiselt ei täidetud elukoha-muutuste registreerimise nõuet ja ekslikke elukohaandmeid on jätkuvalt 20% ringis.

Ülejäänud tunnustes jäi puuduvate väärtuste osa loendusandmestikus alla 1%, mis on rahvaloenduste kontekstis väga hea tulemus.

Tööd järgmiseks loenduseks

Registripõhise rahva ja eluruumide loenduse idee liikus valitsuse ringkondades juba enne 2011. aasta rahvaloendust. Sellega loodeti toetada e-riigi kuvandit ja ilmselt ka ressursse säästa. Statistikaamet oli sellele ideele siis vastu, sest polnud välja töötatud vajalikku metoodikat ja ka kõigi registrite kvaliteet ei vastanud vajadustele.  Puudus aadresside standard, mis võimaldanuks muid andmeid geograafiliste kohtadega siduda, samuti süsteemne ja kõikehõlmav andmevahetuskeskkond. Küll aga nõustus statistikaamet otsusega viia järgmine 2021. aasta rahva ja eluruumide loendus läbi registripõhiselt.  

Tööga alustati kohe ning selles osalesid mitu ministeeriumi ja eri asutusi. Mida tehti?

  • Loodi vajalikud juriidilised alused ­– riikliku statistika seadus;
  • kontrolliti ja korrastati vajalikud riiklikud registrid;
  • loodi universaalne andmevahetussüsteem X-tee;
  • statistikaamet tegi ulatuslikku metoodilist tööd, sh töötas välja registripõhise rahva ja eluruumide loenduse kontseptsiooni, mida testiti koostöös teiste riikide registripõhise loenduse meeskondadega; tutvustas Eesti originaalmetoodikat muuhulgas ka Eurostati ja ÜRO loenduskogudes; kavandas kaks registripõhist prooviloendust (2016 ja 2019) ning ühe kontrolluuringu, mis praeguseks on tehtud; töötas välja kvaliteedi hindamise süsteemi, mis aitaks otsustada, kas registripõhist loendust on võimalik 2021. aastal teha piisava kvaliteediga.

    Miks teha registripõhine loendus?

  • Registripõhine loendus vastab tänapäeva info kogumise ja kasutamise nõuetele. Riigis luuakse järjest rohkem registreid, mille eesmärk on saada teavet riigi või ühiskonna juhtimiseks. Kui on ühtne registrite süsteem, on võimalik teha tõhusaid otsuseid.
  • Registripõhisel loendusel ei teki andmelünki inimeste liikumiste või loendusest hoidumise tõttu.
  • Registripõhine loendus tagab kõrgema kvaliteediga andmestiku, sest andmevigu ei teki unustamise või leibkonnaliikmete vähese informeerituse tõttu. Samuti välistab see n-ö nalja pärast või enesehinnangu tõstmiseks antud sihipäraselt ekslikud vastused. Registripõhise loenduse korral on võimalik mõne registri ebatäpsusi korrigeerida teiste registrite andmete abil.
  • Registripõhine loendus on operatiivne ja seda on võimalik korraldada kas või igal aastal.
  • Registripõhine loendus vähendab tuntavalt vastamiskoormust ja säästab nii inim- kui ka materiaalseid ressursse.

Tunnused loendusprogrammis

Rahva ja eluruumide loenduselt saadud teave on suurepärane algmaterjal teadus­uuringuteks ja seetõttu on arusaadav, et teadlased ja muud huvigrupid soovivad lisada küsimustikku oma uuringute tegemiseks vajalikke küsimusi. Sõjaeelses Eestis lükkas loenduskomisjon kõik ettepanekud karmikäeliselt tagasi, viimastel loendustel on aga loendusankeetidesse lisatud suur hulk lisaküsimusi inimeste päritolu, usu, keelteoskuse ja tervise kohta.

Riikides, kus selliseid tunnuseid soovitakse uurida, korraldatakse tavaliselt valikuuring. Valikuuringu usaldusväärsus ja eelised kõikse uuringu ees said statistikutele ja ühiskonnateadlastele selgeks juba sadakond aastat tagasi, kui uuringud muutusid mitmekesisemaks ja sügavamaks võrreldes loendusega, kus küsimuste ja vastusevariantide arv on piiratud. Valikuuringut võib teha loendusega samal ajal. Sel juhul on kaks küsimustikku: lühem on kõikne ja sisaldab rahvusvaheliselt kohustuslikke tunnuseid ning pikemas on konkreetse riigi ja huvirühmade soovitud küsimused välja valitud küsitletavatele.

Eestis on seis hea

Analüüsid on näidanud, et üldjuhul on registrite andmed ütlustest täpsemad. Skeptikutele, kes soovitavad loendamisel pöörduda tagasi ajalooliste meetodite juurde, on paslik meenutada, et ühiskonda ja inimeste käitumist ei ole võimalik tagasi minevikku pöörata. Minevikus hästi töötanud vahendid ei sobi tänapäeva maailma.

Eestis on uurijate olukord parem kui enamikus teistes riikides, sest meil toimib registrite süsteem hästi. Suure osa uuringuteks vajalikku teavet saab kätte riiklikest andmekogudest.

Savitahvleid kasutati rahvaloenduse andmete talletamiseks umbes  5000 aastat tagasi Lähis-Idas ja taimejuurte kimpe tuhatkonna aasta eest Peruus.     

REGREL-ile pühendatud artiklite sari tutvustab rahva ja eluruumide loenduse ettevalmistust ja metoodikat. REGREL-i kohta on rohkem infot Statistikaameti veebilehel.


REGREL. Rahvastikuregister on nagu Tallinn, mis ei saa kunagi valmis

Rahvastikuregister on märkamatult muutnud Eesti elanike suhtlust eri ametiasutustega. Veel paarkümmend aastat tagasi pidi näiteks passi või pensioni saamiseks esitama sünnitunnistuse. Praegu on riigil inimeste andmed olemas ja neid ei pea paberil ühest asutusest teise kandma.

Enel Pungas, siseministeeriumi rahvastiku toimingute osakonna juhataja

Rahvastikuregister võeti kasutusele 2000. aastate alguses ja selle eesmärk on tagada kogu riigile ühesugused korrektsed isikuandmed. Nende alusel saavad kohaliku omavalitsuse ja riigiasutused ning eraettevõtted pakkuda inimestele teenuseid või suhelda nendega dokumente küsimata.

Rahvastikuregistrisse kantakse kõikide Eestis või välismaal elavate Eesti kodanike andmed. Välismaalaste andmed on registris Eestis elamise ajal. Registris on iga inimese kohta märkimisväärselt suur hulk andmeid, näiteks nimi, sünniaeg, isikukood, sünnikoht, kodakondsus, perekonnaseis, teovõime, hooldusõigused, elukoha- ja kontaktandmed, suhted (vanem, laps, abikaasa, eestkostja, eestkostetav). Registris on ka dokumendid, mille põhjal andmed rahvastikuregistrisse tekivad või mille põhjal muutuvad.

Register kui elusorganism

On suur töö tagada sellise hulga andmete õigsus ja usaldusväärsus. Rahvastikuregister on keerukas infosüsteem ja toimib nagu elusorganism. Sellel on justkui ainevahetus: pidevalt tuleb uusi andmeid juurde, neid töödeldakse ja jagatakse jälle välja. Rahvastikuregistrile toodab ja esitab iga päev andmeid sadakond asutust, ametnikke on neis omakorda tuhandeid. Tekkinud andmehulgaga tegelemiseks on vaja väga selgeid kvaliteedireegleid ja iga tegija peab teadma, mille eest ta vastutab.

Rahvastikuregister on ka rahvaloenduste tegemise alus. Ajalooliselt tähendas loendus inimeselt andmete küsimist. Elektroonilise info maailmas on osasid andmeid inimeselt õigesti kätte saada keeruline ja andmed on kvaliteetsemad registrites, näiteks juriidiline perekonnaseis. Inimesed vastavad loendajale tavaliselt oma enesetunde järgi, näiteks kui ei olda enam abikaasaga koos, siis tuntakse, et ollakse lahutatud, kuigi lahutust ei ole vormistatud. Sama on ka kodakondsusega: Eesti kodakondsuse kohta on riigil dokumenteeritud andmed sõltumata sellest, mida inimene loendajale ütleb.

Peresündmuste andmed

Pea 15 aasta jooksul on loenduste õnnestumise nimel paberarhiivist rahvastikuregistrisse kantud enne registri loomist koostatud Eesti perekonnaseisudokumentide (nt sünnid, abielud) andmeid. See tagab, et registris on inimese õige sünniaeg ja -koht, õiged andmed abikaasade, vanemate ja laste suhete kohta, samuti korrektne perekonnaseis. Püüame võimalikul palju kätte saada ka välismaal meie inimestega toimuvaid sündmusi. Paraku sõltub see paljuski inimestest endist. Eriti keeruline on kätte saada surmainfot nende Eesti kodanike kohta, kes on kaotanud sideme Eestiga ja omavad teise riigi kodakondsust.

Register on vajalik kõigile

Palju on räägitud, kui oluline on elukohaandmete kvaliteet rahvaloendusel. Värske rahvastikuregistri seadus annab uued võimalused tagada andmete parem kvaliteet. Näiteks kui korteri- või majaomanik teatab, et inimene ei ela tema ruumis, jääb elukohaandmete väli tühjaks. Seega suureneb vajadus hoida andmeid korras.

Peale selle on loodud uusi andmevälju, mille täitmine ei sõltu sellest, kas inimene andmeid esitab, vaid andmete olemasolu peavad tagama asutused, kes inimese kuhugi suunavad või paigutavad (nt tööle, hooldele, vanglasse).

Rahvastikuregister on oluline kõigile: inimesele, omavalitsusele, riigile ja erasektorile. Kuid register on nagu Tallinn, mis ei saa kunagi valmis, sest alati saab andmeid efektiivsemalt koguda, parandada nende kvaliteeti ja suurendada selle kaudu andmete usaldusväärsust.

REGREL-ile pühendatud artiklite sari tutvustab rahva ja eluruumide loenduse ettevalmistust ja metoodikat. REGREL-i kohta on rohkem infot Statistikaameti veebilehel.

REGREL. Rahvaloendus maailmas: kelle uksele loendaja koputab?

Uus aeg nõuab uuendusi ka rahvaloenduse metoodikas. Inimesed liiguvad maailmas rohkem ringi, elavad mitmes kohas ja töötavad eri riikides. Kuidas kavatsevad riigid oma rahva üle lugeda?

Diana Beltadze, statistikaameti rahva ja eluruumide registripõhise loenduse projektijuht

Nüüdisaegsete meetoditega on võimalik saada kvaliteetseid andmeid kiiremini ja odavamalt kui traditsiooniliselt ühe ukse tagant teise taha käies.

ÜRO Euroopa majanduskomisjoni (UNECE) kuuluvast 56 riigist viis loobusid traditsioonilisest loendusest juba 1990. aastal, kaheksa riiki 2000. aastal ja 19 riiki 2011. aastal.

Järgmisel loendusel 2021. aastal kavatsevad riigid kasutada senisest enam uusi tehnilisi lahendusi (internet, elektrooniline andmekogumine) ja paljud riigid tahavad korraldada registripõhise loenduse.

Kes koputab uksele, kes kasutab registreid

Tavaloenduse ukselt uksele kavatseb korraldada 95 riiki, neist 22 UNECE riiki. Loendusel tahavad registreid kasutada 42 riiki, nende hulgas 15 riiki kavatsevad korraldada loenduse ainult registrite põhjal. Üksnes Prantsusmaa korraldab traditsioonilise jadaloenduse (loendus, kus rahvastik on jaotatud osavalimiteks ja osad loetakse üle eri aastatel).

Eelmisel rahvaloendusel 2011. aastal kasutas registreid loendusandmestiku saamiseks ainult üheksa riiki. Seekord on täielikult registripõhised loendused kavas ka meie naabritel Lätis ja Leedus.

Aeglane üleminek

Loendusmeetodi muutus riikides on olnud küllaltki aeglane. Juba 1970. aastast on statistikud otsinud alternatiivseid meetodeid, et vähendada loenduse maksumust ja vastajate koormust. Suur osa Euroopa riike (34) kasutas 2011. aastal siiski traditsioonilist loendust.

Kuigi paljudel Euroopa riikidel olid olemas loenduseks vajalikud põhiregistrid, ei olnud enamikus riikides võimalik korraldada loendust registrite alusel. Selle peamised põhjused olid järgmised:

  • andmed ei olnud kvaliteetsed ega ajakohased;
  • registrites oli liiga vähe andmeid, mille põhjal loendustunnuseid moodustada;
  • registrid ei olnud ühtse standardiga;
  • andmete kasutamist takistasid tehnilised või juriidilised probleemid.

Enamikus riikides kasutati eelmise loenduse eeltöödel riiklikke andmekogusid (aadress-nimekirju). Nende alusel täiendati ka puudulikke andmeid ning kontrolliti ja hinnati andmekvaliteeti. Mõned riigid eeltäitsid registriandmete alusel loenduslehed. Eesti kasutas registrite andmeid loenduse kvaliteedi hindamiseks.

Peamised murekohad

Loenduse korraldamist reguleerivad õigusaktid on enamikus riikides üsna detailsed. Kui kasutusele võeti rohkem administratiivseid andmeid, muutsid paljud riigid ka oma õigusakte.

Riigid, kes on võtnud suuna registripõhisele loendusele, on kasutanud traditsioonilise rahvaloenduse tulemusi, et koostada statistilisi registreid või parandada olemasolevaid halduslikke andmekogusid. Ka Eestis korrastati aadressiandmeid.

Suvel 2019 korraldatud riikide küsitluses tulid välja järgmise loenduse ettevalmistamise põhiprobleemid. Kõige rohkem teeb muret uute tehnoloogiliste võimaluste rakendamine ja loendusandmete kvaliteet, samuti on paljudel riikidel endiselt keeruline leida loenduseks piisavalt raha (vaata tabelist).

Nagu näitab teiste riikide kogemus, on uusi meetodeid rakendatud järk-järgult. Seetõttu ei olnud ka Eestis mõistlik muuta loendusmeetodit korraga ja 2011. aasta loendus korraldati segameetodil (traditsiooniline loendus koos registrite kasutamisega). Kas järgmine loendus on täielikult registripõhine või kombineeritakse registrite ja valikuuringu andmeid, sellele küsimusele saab statistikaamet vastuse pärast teist prooviloendust.

Statistikaamet alustas REGREL-ile pühendatud artiklite sarja, et tutvustada rahva ja eluruumide loenduse ettevalmistust ja metoodikat. REGREL-i kohta on rohkem infot Statistikaameti veebilehel.

REGREL. Eesti registrites on info rahvuse ja emakeele kohta olemas

Eesti rahvaloendustel on rahvust ja emakeelt küsitud mitu sajandit. Ka registritel põhinev rahvaloendus annab Eesti püsielanike emakeele ja teiste keelte oskuse kohta ülevaate, aga tegelikult ei pea selleks ootama loendust, vaid statistikaamet avaldab rahvastiku rahvuse ja keeleoskuse kohta ülevaate igal aastal. 

Tekst: Ethel Maasing, statistikaameti juhtivanalüütik 

Statistikaameti andmetel räägiti 2019. aasta 1. jaanuari seisuga Eestis emakeelena üle 200 keele. Eesti keelt räägib emakeelena 68% rahvastikust. Suuremate keelerühmadena järgnevad vene ja ukraina keelt emakeelena rääkijad (vastavalt ligi 381 600 ja ligi 8700 inimest). Vähemalt 1000 kõnelejaga on 9 emakeelt. Emakeele info on teadmata umbes 1% rahvastiku puhul (18 000 inimest). Põhjalikuma ülevaate tegime tänavu emakeelepäeval ilmunud blogiloos „Eestis on kasvanud emakeelte mitmekesisus“.

Mitmekeelsus väärib väärtustamist ja arvestades keelte oskusega seotud andmete olulisust on statistikaamet lisaks registrites olevale infole mõõtnud viimastel aastatel keeleoskust ka erinevate uuringute vahendusel, sh eriti tööhõivega, immigrantrahvastiku ja haridusega seotud uuringutes. Igal aastal lisandub Eesti elanike erinevate rühmade keeleoskusega seotud teave ligi neljakümnesse avaliku andmebaasi tabelisse, mis moodustavad järjepidevad keelekasutust ja -oskust iseloomustavad aegread. Muuhulgas on uuritud ka mitme koduse keelega erinevast rahvusest inimesi. Niisuguste spetsialiseeritud uuringute eeliseks võrreldes loendusandmetega on võimalus esitada täiendavaid ja süvendavaid küsimusi, samuti uuringute järjepidevus – neid teostatakse valdavalt igal aastal sama metoodikaga, mis oluliselt suurendab tulemuste usaldusväärsust.

Keele/keeleoskuse andmed statistikaameti avaliku andmebaasi tabelites
Haridus: HT17, HT58, HT140, HT140U, HT303, HT304, HT307, HT570, HT571
Tööturg: TT56, TT70, TT71, TT130, TT131, TT133,TT134, TT135, TT136, TT244, TT245, TT454, TT456
Immigrantrahvastik: IR45, IR46, IR51, IR53, IR60, IR61, IR71, IR73, IR74, IR75, IR76
Täiskasvanute koolitus: HTT33, HTT37, HTT51
Kultuur: KU12, KU13

Statistikaamet alustas REGREL-ile pühendatud artiklite sarja, et tutvustada rahva ja eluruumide loenduse ettevalmistust ja metoodikat. REGREL-i kohta on rohkem infot Statistikaameti veebilehel.

 

REGREL: Mida tähendab registripõhine loendus?

2021. aasta rahva ja eluruumide loendus on plaanis esimest korda Eesti ajaloos korraldada vaid registriandmete põhjal. See tähendab, et otse inimestelt ei küsita midagi, tulemused saadakse riiklike andmekogude info alusel. Sellest ka loenduse nimetus – registripõhine rahva ja eluruumide loendus (REGREL).

Eesti on kümnes riik maailmas, kes korraldab registripõhise rahva ja eluruumide loenduse. Seda on juba teinud Austria, Belgia, Holland, Island, Norra, Rootsi, Sloveenia, Soome ja Taani. Eestiga samal ajal valmistuvad REGRELiks ka Läti ja Leedu.

Statistikaamet on viimased kümme aastat teinud koostöös andmekogude ja nende pidajatega metoodilisi ja infotehnoloogilisi eeltöid, et korraldada 2021. aasta rahva ja eluruumide loendus registripõhiselt. Eestis on hea riiklike registrite süsteem, kus on andmed Eesti kõigi elanike kohta. Loomulik on kasutada neid andmeid rahvaloenduse korraldamisel.

Loenduse korraldamisel teeb statistikaamet koostööd vähemalt 24 registriga. Peale põhiliste registrite – rahvastikuregister, maa-ameti, maksu- ja tolliameti ning haigekassa registrid – kasutatakse ka teiste riiklike andmekogude teavet tulemuste täiendamiseks ja täpsuse suurendamiseks.

Statistikaamet otsustab selle, kas 2021. aasta rahva ja eluruumide loendus korraldatakse registripõhiselt, käesoleva aasta lõpus. Lõpliku otsuse loendusmeetodi sobivuse üle saab teha pärast seda, kui on lõppenud registripõhise loenduse metoodika arendustööd, mida testiti teisel prooviloendusel 2019. aastal.

 

 

Diana Beltadze, REGREL projektijuht

Statistikaamet alustab REGRELile pühendatud artiklite sarja, et rahva ja eluruumide loenduse ettevalmistust ja metoodikat tutvustada. REGREL kohta on rohkem infot Statistikaameti veebilehel.

 

Enamik Eesti rahvastikust koondub päevasel ajal linnadesse

Rahvastik liigub päeval linnadesse ja alevitesse, kasvatades linnaliste asulate päevast rahvaarvu öisega võrreldes 109 000 inimese võrra. Linnades omakorda koondutakse päeval keskustesse.

Sellise tulemuse andis Statistikaameti registripõhise rahva ja eluruumide (REGREL) loenduse esimene prooviloendus, mis toimus 2016. aastal. Prooviloenduse andmetest selgus, et päevasel ajal linnalistesse asulatesse tööle ja õppima suunduvate inimeste tõttu suureneb linnaliste asulate rahvaarv ligi 109 000 inimese võrra kasvades 1 010 000 inimeseni. Eestis kokku elab 1,3 miljonit inimest. Lisaks suureneb linnaliste asulate rahvaarv päeval neisse erinevaid teenuseid tarbima tulnud inimeste ja turistide võrra, keda päevarahvastikus arvesse ei võetud. Tegemist on hinnangulise päevarahvastiku paiknemisega.

Suuremates linnades koondub päevarahvastik keskustesse

Kõige enam muutub rahvaarv Tallinna kesklinnas, suurenedes päeval rohkem kui 15 000 inimese võrra ruutkilomeetri kohta. Kõige tihedam on päevarahvastik Tallinna kesklinnas Estonia puiestee ümbruses – hinnanguliselt 26 000 inimest ruutkilomeetril. Ka Tartu kesklinnas suureneb rahvaarv päeval enam kui 10 000 inimese võrra. Vaata päevarahvastiku paiknemist ruutkaardil Statistikaameti kaardirakenduses.

Keskustesse koondumist on märgata ka teiste maakondade keskuslinnades, kuid seal on muutused absoluutarvudes kordades väiksemad, jäädes alla 3000 inimese ruutkilomeetri kohta. Keskustesse koondumine on seotud neis paiknevate ametiasutuste, büroode, koolide ja teenindusettevõtetega. Loomulikult suureneb päeval rahvaarv ka tööstuspiirkondades, kuid päevane rahvastikutihedus on seal hõredam kui keskustes. Rahvaarvu suurenemine keskustes toimub peamiselt linnade ümbruskondade ja magalapiirkondade arvelt. Kõige rohkem väheneb rahvaarv piirkonnas, kus viimase rahvaloenduse ruutkaardi andmetel oli kõige tihedamalt eluruume – Tallinnas Mustamäel Vilde, Tammsaare ja Mustamäe teede vahelises piirkonnas. Sealt lahkub päeval 5400 inimest, mis on samas suurusjärgus Põlva linna elanike arvuga.

Kõik inimesed siiski ei liigu päeval keskustesse. Suur osa lapsi ja noori õpivad kodulähedases lasteaias või koolis. Elukohta on päevarahvastiku arvestamisel arvatud kodused, töötud ja pensionärid, kes enam tööl ei käi. Lisaks ei asu kõik töökohad keskustes. Seetõttu on korruselamute piirkondades, kus elanike arv on öösel suur, ka päevane rahvastikutihedus suur. Näiteks on päevarahvastiku tihedus enam kui 10 000 inimest ruutkilomeetril Tallinna nn mägedel – Lasnamäel Linnamäe tee ümbruses ja Vikerlase–Virbi tänavate piirkonnas, Mustamäe Vilde tee piirkonnas ning Õismäel. Tartu Annelinnas on rahvastikutihedus päeval 4000–6000 inimest ruutkilomeetril.

Rahvastiku ööpäevase liikumise visualiseerimiseks on tehtud Tallinna ja Tartu kohta 3D-animatsioonid, mis näitavad öise ja päevase rahvaarvu muutust 1 km x 1 km ruutude kaupa. Punasega on kujutatud piirkonnad, mis saavad päeva jooksul inimesi juurde ning lillaga piirkonnad, mis kaotavad inimesi (mida tumedam värv, seda suurem inimeste arvu muutus).

 

Päevasel ajal tühjeneb elanikest ligikaudu Hiiu maakonna suurune ala – 1085 km2. Ruutkaardi andmetel on päevasel ajal asustatud ruute 20 150, öösel on asustatud ruute 21 235.

Enamasti koondavad suuremad linnad ümbritsevatest valdadest päevasel ajal rahvastikku

Nii kasvab rahvaarv päeval arvuliselt kõige enam Tallinnas (57 000 inimese võrra) ja Tartus (21 000 võrra). Nende linnade naabervaldades päevane rahvaarv üldjuhul väheneb: Tallinna naabervaldadest kõige rohkem Viimsi ja Harku vallas, kus päeval rahvaarv on enam kui 3000 elaniku võrra väiksem. Tartu naabritest on Tartu, Luunja ja Ülenurme valdade päevane rahvaarv 1000–1400 inimese võrra väiksem.

 

Suurtest linnadest on erandlikud Ida-Virumaa linnad

Narva ja Kohtla-Järve rahvaarv päevasel ajal suurenemise asemel hoopis väheneb – Narvas 4800 ja Kohtla-Järvel 3900 inimese võrra. Samas suureneb nende linnade naabervaldade päevane rahvaarv. Nii suureneb Kohtla-Järve naabruses paikneva Jõhvi valla rahvaarv päeval 3800 inimese võrra. Põhjuseks vallas asuv Jõhvi linn, mille elanikud moodustavad 85% Jõhvi valla rahvastikust ning mis toimib Ida-Viru maakonna keskuslinnana. Mäetaguse vallas suureneb päevane rahvaarv 700 inimese võrra eelkõige seal paikneva Estonia Kaevanduse tõttu. Narvaga piirneva Vaivara valla rahvastik päeval peaaegu kahekordistub. Vaivaras asuvad Eesti Energia ettevõtted. Ida-Virumaa elanikele on oluline töökoht ka Tallinn. On üsna tõenäoline, et igapäevaselt Tallinnasse tööle ei käida, vaid pigem omatakse elukohta ka Tallinnas, kuid registri andmetes teised elukohad ei kajastu.

Lisaks eeltoodud Ida-Virumaa valdadele on veel vaid neli valda, kus päevarahvastiku arv ületab öörahvastiku arvu. Need on Laeva, Rae, Sõmeru ja Võru vallad. Neist kõige rohkem suureneb rahvaarv päeval Rae vallas enam kui 4000 inimese võrra. Rae valla olulisemateks tööandjateks on ABB AS, AS Kalev ja Rimi Eesti Food AS, mis pakkusid tööd ligikaudu 2000 inimesele. Sõmeru valla suurimaks tööandjaks on Rakvere lihakombinaat. Võru vallas Võru haigla, AS Barrus ning Arke lihatööstus. Laeva vallas on oluliseks tööandjaks Valio Laeva Meierei, mis annab tööd enam kui 200 inimesele. Kõikide ülejäänud valdade rahvaarv päeval väheneb. Valla öö- ja päevarahvastiku erinevus sõltub eelkõige kohapeal olevate töökohtade arvust – kui töökohti napib, liigutakse päeval oma piirkonnast välja.

 

 

Ülle Valgma, Statistikaameti geoinfo juhtivspetsialist

 

Metoodika

Päevarahvastikuks liigitatakse inimesed, kes viibivad antud piirkonnas töö ajal ning öörahvastiku moodustavad inimesed, kes elavad selles piirkonnas.

Tänu keskse aadressandmete infosüsteemi (ADS) kasutusele võtmisele erinevates registrites, on suure osa elanike päevane asukoht võimalik määrata hoone täpsusega. Seetõttu saab hinnata rahvastiku paiknemist päevasel ajal ruutkaardi alusel. Rahvastiku päevane paiknemine on mõnes mõttes isegi olulisem nende elukohtade järgsest paiknemisest, mida mõõdab rahvastikustatistika, sest suurt osa teenustest tarbitakse päevase asukoha läheduses. Samuti on see oluline ühistranspordi ja teedevõrgu planeerimisel. Andmed päevarahvastiku kohta on hinnangulised, sest põhinevad ettevõtete juriidilisel aadressil, mis võib erineda tegevuskoha aadressist.

Päevarahvastiku andmed tuginevad inimeste hinnangulisele asukohale päevasel ajal. Eeldati, et töötajad paiknevad töökohtades, (üli)õpilased (üli)koolides, lasteaialapsed lasteaedades ning ülejäänud elanikud kodus (pensionärid, töötud, mitte-töötavad). Kuna prooviloenduses vange eraldi ei uuritud ning nende hõiveseisundit eraldi välja ei toodud, on enamus neist päevarahvastiku andmetes elukoha, mitte vangla, aadressil. Sõjaväelastest ligikaudu 60% on paigutatud elukoha aadressile, teised koolidesse ja töökohtadele; õppijad ja töötajad aga kooli või töökoha asukohta. Elanike igapäevast liikumist teenuste tarbimiseks ning vabaaja veetmiseks arvesse ei võetud.

Tulenevalt kasutatud metoodikast ei saa hinnata pendelrändevooge, sest mitme tegevuskohaga ettevõtete töötajad jagati proportsionaalselt tegevuskohtade töötajate arvuga, arvestamata nende elukohtadega.

Päevarahvastiku andmete aluseks on prooviloenduse andmed seisuga 01.01.2016, millest jäeti välja teadmata elukohaga inimesed. Päevase asukoha määramisel oli aluseks hõiveseisund. Kuna hõiveseisundit ei määrata ühepäevase täpsusega, sai selle aluseks esimene täispikk töönädal enne uuringumomenti ehk 14.12.2015–20.12.2015. Hõiveseisundi järgi jagunesid päevased asukohad:

  • Alla 15-aastased ja õppurid – päevaseks asukohaks on õppeasutus, andmete allikaks Eesti Hariduse Infosüsteem.
  • Hõivatud – päevaseks asukohaks on töökoha asukoht. Andmed pärinevad:
    • Töötasu struktuuriuuringust, kust saadi töökoha asukoht asula täpsusega toimlate jaoks. Töötasu struktuuriuuring oli töökoha allikas neil ettevõtetel, mis olid uuringu valimis esindatud ja tegutsesid rohkem kui ühes kohas;
    • Ettevõtete statistilisest registrist, kust pärinevad majanduslikult aktiivsete ettevõtete asukohad aadressi täpsusega. Töökoha asukoht võeti Ettevõtete statistilisest registrist kõigi ülejäänud ettevõtete jaoks, mille puhul töötasu struktuuriuuringu andmeid ei kasutatud.
  • Töötud, pensionärid, muud – nende päevaseks asukohaks loeti elukoht ning andmete allikaks rahvastikuregister;

Hõivatud, õppurid ja alla 15-aastased, kellele ei õnnestunud päevast asukohta määrata, nende jaoks kasutati samuti elukoha asukohta.

Kui ettevõttel oli mitmeid tegevuskohti ehk toimlaid, siis jaotati nende ettevõtete töötajad juhuslikult toimlatesse vastavalt struktuuri-uuringus selgunud proportsioonidele. Näiteks kui töötasu struktuuri-uuringu järgi töötas 25% ettevõtte töötajatest Tartus, siis sama protsent selle ettevõtte töötajaid paigutati Tartusse ka päevarahvastiku andmestikus.

Päevarahvastiku ruutkaardi jaoks agregeeriti punktipõhised asukohad, mis olid teada eluruumi, hoone või katastri täpsusega. Täpne asukoht oli teada 86%-l elanikest. Päevased asukohad, mis olid teada asustusüksuse täpsusega (4%) jaotati juhuslikult asustusüksuse territooriumile võttes arvesse hoonete paiknemist asustusüksuses. Tallinna ja Kohtla-Järve linnaosade ning omavalitsusüksuse tasemel teada olnud töökohtade asukohad, mida oli kokku 10%, jaotati proportsionaalselt vastavalt 2011. aasta päevarahvastiku ruutkaardile.

Kuna 14% andmetest on juhuslikult paigutatud ning ka toimlate vahel on inimesed jaotatud juhuslikult, siis koostati ruutkaart vaid kogu rahvaarvu kohta, jättes soo-vanusjaotuse arvestamata.

Analüüs on tehtud Eurostati grandi „Improvement of the use of administrative sources (ESS.VIP ADMIN WP6 pilot)“ rahastusel ning põhineb Statistikaameti 2016. aastal läbiviidud registripõhise rahva ja eluruumide loenduse (REGREL) esimese prooviloenduse andmetel. 

Suurandmed eraisikute elektritarbimist mõõtmas ja tühje eluruume kindlaks tegemas

Statistikaamet osaleb Eurostati suurandmete katseprojektis, mille raames uuritakse elektri kaugmõõtjate andmete potentsiaalset kasutamisvõimalust riikliku statistika tootmisel. Kasutades Eleringi andmelao mõõteandmeid aastate 2013–2015 kohta uuris Statistikaamet, kas elektri suurandmete põhjal saaks toota Eesti eraisikute elektritarbimise statistikat ning hinnata registripõhise rahva ja eluruumide loenduse jaoks tühjade eluruumide olemasolu.

Suurandmete kasutamine statistika tegemisel võimaldaks vähendada kulu ühiskonnale, mis tuleneb aruannete esitamisest ja sellega seotud halduskoormusest. Suurandmete kasutamine võimaldaks ka märgatavalt lihtsustada statistika tegemise protsesse ja neid automatiseerida. Suurandmete kasutamise kogemuste saamiseks osaleb Eesti koos Taani, Rootsi, Austria, Portugali ja Itaaliaga Eurostati elektri kaugmõõtjate katseprojektis. Järgnevalt tutvustame katseprojekti esimesi tulemusi. Tegemist ei ole ametliku statistikaga, vaid demonstratsiooniga, milliseid väljundeid oleks võimalik suurandmete abil saada.

Katseprojektile seati kolm eesmärki:

  •  kas elektri mõõteandmete põhjal saaks teha seni küsitluse teel saadud elektrienergia statistikat ettevõtete kohta;
  •  kas elektriandmetest saaks toota kodumajapidamiste elektritarbimise statistikat ja
  •  kas elektriandmetest oleks võimalik tuvastada eluruume, milles elatakse, mis on tühjad või mida kasutatakse periooditi.

Katseprojektis kasutati Eleringi andmelao 2013.–2015. aasta andmeid, mis sisaldavad mõõteandmeid ligi 730 000 mõõtepunkti (elektriarvesti) kohta. Andmestikus on infot sõlmitud lepingute, lepingu omaniku (äriettevõte, eraisik), lepingu kehtivuse, lepinguga seotud mõõtepunkti ja selle aadressi kohta, samuti mõõteandmed. Statistikatöödes kasutatavad andmed anonümiseeritakse Statistikaametis. Andmestikus on mõõteandmeid kokku üle 18 miljardi kirje.

Ettevõtetega seotud mõõtepunkte oli 2015. aastal 12% ja eraisikutega 88%, samas moodustasid ettevõtted 78% ning eraisikud 22% tarbimisest. Järgnevad tulemused kajastavad suurandmete põhjal arvutatud eraisikute elektritarbimise tulemusi ja eluruumide kasutamist püsiva elukohana.

Eraisikute elektritarbimine ja eluruumide kasutamine püsiva elukohana

Leibkondade puhul elektrikasutuse uuringut Statistikaamet regulaarselt ei tee, mistõttu võrdlusandmeid ei olnud. Suurandmete linkimiseks kasutati Statistikaameti leibkondade ja eluruumide tabelit, mis sisaldas leibkonnaliikmete anonümiseeritud infot ja aadressi identifikaatorit. Elektriandmetega sidumiseks leiti leibkonnad, kus aadressi identifikaator ühtis mõõtepunkti omaga ja ainult ühel leibkonnaliikmel oli elektrileping. Nii õnnestus siduda 48% leibkondadest elektritarbimise infoga. Samuti oli võimalik siduda elektritarbimisega eluruumi info, millega saab hinnata näiteks elektritarbimise seotust hoone ehitusaasta ja eluruumi suurusega ning see pakuks võimalust hinnata eluruumi energiatõhusust. Saadud tulemus võimaldaks toota statistikat, mida Statistikaametil ei ole siiani olnud võimalik toota andmete puudumise tõttu.

Samuti hinnati, kas elektriandmete põhjal saaks kinnitada eluruumide kasutamist püsiva elukohana. Leiti tuhandeid aadresse, kus rahvastikuregistri järgi peaksid elama inimesed, kuid elektritarbimine oli 0 või siis vastupidi: oli suur elektritarbimine, kuid registri järgi seal kedagi ei elanud. Seetõttu on andmestikul oluline potentsiaal rahvastiku paiknemise analüüsil täiendava elumärgina.

Eraisikute elektritarbimine kuude kaupa

Kõige enam tarbisid eraisikud 2015. aastal elektrit jaanuaris ja kõige vähem juunis. Jaanuaris tarbiti 36% enam elektrit võrreldes juuniga. Teisel kohal oli elektritarbimiselt detsember. Suhteliselt võrdne elektritarbimine oli märtsis ja novembris (moodustades 82% jaanuari tarbimisest) ning mais ja augustis (moodustades ligi 65% jaanuari tarbimisest).

Eraisikute keskmine elektritarbimine kuude kaupa, 2015

 

Eraisikute elektritarbimine sõltub nädalapäevast ja kellaajast

Nagu võib arvata, on elektritarbimine kõige väiksem öistel tundidel – kõige vähem elektrit tarbiti kolmapäeval kella 02:00 ja 03:00 vahel. Elektritarbimine hakkab järk-järgult suurenema juba kell 05:00. Hommikupoolikul on elektritarbimine suurim vahemikus 06:00–07:00, mil suur osa inimestest ärkab ning alustab hommikuste toimingutega. Kuni pärastlõunani on elektritarbimine kodudes suhteliselt stabiilne ning hakkab taas suurenema 14:00 ja 15:00 vahel, kui paljude päev hakkab juba koolis, trennis, tööl ja mujal lõppema. Õhtune elektritarbimise haripunkt on ajavahemikus 17:00–19:00, mil tarbitakse ööpäeva jooksul ka kõige enam elektrit. Pärast kella 19:00 hakkab elektritarbimine järjest vähenema.

Eraisikute elektritarbimine ühel detsembrikuu kolmapäeval 24 h jooksul, 2015

 

Kui kolmapäeval joonistus välja nii-öelda tööinimese graafik, siis laupäeval, mil enamikul inimestest on vaba päev, on ka elektritarbimine kogu päeva jooksul ühtlasem. Kahe päeva öine (kella 23:00 ja 06:00 vaheline aeg) elektritarbimise muster ja tarbitud elektri hulk on sarnased. Kui kolmapäeval oli hommikupoolne elektritarbimise tipp vahemikus 06:00–07:00, siis laupäeval vastavalt 11:00–12:00. Laupäeva elektritarbimise haripunkt on kella 16:00–17:00 ajal ning pärast seda hakkab elektritarbimine järjest vähenema. Laupäeval tarbiti ligi 10% rohkem elektrit võrreldes kolmapäevaga ning madalaima ja kõrgeima keskmise elektritarbimise vahe oli mõlemal päeval ligi kahekordne.

Eraisikute elektritarbimine ühel detsembrikuu laupäeval 24 h jooksul, 2015

 

 

 

 

 

 

 

 

 

Tühjad kortermajad

Suurandmeid on võimalik Statistikaametis teiste andmetabelitega linkida ning seeläbi saada uut teadmust. Näiteks saab aadressiinfot ja elektritarbimist linkides tuvastada tühje kortermaju. Statistikaamet uuris, kas oleks võimalik tuvastada vähese elektritarbimisega korteritega kortermaju ja jaotada kortermajad energiatarbimise alusel gruppidesse vastavalt keskmisele kuutarbimisele – 0 kWh, 1–30 kWh, üle 30 kWh. See on üks lihtne näide, milliseid küsimusi saaksid teised riigiasutused Statistikaameti käest küsida ja millele saaks suurandmeid kasutades vastuse anda.

 

 

 

 

 

 

 

 

 

Kokkuvõte

Suurandmete kasutamine võimaldaks Statistikaametil mitmekesistada tooteportfelli ja pakkuda olulise administratiivse kuluta täiesti uut statistikat. Eurostati katseprojektist oleme õppinud, et suurandmeid kasutades saame ülevaate majapidamiste elektritarbimisest. Samuti on võimalik siduda elektritarbimisega eluruumi info, mille põhjal saab hinnata näiteks elektritarbimise seotust hoone ehitusaasta ja eluruumi suurusega ning seeläbi hinnata ka eluruumi energiatõhusust. Kasutades elektriandmeid on võimalik jälgida ka rahvastiku paiknemise dünaamikat.

Teisalt nägime ka, et andmestikuga töötades tuleb arvesse võtta, et see kajastab elektrilepinguga seotud subjekti elektritarbimist, kes ei pruugi olla tegelik lõpptarbija. Erinevate registrite sidumisel pidime tõdema registriandmete aadressiinfo ebaühtlast kvaliteeti. Seetõttu muudaks standardiseeritud aadresside kasutamine andmete analüüsi ja ka aadressiinfo uuendamise andmekogus oluliselt efektiivsemaks. Jätkame tööd, et jõuda suurandmetest kvaliteetse statistika tootmiseni. Suurandmed pakuvad võimalust toota statistikat kiiremini ja efektiivsemalt ning see on suund, mille poole Euroopa statistikaametid liiguvad.

Põhjalikum ülevaade Eesti Statistika Kvartalikirjas 4/2017 artiklis „Suurandmed statistikas“ (ilmus 29.12.2017).

 

 

Toomas Kirt, Statistikaameti arenduste ekspert

 

 

 

Helerin Äär, Statistikaameti geoinfo spetsialist

 

Metoodika

Suurandmetena käsitletakse tavaliselt andmeid, mis on mahult suured, mis võivad olla struktureerimata ja mida tekib lühikeses ajavahemikus väga palju. Nende omaduste tõttu ei saa suurandmete töötlemiseks tavaliselt kasutada traditsioonilisi andmetöötlusvahendeid. Suurandmed tekivad tavaliselt mingi protsessi tulemina, mille eesmärk ei ole toota andmeid statistiliseks töötluseks ning see muudab nende analüüsi mõnevõrra keerukamaks. Tuleb näiteks arvestada, et andmed võivad olla kallutatud ja esindada vaid osa populatsioonist ning andmetes võib olla vigu ning need võivad olla selektiivsed ja mittetäielikud. Vaatamata sellele pakuvad suurandmed palju võimalusi.

Animatsioonides on kasutatud ruutkaarti, mille iga 1 km ruudu kohta on toodud keskmine eraisikute elektritarbimine ühes tunnis / kuus. Animatsiooni andmed eraisikute keskmise elektritarbimise kohta kuude kaupa kajastavad 93% eraisikutega seotud mõõtepunktidest ning 24 h animatsioonid kolmapäeva ja laupäeva kohta 81% eraisikutega seotud mõõtepunktidest.