Andmebaasist

Statistika andmebaas

Statistika andmebaas esitab riiklikku statistikat. Riiklik statistika hõlmab andmeid, mida Statistikaamet avaldab Vabariigi Valitsuse korraldusega kinnitatud riikliku statistika programmi alusel. Statistika andmebaasis esitatakse kogu avaldatav statistika.

Statistika andmebaasis avaldatu kohta saab detailsemat infot tellida rubriigist Teabenõuded ja tellimustööd.

Lisateavet saab telefonil 625 9300 või e-postiga aadressil stat@stat.ee.

Andmete uuendamine

Andmebaas täieneb pidevalt uute andmetega, mille lisandumisest teavitab avaldamiskalender. Andmebaasi uuendatakse avaldamiskalendris väljakuulutatud päeval kell 8. Andmebaasitabelites on märgitud uuendamise kuupäev.

Andmebaasi struktuur

Statistika andmebaas esitab statistikat nelja statistika põhivaldkonna – keskkond, majandus, rahvastik ja sotsiaalelu – kaupa. Rahva ja eluruumide loenduse ning põllumajandusloenduse andmed on esitatud eraldi. Valdkonnad jagunevad alamvaldkondadeks, moodustades puustruktuuri. Valdkonnad ja alamvaldkonnad on esitatud tähestiku järjekorras.

Andmed on andmebaasis esitatud tabelitena, millel on unikaalne kood. Valdkonnatabelite loetelu on sorditud tabeli koodi järgi. Loetelus on tabeli nimetuse all esitatud tabeli muutujate nimetused koos muutuja mõne väärtusega ja sulgudes muutuja väärtuste arv. Kui tabel mingil põhjusel katkeb, s.t uute perioodide andmeid ei lisandu, märgitakse tabeli pealkirjas sulgudesse esitatavate andmete algus- ja lõpuaasta.

Piirkondliku statistika tabelid on loetelus tähistatud Eesti kaardi kontuuriga tabeli nimetuse ees.

Andmebaasitabeli struktuur on kirjeldatud rubriikides „Statistiline näitaja” ja „Andmebaasitabel”.

Andmete otsimine

Vajaliku tabeli võib leida mööda valdkondade puustruktuuri liikudes.

Tabeli leidmiseks võib kasutada ka tekstiotsingut, mis asub andmebaasi avalehel („Otsing andmebaasist”). Otsinguaknasse tuleb sisestada otsitav tekst või tabeli kood. Teades, millise valdkonna andmeid otsitakse, võib valdkonna märkimisega otsingut kiirendada.

Statistiline näitaja

Statistiline näitaja on andmeelement, mis esitab kindla aja, koha ja muude tunnustega määratud statistilisi andmeid.

Statistiline näitaja (edaspidi näitaja) iseloomustab mingit uuritavat objekti või nähtust – statistilist üksust kui liiki. Statistilisel üksusel on mitmesuguseid tunnuseid, mida nimetatakse statistilisteks muutujateks. Osa neist on mõõdetavad ehk koguselised (ettevõtte investeeringud ja tulud, leibkonna sissetulek), osa liigitavad ehk klassifitseerivad (ettevõtte tegevusala ja omaniku liik, leibkonna tüüp ja elukoht, isiku vanus ja sugu). Klassifitseeriva muutuja võimalikud väärtused on määratud klassifikaatori või muu liigituse kategooriatega. Koguseline muutuja määrab näitaja sisu, klassifitseeriv muutuja näitab, millises lõikes koguseline muutuja esitatakse. Klassifitseeriv muutuja võib puududa.

Näide

Rahvaarv on Eesti rahvastikku iseloomustav tunnus (koguseline muutuja), mida võib esitada konkreetse hetke (1. jaanuari) seisuga või aasta keskmisena – rahvaarv, 1. jaanuar; aastakeskmine rahvaarv. Rahvaarvu võib täpsustada, esitades seda klassifitseerivate muutujate – sugu, vanus, maakond jne – järgi.

Andmebaasitabel

Traditsiooniliselt esitatakse statistiline näitaja tabelina. Andmebaasitabel on mitmemõõtmeline struktuur, mille iga mõõde (tabeli muutuja) määrab ühe täpsustava ehk klassifitseeriva muutuja.

Näited

Rahvaarv soo ja vanuse järgi, 1. jaanuar

Rahvaarvu esitatakse soo ja vanuse järgi – viimased on rahvaarvu klassifitseerivad muutujad.

Kõik selle tabeli näitajad (andmeelemendid) on kirjeldatavad järgmiselt: rahvaarv soo ja vanuse järgi, 1. jaanuar, vaatlusperiood on aasta. Näitaja sisu määrav koguseline muutuja on rahvaarv, klassifitseerivad muutujad on sugu ja vanus. Soo puhul on väärtused mehed ja naised, mehed, naised, vanuse puhul 0, 1, 2 ja 3 ning aasta puhul 2005 ja 2006.

Statistilised andmed on alati kindla ajavahemiku või hetke kohta. Kui esitatakse ühe perioodi andmed, näidatakse see periood tabeli pealkirjas. Mitme perioodi andmete puhul lisandub andmebaasitabelisse uus mõõde – ajamuutuja.

Iga tabeli muutujate väärtuste kombinatsioon määrab andmebaasitabeli ühe elemendi (lahtri).

Kui tabelis esitatakse mitu koguselist muutujat, lisandub tabelile veel üks mõõde, mis määrab esitatavad koguselised muutujad. Andmebaasis nimetatakse seda tabeli mõõdet/muutujat näitajaks, mis aga ei ole päris täpne. Selle tabeli muutuja (nimetusega „näitaja”) väärtused on nt rahvaarv, 1. jaanuar ja aastakeskmine rahvaarv. Ühte tabelisse saab koondada koguselised muutujad, mis on esitatud ühesuguste klassifitseerivate muutujate väärtuste järgi.

Kõik selles tabelis esitatud näitajad (andmeelemendid) on kirjeldatavad järgmiselt:
rahvaarv, 1.jaanuar vanuse ja soo järgi;
aastakeskmine rahvaarv vanuse ja soo järgi.
Vaatlusperiood on aasta.

Kui kõigil andmebaasitabeli näitajatel on üks ja sama mõõtühik, esitatakse see tabeli allmärkuses. Kui näitajatel on eri mõõtühikud, esitatakse mõõtühik iga koguselise muutuja nimetuse või klassifitseeriva muutuja väärtuste juures.

Andmebaasis esitatakse võimalikult suuri tabeleid, s.t kõik ühesuguste klassifitseerivate muutujate väärtuste järgi esitatud näitajad on koondatud ühte tabelisse. Üldjuhul ei ole statistika kasutajal tabeli kõiki andmeid vaja. Andmebaas võimaldab valida just vajalikke koguselisi muutujaid ja klassifitseerivate muutujate väärtusi, et koostada igale kasutajale sobiv tabel.

Andmete valimine tabelist

Klõpsates tabelite loetelus tabeli nimetusel, avaneb tabeli muutujate (mõõdete) väärtuste valimise aken. Rombiga tähistatud muutujatest peab valima vähemalt ühe väärtuse, teised muutujad võib soovi korral eemaldada, s.t valimata jätta.

Kui tabeli muutuja väärtusi on palju, võib kasutada tekstiotsingut (nt maakondade valimisel pikemast loetelust).

Et andmebaasitabelisse on koondatud võimalikult palju andmeid, on ülevaatlikkuse huvides soovitatav valida väljundtabelisse ainult vajalikud andmed.

Andmete vaatamine ja allalaadimine

Valitud tabelit võib vaadata ekraanil kahes vaates ja/või eri vormingutes arvutisse alla laadida. Registreerunud kasutaja saab oma päringud salvestada ja neid korduvalt kasutada.

Vähemalt kolme muutuja reas esitamise korral on tabel ekraanil paremini loetav, kui kasutada teist esitusviisi („Tabel ekraanil, vorm 2”). Tabeli kohal olevate valikutega on võimalik esitatud tabelit teistesse vormingutesse salvestada, vastu- ja päripäeva pöörata, tabelis uut muutujate järjekorda määrata (s.t määrata, millised muutujad millises järjekorras esitatakse ridades ja veergudes), tabeli andmetega mitmesuguseid aritmeetilisi operatsioone teha jne, samuti lisainfot lugeda. Tabeli saab alla laadida Exceli, PC-Axise, CSV-, XML- jm vormingus. Tabeli andmeid saab vaadata diagrammina, maakondade kohta esitatud andmeid ka Google Earthi teemakaardina ning Google Mapsi asukohapõhiste tabelitena. Selleks tuleb Google Earth arvutisse installeerida.

Oma andmebaasi loomiseks ja andmetega opereerimiseks pakume tarbijale tarkvara PC–Axis, mis tuleb arvutisse installeerida. Väga suurte tabelite korral on kogu tabeli arvutisse allalaadimiseks soovitatav kasutada ainult PC-Axise vormingut. Selleks tuleb tähistada märkeruut ja valida esitusviis „PC-Axis”.

Kui kogu tabelit arvutisse alla laadides kasutada märkeruutu, jääb tabelile loetelus esitatud pealkiri. Tehes tabeli muutujate väärtustest valiku (ka kõigi muutujate kõigi väärtuste valimisel), genereeritakse tabelile aga uus pealkiri, kus „---” järel on esitatud tabeli muutujate loetelu. Muutujate järjekord tabeli pealkirjas on määratud muutujate esitamise järjekorraga tabelis – kõigepealt on reas ja seejärel veerus esitatud muutujad. PC-Axise vormingus tabeli pealkirjas genereeritakse muutujate loetelu ette by ja viimaseid muutujaid eraldab and (nt Aastakeskmine rahvaarv by maakond, vanus, sugu and aasta), sest kasutame PC-Axise ingliskeelset versiooni.

Kahte ja nelja punkti muutuja väärtuses (teksti ees) kasutatakse tähenduses „sealhulgas” (nt Harju maakond, ..Tallinn; avalik sektor, ..riik, ..kohalik omavalitsus).

Märgid tabeli lahtrites tähistavad järgmist: üks punkt (.) – mõiste pole rakendatav; kaks punkti (..) – andmeid ei ole saadud või need on avaldamiseks ebakindlad. Kui punktidel on muu tähendus, on sellekohane viide tabeli allmärkuses. Null (0) tähendab nii seda, et nähtust ei esine, kui ka seda, et ümardamisel on saadud null.

Ümardamise tõttu ei pruugi tabelites esitatud summad liidetavate summaga kokku langeda.

Metaandmed (andmed andmetest)

Peale otseselt statistikat kirjeldavate metaandmete andmebaasitabelis (tabeli pealkiri, ridade/veergude tekst) pakutakse ka lisainfot. Üldinfo rubriigis esitatakse mõõtühik (kui see on kogu tabelil ühine), viimane uuendamise kuupäev ja autoriõiguse märk. Märkuste rubriigis on olulised selgitused, mis on vajalikud tabeli õigeks mõistmiseks – need esitatakse alati ka tabeli all. Mõistete ja metoodika rubriigis on esitatud mõisted ja nende määratlused, metoodika kirjeldus, kasutatud klassifikaatorite info, muude andmeallikate viited ja kontaktisiku andmed.

Andmebaasi andmete kasutamisel palume viidata allikale.

Uuendatud: 01.10.2010