pb1

  Nazaj na glavno stran

2 Uvod v podatkovne baze

Preden se bom lotil prikaza PB, ki naj bi bile sestavni del UDK MMIS, bom najprej na kratko prikazal osnove PB. Bralke in bralci, ki že imajo izkušnje z osnovo PB, lahko to poglavje preskočijo! V tem poglavju gre za kratek prikaz PB in različnih programskih oprem za PB (proizvodi -  lahko si ogledate sprotno opombo 8 - pod črto - zelo zanimiva spletna povezava!!!).

2.1 Podatkovne baze (PB)4

Pravi razmah so PB dosegle približno leta 1970 s t.i. CODASYL mrežnim sistemom in CODDOV-im relacijskim podatkovnim modelom. Približno v letih od 1984 – 1986 so začeli prevladovati relacijski sistemi. Po mnenju nekaterih informacijskih teoretikov so tri obdobja ključnega pomena pri razvoju PB. Ta obdobja so naslednja:

  • v središču pozornosti je bil stroj – ostale tri komponente človek, program in podatki, v računalniško podprtem sistemu za podatke so se prilagodile stroju
  • programska revolucija – središče dogajanja pomeni program
  • podatkovna revolucija – pozornost je prenesena na podatke, ki so se približali človeku in so postali razmeroma neodvisni od strojne in programske opreme. Sicer obstajata dva izvora podatkov in sicer človek ter merilnik (npr. merjenje temperature v proizvodnji).

2.1.1 Slika 1: Podatkovni sistem – v ospredju so podatki

Slika 1 prikazuje podatkovni sistem po podatkovni revoluciji, kjer so v ospredju zanimanja podatki. Središče obdelave podatkov je postala PB, ki je podatkovna osnova za podporo mnogih človekovih dejavnosti. Črtkane črte na levi strani slike prikazujejo rahlo povezanost ali neodvisnost, medtem ko polni črti pomenita tesno povezanost ali pogojenost. V prihodnosti pričakujejo, da bo v središču pozornosti človek (npr. nevronske mreže, inteligentni sistemi itd.).

Podatkovna baza je model okolja, ki lahko služi kot osnova za nadzor, sprejemanje odločitev in izvajanje akcij. PB so nekakšno pogonsko sredstvo za delovanje IS oziroma nekakšni rezervarji, ki omogočajo sploh obstoj IS (črpanje podatkov). S PB si človek dejansko gradi miselni model sveta, s katerim si olajša orientacijo v vsakdanjem življenju. S tehničnega vidika je PB zbirka med seboj pomensko povezanih podatkov, ki so shranjeni v računalniškem sistemu, dostop do njih je centraliziran in omogočen s pomočjo sistema za upravljanje PB (SUPB). V PB so podatki shranjeni v obliki datotek, pod okriljem funkcionalne enote. Vsaki enoti pripada množica datotek, ki predstavljajo podatkovno osnovo. Vsaka enota pa skrbi za svoje datoteke, jih vzdržuje in obdeluje s svojimi uporabniškimi programi.

Smotrno upravljanje s podatki zajema:

  • zagotavljanje razpoložljivosti podatkov
  • nadzor nad uporabo podatkov, v katerega okvir sodi skrb za celovitost podatkov, uporabnost podatkov in njihov namen ter prihodnja uporabnost podatkov.

Pod razpoložljivostjo podatkov se razume učinkovit dostop vseh uporabnikov, sočasno in ves čas (pravočasen odziv na dogodke). Upravljanje PB mora zagotoviti učinkovit dostop do podatkov vsem uporabnikom – uporabniški programi za ponavljajoče / rutinske obdelave , parametričnem uporabnikom za transakcijsko delo, občasnim uporabnikom, programerjem za razvoj uporabniških programov in upravitelju PB (nadzor).

Organizacija PB mora biti takšna, da omogoča kratek odzivni čas in povrhu tega mora omogočiti izvajanje čim večjega števila transakcij na časovno enoto pri rutinskih obdelavah.

V PB so zbrani naslednji podatki:

  • notranji podatki
  • količinski podatki
  • zgodovinski podatki
  • zunanji podatki (za povezovanje z okoljem)

Nadzor nad uporabo podatkov v PB zagotavlja neko celovitost, ki se sestoji iz obnavljanja PB, nadzora nad sočasnim dostopom do podatkov in iz preverjanja vhodnih podatkov. V sklopu PB mora obstajati opis pomena podatkov. Problem prilagodljivosti podatkov rešuje tri- nivojska arhitektura PB, ki ločuje zunanji nivo od globalnega (konceptualnega) in le-tega od notranjega (fizičnega) nivoja. Prav na tro- nivojsko arhitekturo PB se bom nekoliko pozneje vrnil. V nadaljevanju si bomo še na kratko ogledali vrste podatkovnih sistemov, ki so naslednji: referenčni sistemi, sistemi za obdelavo besedil, bibliografski sistemi, specializirana PB, podatkovna skladišča, objektno usmerjene PB, baze znanja itd.

  • Referenčni sistemi vsebujejo referenčne podatke o knjigah, revijah, člankih itd. V PB so shranjeni deskriptorji, ključne besede, ki označujejo vsebino teh dokumentov in predstavljajo osnovo za njihovo iskanje in selekcijo, vendar tudi podatke o fizični poziciji določenega dokumenta (zelo uporabno za UDK MMIS).
  • Sistemi za obdelavo besedil so za ustvarjanje besedil in za njihovo pomensko analizo z uporabo ključnih besed. Bibliografski sistemi pomenijo kombinacija med prvim in drugim.
  • Specializirane PB so sistemi, kjer gre za poudarek na majhnih odzivnih časih ali pa je poudarek na postopku upravljanja z zelo velikimi količinami podatkov. Pri specializiranih PB je zelo pomembna fizična organizacija podatkov. Slabosti: zmanjšana podatkovna neodvisnost in zmanjšana prilagodljivost spremembam.
  • Podatkovna skladišča (Datawarehouses) so denormalizirane PB, ki služijo za analizo zbranih podatkov (Online Analitical Processing – OLAP) in jih lahko najdemo v različnih oblikah (npr. konstelacija, zvezda ipd.). Značilna oblika podatkovnih skladišč je takšna, da najdemo v središču tabelo dejstev, iz nje pa izhajajo dimenzijske tabele.
  • Če so PB sistemi, ki se uporabljajo za shranjevanje velikega števila formatiranih podatkov o nekem okolju, so baze znanja prej sistemi, kjer gre za sorazmerno majhno število shranjenih podatkov, ki pa so zelo raznovrstni (npr. UDK MMIS vsebuje fiziko, filozofijo, računalništvo, sociologijo, geografijo itd.). Podatki v bazah znanja so kakovostne narave, kjer je glavni poudarek na njihovem pomenu.
  • Objektno orientirane PB izhajajo s področja objektno orientiranih sistemov. V njih so shranjena tako dejstva, kot tudi navodila za uporabo teh dejstev.

Poznamo centralizirano PB, ki je podprta z računalniškim sistemom, v katerem deluje en sam SUPB, ki skrbi za upravljanje celotne PB in porazdeljeno PB, ki jo podpira več računalniških sistemov nameščenih na različnih lokacijah in povezanih z različnimi komunikacijskimi potmi. Podatkovni del PB sestavljata:

  • Fizična PB (FPB), ki vsebuje vrednosti podatkovnih prvin, ki se nanašajo na lastnosti objektov v modeliranem okolju.
  • Meta PB (MPB) vsebuje shranjene opise fizičnih podatkov in sicer, kako so podatki shranjeni v zunanjem pomnilniku, kaj pomenijo in kako so dostopni uporabnikom.

FPB in MPB sta v zunanjem pomnilniku računalniškega sistema shranjeni v obliki fizičnih datotek in to v okviru datotečnega sistema, ki ga podpira ustrezen operacijski sistem, kajti SUPB preko njega dostopa do teh datotek in je neodvisen od centralne enote računalniškega sistema kot tudi od vrst zunanjih pomnilnikov. S tem je ustvarjen pomemben pogoj za prenosljivost podatkov z enega na drug računalniški sistem, ob predpostavki, da se uporablja enak operacijski sistem.

2.1.2 Slika 2: Shematičen pogled na fizično PB

Slika 2 prikazuje logično (LPN – izolira zunanje sheme pred možnimi spremembami v konceptualni shemi npr. različne oblike relacij) in fizično podatkovno neodvisnost (FPN – izolira konceptualno shemo pred možnimi spremembami notranji shemi npr. izbor indeksiranja) v odnosu na zunanjo in globalno (konceptualno) shemo. Zunanja shema predstavlja uporabnikov pogled na PB z vidika uporabe podatkov, konceptualna shema obsega opise pravil, imen, lastnosti in povezave entitet iz modeliranega okolja (predstavlja logičen model okolja), notranja shema obsega zbirko logičnih zapisov in FPB predstavlja zbirko fizičnih datotek.

Na globalnem in zunanjem nivoju se opisuje PB s pomočjo podatkovnih modelov (PM). PM delimo na globinske (npr. semantični modeli: entiteta razmerje, binarni PM, semantične mreže, infološki PM) in površinske, od katerih so slednje najbolj pogosto uporabljene in razširjene, vendar so globinski PM z vidika uporabnika bolj koristna kot površinski PM, saj globinski PM izhajajo s podatkovnega stališča (isto kot npr. stranke). Površinski PM so:

  • Relacijski PM (RPM) se uporablja za predstavitev PB na konceptualnem in zunanjem nivoju. RPM je zasnovan na relacijah, podatkovni neodvisnosti in razumljivosti (npr. tabele so z vidika uporabnika dokaj razumljive). Sleherna tabela je sestavljena iz čelne in podatkovne vrstice; vsebina pa je dostopna s pomočjo povpraševalnih jezikov (npr. Structured Query Language – SQL). Temeljna funkcija SQL je v podpori definicij podatkovnih struktur (DDL – Data Definition Language), uporabo podatkov v njih (DML – Data Management Language) in v nadzoru nad podatki (ukazi, varnostni mehanizmi). Osnovna koncepta RPM sta domena (npr. imena entitet) in relacija (je model dogajanja ali stanja v okolju – povezava, smer).
  • Objektno relacijski PM (ORPM) je model, ki temelji na objektih in metodah.
  • Mrežni PM (MPM) je model, ki je sicer z vidika uporabnika težje doumljiv, vendar pa omogoča preprosto preslikavo v FPB in učinkovito delovanje SUPB pri dostopu do podatkov (konceptualni in notranji nivo – organizacija podatkov). Osnovna gradnika mreže sta zapis (npr. datoteka mest, datoteka pokrajin) in set (povezava med datoteko pokrajin in datoteko mest).
  • Hierarhični PM (HPM) je podoben mrežnemu PM, vendar je HPM (Information Management System – IMS) bolj specializiran PM kot MPM. Konceptualna podatkovna struktura je mreža gozdov oziroma mreža različnih dreves. Sestavni del HPM je jezik za rokovanje s podatki, ki se imenuje Data Language (DL/ 1). Hierarhična podatkovna struktura se imenuje gozd. Iz tega sledi, da je osnovni gradnik HPM drevo, ki je sestavljeno iz med seboj povezanih zapisov.HPM so zelo primerni za predstavitev hierarhičnih podatkovnih struktur (npr. UDK), za nehierarhične pa ne, saj ustvarjajo redundančne probleme.

 

 

 

 

Hierarchični PM (K1)

 

 

Mrežni PM (K1)

 

 

Relacijski PM (K2)

Površinski PM

Konceptualna podatkovna struktura je mreža gozdov oziroma mreža različnih dreves. Sestavni del HPM je jezik za rokovanje s podatki, ki se imenuje Data Language (DL/ 1). Hierarhična podatkovna struktura se imenuje gozd. Iz tega sledi, da je osnovni gradnik HPM drevo, ki je sestavljeno iz med seboj povezanih zapisov.

Površinski PM

Omogoča preprosto preslikavo v FPB in učinkovito delovanje SUPB pri dostopu do podatkov (konceptualni in notranji nivo – organizacija podatkov). Osnovna gradnika mreže sta zapis (npr. datoteka mest, datoteka pokrajin) in set (povezava med datoteko pokrajin in datoteko mest).

Površinski PM

Relacijski PM (RPM) se uporablja za predstavitev PB na konceptualnem in zunanjem nivoju. RPM je zasnovan na relacijah, podatkovni neodvisnosti in razumljivosti (npr. tabele so z vidika uporabnika dokaj razumljive). Osnovna koncepta RPM sta domena (npr. imena entitet) in relacija (je model dogajanja ali stanja v okolju – povezava, smer).

Glavna značilnost

Drevesna struktura

Glavna značilnost

Statične povezave podatkov

Glavna značilnost

Zbir dveh dimenzionalnih tabel

Prednosti

· Dobro delovanje pri paketnih datotekah

· DBMS

· Preprostost

Pomanjkljivosti

· Pravila in navigacija

· Velike težave pri spreminjanju

· Redundančnost

· Zapletene akcije brisanja

Prednosti

· Dobro delovanje pri direktnem pristopu do podatkov

· DBMS

· Zlahka vgradimo sestavljene odnose

Pomanjkljivosti

· Visoka kompleksnost

· Zapleteno spreminjanje shem PB in naslavljanje

Prednosti

· Izogiba se togih in strogih stuktur

· Podpira standard-SQL

· Koncept transakcijskega krmiljenja

· Varnost podatkov

· Prenosljivost

· Orodja / oprema

Podjetje

- IMS (IBM)

- Pravila in navigacija

- IMAGE/3000 (HP)

- DBMS-10 (DEC)

- DMS1100 (UNISYS)

- UDS (SIEMENS)

- DB2 (IBM)

- ORACLE, SQL Server 2000

- INFORMIX

- RDBMS (DEC)

- SYBASE

- DBASE

Velik pomen pri:

- Velikih podjetjih

- Velikih količinah podatkov

- Majhen pomen

- RDBMS je današnja tehnologija

- Velik pomen, še zlasti ORDBMS

2.1.3 Tabela 1: Pregled treh površinskih PM

 

Na tabeli 1 (slikovni tabeli) je pregled lastnosti treh površinskih PM (hierarhični, mrežni in relacijski PM), ki prikazuje prednosti in pomanjkljivosti teh PM.5 Povrhu tega tabela 1 prikazuje tudi podjetja, ki izdelujejo programsko opremo za te tri PM.6

Hierarhične PM:

Programska oprema IMS (Information Management System) pomeni ravnateljevanje s pomočjo transakcijske in hierarhične podatkovne baze pri elektronskem poslovanju in podatkov. Programska oprema IMS omogoča visoko stopnjo dostopnosti, zmogljivosti, delovanja, integritete in naj bi bil cenovno dokaj ugoden. IMS transakcijski management se npr. uporablja pri omrežni komunikaciji, upravlja vhodno / izhodno procesiranje in varnost, programe za procesiranje podatkov itd. Programska oprema IMS ravnateljevanje s PB organizira podatke v različne zgradbe in s tem omogoča optimizacijo skladiščenja in poizvedovanja podatkov. Povrhu tega tudi zagotavlja celovitost in možnost obnavljanja podatkov. Hierarhični PM imajo velik pomen pri velikih podjetjih, kjer imajo opraviti z velikimi količinami podatkov.

Mrežni PM:

IMAGE/3000 (HP) – programska aplikacija za skladiščenje podatkov. Eden prvih orodij za ravnateljevanje s PB (DBMS). Npr. najde in popravlja okvarjene strukture PB.7

DBMS-10 (DEC) – ravnateljevalni sistem za PB, ki ni nikoli prav zaživel (podobno kot UDS in DMS1100 (UNISYS)), kajti leta 1970 je Codd razvil relacijski PM, zato so mrežni PM v današnjem času manj aktualni.

Relacijski PM:

DB2 (IBM) – prva programska oprema na svetu za spletno multimedijsko SUPB. Omogoča enostaven dostop do informacij in njihovo pridobivanje ter je zelo prijazen do uporabnikov. Proizvodi DB2 so npr. DB2 Intelligent Miner (orodje za analizo in modeliranje podatkov), DB2 Server for VSE & VM (za podporo SUPB), DB2 Universal Database V8.1 (relacijski SUPB za različne operacijske sisteme kot npr. za Linux, Windows itd.) itd. DB2 pomaga strankam, ki želijo npr. v svojem podjetju izvesti prehod na elektronsko poslovanje. DB2 je z ustreznimi razširitvami (XML, Slika, zvok, video) kot objektno relacijska PB sposobna upravljati z multimedijskimi podatki. DB2 omogoča tudi kakovostno ravnateljevanje v odnosih s strankami (CRM – Customer Relationship Management).

ORACLE9i database - je programska oprema, ki naj bi bila cenejša kot DB2 in kot SQL Server.8

INFORMIX – je prav tako programska oprema za SUPB. INFORMIX se prav tako členi na različne proizvode kot npr. Informix Dynamic Server (IDS) (uporablja za spletno procesiranje podatkov za e- poslovanje), Informix SE, Informix Extended Parallel Server (XPS) (za podatakovno skladišče – poslovanje) itd.

RDBMS (DEC) – programska oprema za relacijsko načrtovanje in ravnateljevanje PB.

SYBASE – programska oprema za SUPB v smeri e- poslovanja, analiziranja itd.9

DBASE – omogoča hiter, zanesljiv in enostaven dostop do podatkov preko spleta.10

SQL Server 2000 – Npr. Microsoft SQL Server 2000 Analysis Services je zgolj del PB; strežnik za sprotno analizo (OLAP – online analytical processing) in odkrivanje zakonitosti v podatkih (data mining). V letu 2002 najboljša programska oprema za PB, celo pred ORACLE9i.11

Naj še nekaj besed namenim objektno relacijskim sistemom za upravljanje PB (ORSUPB):

ORSUPB so sinteza OSUPB in RSUPB, ki ima naslednje prednosti:

Povečan nadzor nad dostopom do podatkov, učinkovita obnova podatkov, optimizacija, semantično obogaten PM, možnosti razširitve znotraj SUPB ipd. Aktualni predstavniki ORSUPB so npr.: Oracle9i, IBM DB2 V8.1, IBM Informix 9.3.1, PostgreSQL 7.4, Intersystems Caché 5 ipd. S tovrstnimi ORSUPB je možno shranjevati objekte neposredno v sistem PB, ORSUPB podpirajo objektno orientirane koncepte in omogočajo razširitev podatkovnih tipov (npr. XML, Avdio / Video, slike ipd.).12

SUPB (npr. Oracle9i) na različnih nivojih skrbi za preslikave med opisi PB. SUPB je posrednik med PB in njenimi uporabniki (notranja shema – fizična organizacija PB, konceptualna shema – logična organizacija PB in vse integritetne omejitve in zunanja shema – uporabniški pogled ter pristojnosti uporabnikov). Po eni strani SUPB omogoča uporabnikom dostop do nekaterih podatkov, a po drugi strani pa izvaja nadzor in zaščito nad uporabo podatkov, kajti opraviti imamo z različnimi vrstami uporabnikov, ki so na grobo deljeno lahko posredni ali pa neposredni (neprogramerji so: menujsko vodeni uporabniki, parametrični uporabniki, uporabniki povpraševalnega jezika; programerji so aplikacijski uporabniki in sistemski programerji; pod neposredne uporabnike prištejemo upravitelje PB). Funkcije SUPB se členijo na nadzorne in dostopne, od katerih se slednje še nadalje razvejajo na uporabo (vključuje zajemanje podatkov iz PB, ažuriranje podatkov v PB in razvojno podporo) in gradnjo (vključuje izvedbo shem, izvedbo FPB in reorganizacijo PB). V primeru, da pride do podatkovnih nesreč (nekonsistentnost podatkov) je potrebno PB obnoviti. Obnavljanje PB je v domeni SUPB, ki poteka pod nadzorom upravitelja PB. V namen zagotavljanja konsistentnosti podatkov se lahko uvede dvojna PB. V primeru, da pride do izpada ene PB, se lahko ta nadomesti z drugo, kajti diskovna kontrolna enota izpisuje sočasno podatke na dva fizično ločena diska (se izplača za zelo velike PB, saj olajša delo upravitelja SUPB). Tovrstna zaščita je precej draga in zato mnogokrat uporabljajo metodo kopiranja.

Po kratki predstavitvi podatkovnih baz, se bom v nadaljevanju tega poglavja posvetil okvirnemu modeliranju podatkov z namenom, da prikažem, katere vrste PB bi lahko vključil v UDK MMIS, ponovno bom omenil tri- nivojsko arhitekturo PB, prikazal vzroke za podatkovno modeliranje itd.


4 Uvodno poglavje v tej magistrski seminarski nalogi sem sestavil na podlagi naslednjega vira: Mohorič, T.(2002). Podatkovne baze. 2. popravljena izd. Ljubljana: BI- TIM.

5 Podatke sem dobil na URL: http://www.2cool4u.ch/business_it/datenmodellierung/datenmodellierung.htm#_Toc39488084 (2003-08-02)

6 Podatke sem dobil na URL: http://www-3.ibm.com/software/data/ims/ims/index.html (2003-08-12)

7 URL: http://www.gainsborough.com/software_home.htm (2003-08-12)

8 Na naslednjem spletnem naslovu lahko izvedete spletne evalvacije različnih programskih oprem: http://www.technologyevaluation.com (2003-08-12).

9 Oglejte si URL: http://www.sybase.com/products/databaseservers (2003-07-21)

10 Za podrobnosti si oglejte URL: http://www.dbase.com/Docs/Products.htm (2003-08-13)

11 Več o tem si lahko preberete na spletnem naslovu: http://www.mysql.com/eweek (2003-08-04)

12  http://wwwiti.cs.uni-magdeburg.de/iti_db/lehre/ordbs/ordbs-1.pdf (2003-08-12)


 

Nazaj na glavno stran



Datenschutzerklärung
Kostenlose Homepage von Beepworld
 
Verantwortlich für den Inhalt dieser Seite ist ausschließlich der
Autor dieser Homepage, kontaktierbar über dieses Formular!