Model conceptual de date de stocare corporativă. Sisteme informatice corporative. Model de date relaționale

Din ce în ce mai mult, profesioniștii IT își îndreaptă atenția către soluții de gestionare a datelor bazate pe modele de date standard din industrie și șabloane de decizii de afaceri. Modelele de date fizice complexe și rapoartele de business intelligence gata de încărcat pentru anumite domenii de activitate vă permit să unificați componenta informațională a întreprinderii și să accelerați semnificativ execuția proceselor de afaceri. Șabloanele de soluții permit furnizorilor de servicii să valorifice puterea informațiilor non-standard ascunse în sistemele existente, reducând astfel termenele, costurile și riscurile proiectului. De exemplu, proiectele reale arată că modelul de date și șabloanele de decizie de afaceri pot reduce efortul de dezvoltare cu 50%.

Un model logic al industriei este o vizualizare specifică domeniului, integrată și structurată logic a tuturor informațiilor care ar trebui să fie într-un depozit de date corporative pentru a răspunde atât întrebărilor strategice, cât și tactice de afaceri. Scopul principal al modelelor este de a facilita orientarea în spațiul de date și de a ajuta la evidențierea detaliilor care sunt importante pentru dezvoltarea afacerii. În mediul de afaceri de astăzi, este absolut esențial să avem o înțelegere clară a relațiilor dintre diferitele componente și o bună înțelegere a imaginii de ansamblu a organizației. Identificarea tuturor detaliilor și relațiilor folosind modele permite utilizarea cât mai eficientă a timpului și a instrumentelor de organizare a muncii companiei.

Modelele de date sunt modele abstracte care descriu modul în care datele sunt reprezentate și accesate. Modelele de date definesc elementele de date și relațiile dintre ele într-o zonă dată. Un model de date este un instrument de navigare atât pentru profesioniștii în afaceri, cât și pentru IT, care utilizează un set specific de simboluri și cuvinte pentru a explica cu exactitate o anumită clasă de informații reale. Acest lucru îmbunătățește comunicarea în cadrul organizației și astfel creează un mediu de aplicație mai flexibil și mai stabil.

Un exemplu de GIS pentru autorități și model de autoguvernare locală.

Astăzi, este important din punct de vedere strategic pentru furnizorii de software și servicii să poată răspunde rapid la schimbările din industrie asociate cu inovațiile tehnologice, eliminarea restricțiilor guvernamentale și complexitatea lanțurilor de aprovizionare. Odată cu schimbările în modelul de afaceri, complexitatea și costul tehnologiei informației necesare pentru a susține activitățile companiei este în creștere. Gestionarea datelor este deosebit de dificilă într-un mediu în care sistemele de informații corporative și cerințele lor funcționale și de afaceri sunt în continuă schimbare.

Pentru a ajuta la facilitarea și optimizarea acestui proces, în transpunerea abordării IT la nivel modern, se apelează la modelele de date din industrie.

Modele de date industriale de la companieEsri

Modelele de date pentru platforma Esri ArcGIS sunt șabloane de lucru pentru utilizare în proiecte GIS și pentru crearea de structuri de date pentru diferite domenii de aplicație. Construirea unui model de date implică crearea unui design conceptual, a unei structuri logice și a unei structuri fizice care pot fi apoi utilizate pentru a construi o bază de date geografică personală sau corporativă. ArcGIS oferă instrumente pentru crearea și gestionarea unei scheme de baze de date, iar șabloanele de model de date sunt folosite pentru a lansa rapid un proiect GIS într-o varietate de aplicații și industrii. Esri, împreună cu comunitatea de utilizatori, a petrecut o perioadă semnificativă de timp dezvoltând o serie de șabloane care vă pot ajuta să începeți rapid să proiectați o bază de date geografică pentru întreprinderi. Aceste proiecte sunt descrise și documentate la support.esri.com/datamodels . Mai jos, în ordinea în care apar pe acest site, sunt traducerile semantice ale numelor modelelor industriale ale Esri:

Registrul de adrese
Agricultură
Meteorologie
Date spațiale de bază
biodiversitate
Spațiul interior al clădirilor
Contabilitatea gazelor cu efect de seră
Menținerea limitelor administrative
Forte armate. Serviciul de informații
Energie (inclusiv noul protocol ArcGIS MultiSpeak)
Clădiri ecologice
Ministerul Situațiilor de Urgență. protecție împotriva incendiilor
Cadastru forestier
Silvicultură
Geologie
GIS la nivel național (e-gov)
Ape subterane și ape uzate
sănătate
Arheologia și protecția siturilor memoriale
securitate naționala
Hidrologie
Organizația Hidrografică Internațională (OHI). Format S-57 pentru ENC
Irigare
carte funciara
administrația municipală
Navigația maritimă
Cadastrul de stat
Structuri de petrol și gaze
Conducte
Magazine raster
Batimetrie, topografia fundului mării
Telecomunicatii
Transport
Instalatii sanitare, canalizare, utilitati

Aceste modele conțin toate caracteristicile necesare standardului industrial, și anume:

sunt disponibile gratuit;
nu sunt legate de tehnologia producătorului „selectat”;
creat ca urmare a implementarii unor proiecte reale;
creat cu participarea experților din industrie;
concepute pentru a oferi interacțiunea informațiilor între diverse produse și tehnologii;
nu contrazice alte standarde și documente de reglementare;
utilizat în proiecte implementate în întreaga lume;
sunt concepute pentru a funcționa cu informații pe tot parcursul ciclului de viață al sistemului creat, și nu cu proiectul în sine;
extensibil la nevoile clientului fără a pierde compatibilitatea cu alte proiecte și/sau modele;
însoțit de materiale și exemple suplimentare;
utilizate în ghidurile și materialele tehnice ale diferitelor companii industriale;
o comunitate mare de participanți, în timp ce accesul la comunitate este deschis tuturor;
un număr mare de referințe la modele de date în publicațiile din ultimii ani.

Esri face parte dintr-un grup de experți de organisme independente care recomandă diferite modele industriale pentru utilizare, cum ar fi PODS (Standarde de date deschise pentru conducte - un standard deschis pentru industria petrolului și gazelor; în prezent există o implementare a PODS ca un Esri PODS Esri Spatial 5.1.1 geodatabase) sau o geodatabase (GDB) de la ArcGIS for Aviation care ia în considerare recomandările ICAO și FAA, precum și standardul de schimb de date de navigație AIXM 5.0. În plus, există modele recomandate care respectă strict standardele existente ale industriei, cum ar fi S-57 și ArcGIS for Maritime (trăsături marine și de coastă), precum și modele create din munca Esri Professional Services, care sunt „de facto” standardelor în domeniile relevante. De exemplu, GIS pentru Națiune și Guvernul Local au influențat standardele NSDI și INSPIRE, în timp ce Hydro și Groundwater sunt foarte utilizate în pachetul profesional ArchHydro și produsele comerciale disponibile gratuit. Trebuie remarcat faptul că Esri acceptă și standarde „de facto” precum NHDI. Toate modelele de date propuse sunt documentate și gata de utilizare în procesele IT ale întreprinderii. Materialele însoțitoare pentru modele includ:

diagrame UML ale relațiilor dintre entități;
structuri de date, domenii, directoare;
șabloane de geodatabase gata făcute în format ArcGIS GDB;
eșantion de date și eșantion de aplicații;
exemple de scripturi de încărcare a datelor, exemple de utilitare de analiză;
cărți de referință privind structura de date propusă.

Esri își rezumă experiența în modelele din industria construcțiilor sub formă de cărți și localizează materialele publicate. Esri CIS a localizat și publicat următoarele cărți:

Arhitectură orientată pe servicii geospațiale (SOA);
Proiectare geobaze de date pentru transport;
Sisteme de geoinformații corporative;
GIS: energie nouă a întreprinderilor electrice și gaze;
Petrol și gaze pe o hartă digitală;
Modelând lumea noastră. Ghid de proiectare a bazei de date geodate Esri;
Mă gândesc la GIS. Planificarea GIS: un ghid pentru manageri;
Sisteme informatice geografice. Bazele;
GIS pentru management administrativ și economic;
Web GIS. Principii și aplicare;
Systems Design Strategies, ediția a 26-a;
68 de numere ale revistei ArcReview cu publicații ale companiilor și utilizatorilor sistemelor GIS;
... și multe alte note și publicații tematice.

De exemplu, cartea Modelând lumea noastră...„(traducere) este un ghid cuprinzător și un ghid de referință pentru modelarea datelor GIS în general, și modelul de date geodatabase în special. Cartea arată cum să luați deciziile corecte de modelare a datelor, decizii care sunt implicate în fiecare aspect al unui proiect GIS: de la date de proiectare a bazei de date și colectarea datelor până la analiza și vizualizarea spațială Descrie în detaliu cum să proiectați o bază de date geografică adecvată pentru proiect, să configurați funcționalitatea bazei de date fără programare, să gestionați fluxul de lucru în proiecte complexe, să modelați o varietate de structuri de rețea, cum ar fi râul, transportul sau rețele electrice, să integreze datele de imagini din satelit în analiza geografică și cartografiere și să creeze modele de date GIS 3D. Proiectarea bazelor de geodate pentru transport„conține abordări metodologice care au fost testate pe un număr mare de proiecte și respectă pe deplin cerințele legale ale Europei și Statelor Unite, precum și standardelor internaționale. Și în carte” GIS: energie nouă a întreprinderilor electrice și gaze Folosind exemple din lumea reală, arată beneficiile pe care un GIS de întreprindere le poate aduce unui furnizor de energie, inclusiv aspecte precum serviciul pentru clienți, operarea în rețea și alte procese de afaceri.

Unele dintre cărți, traduse și originale, publicate în limba rusă de Esri CIS și DATA+. Acestea acoperă atât probleme conceptuale legate de tehnologia GIS, cât și multe aspecte aplicate ale modelării și implementării GIS de diferite scări și scopuri.

Vom lua în considerare utilizarea modelelor industriale folosind modelul de date BISDM (Building Interior Space Data Model) versiunea 3.0 ca exemplu. BISDM este o dezvoltare a unui model BIM mai general (Building Information Model, Building Information Model) și este destinat utilizării în proiectarea, construcția, operarea și dezafectarea clădirilor și structurilor. Folosit în software-ul GIS, vă permite să schimbați în mod eficient geodate cu alte platforme și să interacționați cu acestea. Se referă la grupul de sarcini general FM (gestionarea infrastructurii organizației). Enumerăm principalele avantaje ale modelului BISDM, a cărui utilizare permite:

organizează schimbul de informații într-un mediu eterogen după reguli uniforme;
obține o întruchipare „fizică” a conceptului BIM și a regulilor recomandate pentru gestionarea unui proiect de construcție;
menținerea unui singur depozit folosind instrumente GIS pe întreg ciclul de viață al clădirii (de la proiectare până la dezafectare);
coordonează activitatea diverșilor specialiști în proiect;
vizualizați programul planificat și etapele de construcție pentru toți participanții;
dați o estimare preliminară a costului și a timpului de construcție (date 4D și 5D);
controlează progresul proiectului;
să asigure funcționarea de calitate a clădirii, inclusiv întreținerea și reparațiile;
devin parte a sistemului de management al activelor, inclusiv funcțiile de analiză a eficienței utilizării spațiului (închiriere, spații de depozitare, managementul angajaților);
calculează și gestionează eficiența energetică a clădirii;
simulează mișcarea fluxurilor umane.

BISDM definește regulile de lucru cu date spațiale la nivelul spațiilor interne dintr-o clădire, inclusiv scopul și tipurile de utilizare, comunicații așezate, echipamente instalate, contabilitate pentru reparații și întreținere, înregistrarea incidentelor, relațiile cu alte active ale companiei. Modelul ajută la crearea unui depozit unificat de date geografice și non-geografice. Experiența companiilor lider din lume a fost folosită pentru a izola entități și a modela la nivel GDB (geodatabase) relațiile spațiale și logice ale tuturor elementelor fizice care formează atât clădirea în sine, cât și interiorul acesteia. Urmărirea principiilor BISDM vă permite să simplificați semnificativ sarcinile de integrare cu alte sisteme. În prima etapă, aceasta este de obicei integrarea cu CAD. Apoi, în timpul funcționării clădirii, se folosește schimbul de date cu sistemele ERP și EAM (SAP, TRIRIGA, Maximo etc.).

Vizualizarea elementelor structurale BISDM folosind ArcGIS.

În cazul utilizării BISDM, clientul/proprietarul unității primește un schimb de informații end-to-end de la ideea creării unei facilități până la dezvoltarea unui proiect complet, controlul construcției cu obținerea de până la -informații privind data până la momentul punerii în funcțiune a instalației, controlul parametrilor în timpul funcționării și chiar în timpul reconstrucției sau dezafectării instalației. Urmând paradigma BISDM, GIS și GDB create cu ajutorul său devin un depozit comun de date pentru sistemele conexe. Adesea, în GDB există date create și operate de sisteme terțe. Acest lucru trebuie luat în considerare la proiectarea arhitecturii sistemului creat.

La o anumită etapă, „masa critică” de informații acumulată vă permite să treceți la un nou nivel calitativ. De exemplu, la finalizarea fazei de proiectare a unei clădiri noi, este posibil să se vizualizeze automat modele de sondaj 3D în GIS, să se întocmească o listă de echipamente care urmează să fie instalate, să se calculeze kilometrii de rețele de inginerie care urmează să fie instalate, să se efectueze o serie de verificări , și chiar să ofere o estimare financiară preliminară a costului proiectului.

Încă o dată, atunci când utilizați împreună BISDM și ArcGIS, devine posibilă construirea automată a modelelor 3D din datele acumulate, deoarece GDB conține o descriere completă a obiectului, inclusiv coordonatele z, aparținând unui etaj, tipuri de conexiuni ale elementelor, echipamente. metodele de instalare, materialul, căile disponibile deplasările personalului, scopul funcțional al fiecărui element etc. etc. Trebuie remarcat faptul că, după importul inițial al tuturor materialelor de proiectare în BISDM GDB, este nevoie de conținut suplimentar pentru:

plasarea modelelor 3D de obiecte și echipamente în locurile desemnate;
colectarea de informații despre costul materialelor și procedura de așezare și instalare a acestora;
controlul patentei in functie de dimensiunile echipamentului nestandard instalat.

Prin utilizarea ArcGIS, importul de obiecte 3D suplimentare și cărți de referință din surse externe este simplificat. Modulul ArcGIS Data Interoperability vă permite să creați proceduri pentru importarea unor astfel de date și plasarea lor corectă în model. Sunt acceptate toate formatele utilizate în industrie, inclusiv IFC, AutoCAD Revit, Bentlye Microstation.

Modele de date industriale de la IBM

IBM oferă un set de instrumente și modele de gestionare a stocării pentru o varietate de industrii:

IBM Banking and Financial Markets Data Warehouse (finanțare)
IBM Banking Data Warehouse
Modele de servicii și procese bancare IBM
Modelul de date IBM Health Plan (sănătate)
IBM Insurance Information Warehouse (asigurare)
Modele de servicii și procese de asigurare IBM
IBM Retail Data Warehouse (comerț cu amănuntul)
IBM Telecommunications Data Warehouse (telecomunicații)
Pachetul InfoSphere Warehouse:
- pentru Customer Insight (pentru a înțelege clienții)
- pentru Market and Campaign Insight (pentru a înțelege compania și piața)
- pentru Supply Chain Insight (pentru înțelegerea furnizorilor).

De exemplu, modelul IBMbancarșiFinanciarpieţelorDateDepozit concepute pentru a aborda provocările specifice ale industriei bancare în ceea ce privește datele și IBMbancarprocesșiServiciuModele- în ceea ce privește procesele și SOA (arhitectură orientată pe servicii). Modele prezentate pentru industria telecomunicațiilor IBMinformațieCadru(IFW)și IBMTelecomunicatiiDateDepozit (TDW). Ele ajută la accelerarea semnificativă a procesului de creare a sistemelor analitice, precum și la reducerea riscurilor asociate cu dezvoltarea aplicațiilor de business intelligence, managementul datelor corporative și organizarea depozitelor de date, ținând cont de specificul industriei telecomunicațiilor. Capacitățile IBM TDW acoperă întregul spectru al pieței de telecomunicații - de la furnizori de internet și operatori de rețele de cablu care oferă servicii de telefonie cu fir și fără fir, transmisie de date și conținut multimedia, până la companii multinaționale care furnizează servicii de telefonie, satelit, la distanță lungă și de comunicații internaționale, precum și ca organizații rețele globale. Astăzi, TDW este utilizat de furnizorii de servicii cu fir și fără fir mari și mici din întreaga lume.

Instrumentul numit InfoSphere Warehouse Pack pentru cunoștințe despre clienți este un conținut de afaceri structurat și ușor de implementat pentru un număr tot mai mare de proiecte și industrii de afaceri, inclusiv bancar, asigurări, finanțe, programe de asigurări de sănătate, telecomunicații, retail și distribuție. Pentru utilizatorii business Pachetul InfoSphere Warehouse pentru perspectivă privind piața și campania vă ajută să maximizați eficacitatea informațiilor de piață și a campaniilor de marketing printr-un proces de dezvoltare pas cu pas și specific afacerii. Prin intermediul InfoSphere Warehouse Pack pentru Supply Chain Insight organizațiile au capacitatea de a obține informații actuale despre operațiunile lanțului de aprovizionare.

Poziția lui Esri în arhitectura soluției IBM.

De remarcat în mod deosebit este abordarea IBM față de utilități și companii de utilități. Pentru a satisface cerințele tot mai mari ale clienților, companiile de utilități au nevoie de o arhitectură mai flexibilă decât cea pe care o folosesc în prezent, precum și de un model obiect standard pentru industrie pentru a facilita schimbul liber de informații. Acest lucru va îmbunătăți capacitățile de comunicare ale companiilor energetice, permițându-le să comunice mai eficient din punct de vedere al costurilor și va oferi noilor sisteme o vizibilitate mai bună asupra tuturor resurselor necesare, indiferent unde se află acestea în cadrul organizației. La baza acestei abordări se află SOA (Service Oriented Architecture), un model component care stabilește o corespondență între funcțiile departamentelor și serviciile diferitelor aplicații care pot fi reutilizate. „Serviciile” acestor componente comunică prin interfețe fără hard binding, ascunzând utilizatorului întreaga complexitate a sistemelor din spatele lor. În acest mod, întreprinderile pot adăuga cu ușurință noi aplicații, indiferent de furnizorul de software, sistemul de operare, limbajul de programare sau alte caracteristici intrinseci ale software-ului. Conceptul este implementat pe baza SOA SIGUR ( Arhitectura de soluții pentru energie, permite industriei de utilități să obțină o viziune holistică, bazată pe standarde, asupra infrastructurii lor.

Esri ArcGIS® este o platformă software recunoscută la nivel global pentru sistemele de informații geografice (GIS), care oferă crearea și gestionarea activelor digitale ale rețelelor de energie electrică, transport de gaze, distribuție și telecomunicații. ArcGIS vă permite să efectuați cel mai complet inventar al componentelor rețelei de distribuție electrică, ținând cont de locația lor spațială. ArcGIS extinde foarte mult arhitectura IBM SAFE prin furnizarea de instrumente, aplicații, fluxuri de lucru, analize și capacități de informații și integrare necesare pentru a gestiona rețeaua inteligentă. ArcGIS din cadrul IBM SAFE vă permite să primiți informații din diverse surse despre obiecte de infrastructură, active, clienți și angajați cu date exacte despre locația lor, precum și să creați, stocați și procesați informații geo-referențiate despre activele întreprinderii (piloni, conducte, fire, transformatoare, canale de cablu etc.). ArcGIS în cadrul unei infrastructuri SAFE vă permite să combinați în mod dinamic aplicațiile cheie de afaceri prin combinarea datelor din sistemele GIS, SCADA și de servicii pentru clienți cu informații externe, cum ar fi traficul, condițiile meteorologice sau imaginile din satelit. Utilitățile folosesc aceste informații combinate într-o varietate de scopuri, de la C.O.R. (imagine de ansamblu a mediului operațional) la inspecții la fața locului, întreținere, analiza și planificarea rețelei.

Componentele informaționale ale unei întreprinderi de alimentare cu energie electrică pot fi modelate folosind mai multe niveluri, care variază de la cel mai scăzut - fizic - până la cel mai de sus, cel mai complex nivel al logicii procesului de afaceri. Aceste straturi pot fi integrate pentru a îndeplini cerințele tipice ale industriei, cum ar fi înregistrarea automată a măsurătorilor și controlul de supraveghere și controlul achiziției de date (SCADA). Prin construirea arhitecturii SAFE, companiile de utilități fac progrese semnificative în promovarea unui model de obiect deschis la nivelul întregii industrie, numit Common Information Model (CIM) pentru energie și utilități. Acest model oferă baza necesară pentru mutarea multor întreprinderi către o arhitectură orientată spre servicii, deoarece încurajează utilizarea standardelor deschise pentru structurarea datelor și a obiectelor. Dacă toate sistemele folosesc aceleași obiecte, confuzia și inelasticitatea asociate cu diferite implementări ale acelorași obiecte vor fi reduse la minimum. Astfel, definiția obiectului „client” și a altor obiecte de afaceri importante vor fi unificate în toate sistemele companiei de alimentare cu energie. Cu CIM, furnizorii de servicii și consumatorii de servicii pot împărtăși acum o structură de date comună, facilitând externalizarea componentelor de afaceri costisitoare, deoarece CIM stabilește o bază comună pe care să construiască schimbul de informații.

Concluzie

Modelele cuprinzătoare de date din industrie oferă companiilor o vizualizare unică și integrată a informațiilor lor de afaceri. Multe companii consideră că este dificil să-și integreze datele, deși aceasta este o condiție prealabilă pentru majoritatea proiectelor la nivel de întreprindere. Potrivit unui studiu realizat de The Data Warehousing Institute (TDWI), peste 69% dintre organizațiile chestionate au considerat că integrarea este o barieră semnificativă în calea adoptării de noi aplicații. Dimpotrivă, implementarea integrării datelor aduce companiei venituri tangibile și eficiență sporită.

Un model bine construit definește în mod unic sensul datelor, care în acest caz sunt date structurate (spre deosebire de datele nestructurate, cum ar fi o imagine, un fișier binar sau un text, unde valoarea poate fi ambiguă). Cele mai eficiente modele din industrie sunt oferite de furnizori profesioniști, inclusiv Esri și IBM. Rentabilitatea ridicată din utilizarea modelelor lor este obținută datorită nivelului lor semnificativ de detaliu și acuratețe. Acestea conțin de obicei multe atribute de date. În plus, experții de la Esri și IBM nu numai că au o experiență vastă în modelare, dar sunt și bine versați în construirea de modele pentru o anumită industrie.

Modele de date industriale

Scopul principal al modelelor este de a facilita orientarea în spațiul de date și de a ajuta la evidențierea detaliilor care sunt importante pentru dezvoltarea afacerii. În mediul de afaceri de astăzi, este absolut esențial să avem o înțelegere clară a relațiilor dintre diferitele componente și o bună înțelegere a imaginii de ansamblu a organizației. Identificarea tuturor detaliilor și relațiilor folosind modele permite utilizarea cât mai eficientă a timpului și a instrumentelor de organizare a muncii companiei.

Modelul de date definește în mod unic sensul datelor, care în acest caz sunt date structurate (spre deosebire de datele nestructurate, cum ar fi o imagine, un fișier binar sau un text, unde valoarea poate fi ambiguă).

De regulă, se disting modele de nivel superior (și mai general ca conținut) și de nivel inferior (respectiv, mai detaliat). Nivelul superior al modelării este așa-numitul modele conceptuale de date(modele de date conceptuale), care oferă imaginea cea mai generală a funcționării unei întreprinderi sau organizații. Modelul conceptual include principalele concepte sau domenii care sunt critice pentru funcționarea organizației; de obicei numărul lor nu depăşeşte 12-15. Un astfel de model descrie clase de entități importante pentru organizație (obiecte de afaceri), caracteristicile lor (atribute) și asocieri între perechile acestor clase (adică relații). Întrucât terminologia în modelarea afacerilor nu a fost încă complet stabilită, în diverse surse în limba engleză, modelele conceptuale de date pot fi numite și model de subiect (care poate fi tradus ca modele de subiect) sau model de date de întreprindere (subiect modele de date corporative). ).

Următorul nivel ierarhic este modele logice de date(modele logice de date). Ele pot fi, de asemenea, denumite modele de date de întreprindere sau modele de afaceri. Aceste modele conțin structuri de date, atributele lor și regulile de afaceri și reprezintă informații utilizate de o întreprindere din perspectiva afacerii. Într-un astfel de model, datele sunt organizate sub formă de entități și relații dintre acestea. Modelul logic reprezintă datele într-un mod ușor de înțeles de către utilizatorii de afaceri. Într-un model logic, un dicționar de date poate fi alocat - o listă a tuturor entităților cu definițiile lor exacte, ceea ce permite diferitelor categorii de utilizatori să aibă o înțelegere comună a tuturor fluxurilor de intrare și de ieșire de informații ale modelului. Următorul nivel inferior de modelare este deja implementarea fizică a modelului logic folosind instrumente software specifice și platforme tehnice.

Modelul logic conține decizia de afaceri detaliată a întreprinderii, care de obicei ia forma unui model normalizat. Normalizarea este procesul care asigură că fiecare element de date din model are o singură valoare și este complet și unic dependent de cheia primară. Elementele de date sunt organizate în grupuri în funcție de identificarea lor unică. Regulile de afaceri care controlează elementele de date trebuie incluse integral în modelul normalizat cu o verificare prealabilă a validității și corectitudinii acestora. De exemplu, un element de date, cum ar fi Numele Clientului, ar fi cel mai probabil împărțit în Prenume și Nume și grupat cu alte elemente de date relevante într-o entitate Client cu o cheie primară a ID-ului Clientului.

Modelul de date logic este independent de tehnologiile aplicației, cum ar fi bazele de date, rețelele sau instrumentele de raportare și de implementarea lor fizică. O organizație poate avea un singur model de date de întreprindere. Modelele logice includ de obicei mii de entități, relații și atribute. De exemplu, un model de date pentru o instituție financiară sau o companie de telecomunicații poate conține aproximativ 3.000 de concepte industriale.

Este important să se facă distincția între modelul de date logic și semantic. Modelul de date logic reprezintă soluția de afaceri corporativă, în timp ce modelul de date semantice reprezintă soluția de afaceri aplicată. Același model de date logice corporative poate fi implementat folosind modele semantice diferite, de ex. modelele semantice pot fi considerate drept următorul nivel de modelare care se apropie de modelele fizice. În plus, fiecare dintre aceste modele va reprezenta o „slice” separată a modelului de date corporative în conformitate cu cerințele diferitelor aplicații. De exemplu, într-un model de date logic corporativ, entitatea Client va fi complet normalizată, iar într-un model semantic pentru un data mart, poate fi reprezentată ca o structură multidimensională.

O companie poate avea două moduri de a crea un model de date logic de întreprindere: construiți-l singur sau utilizați un model gata făcut model de industrie(model de date logice pentru industrie). În acest caz, diferențele în termeni reflectă doar abordări diferite pentru construirea aceluiași model logic. În cazul în care o companie dezvoltă și implementează în mod independent propriul model de date logice, atunci un astfel de model, de regulă, se numește pur și simplu model logic corporativ. Dacă organizația decide să folosească produsul finit al unui furnizor profesionist, atunci putem vorbi despre un model de date logic al industriei. Acesta din urmă este un model de date logice gata făcute care reflectă funcționarea unei anumite industrii cu un grad ridicat de acuratețe. Un model logic al industriei este o vedere integrată și specifică domeniului a tuturor informațiilor care trebuie să fie într-un depozit de date al întreprinderii pentru a răspunde atât la întrebările strategice, cât și la cele tactice de afaceri. Ca orice alt model de date logice, modelul industrial nu depinde de soluțiile aplicației. De asemenea, nu include date derivate sau alte calcule pentru o recuperare mai rapidă a datelor. De regulă, majoritatea structurilor logice ale unui astfel de model își găsesc o realizare bună în implementarea sa fizică eficientă. Astfel de modele sunt dezvoltate de mulți furnizori pentru o mare varietate de domenii: finanțe, producție, turism, sănătate, asigurări etc.

Un model de date logic de industrie conține informații care sunt comune unei industrie și, prin urmare, nu poate fi o soluție completă pentru o companie. Majoritatea companiilor trebuie să mărească modelul cu o medie de 25% prin adăugarea de elemente de date și extinderea definițiilor. Modelele finite conțin doar elementele de date cheie, iar restul elementelor trebuie adăugate la obiectele de business corespunzătoare în timpul instalării modelului în companie.

Modelele de date logice ale industriei conțin un număr semnificativ de abstracții. Abstracția se referă la unirea unor concepte similare sub denumiri comune, cum ar fi Eveniment sau Participant. Acest lucru adaugă flexibilitate modelelor industriale și le face mai unificate. Astfel, conceptul de Eveniment este aplicabil tuturor industriilor.

Expertul în Business Intelligence Steve Hoberman subliniază cinci factori de care trebuie să luați în considerare atunci când decideți dacă să achiziționați un model de date din industrie. Primul este timpul și resursele necesare pentru a construi modelul. Dacă o organizație trebuie să obțină rapid rezultate, atunci modelul industriei va oferi un avantaj. Utilizarea unui model industrial poate să nu ofere imediat o imagine a întregii organizații, dar poate economisi o cantitate semnificativă de timp. În loc de modelarea propriu-zisă, se va cheltui timp legând structurile existente la modelul industriei, precum și discutând cum să-l personalizeze cel mai bine la nevoile organizației (de exemplu, ce definiții ar trebui modificate și ce elemente de date ar trebui adăugate).

Al doilea factor este timpul și banii necesari pentru a menține modelul în funcțiune. Dacă un model de date de întreprindere nu face parte dintr-o metodologie care îl menține exact și actualizat, atunci modelul va deveni învechit foarte repede. Modelul de date din industrie poate preveni acest risc, deoarece este ținut la zi de resurse externe. Desigur, schimbările care apar în cadrul organizației trebuie să fie reflectate în model de către compania însăși, dar schimbările din industrie vor fi reproduse în model de către furnizorul său.

Al treilea factor este experiența în evaluarea și modelarea riscurilor. Crearea unui model de date de întreprindere necesită resurse calificate atât din partea companiei, cât și a personalului IT. De regulă, managerii cunosc bine fie activitatea organizației în ansamblu, fie activitățile unui anumit departament. Puțini dintre aceștia au atât cunoștințe ample (la nivelul întregii companii) cât și profunde (la nivelul întregii unități) despre afacerea lor. Majoritatea managerilor cunosc bine un singur domeniu. Prin urmare, pentru a obține o imagine la nivel corporativ, sunt necesare resurse semnificative de afaceri. Acest lucru crește, de asemenea, cerințele pentru personalul IT. Cu cât sunt necesare mai multe resurse de afaceri pentru a crea și testa un model, cu atât analiștii trebuie să aibă mai multă experiență. Ei trebuie să știe nu numai să obțină informații de la personalul de afaceri, ci și să poată găsi un teren comun în zone controversate și să poată prezenta toate aceste informații într-un mod integrat. Cel care creează modelul (în multe cazuri, acesta este același analist) trebuie să aibă bune abilități de modelare. Crearea modelelor logice corporative necesită modelare „pentru viitor” și capacitatea de a transforma afaceri complexe în literalmente „pătrate și linii”.

Pe de altă parte, modelul industriei vă permite să folosiți experiența specialiștilor terți. Modelele logice specifice industriei folosesc metodologii de modelare dovedite și echipe de profesioniști cu experiență pentru a evita problemele comune și costisitoare care pot apărea la dezvoltarea modelelor de date ale întreprinderii în cadrul unei organizații.

Al patrulea factor este infrastructura aplicației existente și relațiile cu furnizorii. Dacă o organizație folosește deja multe instrumente de la același furnizor și a stabilit relații cu aceștia, atunci este logic să comanzi modelul de industrie și de la ei. Un astfel de model va putea lucra liber cu alte produse ale aceluiași furnizor.

Al cincilea factor este schimbul de informații intra-industrie. Dacă o companie trebuie să partajeze date cu alte organizații care operează în același domeniu, atunci un model de industrie poate fi de mare ajutor în această situație. Organizațiile din aceeași industrie folosesc componente structurale și terminologie similare. În zilele noastre, în majoritatea industriilor, companiile sunt forțate să partajeze date pentru a-și conduce afacerea cu succes.

Modelele de industrie oferite de furnizorii profesioniști sunt cele mai eficiente. Eficiența ridicată a utilizării lor este atinsă datorită unui nivel semnificativ de detaliu și acuratețe a acestor modele. Acestea conțin de obicei multe atribute de date. În plus, creatorii acestor modele nu numai că au o experiență vastă de modelare, dar sunt și bine versați în construirea de modele pentru o anumită industrie.

Modelele de date din industrie oferă companiilor o vizualizare unică și integrată a informațiilor lor de afaceri. Multe companii consideră că este dificil să-și integreze datele, deși aceasta este o condiție prealabilă pentru majoritatea proiectelor la nivel de întreprindere. Potrivit unui studiu realizat de The Data Warehousing Institute (TDWI), peste 69% dintre organizațiile chestionate au considerat că integrarea este o barieră semnificativă în calea adoptării de noi aplicații. Dimpotrivă, implementarea integrării datelor aduce un venit semnificativ companiei.

Modelul de date din industrie, pe lângă conectarea cu sistemele existente, oferă avantaje mari pentru proiecte la nivel de întreprindere, cum ar fi planificarea resurselor întreprinderii (ERP), managementul datelor de bază, business intelligence, îmbunătățirea calității datelor și dezvoltarea angajaților.

Astfel, modelele de date logice ale industriei sunt un instrument eficient pentru integrarea datelor și obținerea unei imagini holistice a afacerii. Utilizarea modelelor logice pare a fi un pas necesar spre crearea depozitelor de date corporative.

Publicaţii

Steve Hoberman. Utilizarea modelului de date logice ale industriei ca model de date de întreprindere
Claudia Imhoff. Urmărirea rapidă a proiectelor de depozitare a datelor și de Business Intelligence prin modelarea inteligentă a datelor

Trimiteți-vă munca bună în baza de cunoștințe este simplu. Utilizați formularul de mai jos

Studenții, studenții absolvenți, tinerii oameni de știință care folosesc baza de cunoștințe în studiile și munca lor vă vor fi foarte recunoscători.

postat pe http://www.allbest.ru/

1. Model de date relaționale

1.1 Model de date relaționale. Definiții de bază
1.2 Operațiuni pe relații

2. Sisteme informatice corporative
Bibliografie

1. Model de date relaționale

1.1 Model de date relaționale. Definiții de bază

În disciplinele matematice, conceptul de „tabel” corespunde conceptului de „relație” (relație). Tabelul reflectă un obiect din lumea reală - o entitate, iar fiecare dintre rândurile sale reflectă o instanță specifică a entității. Fiecare coloană are un nume unic pentru tabel. Șirurile nu au nume, ordinea lor nu este definită și numărul lor nu este limitat logic. Unul dintre principalele avantaje ale modelului de date relaționale este omogenitatea (fiecare rând al unui tabel are un format). Utilizatorul însuși decide dacă entitățile corespunzătoare au omogenitate. Aceasta rezolvă problema adecvării modelului.

Noțiuni de bază:

* O relație este un tabel bidimensional care conține unele date.

* Entitate - un obiect de orice natură, ale cărui date sunt stocate în baza de date. Atribute - proprietăți care caracterizează entitatea (coloane).

* Gradul de relație - numărul de coloane.

* Schemă de relații - o listă de nume de atribute, de exemplu, ANGAJAT (Nr., Nume complet, Anul nașterii, Funcția, Departamentul).

* Domeniu - un set de valori ale atributelor de relație (tip de date).

* Tuplu - rând de masă.

* Cardinalitate (putere) - numărul de rânduri din tabel.

* Cheia primară este un atribut care identifică în mod unic rândurile dintr-o relație. O cheie primară cu atribute multiple se numește cheie compusă. Cheia primară nu poate fi complet sau parțial goală (au o valoare nulă). Cheile care pot fi folosite ca chei primare se numesc chei candidate sau alternative.

* O cheie externă este un atribut(e) al unui tabel care poate servi ca cheie primară a altui tabel. Este o referință la cheia primară a unui alt tabel.

Normalizarea este un proces care vizează reducerea redundanței informațiilor dintr-o bază de date. Pe lângă datele în sine, diferite nume, nume de obiecte și expresii pot fi, de asemenea, normalizate în baza de date.

O bază de date nenormalizată conține informații în unul sau mai multe tabele diferite; acest lucru creează impresia că includerea datelor într-un anumit tabel nu se datorează unor motive aparente. Această stare de lucruri poate avea un impact negativ asupra securității datelor, gestionării spațiului pe disc, vitezei de interogare, eficienței actualizării bazei de date și, poate cel mai important, integrității informațiilor stocate. Baza de date înainte de normalizare este o structură care nu a fost încă împărțită logic în tabele mai mici mai ușor de gestionat.

Forma normală este un fel de indicator al nivelului sau profunzimii normalizării bazei de date. Nivelul de normalizare al unei baze de date corespunde formei normale în care se află.

1.2 Operațiuni pe relații

Pentru a converti un tabel în prima formă normală (1NF), trebuie respectate două reguli:

1. Atomicitate sau indivizibilitate. Fiecare coloană trebuie să conțină o valoare indivizibilă.

2. Tabelul nu trebuie să conțină coloane repetate sau grupuri de date.

De exemplu, dacă un tabel conține adresa completă a unei persoane (stradă, oraș, cod poștal) într-un câmp, acesta nu va respecta regulile 1NF, deoarece va conține diferite valori într-o coloană, care va fi o încălcare a regulii atomicității. Sau dacă baza de date conține date despre filme și are coloanele actor1, actor2, actor3, nu va îndeplini nici regulile, deoarece va exista repetare a datelor.

Normalizarea ar trebui să înceapă cu verificarea structurii bazei de date pentru compatibilitate cu 1NF. Toate coloanele care nu sunt atomice trebuie defalcate în coloanele lor constitutive. Dacă tabelul are coloane duplicate, atunci acestea trebuie să aloce un tabel separat.

Pentru a converti un tabel în prima formă normală:

* Găsiți toate câmpurile care conțin mai multe informații.

* Acele date care pot fi defalcate în părți componente trebuie plasate în câmpuri separate.

* Mutați datele duplicate într-un tabel separat.

* Verificați dacă toate tabelele se încadrează în condițiile primei forme normale.

Pentru a converti tabelele în a doua formă normală (2NF), tabelele rezultate trebuie să fie deja în 1NF. Normalizarea trebuie făcută în ordine.

Acum, în a doua formă normală, condiția trebuie îndeplinită - orice coloană care nu este o cheie (inclusiv cele străine) trebuie să depindă de cheia primară. De obicei, aceste coloane, care au valori care nu depind de cheie, sunt ușor de identificat. Dacă datele conținute într-o coloană nu sunt legate de cheia care descrie rândul, atunci acestea ar trebui separate în propriul lor tabel separat. Cheia primară trebuie returnată la tabelul vechi.

Pentru a converti baza în a doua formă normală:

* Identificați toate coloanele care nu depind direct de cheia primară a acestui tabel.

* Creați câmpurile necesare în tabelele de utilizatori și forumuri, selectați dintre câmpurile existente sau creați chei primare din altele noi.

* Fiecare tabel are nevoie de propria sa cheie primară

* Creați chei străine și denotați relațiile lor între tabele. Pasul final al normalizării la 2NF va fi alocarea cheilor externe pentru asociere cu tabelele asociate. Cheia primară a unui tabel trebuie să fie o cheie străină în alta.

Sugestii:

O altă modalitate de a realiza o schemă 2NF este să te uiți la relațiile dintre tabele. Opțiunea ideală este crearea tuturor relațiilor unu-la-mai multe. Relațiile de la mulți la mulți trebuie restructurate.

Un tabel normalizat corect nu va avea niciodată rânduri duplicat (două sau mai multe rânduri ale căror valori nu sunt chei și conțin aceleași date).

O bază de date va fi în a treia formă normală dacă este turnată la a doua formă normală și fiecare coloană fără cheie este independentă una de cealaltă. Dacă procesul de normalizare este urmat corect până în acest moment, este posibil să nu existe probleme cu reducerea la 3NF. Trebuie să știți că 3NF este încălcat dacă o modificare a unei valori într-o coloană necesită o modificare în altă coloană.

Pentru a converti baza în a treia formă normală:

* Stabiliți în ce câmpuri dintre care tabele există o interdependență, de ex. domenii care depind mai mult unul de celălalt decât de serie în ansamblu.

* Creați tabele relevante. Dacă există o coloană problematică la pasul 1, creați tabele separate pentru aceasta.

* Creați sau alocați chei primare. Fiecare tabel trebuie să aibă o cheie primară.

* Creați cheile străine necesare care formează oricare dintre relații.

În a patra formă normală, o regulă suplimentară este excluderea dependențelor cu mai multe valori. Cu alte cuvinte, toate rândurile de tabel trebuie să fie independente unele de altele. Prezența unui rând X nu ar trebui să însemne că și rândul Y este undeva în acest tabel.

2. Sisteme informatice corporative

sistem de date model relațional

Un sistem (din grecescul systema - un întreg, o legătură alcătuită din părți) este un ansamblu de elemente care interacționează între ele, formând o anumită integritate, unitate. Iată câteva concepte care sunt adesea folosite pentru a caracteriza un sistem.

1. Element al sistemului -- o parte a sistemului care are un scop funcțional specific. Elementele complexe ale sistemelor, constând la rândul lor din elemente mai simple interconectate, sunt adesea numite subsisteme.

2. Organizarea sistemului - ordine interioară, consistență în interacțiunea elementelor sistemului, care se manifestă, în special, prin limitarea diversității stărilor elementelor din cadrul sistemului.

3. Structura sistemului - compoziția, ordinea și principiile de interacțiune a elementelor sistemului, care determină proprietățile de bază ale sistemului. Dacă elementele individuale ale sistemului sunt distanțate la diferite niveluri și legăturile interne dintre elemente sunt organizate doar de la niveluri superioare la nivele inferioare și invers, atunci ele vorbesc despre o structură ierarhică a sistemului. Structurile pur ierarhice sunt practic rare, prin urmare, extinzând oarecum acest concept, o structură ierarhică este de obicei înțeleasă ca fiind astfel de structuri în care, printre alte conexiuni, conexiunile ierarhice sunt de o importanță capitală.

4. Arhitectura sistemului -- un set de proprietăți de sistem care sunt esențiale pentru utilizator.

5. Integritatea sistemului - ireductibilitatea fundamentală a proprietăților sistemului la suma proprietăților elementelor sale individuale (apariția proprietăților) și, în același timp, dependența proprietăților fiecărui element de el. locul și funcția în cadrul sistemului.

Un sistem informatic este un ansamblu interconectat de mijloace, metode și personal utilizat pentru stocarea, procesarea și emiterea de informații în vederea atingerii scopului.”

Legea federală „Cu privire la informații, informatizare și protecția informațiilor” oferă următoarea definiție:

„Sistemul informațional este un set organizat de documente (matrice de documente) și tehnologii informaționale, inclusiv utilizarea tehnologiei informatice și a instrumentelor de comunicare care implementează procesele informaționale”

Clasificare la scară

După scară, sistemele informaționale sunt împărțite în următoarele grupe:

* singur;

* grup;

* corporative.

Un sistem informatic corporativ este un sistem scalabil conceput pentru automatizarea complexă a tuturor tipurilor de activități economice ale întreprinderilor mari și mijlocii, inclusiv corporațiilor formate dintr-un grup de companii care necesită un management unificat.

Un sistem informatic corporativ poate fi considerat un sistem care automatizează mai mult de 80% din diviziile companiei.

Recent, în multe publicații dedicate utilizării tehnologiilor informaționale în managementul obiectelor economice, este adesea folosit termenul „sisteme informaționale corporative”, care se referă la sistemele informatice automatizate propriu-zise ale obiectelor economice.

Un sistem informatic automatizat (AIS) este o combinație de diverse tipuri de suport, precum și specialiști menționați pentru a automatiza procesarea informațiilor contabile și analitice. Tipurile de suport din punct de vedere al compoziției sunt, de regulă, omogene pentru diferite sisteme, ceea ce face posibilă implementarea principiului compatibilității sistemelor în timpul funcționării lor. În procesul de studiere a AIS ca sistem complex, este necesar să se evidențieze părțile și elementele individuale și să se ia în considerare caracteristicile utilizării lor în etapele de creare și operare.

Sistemele informaționale ale întreprinderilor sunt o evoluție a sistemelor pentru grupuri de lucru, sunt concentrate pe companii mari și pot suporta noduri sau rețele dispersate geografic. Practic, au o structură ierarhică de mai multe niveluri. Astfel de sisteme se caracterizează printr-o arhitectură client-server cu specializarea serverelor sau o arhitectură pe mai multe niveluri. La dezvoltarea unor astfel de sisteme, pot fi utilizate aceleași servere de baze de date ca și la dezvoltarea sistemelor de informații de grup. Cu toate acestea, în sistemele informatice mari, cele mai utilizate servere sunt Oracle, DB2 și Microsoft SQL Server.

Pentru sistemele de grup și corporative, cerințele pentru fiabilitatea funcționării și siguranța datelor sunt semnificativ crescute. Aceste proprietăți sunt furnizate prin menținerea integrității datelor, legăturilor și tranzacțiilor în serverele de baze de date.

Clasificarea după sfera de aplicare

În funcție de domeniul de aplicare al sistemelor informaționale sunt de obicei împărțite în patru grupuri:

* sisteme de procesare a tranzacțiilor;

* sisteme decizionale;

* sisteme informatice si de referinta;

* sisteme informatice de birou.

Bibliografie

1. Agaltsov, V.P. Bază de date. În 2 volume.V. 2. Baze de date distribuite și la distanță: Manual / V.P. Agaltsov. - M.: ID FORUM, SIC INFRA-M, 2013.

2. Golitsyna, O.L. Baze de date: Manual / O.L. Golitsyna, N.V. Maksimov, I.I. Popov. - M.: Forum, 2012.

3. Karpova, I.P. Baze de date: Manual / I.P. Karpov. - Sankt Petersburg: Peter, 2013.

4. Kirillov, V.V. Introducere în bazele de date relaționale.Introducere în bazele de date relaționale / V.V. Kirillov, G.Yu. Gromov. - Sankt Petersburg: BHV-Petersburg, 2012.

5. Pirogov, V.Yu. Sisteme informatice si baze de date: organizare si proiectare: Manual / V.Yu. Pirogov. - Sankt Petersburg: BHV-Petersburg, 2009.

6. G.N. Fedorov. Sisteme de informare. - M.: Academia, 2013.

7. A.E. Satunina, L.A. Sysoev. Management de proiect al sistemului informatic corporativ al întreprinderii. - M.: Finanțe și statistică, Infra-M, 2009.

Găzduit pe Allbest.ru

...

Documente similare

Esența și caracteristicile tipurilor de modele de date: ierarhice, de rețea și relaționale. Concepte de bază ale modelului de date relaționale. Atribute, schema relației bazei de date. Condiții de integritate a datelor. Relațiile dintre tabele. Idei generale despre modelul de date.

lucrare de termen, adăugată 29.01.2011

Sisteme de informații corporative și baze de date, utilizarea lor pentru îmbunătățirea și depanarea afacerii. Clasificarea sistemelor informatice corporative. Sisteme informatice din clasa OLTP. Prelucrare analitică operațională.

lucrare de termen, adăugată 19.01.2011

Baze de date cu fișiere bidimensionale și sisteme de management al bazelor de date relaționale (DBMS). Crearea unei baze de date și procesarea interogărilor către acestea folosind un SGBD. Tipuri de bază de baze de date. Concepte de bază ale bazelor de date relaționale. Proprietățile fundamentale ale relațiilor.

rezumat, adăugat 20.12.2010

Conceptul de sistem de baze de date. Modelul relațional și caracteristicile acestuia. Integritatea în modelul relațional. Algebră relațională. Probleme de proiectare a bazelor de date. forme normale de relație. Proiectarea unei baze de date folosind metoda entitate-relație. Diagramele ER. Limbajul SQL.

curs de prelegeri, adăugat 03.10.2008

O structură logică specifică a datelor care este stocată într-o bază de date. Modele de date de bază. Elemente ale modelului de date relaționale. Un exemplu de utilizare a cheilor externe. Principalele cerințe pentru relațiile modelului de date relaționale.

prezentare, adaugat 14.10.2013

Baze de date și utilizarea lor în calcul. Caracteristici și unitatea structurală de bază a modelului de date de rețea. Model ierarhic, obiecte de domeniu. Modelul relațional, vizibilitatea acestuia, prezentarea datelor sub formă tabelară.

rezumat, adăugat 19.12.2011

Tipuri și funcții ale sistemului de management al bazelor de date Microsoft Access. Model ierarhic, de rețea, relațional al descrierii bazei de date. Concepte de bază ale unui tabel de bază de date. Caracteristici de creare a obiectelor bazei de date, formulare de bază. Acces la Internet în Access.

lucrare de control, adaugat 01.08.2011

Sisteme moderne de gestionare a bazelor de date (DBMS). Analiza modelului ierarhic de date. Model de date relaționale. Model de date post-relaționale ca model relațional extins care înlătură restricția indivizibilității datelor stocate în înregistrările tabelului.

lucrare stiintifica, adaugata 06.08.2010

Modele de date în managementul bazelor de date. Modele conceptuale de date. Rolul bazelor de date în sistemele informaţionale. Model de date relaționale. Definirea domeniului subiectului. Construirea unui model de bază de date pentru sistemul informațional „Animalele de companie”.

lucrare de termen, adăugată 19.04.2011

Un model de informații în Access ca un substitut simplificat pentru un obiect sau sistem real. Structuri de bază care definesc organizarea datelor și relațiile dintre acestea; tip relațional de organizare a datelor. Un exemplu de bază de date în impozitare.

Zaitsev S.L., Ph.D.

Grupuri repetate

Grupurile care se repetă sunt atribute pentru care o singură instanță de entitate poate avea mai multe valori. De exemplu, o persoană poate avea mai multe abilități. Dacă, în ceea ce privește cerințele de business, trebuie să cunoaștem nivelul de calificare pentru toată lumea și fiecare persoană poate avea doar două aptitudini, putem crea entitatea prezentată în Fig. 1.6. Aici este entitatea O PERSOANA cu două atribute pentru a stoca abilitățile și nivelurile de abilități pentru fiecare.

Orez. 1.6. Acest exemplu folosește grupuri repetate.

Problema cu repetarea grupurilor este că nu putem ști exact câte abilități ar putea avea o persoană. În viața reală, unii oameni au o singură abilitate, alții au mai multe, iar alții nu au încă nici una. Figura 1.7 prezintă modelul redus la prima formă normală. Observați adăugarea ID abilitate , care definește fiecare în mod unic ABILITATE.

Orez. 1.7. Model redus la prima formă normală.

Un fapt într-un singur loc

Dacă același atribut este prezent în mai multe entități și nu este o cheie străină, atunci acel atribut este considerat redundant. Modelul logic nu trebuie să conțină date redundante.

Redundanța necesită spațiu suplimentar, dar în timp ce eficiența memoriei este importantă, adevărata problemă se află în altă parte. Sincronizarea garantată a datelor redundante vine cu o suprasarcină și riscați întotdeauna să creați valori conflictuale.

În exemplul anterior ABILITATE depinde de ID persoana iar din ID abilitate. Asta înseamnă că nu vei avea ABILITATE până când apare O PERSOANA, având această abilitate. De asemenea, este mai dificilă schimbarea numelui aptitudinii. Trebuie să găsiți fiecare intrare Nume abilitate și să o modificați pentru fiecare persoană care deține acea abilitate.

Figura 1.8 prezintă modelul în a doua formă normală. Rețineți că entitatea a fost adăugată ABILITATE, și atribut TITLU competențe transferate acestei entități. Nivelul de calificare a rămas, respectiv, la intersecție PERSOANE și ABILITĂȚI.

Orez. 1.8. În a doua formă normală, grupul care se repetă este mutat într-o altă entitate. Acest lucru oferă flexibilitatea de a adăuga cât mai multe aptitudini este necesar și de a schimba numele sau descrierea aptitudinii într-un singur loc.

Fiecare atribut depinde de o cheie

Fiecare atribut al unei entități trebuie să depindă de cheia primară a acelei entități. În exemplul anterior Numele scoliiși Zona geografica prezente în tabel O PERSOANA dar nu descrie o persoană. Pentru a realiza a treia formă normală, trebuie să mutați atributele în entitate, unde acestea vor depinde de cheie. Figura 1.9. arată modelul în a treia formă normală.

Orez. 1.9. În a treia formă normală Numele scoliiși Regiunea geografică mutat la entitate, unde valorile lor depind de cheie.

Relații multi-la-multe

Relaţie multi-la-multi reflectă realitatea mediului. Rețineți că în Figura 1.9 există o relație multi-la-mulți între PERSOANĂși ŞCOALĂ. Raportul reflectă cu exactitate faptul că O PERSOANA pot studia în multe SCOALILE si in ŞCOALĂ poate invata multe PERSOANĂ. Pentru a obține a patra formă normală, este creată o entitate asociativă care elimină relația monogie-la-mulți prin generarea unei intrări separate pentru fiecare combinație unică de școală și persoană. Figura 1.10 prezintă modelul în a patra formă normală.

Orez. 1.10. În a patra formă normală, relația monogie-la-mulți dintre PERSOANĂși ŞCOALĂ rezolvată prin introducerea unei entități asociative, în care se atribuie o intrare separată pentru fiecare combinație unică SCOALILEși PERSOANE.

Definiții formale ale formelor normale

Următoarele definiții ale formelor normale pot părea intimidante. Gândiți-vă la ele pur și simplu ca la formule pentru atingerea normalizării. Formele normale se bazează pe algebră relațională și pot fi interpretate ca transformări matematice. Deși această carte nu acoperă o discuție detaliată a formelor normale, modelatorii sunt încurajați să aprofundeze subiectul.

Într-o relație dată R, atributul Y este dependent funcțional de atributul X. În mod simbolic, R.X -> R.Y (a se citi „R.X definește funcțional R.Y”) dacă și numai dacă fiecare valoare X din R este asociată cu exact o valoare Y în R ( la orice moment dat). Atributele X și Y pot fi compuse (Date K.J. Introduction to Database Systems. Ediția a 6-a. Ed. Williams: 1999, 848 p.).

O relație R este în prima formă normală (1NF) dacă și numai dacă toate domeniile sale conțin numai valori atomice (Data, ibid.).

O relație R este în a doua formă normală (2NF) dacă și numai dacă este în 1NF și fiecare atribut non-cheie este complet dependent de cheia primară (Data, ibid.).

O relație R este în a treia formă normală (3NF) dacă și numai dacă este în 2NF și fiecare atribut non-cheie nu este dependent tranzitiv de cheia primară (Data, ibid.).

Relația R este în formă normală Boyce-Codd (BCNF) dacă și numai dacă fiecare determinant este candidat pentru utilizare ca cheie.

NOTĂ Mai jos este o scurtă explicație a unora dintre abrevierile utilizate în definițiile date.

MVD (dependență cu mai multe valori) - dependență cu mai multe valori. Folosit numai pentru entitățile cu trei sau mai multe atribute. Într-o dependență cu mai multe valori, valoarea unui atribut depinde doar de o parte a cheii primare.

FD (dependență funcțională) - dependență funcțională. Într-o dependență funcțională, valoarea unui atribut depinde de valoarea unui alt atribut care nu face parte din cheia primară.

JD (dependență de alăturare) - dependență de alăturare. Într-o dependență de îmbinare, cheia primară a entității părinte poate fi urmărită la cel puțin descendenții de nivel al treilea, păstrând în același timp capacitatea de a fi utilizată în îmbinarea cheii originale.

O relație este în a patra formă normală (4NF) dacă și numai dacă există un MVD în R, cum ar fi A®®B. În acest caz, toate atributele lui R sunt dependente funcțional de A. Cu alte cuvinte, numai dependențele (FD sau MVD) de forma K®X sunt prezente în R (adică, dependența funcțională a atributului X de candidatul pentru utilizare). ca cheie K). În consecință, R îndeplinește cerințele 4NF dacă respectă BCNF și toate MVD-urile sunt de fapt FD (Date, ibid.).

Pentru a cincea formă normală, relația R satisface relația de unire (JD)*(X, Y, …, Z) dacă și numai dacă R este echivalent cu proiecțiile sale pe X, Y,..., Z, unde X, Y,..., Z submulțimi ale setului de atribute R.

Există multe alte forme normale pentru tipuri de date complexe și situații specifice care depășesc scopul discuției noastre. Fiecare entuziast al dezvoltării modelelor ar dori să exploreze alte forme normale.

Forme normale de afaceri

În cartea sa, Clive Finklestein (Finklestein Cl. An Introduction to Information Engineering: From Strategic Planning to Information Systems. Reading, Massachusetts: Addison-Wesley, 1989) a adoptat o abordare diferită a normalizării. Acesta definește forme normale de afaceri în termeni de reduceri la aceste forme. Mulți modelatori consideră că această abordare este mai intuitivă și mai pragmatică.

First Business Normal Form (1BNF) mapează grupuri care se repetă la o altă entitate. Această entitate primește propriul nume și atributele cheie primare (compozite) de la entitatea originală și de la grupul său care se repetă.

Second Business Normal Form (2BNF) mapează atribute care depind parțial de o cheie primară către o altă entitate. Cheia primară (compozită) a acestei entități este cheia primară a entității în care a locuit inițial, împreună cu cheile suplimentare de care atributul este complet dependent.

A treia formă normală de afaceri (3BNF) mută atributele care nu depind de cheia primară către o altă entitate, unde sunt complet dependente de cheia primară a acestei entități.

Forma a patra Business Normal Form (4BNF) mapează atributele care depind de valoarea cheii primare sau sunt opționale pentru o entitate secundară, unde depind în întregime de valoarea cheii primare sau unde trebuie (obligatoriu) să fie prezente în acea entitate. .

Fifth Business Normal Form (5BNF) apare ca o entitate structurală dacă există o dependență recursivă sau de altă natură între instanțe ale unei entități secundare sau dacă există o dependență recursivă între instanțe ale entității sale primare.

Model de date logic finalizat

Modelul logic completat trebuie să satisfacă cerințele celei de-a treia forme normale de afaceri și să includă toate entitățile, atributele și relațiile necesare pentru a susține cerințele de date și regulile de afaceri asociate datelor.

Toate entitățile trebuie să aibă nume care descriu conținutul și o descriere sau definiție clară, concisă, completă. Într-una dintre următoarele publicații, va fi luat în considerare un set inițial de recomandări pentru formarea corectă a numelor și descrierilor entităților.

Relațiile ar trebui să includă o construcție a verbului care descrie relația dintre entități, împreună cu caracteristici precum pluralitatea, nevoia de existență sau posibilitatea de inexistență a relației.

NOTĂ Multitudine relațiile descrie numărul maxim de instanțe de entitate secundară care pot fi asociate cu o instanță a entității originale.Nevoia de existență sauposibilitatea de absență relația este utilizată pentru a defini numărul minim de instanțe ale unei entități secundare care pot fi asociate cu o instanță a entității originale.

Model de date fizice

După crearea unui model logic complet și adecvat, sunteți gata să luați o decizie cu privire la alegerea platformei de implementare. Alegerea platformei depinde de cerințele de utilizare a datelor și de principiile strategice ale arhitecturii organizației. Selectarea platformei este o problemă complexă care depășește scopul acestei cărți.

În ERwin, modelul fizic este o reprezentare grafică a bazei de date actuale. Baza de date fizică va consta din tabele, coloane și relații. Modelul fizic depinde de platforma aleasă pentru implementare și de cerințele de utilizare a datelor. Modelul fizic pentru IMS va fi foarte diferit de același model pentru Sybase. Modelul fizic pentru rapoartele OLAP va arăta diferit de modelul pentru OLTP (Online Transaction Processing).

Modelatorul de date și administratorul bazei de date (DBA) utilizează modelul logic, cerințele de utilizare și principiile strategice ale arhitecturii corporative pentru a dezvolta modelul fizic de date. Puteți denormaliza modelul fizic pentru a îmbunătăți performanța și puteți crea vizualizări pentru a susține cerințele de utilizare. Următoarele secțiuni detaliază procesul de denormalizare și crearea vizualizării.

Această secțiune oferă o privire de ansamblu asupra procesului de construire a unui model fizic, colectarea cerințelor pentru utilizarea datelor, definirea componentelor unui model fizic și inginerie inversă. Aceste probleme vor fi tratate mai detaliat în publicațiile viitoare.

Colectarea cerințelor de utilizare a datelor

De obicei, colectați cerințele de utilizare a datelor devreme în timpul interviurilor și sesiunilor de lucru. În același timp, cerințele ar trebui să definească utilizarea datelor de către utilizator cât mai complet posibil. Atitudinea superficială și lacunele în modelul fizic pot duce la costuri neplanificate și pot întârzia proiectul. Cerințele de utilizare includ:

Cerințe de acces și performanță

Caracteristici volumetrice (o estimare a cantității de date de stocat), care permit administratorului să reprezinte volumul fizic al bazei de date

O estimare a numărului de utilizatori care trebuie să acceseze date simultan, care vă ajută să vă proiectați baza de date pentru un nivel acceptabil de performanță

Rezumat, rezumat și alte date calculate sau derivate care pot fi considerate candidate pentru stocarea în structuri de date durabile

Cerințe pentru generarea de rapoarte și interogări standard pentru a ajuta administratorul bazei de date să construiască indecși

Vizualizări (permanente sau virtuale) care vor ajuta utilizatorul în efectuarea operațiunilor de îmbinare sau filtrare a datelor.

Pe lângă președinte, secretar și utilizatori, sesiunea de cerințe de utilizare ar trebui să includă modelatorul, administratorul bazei de date și arhitectul bazei de date. Ar trebui discutate cerințele utilizatorilor pentru datele istorice. Durata de stocare a datelor are un impact semnificativ asupra dimensiunii bazei de date. Adesea, datele mai vechi sunt stocate în formă agregată, iar datele atomice sunt arhivate sau șterse.

Utilizatorii ar trebui să aducă eșantion de interogări și rapoarte cu ei la sesiune. Rapoartele trebuie să fie strict definite și trebuie să includă valorile atomice utilizate pentru orice câmpuri de rezumat și rezumat.

Componentele modelului fizic de date

Componentele modelului fizic de date sunt tabele, coloanele și relațiile. Este posibil ca entitățile din modelul logic să devină tabele în modelul fizic. Atributele booleene vor deveni coloane. Relațiile logice vor deveni constrângeri asupra integrității relațiilor. Unele relații logice nu pot fi implementate într-o bază de date fizică.

Inginerie inversă

Când modelul logic nu este disponibil, devine necesară recrearea modelului din baza de date existentă. La ERwin, acest proces se numește inginerie inversă. Ingineria inversă se poate face în mai multe moduri. Modelatorul poate explora structurile de date din baza de date și poate recrea tabelele într-un mediu de modelare vizuală. Puteți importa un limbaj de definire a datelor (DDL) într-un instrument care acceptă inginerie inversă (de exemplu, Erwin). Instrumentele avansate precum ERwin includ funcții care asigură comunicarea ODBC cu o bază de date existentă pentru a crea un model prin citirea directă a structurilor de date. Inginerie inversă folosind ERwin va fi discutată în detaliu într-o publicație viitoare.

Utilizarea limitelor funcționale corporative

Atunci când construiește un model logic, este important ca modelatorul să se asigure că noul model se potrivește cu modelul întreprinderii. Utilizarea limitelor funcționale ale corporației înseamnă modelarea datelor în termeni utilizați în cadrul unei corporații. Modul în care sunt utilizate datele într-o corporație se schimbă mai repede decât datele în sine. În fiecare model logic, datele trebuie să fie reprezentate holistic, indiferent de domeniul de afaceri pe care îl suportă. Entitățile, atributele și relațiile ar trebui să definească regulile de afaceri la nivel corporativ.

NOTĂ Unii dintre colegii mei se referă la aceste limite funcționale corporative ca modelare în lumea reală. Modelarea în lumea reală încurajează modelatorul să vadă informațiile în ceea ce privește relațiile și relațiile din viața reală.

Utilizarea limitelor funcționale corporative pentru un model de date corect construit oferă un cadru pentru a sprijini nevoile de informații ale oricărui număr de procese și aplicații, permițând unei corporații să exploateze mai eficient unul dintre activele sale cele mai valoroase, informațiile.

Ce este un model de date de întreprindere?

Model de date pentru întreprinderi (EDM) conține entități, atribute și relații care reprezintă nevoile de informații ale unei corporații. EDM este de obicei subdivizat în domenii, care reprezintă grupuri de entități legate de susținerea nevoilor specifice de afaceri. Unele domenii pot acoperi anumite funcții de afaceri, cum ar fi managementul contractelor, altele pot grupa entități care descriu produse sau servicii.

Fiecare model logic trebuie să corespundă unui domeniu existent de model de date de întreprindere. Dacă modelul logic nu îndeplinește această cerință, trebuie adăugat la el un model care definește domeniul de studiu. Această comparație asigură că modelul corporativ este îmbunătățit sau ajustat și că toate eforturile de modelare logică sunt coordonate în cadrul corporației.

EDM include, de asemenea, entități specifice care definesc domeniul de aplicare al valorilor pentru atributele cheie. Aceste entități nu au părinți și sunt definite ca independente. Entitățile independente sunt adesea folosite pentru a menține integritatea relațiilor. Aceste entități sunt identificate prin mai multe nume diferite, cum ar fi tabele de coduri, tabele de legături, tabele de tipuri sau tabele de clasificare. Vom folosi termenul „obiect corporativ de afaceri”. Un obiect de afaceri al întreprinderii este o entitate care conține un set de valori ale atributelor care sunt independente de orice altă entitate. Obiectele de afaceri ale întreprinderii din cadrul unei corporații ar trebui utilizate în mod consecvent.

Construirea unui model de date pentru întreprinderi prin scalare

Există organizații în care modelul corporativ de la început până la sfârșit a fost construit ca urmare a unui singur efort concertat. Pe de altă parte, majoritatea organizațiilor construiesc modele de întreprindere destul de complete prin construirea.

Creșterea înseamnă construirea a ceva, strat cu strat, așa cum o stridie crește o perlă. Fiecare model de date creat oferă input pentru formarea EDM. Construirea unui EDM în acest fel necesită pași suplimentari de modelare pentru a adăuga noi structuri de date și domenii sau pentru a extinde structurile de date existente. Acest lucru face posibilă construirea unui model de date de întreprindere prin construirea, adăugând în mod iterativ niveluri de detaliu și rafinament.

Conceptul de metodologie de modelare

Există mai multe metodologii pentru modelarea datelor vizuale. ERwin acceptă două:

IDEF1X (Integration Definition for Information Modeling - descrierea integrată a modelelor informaționale).

IE (Ingineria Informației - ingineria informațiilor).

IDEF1X este o metodologie bună și notația sa este utilizată pe scară largă

Descrierea integrată a modelelor informaționale

IDEF1X este o metodologie de modelare a datelor foarte structurată care extinde metodologia IDEF1 adoptată ca standard FIPS (Standarde federale de procesare a informațiilor). IDEF1X folosește un set foarte structurat de tipuri de constructe de modelare și are ca rezultat un model de date care necesită o înțelegere a naturii fizice a datelor înainte ca astfel de informații să poată fi puse la dispoziție.

Structura rigidă a IDEF1X forțează modelatorul să atribuie caracteristici entităților care ar putea să nu corespundă realităților lumii din jurul lor. De exemplu, IDEF1X necesită ca toate subtipurile de entități să fie exclusive. Acest lucru duce la faptul că o persoană nu poate fi atât client, cât și angajat. În timp ce practica reală ne spune altceva.

Ingineria informației

Clive Finklestein este adesea numit părintele ingineriei informaționale, deși James Martin a împărtășit concepte similare cu el (Martin, James. Managing the Database Environment. Upper Saddle River, New Jersey: Prentice Hall, 1983.). Ingineria informației folosește o abordare bazată pe afaceri pentru a gestiona informațiile și folosește o notație diferită pentru a reprezenta regulile de afaceri. IE servește ca extensie și dezvoltare a notării și conceptelor de bază ale metodologiei ER propuse de Peter Chen.

IE oferă infrastructura pentru a susține cerințele de informații prin integrarea planificării strategice corporative cu sistemele informaționale în curs de dezvoltare. O astfel de integrare face posibilă legarea mai strânsă a managementului resurselor informaționale cu perspectivele strategice pe termen lung ale corporației. Această abordare bazată pe afaceri îi determină pe mulți modelatori să aleagă IE față de alte metodologii care se concentrează în primul rând pe rezolvarea problemelor imediate de dezvoltare.

IE oferă un flux de lucru care conduce o corporație să identifice toate nevoile sale de informații pentru a colecta și gestiona date și pentru a identifica relațiile dintre obiectele informaționale. Ca urmare, cerințele de informare sunt articulate pe baza directivelor de management și pot fi direct traduse într-un sistem informațional de management care va sprijini nevoile strategice de informații.

Concluzie

Înțelegerea modului de utilizare a unui instrument de modelare a datelor precum ERwin este doar o parte a problemei. În plus, trebuie să înțelegeți când sunt efectuate sarcinile de modelare a datelor și cum sunt colectate cerințele de informații și regulile de afaceri pentru a fi reprezentate în modelul de date. Desfășurarea sesiunilor de lucru oferă cele mai favorabile condiții pentru colectarea cerințelor de informații într-un mediu care include experți în domeniu, utilizatori și specialiști în tehnologia informației.

Construirea unui model de date bun necesită analiza și cercetarea cerințelor de informații și a regulilor de afaceri colectate în timpul sesiunilor de lucru și interviurilor. Modelul de date rezultat ar trebui comparat cu modelul de întreprindere, dacă este posibil, pentru a se asigura că nu intră în conflict cu modelele de obiecte existente și include toate obiectele necesare.

Modelul de date constă din modele logice și fizice reprezentând cerințele de informații și regulile de afaceri. Modelul logic trebuie redus la a treia formă normală. A treia formă normală limitează, adaugă, actualizează și elimină anomaliile structurii datelor pentru a sprijini principiul „un fapt, un loc”. Cerințele de informații colectate și regulile de afaceri ar trebui analizate și cercetate. Acestea trebuie comparate cu modelul de întreprindere pentru a se asigura că nu intră în conflict cu modelele de obiecte existente și că includ toate obiectele necesare.

În ERwin, modelul de date include atât modele logice, cât și modele fizice. ERwin implementează abordarea ER și vă permite să creați obiecte model logic și fizic pentru a reprezenta cerințele de informații și regulile de afaceri. Obiectele modelului logic includ entități, atribute și relații. Obiectele modelului fizic includ tabele, coloane și constrângeri de integritate a relațiilor.

Într-una din publicațiile următoare, vor fi luate în considerare problemele de identificare a entităților, determinarea tipurilor de entități, alegerea numelor și descrierilor entităților, precum și câteva trucuri pentru evitarea celor mai frecvente erori de modelare asociate cu utilizarea entităților.

Entitățile trebuie să aibă un set complet de atribute, astfel încât fiecare fapt despre fiecare entitate să poată fi reprezentat prin atributele sale. Fiecare atribut trebuie să aibă un nume care să reflecte valorile sale, un tip de date boolean și o descriere sau definiție clară, scurtă și completă. Într-una dintre următoarele publicații, vom lua în considerare setul inițial de recomandări pentru formarea corectă a numelor și descrierilor atributelor. Relațiile ar trebui să includă o construcție a verbului care descrie relația dintre entități, împreună cu caracteristici precum pluralitatea, nevoia de existență sau posibilitatea de inexistență a relației.

NOTĂ Multitudine relațiile descrie numărul maxim de instanțe de entitate secundară care pot fi asociate cu o instanță a entității originale.Necesitatea existenței sau posibilitatea absenței relația este utilizată pentru a determina numărul minim de instanțe ale unei entități secundare care pot fi asociate cu o instanță a originalului

Baza de date corporativă este legătura centrală a sistemului informațional corporativ și vă permite să creați un singur spațiu de informații corporative. Baze de date corporative

Distribuiți munca pe rețelele sociale

Dacă această lucrare nu vă convine, există o listă de lucrări similare în partea de jos a paginii. De asemenea, puteți utiliza butonul de căutare

Pagina 15

TEMA V BAZELE DE DATE CORPORATE

PRELEZA 8

V .unu. Organizarea datelor în sistemele corporative. Baze de date corporative.

V .2. SGBD și soluții structurale în sistemele corporative.

V.3. Tehnologii Internet/Intranet și soluții de acces la baze de date corporative.

V .unu. ORGANIZAREA DATELOR ÎN SISTEME CORPORATIVE. BAZELE DE DATE CORPORATE

Baza corporativădatele reprezintă legătura centrală a sistemului informațional corporativ și vă permit să creați un singur spațiu de informații al corporației. Baze de date corporative (Figura 1.1).

Există diferite definiții ale bazelor de date.

În baza de date (DB)înțelege un set de informații legate logic în așa fel încât să constituie un singur set de date stocate în dispozitivele de stocare ale unui computer. Acest set acționează ca date inițiale ale sarcinilor rezolvate în procesul de funcționare a sistemelor automate de control, a sistemelor de prelucrare a datelor, a sistemelor informatice și de calcul.

Puteți formula pe scurt termenul bază de date ca o colecție de date legate logic destinate partajării.

Sub baza de datese referă la o colecție de date stocate împreună cu redundanță minimă, astfel încât să poată fi utilizate în mod optim pentru una sau mai multe aplicații.

Scopul creării bazelor de dateca formă de stocare a datelor construirea unui sistem de date care nu depinde de algoritmii (software) adoptați, mijloacele tehnice folosite, locația fizică a datelor în calculator. Baza de date presupune o utilizare multifuncțională (mai mulți utilizatori, multe forme de documente și interogări ale unui singur utilizator).

Cerințe de bază pentru baze de date:

Completitudinea prezentării datelor. Datele din baza de date ar trebui să reprezinte în mod adecvat toate informațiile despre obiect și ar trebui să fie suficiente pentru ODS.
Integritatea bazei de date. Datele trebuie păstrate în timpul prelucrării ODS-ului lor și în orice situații care apar în timpul muncii.
Flexibilitatea structurii datelor. Baza de date ar trebui să permită modificarea structurilor de date fără a-i încălca integritatea și integralitatea atunci când condițiile externe se schimbă.
Realizabilitate. Aceasta înseamnă că trebuie să existe o reprezentare obiectivă a diferitelor obiecte, proprietățile și relațiile acestora.
Disponibilitate. Este necesar să se asigure diferențierea accesului la date.
redundanţă. Baza de date ar trebui să aibă redundanță minimă în reprezentarea datelor despre orice obiect.

Cunoașterea este înțeleasăun set de fapte, modele și reguli euristice cu ajutorul cărora puteți rezolva problema.

Baza de cunoștințe (KB)  colectare de baze de date și reguli utilizate, primite de la factorii de decizie. Baza de cunoștințe este un element al sistemelor expert.

ar trebui să se distingămoduri diferite de prezentare a datelor.

Date fiziceAcestea sunt date stocate în memoria computerului.

Reprezentarea logică a datelorcorespunde reprezentării datelor fizice de către utilizator. Diferența dintre o reprezentare fizică și o reprezentare logică corespunzătoare a datelor este că aceasta din urmă reflectă unele relații importante între datele fizice.

Sub baza de date corporativăsă înțeleagă o bază de date care combină într-o formă sau alta toate datele și cunoștințele necesare despre o organizație automatizată. În sistemele informaționale corporative, un astfel de concept cabaze de date integrate, în care este implementat principiul intrării unice și utilizării multiple a informațiilor.

Orez. 1.1. Structura interacțiunii departamentelor cu resursele informaționale ale corporației.

Bazele de date corporative suntconcentrat (centralizat) și distribuite .

Concentrat (centralizat) Bază de date este o bază de date ale cărei date sunt stocate fizic în dispozitivele de stocare ale unui computer. Pe fig. 1.2 prezintă o diagramă a unei aplicații server pentru accesarea bazelor de date pe diverse platforme.

Fig.1.2. Diagrama unui eterogen baza de date centralizata

Centralizarea procesării informațiilor a făcut posibilă eliminarea unor astfel de deficiențe ale sistemelor de fișiere tradiționale precum incoerența, inconsecvența și redundanța datelor. Cu toate acestea, pe măsură ce bazele de date cresc, și mai ales atunci când sunt utilizate în organizații dispersate geografic, apar probleme. De exemplu, pentru bazele de date concentrate situate într-un nod al rețelei de telecomunicații, prin care diverse departamente ale unei organizații accesează date, cu o creștere a volumului de informații și a numărului de tranzacții, apar următoarele dificultăți:

Flux mare de schimb de date;
Trafic mare de rețea;
Fiabilitate scăzută;
Performanță generală scăzută.

Deși este mai ușor să se asigure securitatea, integritatea și consistența informațiilor în timpul actualizărilor într-o bază de date concentrată, aceste probleme creează anumite dificultăți. Descentralizarea datelor este propusă ca o posibilă soluție la aceste probleme. Descentralizarea realizează:

Grad mai mare de simultaneitate a procesării datorită partajării sarcinii;
Îmbunătățirea utilizării datelor în teren atunci când se efectuează interogări la distanță (la distanță);
costuri mai mici;
Ușor de gestionat bazele de date locale.

Costurile creării unei rețele cu stații de lucru (calculatoare mici) la nodurile sale sunt mult mai mici decât costurile creării unui sistem similar folosind un mainframe. Figura 1.3 prezintă o diagramă logică a unei baze de date distribuite.

Fig.1.3. Baza de date corporativă distribuită.

Oferim următoarea definiție a unei baze de date distribuite.

Baza de date distribuita -aceasta este o colecție de informații, fișiere (relații) stocate în diferite noduri ale rețelei informaționale și legate logic în așa fel încât să constituie un singur set de date (legatura poate fi funcțională sau prin copii ale aceluiași fișier). Astfel, este un set de baze de date care sunt interconectate logic, dar situate fizic pe mai multe mașini care fac parte din aceeași rețea de calculatoare.

Cele mai importante cerințe pentru caracteristicile unei baze de date distribuite sunt următoarele:

Scalabilitate;
Compatibilitate;
Suport pentru diverse modele de date;
portabilitate;
Transparența locației;
Autonomia nodurilor bazei de date distribuite (Site Autonomy);
Procesarea cererilor distribuite;
Executarea tranzactiilor distribuite.
Sprijin pentru un sistem de securitate omogen.

Transparența locației permite utilizatorilor să lucreze cu baze de date fără să știe nimic despre locația lor. Autonomia nodurilor bazei de date distribuite înseamnă că fiecare bază de date poate fi menținută independent de celelalte. O interogare distribuită este o interogare (instrucțiune SQL) în timpul căreia are loc accesul la obiecte (tabele sau vizualizări) din diferite baze de date. La executarea tranzacțiilor distribuite, controlul concurenței este exercitat asupra tuturor bazelor de date implicate. Oracle7 folosește tehnologia de transfer de informații în două faze pentru a efectua tranzacții distribuite.

Bazele de date care alcătuiesc o bază de date distribuită nu trebuie să fie omogene (adică să fie rulate de același DBMS) sau să ruleze pe același mediu de sistem de operare și/sau pe același tip de computere. De exemplu, o bază de date ar putea fi o bază de date Oracle pe un computer SUN care rulează SUN OS (UNIX), o a doua bază de date ar putea fi rulată de un DBMS DB2 pe un mainframe IBM 3090 care rulează un sistem de operare MVS și o a treia bază de date ar putea fi rulată de un DBMS SQL/DS tot pe mainframe IBM, dar cu un sistem de operare VM. O singură condiție este obligatorie - toate mașinile cu baze de date trebuie să fie accesibile prin rețeaua din care fac parte.

Sarcina principală a unei baze de date distribuitedistribuirea datelor prin rețea și asigurarea accesului la aceasta. Există următoarele moduri de a rezolva această problemă:

Fiecare nod stochează și folosește propriul set de date care este disponibil pentru interogări la distanță. Această distribuție este împărțită.
Unele date care sunt utilizate frecvent pe site-uri la distanță pot fi duplicate. O astfel de distribuție se numește parțial duplicat.
Toate datele sunt duplicate în fiecare nod. O astfel de distribuție se numește complet redundantă.
Unele fișiere pot fi împărțite orizontal (este selectat un subset de înregistrări) sau vertical (este selectat un subset de câmpuri de atribute), în timp ce subseturile împărțite sunt stocate în noduri diferite împreună cu datele nedivizate. O astfel de distribuție se numește split (fragmentat).

Când creați o bază de date distribuită la nivel conceptual, trebuie să rezolvați următoarele sarcini:

Este necesar să existe o singură schemă conceptuală pentru întreaga rețea. Acest lucru va oferi utilizatorului transparență logică a datelor, în urma căreia acesta va putea forma o cerere către întreaga bază de date, aflându-se la un terminal separat (funcționează, parcă, cu o bază de date centralizată).
Este necesară o schemă pentru a localiza datele în rețea. Acest lucru va oferi transparență în plasarea datelor, astfel încât utilizatorul să nu fie nevoit să specifice unde să trimită cererea pentru a obține datele necesare.
Este necesar să se rezolve problema eterogenității bazelor de date distribuite. Bazele de date distribuite pot fi omogene sau eterogene din punct de vedere hardware și software. Problema eterogenității este relativ ușor de rezolvat dacă baza de date distribuită este eterogenă din punct de vedere hardware, dar omogenă din punct de vedere software (același DBMS în noduri). Dacă sunt utilizate diferite SGBD în nodurile unui sistem distribuit, sunt necesare mijloace de conversie a structurilor de date și a limbilor. Acest lucru ar trebui să ofere transparență a transformării în nodurile de baze de date distribuite.
Este necesar să se rezolve problema gestionării dicționarelor. Pentru a oferi tot felul de transparență într-o bază de date distribuită, sunt necesare programe care gestionează numeroase dicționare și cărți de referință.
Este necesar să se definească metode de executare a interogărilor într-o bază de date distribuită. Metodele de executare a interogărilor într-o bază de date distribuită diferă de metodele similare din bazele de date centralizate, deoarece părțile individuale ale interogărilor trebuie executate la locația datelor corespunzătoare și rezultatele parțiale trebuie transmise către alte noduri; în același timp, trebuie asigurată coordonarea tuturor proceselor.
Este necesar să se rezolve problema executării paralele a interogărilor. Într-o bază de date distribuită este nevoie de un mecanism complex de gestionare a prelucrărilor concurente, care, în special, trebuie să asigure sincronizarea la actualizarea informațiilor, ceea ce garantează consistența datelor.
Necesitatea unei metodologii dezvoltate pentru distribuirea și plasarea datelor, inclusiv împărțirea, este una dintre cerințele principale pentru o bază de date distribuită.

Una dintre noile domenii în curs de dezvoltare ale arhitecturii sistemelor informatice, care este un instrument puternic pentru procesarea informațiilor nenumerice, estemașini de baze de date. Mașinile de baze de date sunt folosite pentru a rezolva sarcini non-numerice, cum ar fi stocarea, căutarea și transformarea documentelor și faptelor, lucrul cu obiecte. În urma definirii datelor ca informații digitale și grafice despre obiectele lumii înconjurătoare, în conceptul de date este încorporat conținut diferit în procesarea numerică și nenumerică. Procesarea numerică utilizează obiecte precum variabile, vectori, matrice, matrice multidimensionale, constante și așa mai departe, în timp ce procesarea non-numerică utilizează obiecte precum fișiere, înregistrări, câmpuri, ierarhii, rețele, relații și așa mai departe. este preocupat direct de informații despre obiecte (de exemplu, un anumit angajat sau grup de angajați), și nu fișierul angajatului în sine. Nu indexează fișierul angajatului pentru a selecta o anumită persoană; aici mai interesat de conținutul înregistrării dorite. Volume uriașe de informații sunt de obicei supuse unei prelucrări nenumerice. În diverse aplicații, astfel de operațiuni pot fi efectuate pe aceste date, de exemplu:

creșterea salariului tuturor angajaților companiei;
calculează dobânda bancară pe conturile tuturor clienților;
efectuați modificări în lista tuturor mărfurilor din stoc;
găsiți rezumatul necesar din toate textele stocate în bibliotecă sau în sistemul de regăsire a informațiilor bibliografice;
găsiți descrierea contractului dorit într-un dosar care conține documente legale;
vizualizați toate fișierele care conțin descrieri ale brevetelor și găsiți un brevet (dacă există) similar cu cel propus din nou.

Pentru a implementa motorul bazei de date, paralel și asociativ arhitecturi ca alternativă la uniprocesorvon Neumannstructura, permițându-vă să lucrați cu cantități mari de informații în timp real.

Motoarele de baze de date câștigă importanță în legătură cu cercetarea și aplicarea conceptelor de inteligență artificială precum reprezentarea cunoștințelor, sistemele expert, inferența, recunoașterea modelelor etc.

Depozitele de informații.Astăzi, mulți recunosc că majoritatea companiilor operează deja mai multe baze de date și, pentru a lucra cu succes cu informații, sunt necesare nu doar diferite tipuri de baze de date, ci diferite generații de SGBD. Conform statisticilor, fiecare organizație folosește în medie 2,5 SGBD diferite. A devenit evidentă nevoia de a „izola” afacerile companiilor, sau mai bine zis, a persoanelor implicate în această afacere, de caracteristicile tehnologice ale bazelor de date, pentru a oferi utilizatorilor o imagine unică a informațiilor corporative, indiferent de locul în care sunt stocate fizic. . Acest lucru a stimulat apariția tehnologiei de depozitare a informațiilor ( Data Warehousing, DW).

Scopul principal al DW estecrearea unei reprezentări logice unice a datelor conținute în diferite tipuri de baze de date sau, cu alte cuvinte, a unui singur model de date corporative.

O nouă rundă de dezvoltare a DW a devenit posibilă datorită îmbunătățirii tehnologiei informației în general, în special a apariției unor noi tipuri de baze de date bazate pe procesarea interogărilor paralele, care la rândul lor s-au bazat pe progresele din domeniul calculatoarelor paralele. Au fost createconstructori de interogăricu o interfață grafică intuitivă care a făcut ușoară construirea de interogări complexe de baze de date. Software diversemiddlewarefurnizat comunicareîntre diferite tipuri de baze de date, și în cele din urmă a scăzut brusc în prețdispozitive de stocare a informațiilor.

Structura unei corporații poate conține Bază de date.

Bază de date componentă funcțională și organizatorică în sistemele automate de control și sisteme informatice și de calcul, care oferă suport informațional centralizat pentru un grup de utilizatori sau un set de sarcini rezolvate în sistem.

Bază de date este considerat un sistem de informare și referință, al cărui scop principal este:

în acumularea și menținerea în stare de funcționare a unui set de informații care constituie baza de informații a întregului sistem automatizat sau a unui anumit set de sarcini rezolvate în acesta;
în emiterea datelor solicitate de sarcină sau utilizator;
în asigurarea accesului colectiv la informațiile stocate;
in asigurarea managementului necesar al utilizarii informatiilor continute in infobaza.

Astfel, o bancă de date modernă este un complex software și hardware complex, care include instrumente tehnice, de sistem și de rețea, baze de date și DBMS, sisteme de regăsire a informațiilor pentru diverse scopuri.

V .2. SGBD ȘI SOLUȚII STRUCTURALE ÎN SISTEME CORPORATE

Baze de date și sisteme de management al cunoștințelor

O componentă importantă a sistemelor informatice moderne sunt sistemele de management al bazelor de date (DBMS).

SGBD un set de instrumente software și lingvistice concepute pentru a crea, întreține și utiliza baze de date.

Sistemul de management al bazelor de date oferă sisteme de prelucrare a datelor cu acces la baze de date. După cum sa menționat deja, un rol important al DBMS este dobândit în crearea sistemelor informaționale corporative și un rol deosebit de important în crearea sistemelor informaționale care utilizează resurse de informații distribuite bazate pe tehnologiile moderne de calcul de rețea.

Principala caracteristică a SGBD-urilor moderne este că SGBD-urile moderne acceptă astfel de tehnologii precum:

tehnologie client/server.
Suport pentru limbile baze de date. Acestlimbaj de definire a schemei DB (SDL - Schema Definition Language),limbaj de manipulare a datelor (DML - Data Manipulation Language), limbaje integrate SQL (Structured Queue Language), QDB (Query - By - Example) și QMF (Query Management Facility) ) Instrument periferic avansat pentru specificarea interogărilor și generarea de rapoarte pentru DB 2 etc.;
Gestionarea directă a datelor din memoria externă.
Gestionarea memoriei tampon.
Managementul tranzacțiilor. Tehnologia OLTP (Procesarea tranzacțiilor on-line), OLAP tehnologie (Procesare de analiză on-line) pentru DW.
Asigurați protecția și integritatea datelor. Utilizarea sistemului este permisă numai utilizatorilor care au drept de acces la date. Atunci când utilizatorii efectuează operațiuni asupra datelor, consecvența datelor stocate (integritatea) este menținută. Acest lucru este important în sistemele de informații corporative cu mai mulți utilizatori.
Jurnalizarea.

SGBD-ul modern trebuie să îndeplinească cerințele bazei de date enumerate mai sus. În plus, trebuie să respecte următoarele principii:

Independenta datelor.
Versatilitate. SGBD-ul trebuie să aibă suport puternic pentru modelul conceptual de date pentru a afișa vederi logice personalizate.
Compatibilitate. SGBD-ul trebuie să rămână operațional cu dezvoltarea de software și hardware.
Redundanță de date. Spre deosebire de sistemele de fișiere, o bază de date trebuie să fie un singur set de date integrate.
Protejarea datelor. SGBD-ul trebuie să ofere protecție împotriva accesului neautorizat.
Integritatea datelor. SGBD-ul trebuie să împiedice utilizatorii să modifice baza de date.
Gestionarea muncii concomitente. SGBD-ul trebuie să protejeze baza de date de inconsecvențele în modul de acces partajat. Pentru a asigura o stare consistentă a bazei de date, toate cererile (tranzacțiile) ale utilizatorilor trebuie efectuate într-o anumită ordine.
SGBD-ul trebuie să fie universal. Ar trebui să accepte diferite modele de date pe o singură bază logică și fizică.
SGBD-ul ar trebui să suporte atât baze de date centralizate, cât și distribuite și, astfel, să devină o legătură importantă în rețelele de calculatoare.

Considerând un SGBD ca o clasă de produse software axate pe menținerea bazelor de date în sisteme automate, putem distinge două dintre cele mai semnificative caracteristici care determină tipurile de SGBD. Potrivit acestora, SGBD-ul poate fi considerat din două puncte de vedere:

capacitățile lor în legătură cu bazele de date distribuite (corporate);
relația lor cu tipul de model de date implementat în SGBD.

În ceea ce privește bazele de date corporative (distribuite), se pot distinge în mod convențional următoarele tipuri de SGBD:

DBMS „desktop”. Aceste produse se concentrează în primul rând pe lucrul cu date personale (date de pe desktop). Au seturi de comenzi pentru partajarea bazelor de date comune, dar au dimensiuni mici (tip birou mic). În primul rând, este un DBMS precum Access, dBASE, Paradox, ExPro. De ce Access, dBASE, Paradox, ExPro au acces slab la datele corporative. Faptul este că nu există o modalitate ușoară de a depăși bariera dintre datele personale și cele corporative. Și nici măcar ideea nu este că mecanismul unui SGBD de date personale (sau un birou mic) este axat pe accesarea datelor prin multe gateway-uri, produse gateway etc. Problema este că aceste mecanisme implică de obicei transferuri complete de fișiere și o lipsă de suport extins pentru indexuri, ceea ce duce la cozi la server care sunt practic o oprire în sistemele mari.
SGBD specializat de înaltă performanță multi-utilizator. Astfel de SGBD-uri sunt caracterizate prin prezența unui nucleu de sistem multi-utilizator, a unui limbaj de manipulare a datelor și a următoarelor funcții care sunt tipice pentru SGBD-urile multi-utilizator dezvoltate:
organizarea unui pool tampon;
prezența unui sistem de procesare a cozilor de tranzacții;
prezența mecanismelor de blocare a datelor multi-utilizator;
înregistrarea tranzacțiilor;
disponibilitatea mecanismelor de control al accesului.

Acestea sunt DBMS precum Oracle, DВ2, SQL/Server, Informix, Sybase, ADABAS, Titanium și altele oferă un serviciu larg pentru procesarea bazelor de date corporative.

Când lucrați cu baze de date, este utilizat mecanismul tranzacțiilor.

tranzacţie este o unitate logică de lucru.

tranzacţie este o secvență de instrucțiuni de manipulare a datelor care este executatăca un(totul sau nimic) și baza de date de traducerede la o stare integrală la alta stare integrală.

O tranzacție are patru proprietăți importante cunoscute ca Proprietăți ASID:

(A) Atomicitate . Tranzacția este executată ca o operațiune atomică - fie întreaga tranzacție este executată, fie întreaga tranzacție nu este executată.
(C) Consecvență. O tranzacție mută o bază de date dintr-o stare consistentă (consecventă) într-o altă stare consecventă (consecventă). În cadrul unei tranzacții, consistența bazei de date poate fi întreruptă.
(I) Izolarea . Tranzacțiile diferiților utilizatori nu ar trebui să interfereze între ele (de exemplu, ca și cum ar fi efectuate strict pe rând).
(D) Durabilitate. Dacă tranzacția este finalizată, atunci rezultatele muncii sale ar trebui să fie salvate în baza de date, chiar dacă sistemul se blochează în momentul următor.

Tranzacția începe de obicei automat din momentul în care utilizatorul se alătură SGBD și continuă până când apare unul dintre următoarele evenimente:

A fost emisă o comandă COMMIT WORK (pentru a comite o tranzacție).
Comanda ROLLBACK WORK a fost emisă.
Utilizatorul s-a deconectat de la SGBD.
A avut loc o defecțiune a sistemului.

Pentru utilizator, ea poartă de obiceicaracter atomic. De fapt, acesta este un mecanism complex de interacțiune între utilizator (aplicație) și baza de date. Software-ul pentru sistemele de întreprindere utilizează un motor de procesare a tranzacțiilor în timp real (Sisteme de procesare a tranzacțiilor online, OLTP), în special programele de contabilitate, software-ul pentru primirea și procesarea aplicațiilor clienților, aplicațiile financiare, produc o mulțime de informații. Aceste sisteme sunt proiectate (și optimizate în mod corespunzător) pentru procesarea unor cantități mari de date, tranzacții complexe și operațiuni intensive de citire/scriere.

Din păcate, informațiile plasate în bazele de date ale sistemelor OLTP nu sunt foarte potrivite pentru utilizarea de către utilizatorii obișnuiți (din cauza gradului ridicat de normalizare a tabelelor, a formatelor specifice de prezentare a datelor și a altor factori). Prin urmare, datele din diferite conducte de informații sunt trimise (în sensul de a fi copiate) cătredepozit de depozitare, sortarea și livrarea ulterioară către consumator. În tehnologia informației, rolul depozitelor îl joacădepozite de informații.

Livrarea de informații către utilizatorul final - sunt angajate sisteme de prelucrare a datelor analitice în timp real(Procesare analitică on-line, OLAP), care oferă acces extrem de ușor la date prin instrumente convenabile pentru generarea de interogări și analiza rezultatelor. În sistemele OLAP, valoarea unui produs informațional este crescută prin utilizarea diferitelor metode de analiză și prelucrare statistică. În plus, aceste sisteme sunt optimizate în ceea ce privește viteza de extragere a datelor, colectarea de informații generalizate și sunt concentrate pe utilizatorii obișnuiți (au o interfață intuitivă). Dacă sistem OLTP oferă răspunsuri la întrebări simple precum „care a fost nivelul vânzărilor produsului N în regiunea M în ianuarie 199x?”, apoi sisteme OLAP sunt pregătiți pentru solicitări mai complexe ale utilizatorilor, de exemplu: „Oferiți o analiză a vânzărilor produsului N pentru toate regiunile conform planului pentru al doilea trimestru comparativ cu cei doi ani anteriori”.

Arhitectura client/server

În sistemele moderneprocesarea distribuită a informațiilortehnologia ocupă centrul atenției client server. În sistem arhitecturi client-serverprelucrarea datelor este împărțită între un computer client și un computer server, comunicarea între care are loc printr-o rețea. Această separare a proceselor de prelucrare a datelor se bazează pe gruparea funcțiilor. De obicei, un computer cu server de baze de date este dedicat pentru a efectua operațiuni de bază de date, în timp ce un computer client rulează programe de aplicație. Figura 2.1 prezintă un sistem simplu de arhitectură client-server care include un computer care acționează ca server și un alt computer care acționează ca client. Fiecare mașină îndeplinește funcții diferite și are propriile sale resurse.

Server		Bază de date
Computer server
Reţea
PC compatibil IBM	PC compatibil IBM	PC compatibil IBM
Clienții		Aplicații

Orez. 2.1. Sistem arhitectural client-server

Funcția principală a computerului client este de a rula aplicația (interfață cu utilizatorul și logica de prezentare) și de a comunica cu serverul atunci când este cerut de aplicație.

Server (Server) acesta este un obiect (calculator) care oferă servicii altor obiecte la cererea acestora.

După cum sugerează termenul, funcția principală a computerului server este de a servi nevoile clientului. Termenul „Server” este folosit pentru a face referire la două grupuri diferite de funcții: un server de fișiere și un server de baze de date (în continuare, acești termeni înseamnă, în funcție de context, fie software-ul care implementează aceste grupuri de funcții, fie computerele cu acest software ). Serverele de fișiere nu sunt proiectate pentru a efectua operațiuni de baze de date, funcția lor principală este de a partaja fișiere între mai mulți utilizatori, de exemplu. asigurarea accesului simultan al multor utilizatori la fișierele de pe un computer - un server de fișiere. Un exemplu de server de fișiere este sistemul de operare NetWare de la Novell. Serverul de baze de date poate fi instalat și rulat pe un computer server de fișiere. Oracle DBMS sub formă de NLM (Network Loadable Module) rulează într-un mediu NetWare pe un server de fișiere.

Serverul de rețea locală trebuie să aibă resurse care să corespundă scopului său funcțional și nevoilor rețelei. Rețineți că, datorită orientării către abordarea sistemelor deschise, este mai corect să vorbim de servere logice (adică un set de resurse și instrumente software care oferă servicii peste aceste resurse), care nu se află neapărat pe computere diferite. O caracteristică a unui server logic într-un sistem deschis este că, dacă, din motive de eficiență, este recomandabil să mutați serverul pe un computer separat, atunci acest lucru se poate face fără a fi nevoie de nicio rafinare, atât a acesteia, cât și a aplicației. programele care îl folosesc.

Una dintre cerințele importante ale serverului este ca sistemul de operare în care este găzduit serverul de baze de date trebuie să fie multitasking (și de preferință, dar nu neapărat, multiutilizator). De exemplu, SGBD Oracle instalat pe un computer personal cu un sistem de operare MS-DOS (sau PC-DOS) care nu îndeplinește cerințele pentru multitasking nu poate fi utilizat ca server de bază de date. Și același DBMS Oracle instalat pe un computer cu un sistem de operare OS / 2 multitasking (deși nu multiutilizator) poate fi un server de baze de date. Multe varietăți de UNIX, MVS, VM și alte sisteme de operare sunt atât multitasking, cât și multiuser.

Calcul distribuit

Termenul „calculator distribuit” este adesea folosit pentru a se referi la două concepte diferite, deși complementare:

Baza de date distribuită;
Prelucrare distribuită a datelor.

Aplicarea acestor concepte face posibilă organizarea accesului la informațiile stocate pe mai multe mașini pentru utilizatorii finali folosind diverse mijloace.

Există mai multe tipuri de servere:

Server de baze de date;
Server de imprimare;
Server de acces la distanță;
server de fax;
server web, etc.

La baza tehnologiei Client/ServerExistă tehnologii de bază precum:

Tehnologii ale sistemelor de operare, conceptul de interacțiune a sistemelor deschise, crearea de medii orientate pe obiecte pentru funcționarea programelor;
Tehnologii de telecomunicații;
Tehnologii de rețea;
Tehnologii de interfață grafică cu utilizatorul ( GUI);
etc.

Avantajele tehnologiei client-server:

Tehnologia client/server permite calcularea în medii de calcul eterogene. Independența platformei: Acces la medii de rețea eterogene care includ diferite tipuri de computere cu sisteme de operare diferite.
Independență față de sursele de date: acces la informații din baze de date eterogene. Exemple de astfel de sisteme sunt DB2, SQL/DS, Oracle, Sybase.
Echilibrul de încărcare între client și server.
Efectuarea calculelor acolo unde se întâmplă cel mai eficient;
Oferă o capacitate eficientă de scalare;
Cross platform computing. Calcularea multiplatformă este definită pur și simplu ca implementarea tehnologiilor în medii de calcul eterogene. Următoarele opțiuni ar trebui furnizate aici:
Aplicația trebuie să ruleze pe mai multe platforme;
Pe toate platformele, ar trebui să aibă aceeași interfață și aceeași logică de lucru;
Aplicația trebuie să se integreze cu mediul de operare nativ;
Ar trebui să se comporte la fel pe toate platformele;
Ar trebui să aibă un suport simplu și consistent.

 Calcul distribuit. Calculul distribuit implică distribuirea muncii între mai multe computere (deși calculul distribuit este un concept mai larg).

 Reducerea la scară. Reducerea de portare a aplicațiilor mainframe pe platforme de calcul mici.

Reduceți costurile de infrastructură și hardware. Eficient din punct de vedere al costurilor: Disponibilitatea hardware-ului de calcul cu costuri reduse și prevalența în creștere a rețelelor locale fac ca tehnologia client-server să fie mai rentabilă decât alte tehnologii de procesare a datelor. Echipamentul poate fi modernizat după cum este necesar.

 Reducerea timpului general de execuție a aplicației;

 Utilizare redusă a memoriei clientului;

 Reducerea traficului de rețea.

Abilitatea de a lucra cu multimedia: Până în prezent, au fost create o mulțime de programe pentru lucrul cu multimedia pentru computere. Fie nu există astfel de programe pentru configurarea terminal-gazdă, fie sunt foarte scumpe.
Capacitatea de a utiliza mai multe resurse de calcul pentru operațiunile bazei de date: deoarece aplicațiile rulează pe computerele client, resurse suplimentare (comparativ cu configurația terminal-gazdă) sunt eliberate pe computerul server pentru operațiunile bazei de date, cum ar fi CPU și resursele operaționale.
Productivitate crescută a programatorului: productivitatea programatorului este crescută prin utilizarea unor instrumente precum SQL*Forms și CASE pentru a dezvolta aplicații mai rapid decât limbajele de programare precum C, PL1 sau COBOL.
Creșterea productivității utilizatorilor finali: în prezent, mulți utilizatori finali au îmbrățișat sisteme precum Lotus, Paradox, Word Perfect, Harvard Graphics etc.

Interfața de back-end este definită și fixată. Prin urmare, este posibil să se creeze noi părți client ale unui sistem existent (un exemplu de interoperabilitate la nivel de sistem).

Orez. 2.2. O ilustrare a accesului clientului la o partajare de server.

Cum se implementează tehnologia client-server

Instalarea unui sistem bazat pe tehnologie client-server și capabil de prelucrare distribuită a datelor este discutată mai jos. Următoarele componente hardware și software sunt necesare:

computer server de baze de date;
calculatoare client;
rețea de comunicații;
software de rețea;
software de aplicație.

Limbajul SQL . Limbajul de interogare la nivel înalt - SQL (Structured Query Language ) este folosit pentru a implementa interogări în baze de date, cum ar fi NMD, NDL și PJD, și a fost adoptat ca standard. Limba SQL a fost adoptat inițial ca limbaj de date al produselor software ale firmei IBM și YMD al unui SGBD relațional SYSTEM R de la IBM . O caracteristică importantă a limbii SQL este că același limbaj este reprezentat prin două interfețe diferite și anume: printr-o interfață interactivă și printr-o interfață de programare a aplicațiilor (dinamică). SQL). SQL dinamic constă din multe caracteristici de limbaj încorporate SQL , furnizat special pentru construirea de aplicații interactive, în care o aplicație interactivă este un program care este scris pentru a sprijini accesul la baza de date de către utilizatorul final care rulează pe terminalul interactiv. Limba SQL oferă funcțiile de definire, manipulare și gestionare a datelor bazei de date și este transparent pentru utilizator din punctul de vedere al SGBD implementat.

Orez. 2.3. Schemă pentru executarea cererilor utilizatorilor către baze de date distribuite.

Structura internă a bazelor de date este determinată de modelele de date utilizate. Modelul conceptual are mai multe capacități de abstractizare și o semantică mai bogată decât modelele externe. Modelele externe sunt adesea numite modele sintactice sau operaționale, referindu-se la natura sintactică a managementului și aplicației ca mijloc de interacțiune a utilizatorului cu baza de date. În modelarea informației, există diferite niveluri de abstractizare, de la nivelul modelului conceptual până la nivelul modelului fizic de date, care afectează arhitectura SGBD.

Modelul de date are trei componente:

O structură de date de reprezentat din perspectiva utilizatorului asupra bazei de date.
Operații valide de efectuat asupra structurii de date. Este necesar să se poată lucra cu această structură folosind diverse operații DDL și NML. O structură bogată nu are valoare dacă nu îi poți manipula conținutul.
Constrângeri pentru controlul integrității. Modelul de date trebuie să fie prevăzut cu mijloace pentru a-și păstra integritatea și a-l proteja. Ca exemplu, luați în considerare următoarele două constrângeri:
Fiecare subarbore trebuie să aibă un nod sursă. Bazele de date ierarhice nu pot stoca noduri copil fără un nod părinte.
În raport cu o bază de date relațională, nu pot exista tupluri identice. Pentru un fișier, această cerință necesită ca toate înregistrările să fie unice.

Una dintre cele mai importante caracteristici ale DBMS este capacitatea de a lega obiecte.

Există următoarele tipuri de legături între obiecte:

Unu la unu (1:1). Un obiect dintr-un set poate fi asociat cu un obiect al altui set.
Unu-la-Mulți (1:M). Un obiect dintr-un set poate fi legat de multe obiecte dintr-un alt set.
Multi-la-Multe (M:N). Un obiect dintr-un set poate fi asociat cu multe obiecte dintr-un alt set, dar în același timp, un obiect dintr-un alt set poate fi asociat cu multe obiecte din primul set.
ramificată . Un obiect dintr-un set poate fi asociat cu obiecte din mai multe seturi.
Recursiv . Un obiect dintr-o mulțime dată poate fi asociat cu un obiect din aceeași mulțime.

Există următoarele modele principale de date:

Model de date relaționale.
Model ierarhic de date.
Model de date de rețea incomplet.
Model de date CODASYL.
Model extins de date de rețea.

V.3. TEHNOLOGII INTERNET / INTRANET SI SOLUȚII DE ACCES LA BAZĂ DE DATE CORPORATE

Principala problemă a sistemelor bazate pe arhitectura „client-server” este că, în conformitate cu conceptul de sisteme deschise, acestea trebuie să fie mobile în cea mai largă clasă posibilă de soluții hardware și software de sistem deschis. Chiar dacă ne limităm la rețelele locale bazate pe UNIX, diferite rețele folosesc echipamente și protocoale de comunicație diferite. Încercarea de a crea sisteme care acceptă toate protocoalele posibile duce la supraîncărcarea acestora cu detalii de rețea în detrimentul funcționalității.

Un aspect și mai complex al acestei probleme este legat de posibilitatea utilizării diferitelor reprezentări ale datelor în diferite noduri ale unei rețele locale eterogene. Calculatoare diferite pot avea adrese diferite, reprezentarea numerelor, codificarea caracterelor etc. Acest lucru este deosebit de important pentru serverele de nivel înalt: telecomunicații, calcul, baze de date.

O soluție comună la problema mobilității sistemelor bazate pe arhitectura „client-server” este să se bazeze pe pachete software care implementează protocoale de apel de procedură la distanță (RPC - Remote Procedure Call). Folosind aceste instrumente, apelarea unui serviciu de la gazda la distanță arată ca un apel de procedură normală. Instrumentele RPC, care, desigur, conțin toate informațiile despre specificul echipamentului rețelei locale și protocoalelor de rețea, traduce apelul într-o succesiune de interacțiuni de rețea. Astfel, specificul mediului de rețea și protocoalele sunt ascunse de programatorul aplicației.

Când este apelată o procedură de la distanță, programele RPC convertesc formatele de date client în formate intermediare independente de mașină și apoi convertesc în formate de date de server. La trecerea parametrilor de răspuns, se efectuează transformări similare.

Alte lucrări conexe care vă pot interesa.vshm>
6914.		Conceptul bazei de date	11,56 KB
	Baza de date este un set de materiale independente prezentate într-o formă obiectivă de articole de calcul a actelor normative ale hotărârilor judecătorești și alte materiale similare sistematizate în așa fel încât aceste materiale să poată fi găsite și prelucrate folosind un computer electronic Codul civil al Federației Ruse Artă. O bază de date organizată în conformitate cu anumite reguli și menținută în memoria computerului, un set de date care caracterizează starea actuală a unor...
8064.		Baze de date distribuite	43,66 KB
	Baze de date distribuite O bază de date RDB distribuită este un set de date partajate interconectate logic care sunt distribuite fizic pe diferite noduri ale unei rețele de calculatoare. Accesul la date nu ar trebui să depindă de prezența sau absența replicilor de date. Sistemul ar trebui să determine automat metodele de realizare a îmbinării de date, o legătură de rețea capabilă să gestioneze cantitatea de informații transferate și un nod care are suficientă putere de procesare pentru a se alătura tabelelor. RDBMS trebuie să fie capabil să...
20319.		BAZELE DE DATE ȘI PROTECȚIA LOR	102,86 KB
	Bazele de date online online au apărut la mijlocul anilor 1960. Operațiunile pe baze de date operaționale au fost procesate interactiv folosind terminale. Organizarea simplă a înregistrărilor index-secvențiale a evoluat rapid la un model de înregistrare mai puternic, orientat spre set. Charles Bachmann a primit Premiul Turing pentru conducerea lucrărilor Data Base Task Group (DBTG), care a dezvoltat un limbaj standard pentru descrierea datelor și manipularea datelor.
5031.		Biblioteca de dezvoltare a bazelor de date	11,72 MB
	Tehnologia de proiectare a bazelor de date. Definirea relațiilor dintre entități și crearea unui model de date. Ideile principale ale tehnologiei informaționale moderne se bazează pe conceptul că datele ar trebui organizate în baze de date pentru a reflecta în mod adecvat lumea reală în schimbare și pentru a răspunde nevoilor de informații ale utilizatorilor. Aceste baze de date sunt create și operate sub controlul unor sisteme software speciale numite sisteme de gestionare a bazelor de date DBMS.
13815.		MODEL BAZĂ DE DATE IERARHICĂ	81,62 KB
	Principalele idei ale tehnologiei informaționale moderne se bazează pe conceptul de baze de date, conform căruia baza tehnologiei informației sunt date organizate în baze de date care reflectă în mod adecvat starea unui anumit domeniu și oferă utilizatorului informații relevante în acest domeniu. Trebuie să recunoaștem că datele sunt...
14095.		Dezvoltarea bazei de date a bibliotecii	11,72 MB
	Creșterea volumului și complexității structurale a datelor stocate, extinderea cercului de utilizatori ai sistemelor informaționale au condus la utilizarea pe scară largă a celui mai convenabil și relativ ușor de înțeles SGBD relațional (tabelar).
5061.		Crearea unei baze de date policlinici	2,4 MB
	Dezvoltarea tehnologiei informatice și a tehnologiei informației a oferit oportunități pentru crearea și utilizarea pe scară largă a sistemelor informatice automatizate (AIS) în diverse scopuri. Sunt în curs de dezvoltare și implementare sisteme informatice pentru gestionarea instalațiilor economice și tehnice
13542.		Baze de date cu informații geologice	20,73 KB
	Recent, introducerea tehnologiilor informatice și, în special, a bazelor de date, în sfera științifică a avut loc într-un ritm rapid. Acest proces nu ocolește nici geologia, deoarece în științele naturii este nevoie de a stoca și procesa cantități mari de informații.
9100.		Bază de date. Noțiuni de bază	26,28 KB
	O bază de date este o colecție de informații despre obiecte specifice ale lumii reale din orice domeniu, economie, management, chimie etc. Scopul unui sistem informațional nu este doar acela de a stoca date despre obiecte, ci și de a manipula aceste date, luând ţin cont de relaţiile dintre obiecte. Fiecare obiect este caracterizat de un set de proprietăți de date, care sunt numite atribute în baza de date.
5240.		Crearea bazei de date „Decanatul universității”	1,57 MB
	O bază de date (DB) este o colecție de date interconectate stocate împreună pe mediile de stocare externe ale unui computer, cu o astfel de organizare și redundanță minimă care permite utilizarea lor într-un mod optim pentru una sau mai multe aplicații.