Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Zależności funkcyjne. Schemat semantyczny Warunki integralności stanowią zbiór ograniczeń narzuconych na dane. Definicja 1. Niech W oznacza zbiór warunków.

Podobne prezentacje


Prezentacja na temat: "Zależności funkcyjne. Schemat semantyczny Warunki integralności stanowią zbiór ograniczeń narzuconych na dane. Definicja 1. Niech W oznacza zbiór warunków."— Zapis prezentacji:

1 Zależności funkcyjne

2 Schemat semantyczny Warunki integralności stanowią zbiór ograniczeń narzuconych na dane. Definicja 1. Niech W oznacza zbiór warunków integralności dotyczących relacji R o schemacie SCH. Para = (SCH, W) jest definiowana jako schemat semantyczny relacji.

3 Schemat semantyczny Definicja 2. Niech będzie dany zbiór schematów semantycznych relacji: = { 1, 2, …, 2 }. Niech oznacza zbiór zależności semantycznych dotyczących więcej niż jednego schematu. Para = {, } jest definiowana jako schemat semantyczny bazy danych.

4 Zależności funkcyjne Zależności funkcyjne między atrybutami są rodzajem warunków integralności. Definicja 3. Niech będzie dany zbiór atrybutów SCH oraz jego podzbiory X i Y. Mówimy, że Y jest funkcyjnie zależny od X, co zapisujemy X Y, wtedy i tylko wtedy, gdy dla każdej relacji R rozpiętej na schemacie SCH i dla każdych dwóch krotek t 1, t 2 R jest spełniony warunek: t 1 (X) = t 2 (X) t 1 (Y) = t 2 (Y).

5 Zależności funkcyjne Dla zależności funkcyjnych sformułowano zbiór reguł wnioskowania, które pozwalają na wyprowadzenie nowych zależności na podstawie istniejących. Nazywamy je aksjomatami Armstronga.

6 AKSJOMATY ARMSTRONGA A1. Y X X Y (zwrotność) A2. X Y Z W XW YZ (powiększenie) A3. X Y Y Z X Z (przechodniość)

7 AKSJOMATY ARMSTRONGA Dowód A1. t 1 (X) = t 2 (X) Y X t 1 (Y) = t 2 (Y) Zależności wynikające z aksjomatu zwrotności są często nazywane trywialnymi.

8 AKSJOMATY ARMSTRONGA A2. Dowód przez zaprzeczenie. Załóżmy, że : t 1 (XW) = t 2 (XW) t 1 (YZ) t 2 (YZ). t 1 (XW) = t 2 (XW) Z W t 1 (XZ) = t 2 (XZ) t 1 (X) = t 2 (X) t 1 (Z) = t 2 (Z) t 1 (Z) = t 2 (Z) t 1 (YZ) t 2 (YZ) t 1 (Y) t 2 (Y) Otrzymaliśmy: t 1 (X) = t 2 (X) t 1 (Y) t 2 (Y), co jest sprzeczne z założeniem.

9 AKSJOMATY ARMSTRONGA A3. ( t 1 (X) = t 2 (X) t 1 (Y) = t 2 (Y)) (t 1 (Y) = t 2 (Y) t 1 (Z) = t 2 (Z)) (t 1 (X) = t 2 (X) t 1 (Z) = t 2 (Z))

10 REGUŁY ARMSTRONGA Z aksjomatów Armstronga wynikają następujące reguły: D1. X Y X Z X YZ (suma) D2. X Y WY Z XW Z (pseudoprzechodniość) D3. X Y Z Y X Z (rozkład)

11 REGUŁY ARMSTRONGA Dowód D1. X Y X YX (aksjomat A2) X Z XY ZY (aksjomat A2) X YX XY ZY X YZ (aksjomat A3)

12 REGUŁY ARMSTRONGA Dowód D2. X Y XW YW (aksjomat A2) XW YW YW Z XW Z (aksjomat A3)

13 REGUŁY ARMSTRONGA Dowód D3. Z Y Y Z (aksjomat A1) X Y Y Z X Z (aksjomat A3)

14 REGUŁY ARMSTRONGA Zbiór reguł wnioskowania jest zupełny (sound) i kompletny (complete). Oznacza to, że wszystkie wyprowadzone zależności są poprawne oraz że można wyprowadzić wszystkie zależności istniejące w danym schemacie relacji.

15 Konsekwencja logiczna Oznaczmy przez F zbiór zależności funkcyjnych między atrybutami schematu SCH. Zależność funkcyjna f jest konsekwencją logiczną F, co zapisujemy F = f, jeśli f jest spełnione dla wszystkich relacji o schemacie SCH.

16 Domknięcie zbioru zależności funkcyjnych F + Jest to zbiór zależności funkcyjnych będących konsekwencjami logicznymi F

17 Nasycenie atrybutu X + Zbiór F + zawiera zazwyczaj wiele elementów, nawet jeśli F nie jest zbiorem dużym. Za pomocą reguł wnioskowania można bowiem wyprowadzić wiele zależności. Wyznaczanie F + jest więc procesem czasochłonnym. Znacznie łatwiej można wyznaczyć nasycenie atrybutu X +.

18 Nasycenie atrybutu X + Jest to zbiór atrybutów prostych A takich, że zależność X A można wyprowadzić zgodnie z regułami wnioskowania.

19 Twierdzenie 1 Zależność X Y można otrzymać na podstawie reguł wnioskowania Y X +

20 Twierdzenie 1 Dowód Załóżmy, że Y = {A i, A 2, …, A n } 1. Y X +. Zgodnie z definicją X + jest zbiorem atrybutów A i, takich, że prawdziwa jest zależność X A i. Na podstawie reguły sumy X X +. Y X + X + Y (aksjomat A1 X X + X + Y X Y (aksjomat A3)

21 2. X Y X Y X A i. (D6) Oznacza to, że A i X + Y X + Twierdzenie 1

22 1. Przyjmujemy X 0 = X 2. W każdym następnym kroku powiększamy X i, X i+1 = X i S, o atrybuty należące do następującego zbioru S: S = {A: Y Z Y X i A Z}. Ze względu na to, że X i X i+1 … U wnioskujemy, że metoda jest zbieżna. Proces wyznaczania X + kończymy, gdy X i = X i+1. WYZNACZANIE NASYCENIA ATRYBUTU

23 AB C, D EG, C A, BE C, BC D, CG BD, ACD B, CE AG X = BD X + = ? WYZNACZANIE NASYCENIA ATRYBUTU - PRZYKŁAD

24 1. X 0 = BD 2. Tylko jedna zależność spełnia warunek Y X i. Jest to D EG. Lewa strona tylko tej zależności jest podzbiorem X 0. Powiększamy X 0 o {E,G}. Tak więc X 1 = {BDEG}. Postępując podobnie otrzymujemy w czwartym kroku X 3 = {ABCDEG}, czyli zbiór wszystkich atrybutów. WYZNACZANIE NASYCENIA ATRYBUTU - PRZYKŁAD

25 Zbiory zależności F i G są równoważne, jeśli F + = G +. Mówimy, że F pokrywa G ( i G pokrywa F). Zbiory są równoważne każda zależność z F należy do G + i każda zależność z G należy do F +. Twierdzenie 2 Każdy zbiór zależności funkcyjnych F jest pokryty zbiorem zależności G, w którym nie istnieje prawa strona o więcej niż jednym atrybucie. POKRYCIA ZBIORÓW ZALEŻNOŚCI

26 Dowód: Niech X Y F, Y = {A 1, A 2,…, A n }. Niech G będzie zbiorem zależności postaci X A i. Atrybuty A i odpowiadają zależnościom X Y F. Na podstawie D6 X Y X A i G F +. Na podstawie D4 X A 1 X A 2 … X A n X Y F G + POKRYCIA ZBIORÓW ZALEŻNOŚCI

27 Wyznaczenie F + nie jest konieczne. Wystarczy wyznaczyć zbiór minimalny, czyli taki z którego wynikają wszystkie zależności należące do F +. ZBIÓR MINIMALNY

28 Zbiór zależności F jest minimalny jeśli: 1.Prawa strona każdej zależności w F jest pojedynczym atrybutem 2.Zbiór F – {X A} nie jest równoważny F 3.Zbiór F – {X A} {Z A}, gdzie Z X nie jest równoważny F. ZBIÓR MINIMALNY

29 Warunek 2 oznacza, że zbiór F nie zawiera zależności redundantnych. Warunek 3 oznacza, że zbiór F nie zawiera zależności z atrybutami nadmiarowymi po lewej stronie. ZBIÓR MINIMALNY

30 A B, B A, A C, C A, B C Co można wyeliminować? ZBIÓR MINIMALNY - PRZYKŁAD

31 1.B A i A C B C C A B A, A B B C A C 2. B C B A A C B C Nie można wyeliminować wszystkich trzech zależności. Wynik zależy od kolejności analizowania poszczególnych zależności ZBIÓR MINIMALNY - PRZYKŁAD

32 AB C, A B, B A Co można wyeliminować? ZBIÓR MINIMALNY - PRZYKŁAD

33 AB C, A B, B A A B AB C A C B A AB C B C Można wyeliminować A albo B. Nie można wyeliminować A i B Na wynik ma wpływ kolejność. ZBIÓR MINIMALNY - PRZYKŁAD

34 AB C, D EG, C A, BE C, BC D, CG BD, ACD B, CE AG Wyznaczyć zbiór minimalny ZBIÓR MINIMALNY - PRZYKŁAD

35 Na podstawie D6 otrzymujemy zależności z pojedynczymi atrybutami po prawej stronie: AB C, D E, D G C A, BE C, BC D, CG B, CG D ACD B, CE A, CE G ZBIÓR MINIMALNY - PRZYKŁAD

36 AB C, D E, D G C A, BE C, BC D, CG B, CG D ACD B, CE A, CE G 1. C A CE A CE A do usunięcia ZBIÓR MINIMALNY - PRZYKŁAD

37 1.C A ACD B CD B do usunięcia A z ACD B 2. CG D CD B CG B CG B do usunięcia Rozwiązanie I AB C, D E, D G, C A, BE C, BC D, CG D, CD B, CE G ZBIÓR MINIMALNY – PRZYKŁAD – ROZWIĄZANIE I

38 1.CG B BC D CG D CG D do usunięcia 2.D G CG B CD B ACD B ACD B do usunięcia Rozwiązanie II AB C, D E, D G, C A, BE C, BC D, CG B, CE G ZBIÓR MINIMALNY – PRZYKŁAD – ROZWIAZANIE II

39 WYZNACZANIE KLUCZA Twierdzenie 3 Niech R oznacza relację o schemacie SCH. Niech F oznacza zbiór zależności funkcyjnych między atrybutami schematu SCH. X A F + SCH – {A} SCH F + Dowód: (SCH – {A}) X (SCH – {A}) A F + (aksjomat A2)

40 WYZNACZANIE KLUCZA Przy wyznaczaniu klucza wykorzystujemy twierdzenie 3. Jako pierwsze przybliżenie przyjmujemy zbiór wszystkich atrybutów: K = SCH. Następnie usuwamy poszczególne atrybuty sprawdzając czy K – {A} SCH F +. Algorytm kończy się, gdy nie istnieje możliwość usunięcia żadnego atrybutu. Otrzymany wynik zależy od kolejności w jakiej rozpatrujemy poszczególne atrybuty.

41 WYZNACZANIE KLUCZA - PRZYKŁAD P-profesor, G-godzina, N-sala, Y-klasa, T-przedmiot Profesor P wykładający przedmiot T prowadzi zajecia o godzinie G w sali N z klasą Y Zbiór zależności: F = {P T, PG Y, GN P, GY N}

42 WYZNACZANIE KLUCZA - PRZYKŁAD K = PGNYT P T PGNY PGNYT K = PGNY PG Y PGN PGNY K = PGN GN P GN PGN K = GN Kluczem jest GN. Można zauważyć, że nie jest to jedyny klucz. Przy innej kolejności usuwania atrybutów otrzymalibyśmy klucze PG lub GY.

43 WYZNACZANIE KLUCZA – UWAGI DODATKOWE Przy wyznaczaniu kluczy można wykorzystać następujące własności: 1. Każdy klucz kandydujący zawiera wszystkie atrybuty występujące tylko po lewej stronie zależności funkcyjnych 2. Nie istnieje klucz kandydujący zawierający atrybuty występujące tylko po prawej stronie zależności funkcyjnych 3. Jeżeli zbiór atrybutów występujących tylko po lewej stronie zależności funkcyjnych identyfikuje pozostałe atrybuty, to tworzy on jedyny klucz relacji.

44 WYZNACZANIE KLUCZA - PRZYKŁAD Wyznaczmy klucz schematu R(K, G, N, S, U, O) z następującymi zależnościami: GU S, GS K, K N, KU O Atrybutami występującymi tylko po lewej stronie są Na podstawie reguł Armstronga otrzymujemy: GU S GS K GU K GU K K N GU N GU K KU O GU O GU identyfikuje pozostałe atrybuty, co oznacza, że jest to jedyny klucz schematu.

45 ROZKŁAD do 3NF Algorytm zapewniający uzyskanie rozkładu bezstratnego i zachowującego zależności do postaci 3NF. 1. Wyznaczyć zbiór minimalny zależności 2. Dla zależności postaci X A i utworzyć schemat {X, A 1, A 2, …, A n } 3. Jeżeli żaden ze schematów nie zawiera klucza, utworzyć schemat, do którego należą atrybuty kluczowe

46 ROZKŁAD do 3NF PRZYKŁAD Rozpatrzmy następujące rozkłady schematu R(A, B, C, D) ze zbiorem zależności: F = {A C, C B} R1(A, C), R3(A, B, D) R2(B, C), R4(A, C, D) R1(A, C), R2(B, C), R5(A, D)

47 PRZYKŁAD 1. R1(A, C), R3(A, B, D) – brak zależności B C, rozkład odwracalny, R1 w BCNF, R3 w 1NF 2. R2(B, C), R4(A, C, D) – rozkład odwracalny, zależności zachowane, R2 w BCNF, R4 w 1NF 3. R1(A, C), R2(B, C), R5(A, D) – rozkład odwracalny, zależności zachowane, relacje w BCNF

48 PRZYKŁAD Zauważmy, że zbiór zależności F = {A C, C B} jest zbiorem minimalnym oraz że kluczem schematu jest AD. Przedstawiony algorytm prowadzi do rozkładu R1(A, C), R2(B, C), R5(A, D).


Pobierz ppt "Zależności funkcyjne. Schemat semantyczny Warunki integralności stanowią zbiór ograniczeń narzuconych na dane. Definicja 1. Niech W oznacza zbiór warunków."

Podobne prezentacje


Reklamy Google