Chương 4: Mô hình quan hệ (Relational model) & Chương 5: Đại số quan hệ (The relational algebra )
Chức năng tổng hợp và Phân nhóm
Một loại yêu cầu mà không thể thực hiện bằng các phép toán đại số quan hệ cơ bản là thực hiện các chức năng tổng hợp trên một tập giá trị từ CSDL.
Các hàm tổng hợp được áp dụng cho một tập giá trị bao gồm: SUM, AVERAGE, MAXIMUM, MINIMUM, COUNT.
68 trang |
Chia sẻ: vutrong32 | Lượt xem: 1600 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Chương 4: Mô hình quan hệ (Relational model) & Chương 5: Đại số quan hệ (The relational algebra ), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 4MÔ HÌNH QUAN HỆ (Relational Model)Khái niệm mô hình quan hệMô hình quan hệ (Relational Model) sử dụng một tập các quan hệ (Relational) để biểu diễn dữ liệu và mối quan hệ giữa các dữ liệu. Mô hình quan hệ là sự kết hợp của 3 thành phần: Cấu trúc, toàn vẹn và thao tác.Khái niệm mô hình quan hệCấu trúc: định nghĩa cơ sở dữ liệu như là một tập hợp các quan hệ (Relations).Toàn vẹn: tính toàn vẹn của cơ sơ dữ liệu được duy trì trong mô hình quan hệ bằng cách sử dụng khóa chính và khóa ngoại.Thao tác: Một tập hợp các phép toán thao tác trên dữ liệu như phép toán tập hợp, phép toán quan hệKhái niệm mô hình quan hệQuan hệ (Relation): là một bảng giá trị gồm hai thành phần: lược đồ quan hệ (relation schema) và thể hiện của quan hệ (relation instance)Lược đồ quan hệ (relation schema): xác định tên của quan hệ, tên và kiểu dữ liệu của thuộc tính của quan hệ. Ký hiệu: R(A1, A2, , An). A1, A2, , An: danh sách các thuộc tính.R là tên của quan hệKhái niệm mô hình quan hệThể hiện của quan hệ (relation instance): là một bảng giá trị gồm các dòng và các cộtVí dụ: lược đồ quan hệ StudentStudents(sid: string, name: string, login: string, age: integer , gpa: real)Khái niệm mô hình quan hệMiền giá trị (Domain): là tập giá trị hợp lệ của một thuộc tính trong một quan hệ.Lược đồ quan hệ R(A1, A2, , An)D: miền giá trị của Ai ký hiệu dom(Ai)Ràng buộc miền giá trị (Domain constraint): là điều kiện mà các thể hiện của quan hệ phải thỏa mãn. Mỗi giá trị trong domain là nguyên tố.Ví dụ:Số CMND là tập các số từ 0 đến 9Khái niệm mô hình quan hệCác thành phần trong một quan hệ:Khái niệm mô hình quan hệMột quan hệ (relation) r của một lược đồ quan hệ R(A1, A2, , An) được ký hiệu là r(R), là một tập n-tuples r = {t1, t2, . . ., tm}.Mỗi n-tuples t là một danh sách có thứ tự của n giá trị t = , với vi, 1 ≤ i ≤ n, là một phần tử của dom(A) hoặc một giá trị đặc biệt null.Giá trị thứ i trong bộ t tương ứng với thuộc tính Ai được biểu diễn bằng t[Ai].Các ràng buộc của quan hệRàng buộc khóa (Key Constraints): một quan hệ được định nghĩa như là một tập hợp các bộ (tuples). Tất cả các bộ trong một quan hệ phải là duy nhất.Các ràng buộc của quan hệKhóa (key): Một thuộc tính hoặc một tập các thuộc tính dùng để xác định một dòng trong một quan hệ. Khóa được chia thành 3 loại:Siêu khóa (Super key)Khóa dự tuyển (Candidate key)Khóa chính (Primary key)Các ràng buộc của quan hệSiêu khóa (Subper key) của R: là một tập thuộc tính SK của R sao cho không có hai bộ hợp lệ bất kỳ trong thể hiện của quan hệ r(R) có giá trị trùng nhau tại tập thuộc tính SK.Cho hai bộ bất kỳ t1 và t2 trong r(R) thì ta có t1[SK] t2[SK].Các ràng buộc của quan hệKhóa K (Key) của một lược đồ quan hệ R là một siêu khóa của R mà khi loại bỏ bất kỳ thuộc tính A từ K thì được một tập các thuộc tính K’ mà không là siêu khóa của R nữaVí dụ:Super key: {SSN, Name, Age}Key: {SSN} Các ràng buộc của quan hệKhóa dự tuyển (Candidate key):Trong một lược đồ quan hệ có thể có nhiều hơn một khóa, mỗi khóa được gọi là khóa dự tuyển.Khóa chính (Primary key): một trong các khóa dự tuyển được chọn là khóa tiêu biểu.Các ràng buộc của quan hệKhóa ngoại (Foreign key): tập các trường (field) hoặc thuộc tính trong một quan hệ được sử dụng để "tham chiếu” đến một bộ trong quan hệ khác.Lược đồ CSDL quan hệMột lược đồ cơ sở dữ liệu quan hệ (relational database schema) S là một tập các lược đồ quan hệ S = {R1, R2, ... , Rm} và một tập các ràng buộc toàn vẹn (integrity constraints IC).Ví dụ: lược đồ cơ sơ dữ liệu COMPANY = {EMPLOYEE, DEPARTMENT, DEPT_LOCATIONS, PROJECT, WORKS_ON, DEPENDENT}. Lược đồ CSDL quan hệLược đồ CSDL quan hệRàng buộc toàn vẹn thực thể (Entity Integrity constraint): cho lược đồ cơ sở dữ liệu quan hệ S = {R1, R2, ..., Rn}Các thuộc tính khóa chính (primary key attributes) PK của mỗi lược đồ quan hệ R trong S không chứa giá trị null trong bất kỳ bộ nào của r(R), vì giá trị của khóa chính dùng để xác định một bộ riêng biệt.t[PK] null với mọi bộ t trong r(R)Lược đồ CSDL quan hệRàng buộc toàn vẹn tham chiếu (The referential integrity constraint) được xác định giữa hai quan hệ.Được sử dụng để duy trì sự nhất quán giữa các bộ trong hai quan hệ: quan hệ tham chiếu (the referencing relation) và quan hệ được tham chiếu (the referenced relation)Các bộ trong quan hệ tham chiếu R1 có thuộc tính khóa ngoại FK (foreign key) tham chiếu đến khóa chính trong PK của quan hệ được tham chiếu R2.Lược đồ CSDL quan hệMột bộ t1 trong R1 tham chiếu đến một bộ t2 trong R2 nếu t1[FK] = t2[PK].Ràng buộc tham chiếu biểu diễn trong lược đồ cơ sở dữ liệu quan hệ bằng một đường cong từ khóa ngoại đến khóa chínhLược đồ CSDL quan hệCác thao tác cập nhật và xử lý vi phạm ràng buộcCó 3 thao tác trên quan hệ: insert, delete, và modify. Insert: chèn thêm một hoặc nhiều bộ vào một quan hệ.Delete: Xóa các bộ trong quan hệ.Update (or Modify): thay đổi giá trị của các thuộc tính trong các bộ.Khi các thao tác trên được áp dụng vào một quan hệ có thể vi phạm các ràng buộc của quan hệ.Các thao tác cập nhật và xử lý vi phạm ràng buộcThao tác insert có thể vi phạm 4 ràng buộc sau:Ràng buộc miền giá trị (Domain constraint) Ràng buộc khóa (Key constraints).Ràng buộc toàn vẹn thực thể (Entity integrity)Ràng buộc toàn vẹn tham chiếu (Referential integrity).Các thao tác cập nhật và xử lý vi phạm ràng buộcThao tác Delete: chỉ có thể vi phạm toàn vẹn tham chiếu, nếu bộ bị xóa được tham chiếu bởi các khóa ngoại từ các bộ dữ liệu khác trong cơ sở dữ liệu.Thao tác Update: thay đổi giá trị của một hoặc nhiều thuộc tính trong một bộ của quan hệ. Cần phải xác định điều kiện trên thuộc tính để chọn bộ muốn cập nhật.CHƯƠNG 5: ĐẠI SỐ QUAN HỆ (The Relational Algebra )Các phép toán đại số quan hệ cơ bảnTập các phép toán trên mô hình quan hệ gọi là đại số quan hệ. Các phép toán này cho phép người dùng truy xuất dữ liệu theo yêu cầu, kết quả của phép toán là một quan hệ mớiCó thể chia thành 3 nhóm:Nhóm thao tác CSDL: Select, ProjectKết hợp (Combined set): Cartesian (x), Join( )Phép toán tập hợp (Set operations): Union, Intersection, rename, Set Difference, Division.Phép toán quan hệ một ngôiPhép toán SELECT: dùng để chọn một tập con các bộ từ một quan hệ mà nó thỏa mãn điều kiện được chỉ định (sigma): toán tử select: biểu thức kiểu Boolean (R) Phép toán quan hệ một ngôiVí dụ: Chọn ra những nhân viên làm việc tại phòng ban có DNO=4: DNO = 4 (EMPLOYEE)Chọn ra những nhân viên có salary>$30,000: SALARY > 30,000 (EMPLOYEE)Phép toán quan hệ một ngôiThuộc tính của phép toánSELECT:Phép toán SELECT tạo ra một quan hệ mới S có cùng lược đồ với quan hệ R.Có tính giao hoán (commutative)Nếu có một chuỗi các phép toán SELECT thì có thể thực hiện theo một trình tự bất kỳ.((R))= ( (R)) ( ( ( R)) = ( ( ( R)))6.1 Unary relational operationsMột chuỗi phép toán SELECT có thể thay thế bằng một phép toán đơn với sự kết hợp của tất cả các điều kiện.Ví dụ: ( ( ( R)) = AND AND ( R)))Phép toán quan hệ một ngôiPhép toán PROJECT: chọn các cột nhất định từ bảng và loại bỏ các cột khác.Ký hiệu : Ký hiệu phép toán Project: các thuộc tính trích ra từ các thuộc tính của R.(R)Phép toán quan hệ một ngôiVí dụ: Xem thông tin của các nhân viên gồm các field first name, last name và salary. LNAME, FNAME,SALARY(EMPLOYEE)Phép toán quan hệ một ngôiTính chất của phép toán Project: Phép tóa Project loại bỏ các bộ trùng lắp.Số bộ trong kết quả luôn ((R)) = (R)Phép toán quan hệ một ngôiVí dụ: xem thông tin của nhân viên làm việc ở phòng DNO=5, thông tin bao gồm first name, last name, và salary:Cách 1:FNAME, LNAME, SALARY(DNO=5(EMPLOYEE))Cách 2: DEP5_EMPS DNO=5(EMPLOYEE) RESULTFNAME, LNAME, SALARY(DEP5_EMPS) Phép toán quan hệ một ngôiVí dụ: Phép toán quan hệ một ngôiSự tuần tự của các toán tử và toán tử renameĐể áp dụng một loạt các phép toán đại số quan hệ, có thể thực hiện một trong hai cách:Viết các phép toán thành một biểu thức đơn với các phép toán lòng nhau.Mỗi phép toán tạo một quan hệ kết quả trung gian, sử dụng phép toán Rename đặt tên cho quan hệ kết quả trung gian.Phép toán quan hệ một ngôiPhép toán Rename : : kết quả là một quan hệ với tên là S dựa trên quan hệ R với các cột là B1, B1, ..., Bn.S (R): một quan hệ với tên mới là S dựa trên R (B1, B2, , Bn) (R): Một quan hệ mới với các cột là B1, B1, , Bn không chỉ định tên mới.S (B1, B2, , Bn) (R)Các phép toán đại số quan hệ từ lý thuyết tập hợpUnion, Intersection, Set Difference: Là các phép toán nhị phân. Các quan hệ toán hạng của các phép toán trên phải có cùng loại của các bộ.Các quan hệ toán hạng R1(A1, A2, ..., An) và R2(B1, B2, ..., Bn) phải có cùng số thuộc tính và miền giá trị của các thuộc tính tương ứng phải tương thích nhau.Các phép toán đại số quan hệ từ lý thuyết tập hợpUNION RS: Xác định một quan hệ chứa tất cả các bộ thuộc R hoặc thuộc S hoặc thuộc cả R và S, loại bỏ các bộ trùng nhau. Ví dụ: Các phép toán đại số quan hệ từ lý thuyết tập hợpVí dụ: Xem SSN của tất cả nhân viên hoặc là làm việc ở phòng ban số 5 hoặc là giám sát của nhân viên làm ở phòng ban 5.DEP5_EMPS DNO=5 (EMPLOYEE)RESULT1 SSN(DEP5_EMPS)RESULT2(SSN) SUPERSSN(DEP5_EMPS)RESULT RESULT1 RESULT2Các phép toán đại số quan hệ từ lý thuyết tập hợpRESULT1 RESULT2Các phép toán đại số quan hệ từ lý thuyết tập hợpIntersection RS: xác định một quan hệ chứa tất cả các bộ thuôc R và S. Biểu thức: Ví dụ: Các phép toán đại số quan hệ từ lý thuyết tập hợpVí dụ: STUDENT INTRUCTORSTUDENT INTRUCTORCác phép toán đại số quan hệ từ lý thuyết tập hợpCác phép toán UNION và INTERSECTION có tính giao hoán R S = S R, và R S = S RUNION và INTERSECTION có tính kết hợpR(ST) = (RS)T, (RS)T = R(ST)Các phép toán đại số quan hệ từ lý thuyết tập hợpPhép trừ (Set difference hoặc MINUS) R - S: Xác định một quan hệ chứa tất cả các bộ thuộc R nhưng không thuộc S. Biểu thức: Ví dụ: Các phép toán đại số quan hệ từ lý thuyết tập hợpVí dụ: INSTRUCTOR - STUDENT.INSTRUCTOR - STUDENTCác phép toán đại số quan hệ từ lý thuyết tập hợpHai toán hạng phải tương thích.Phép toán MINUS không giao hoán : R – S ≠ S – R STUDENT-INSTRUCTORINSTRUCTOR-STUDENTCác phép toán đại số quan hệ từ lý thuyết tập hợp Các phép toán đại số quan hệ từ lý thuyết tập hợpVí dụ:Các phép toán đại số quan hệ từ tập kết hợp (Combined set)Tích descartes (CARTESIAN): Biểu thức:Kết quả là một quan hệ mới Q(A1, A2, . . ., An, B1, B2, . . ., Bm) với n+m thuộc tính. Nếu R có nR bộ, và S có nS bộ, thì kết quả của phép tích Descartes |R x S| là nR * nS bộ.Q= R(A1, A2, . . ., An) x S(B1, B2, . . ., Bm) Các phép toán đại số quan hệ từ tập kết hợp (Combined set)Example:Các phép toán đại số quan hệ từ tập kết hợp (Combined set)Phép JOIN: Kết hợp hai quan hệ R(A1, A2, . . ., An) và S(B1, B2, . . ., Bm) tạo một quan hệ mới.Biểu thức: Các quan hệ kết hợp dựa trên cột chung, và cột chung phải có cùng miền giá trịCó 3 loại phép kết: Equi Join Natural Join Theta JoinR ⨝SCác phép toán đại số quan hệ từ tập kết hợp (Combined set)EQUIJOIN: Điều kiện kết chỉ chứa phép so sánh bằng.Ex: Các phép toán đại số quan hệ từ tập kết hợp (Combined set) Các phép toán đại số quan hệ từ tập kết hợp (Combined set)Ví dụ:Các phép toán đại số quan hệ từ tập kết hợp (Combined set)Theta Join: Điều kiện kết khác với phép bằng. Example:Các phép toán đại số quan hệ từ tập kết hợp (Combined set)Outer Join: giữ lại những cặp giá trị so trùng tại field liên kết giữa hai quan hệ, những giá trị không so trùng sẽ có giá trị null trong bảng còn lại. Có 3 loại kết outer joinFull outer join Left outer join Right outer join Các phép toán đại số quan hệ từ tập kết hợp (Combined set)Outer Join:Các phép toán đại số quan hệ từ tập kết hợp (Combined set)Outer JoinCác phép toán đại số quan hệ từ tập kết hợp (Combined set)Outer Join:Các phép toán đại số quan hệ từ tập kết hợp (Combined set)Outer JoinTập đầy đủ các phép toán quan hệTập các phép toán: select, project, union, set difference, và Cartesian product gọi là tập đầy đủ tất cả các biểu thức đại số quan hệ đều được kết hợp bởi 5 phép toán này.Ví dụ: R S = (R S ) – ((R - S) (S - R)) R ⨝ S = (R X S)Chức năng tổng hợp và Phân nhómMột loại yêu cầu mà không thể thực hiện bằng các phép toán đại số quan hệ cơ bản là thực hiện các chức năng tổng hợp trên một tập giá trị từ CSDL.Các hàm tổng hợp được áp dụng cho một tập giá trị bao gồm: SUM, AVERAGE, MAXIMUM, MINIMUM, COUNT.Chức năng tổng hợp và Phân nhómVí dụ:Chức năng tổng hợp và Phân nhómCách sử dụng toán tổng hợp ℱℱMAX Salary (Employee): Xuất ra danh sách nhân viên có lương cao nhất.ℱMIN Salary (Employee): Xuất ra danh sách nhân viên có lương thấp nhất.ℱSUM Salary (Employee): Xuất ra tổng lương của nhân viên.6.5 Additional Relational OperationsℱCOUNT SSN, AVERAGE Salary (Employee): Nhóm nhân viên theo DNO, đếm số nhân viên và tính lương trung bình của từng phòng ban.Examples of Queries in Relational AlgebraQUERY 1: Retrieve the name and address of all employees who work for the 'Research' department.RESEARCH_DEPT DNAME=’Research’ (DEPARTMENT)RESEARCH_EMPS (RESEARCH_DEPT ⨝DNUMBER= DNOEMPLOYEEEMPLOYEE)RESULT FNAME, LNAME, ADDRESS (RESEARCH_EMPS)Examples of Queries in Relational AlgebraQUERY 2: For every project located in 'Stafford', list the project number, the controlling department number, and the department manager's last name, address, and birth date.STAFFORO_PROJS PLOCATION=' STAFFORD' (PROJECT)CONTR_DEPT(STAFFORD_PROJS⨝DNVM=DNVMBER DEPARTMENT)PROJ_DEPT_MGR (CONTR_DEPT ⨝ NMGRSSN=SSN EMPLOYEE)RESULT PNUMBER, DNUM, LNAME, ADDRESS. BDATE (PROJ_DEPT_MGR)
Các file đính kèm theo tài liệu này:
- chuong4_5_6973.pptx