Bài tự trắc nghiệm kiến thức Chương 2
Chọn đáp án đúng cho các câu hỏi lựa chọn và câu hỏi điền vào chỗ trống. Chú ý, có thể có nhiều
đáp án đúng cho mỗi câu hỏi.
1. Ví dụ nào sau đây là thực thể?
A. Một khách hàng.
B. Một đơn hàng của khách hàng.
C. Tiền lương của nhân viên.
D. Tên của khách hàng.
2. Ví dụ nào sau đây là thuộc tính?
A. Một nhân viên.
B. Tên của nhân viên.
C. Tiền lương của nhân viên.
D. Một danh sách tên của các nhân viên được sắp xếp theo thứ tự ABC.
3. Dấu hiệu nào sau đây biểu thị cho lực lượng quan hệ bằng “0, 1, hoặc nhiều” trên đường biểu
diễn quan hệ?
A. Một dấu vuông góc và dấu ký hiệu hình vương miện gần vị trí kết thúc của đường quan hệ.
B. Một vòng tròn gần vị trí kết thúc của đường quan hệ và dấu ký hiệu hình vương miện ở
vị trí kết thúc của đường quan hệ.
C. Hai dấu vuông góc gần vị trí kết thúc của đường quan hệ.
D. Một vòng tròn và dấu vuông góc gần vị trí kết thúc của đường quan hệ.
56 trang |
Chia sẻ: vutrong32 | Lượt xem: 1161 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Nhập môn Cơ sở dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
xảy ra giữa các thực thể. Trong thực tế, quan hệ
một - một bắt buộc theo cả hai chiều và không có tính khả chuyển thể hiện lỗi thiết kế, song lỗi
này có thể chỉnh sửa được bằng cách kết hợp hai thực thể với nhau. Như vậy, sổ ghi nợ có phải
chỉ là một thông tin thêm của khách hàng? Chúng ta không có ý định thu thập dữ liệu về sổ ghi
nợ; thay vào đó, thông tin về thực thể Account Receivable đơn giản chỉ là thông tin về khách
hàng được thu thập thêm. Mặt khác, nếu chúng ta mua một phần mềm tài chính từ nhà cung cấp
phần mềm độc lập (thực tế, thường là như vậy), gần như chắc chắn phần mềm đó đã kèm theo
một cơ sở dữ liệu được định nghĩa trước, do đó, chúng ta không có lựa chọn nào khác. Chúng ta
không thể thay đổi các thiết kế cơ sở dữ liệu của nhà cung cấp để thêm những dữ liệu chúng ta
muốn có về khách hàng, và cũng không thể làm cho phần mềm của nhà cung cấp đó nhận biết
được những dữ liệu lưu trong cơ sở dữ liệu của chúng ta.
Hình 2-2 cho thấy một quan hệ một - một “đặc biệt” khác, trong đó, hai phía của quan hệ là
tùy chọn (optional), hay đôi khi gọi là có điều kiện (conditional), theo cả hai chiều. Giả sử, chúng
ta đang thiết kế cơ sở dữ liệu cho một đại lý ô tô. Đại lý này phát một số ô tô cho nhân viên,
thường là nhân viên bán hàng, để họ lái thử trong thời gian nhất định. Rõ ràng, đại lý đó không
muốn phát tất cả ô tô cho nhân viên (nếu làm như vậy, họ sẽ không còn ô tô để bán). Chúng ta
có thể hiểu quan hệ giữa thực thể Employee và Automobile như sau: “Tại một thời điểm bất kỳ,
mỗi nhân viên có thể được phát cho một ô tô hoặc không được phát ô tô nào cả; và ngược lại, mỗi
ô tô có thể được gán cho một nhân viên hoặc không nhân viên nào cả”. Hãy chú ý mệnh đề Tại
Employee
Employee ID
First Name
Last Name
Job Title
Automobile
VIN
Make
Model
Year
Color
Employee ID (FK)
Hình 2-2 Quan hệ Employee-automobile.
33Chương 2: Tìm hiểu các thành phần của cơ sở dữ liệu quan hệ
một thời điểm bất kỳ. Nếu một chiếc ô tô được thu hồi lại từ một nhân viên, sau đó được đưa cho
một nhân viên khác thì quan hệ vẫn là một - một. Đó là do khi xem xét các quan hệ, chúng ta luôn
tư duy vấn đề xảy ra trong một thời điểm cụ thể. Và như đã mô tả trước đó, quan hệ Employee-
Automobile là quan hệ khả chuyển.
Quan hệ một - nhiều
Quan hệ một - nhiều (one-to-many relationship) là sự kết hợp giữa hai thực thể, trong đó một thể
hiện bất kỳ của thực thể thứ nhất có thể liên kết với một hoặc nhiều thể hiện của thực thể thứ hai,
và bất kỳ thể hiện nào của thực thể thứ hai đều có thể liên kết với nhiều nhất một thể hiện của
thực thể thứ nhất. Hình 2-1 có hai quan hệ một - nhiều: Quan hệ Customer - Order và quan hệ
Employee - Order. Quan hệ giữa thực thể Customer và Order bắt buộc phải theo một chiều, có thể
được hiểu như sau: “Tại một thời điểm bất kỳ, mỗi khách hàng có thể không có hoặc có nhiều đơn
hàng, và mỗi đơn hàng phải thuộc về một và chỉ một khách hàng”.
Quan hệ một - nhiều rất phổ biến. Trong thực tế, quan hệ một - nhiều là thành phần cơ bản tạo
nên mô hình cơ sở dữ liệu quan hệ, vì các quan hệ trong cơ sở dữ liệu quan hệ đều được cài đặt là
quan hệ một - nhiều. Trong quan hệ một - nhiều, rất ít khi phía “một” là tùy chọn, và càng hiếm
khi phía “nhiều” là bắt buộc, song những tình huống như vậy vẫn xảy ra. Hãy xem xét ví dụ trong
Hình 2-3. Khi đóng một tài khoản khách hàng, chúng ta lưu lại lý do tài khoản bị đóng bằng cách
Hình 2-3 Quan hệ một - nhiều.
Account Closure Reason
Account Closure Reason Code
Description
Customer
Customer ID
Company Name
Address
City
State / Province
Country / Region
Business Phone
Account Closure Reason Code (FK)
Credit Report
Credit Report Number
Report Date
Credit Score
Notes
Customer ID (FK)
34 Nhập môn Cơ sở dữ liệu
sử dụng một mã lý do đóng tài khoản. Vì một số tài khoản có thể đang mở, nên mã lý do đóng tài
khoản là tùy chọn. Chúng ta có thể hiểu quan hệ này như sau: “Tại một thời điểm xác định, mỗi
mã lý do đóng tài khoản có thể được gán cho 0, 1, hoặc nhiều khách hàng, và mỗi khách hàng có
thể có 0 hoặc 1 mã lý do đóng tài khoản”. Giả sử, một công ty có chính sách là không cho phép
mở bất kỳ tài khoản khách hàng nào khi chưa nhận được báo cáo tín dụng về khách hàng đó, và
tất cả các báo cáo đều được lưu trong cơ sở dữ liệu. Điều đó có nghĩa là, một khách hàng bất kỳ
có thể có nhiều hơn một báo cáo tín dụng trong cơ sở dữ liệu. Điều này làm cho quan hệ giữa thực
thể Customer và Credit Report là quan hệ một - nhiều, và bắt buộc theo cả hai chiều. Chúng ta có
thể hiểu quan hệ này như sau: “Tại một thời điểm xác định, mỗi khách hàng có thể có một hoặc
nhiều báo cáo tín dụng, và mỗi báo cáo tín dụng thuộc về một và chỉ một khách hàng”.
Quan hệ nhiều - nhiều
Quan hệ nhiều - nhiều (many-to-many relationship) là sự kết hợp giữa hai thực thể, trong đó một
thể hiện bất kỳ của thực thể thứ nhất có thể liên kết với 0, 1 hoặc nhiều thể hiện của thực thể thứ
hai, và ngược lại. Trở lại Hình 2-1, quan hệ giữa thực thể Order và Product là quan hệ nhiều -
nhiều. Chúng ta có thể hiểu quan hệ này như sau: “Tại một thời điểm bất kỳ, mỗi đơn hàng có thể
không chứa hoặc chứa nhiều sản phẩm, và mỗi sản phẩm có thể xuất hiện trong nhiều đơn hàng
hoặc không xuất hiện trong đơn hàng nào cả”.
Quan hệ này có dữ liệu liên kết, được biểu diễn trong hình thoi ở Hình 2-1. Dữ liệu thuộc
về quan hệ nhiều - nhiều được gọi là dữ liệu tương giao (intersection data). Dữ liệu tương giao
không có ý nghĩa, trừ khi nó được liên kết với cả hai thực thể cùng một lúc. Ví dụ, thuộc tính
Quantity (số lượng) không có ý nghĩa, trừ khi bạn biết khách hàng là ai và sản phẩm là gì. Nếu
nhìn lại Hình 1-7 trong Chương 1, bạn sẽ nhận thấy dữ liệu tương giao trong bảng Order Detail
của mô hình cơ sở dữ liệu Northwind. Vậy tại sao không coi Order Detail là một thực thể? Câu
trả lời rất đơn giản: Order Detail không thỏa mãn định nghĩa của một thực thể. Chúng ta không
thu thập dữ liệu về các dòng chi tiết trong đơn hàng; thay vào đó, những dòng chi tiết này chỉ đơn
giản là thông tin thêm về đơn hàng.
Quan hệ nhiều - nhiều rất phổ biến, và hầu hết đều có dữ liệu tương giao đi kèm. Dù vậy, mô
hình quan hệ không trực tiếp hỗ trợ kiểu quan hệ nhiều - nhiều. Trong thiết kế mức khái niệm,
quan hệ nhiều - nhiều có thể được biểu diễn dễ dàng, bởi thiết kế mức khái niệm hoàn toàn không
phụ thuộc vào bất kỳ công nghệ cụ thể nào. Tuy nhiên, nếu cơ sở dữ liệu được chọn theo mô hình
quan hệ, khi ánh xạ mô hình khái niệm sang mô hình lôgíc tương ứng, bạn cần thay đổi một chút.
Giải pháp là ánh xạ dữ liệu tương giao thành một bảng riêng, gọi là bảng tương giao (intersection
table), đồng thời ánh xạ quan hệ nhiều - nhiều thành hai quan hệ một - nhiều, bảng tương giao sẽ
nằm ở giữa và ở phía “nhiều” trong cả hai quan hệ một - nhiều. Hình 1-7 đưa ra kết quả cho giải
pháp này, bảng Order Detail chứa dữ liệu tương giao và tham gia vào hai quan hệ một - nhiều,
thay thế cho quan hệ nhiều - nhiều ban đầu. Quy trình nhận biết và xử lý các vấn đề liên quan tới
quan hệ nhiều - nhiều sẽ được đề cập chi tiết trong Chương 6.
35Chương 2: Tìm hiểu các thành phần của cơ sở dữ liệu quan hệ
Quan hệ đệ quy
Đến đây, bạn đã tìm hiểu về quan hệ giữa những thể hiện của các thực thể khác nhau. Tuy nhiên,
quan hệ có thể tồn tại giữa các thể hiện cùng loại. Và những quan hệ như vậy được gọi là quan
hệ đệ quy (recursive relationship). Tất cả các quan hệ đã được trình bày (một - một, một - nhiều,
nhiều - nhiều) cũng có thể là quan hệ đệ quy. Hình 2-4 và danh sách dưới đây đưa ra một số ví dụ
về quan hệ đệ quy:
● Một - một Nếu muốn thống kê các nhân viên kết hôn với nhân viên khác, chúng ta mong
muốn mỗi nhân viên có thể kết hôn với một hoặc không nhân viên khác tại một thời điểm.
Employee
Employee ID
Last Name
First Name
Job Title
Spouse Employee ID (FK)
Employee
Employee ID
Last Name
First Name
Job Title
Manager Employee ID (FK)
Part
Part ID
Description
Một - một: Mỗi nhân viên
có thể kết hôn với một nhân
viên khác hoặc không kết
hôn với ai cả.
Một - nhiều: Một nhân viên
có thể quản lý các nhân
viên khác.
Nhiều - nhiều: Mỗi bộ phận
có thể chứa các bộ phận
khác; mỗi bộ phận có thể là
một thành phần của các bộ
phận khác.
Hình 2-4 Các ví dụ về quan hệ đệ quy.
● Một - nhiều Việc theo dõi và quản lý nhân viên là việc làm rất phổ biến. Trong hầu hết
các tổ chức, mọi người thường có một người quản lý cấp trên. Vì vậy, chúng ta thường mong
muốn mỗi nhân viên chịu sự quản lý của một nhân viên khác hoặc không ai cả, và những
người làm quản lý, giám sát lại trực tiếp quản lý một hoặc nhiều nhân viên.
● Nhiều - nhiều Trong môi trường sản xuất, một quan hệ rất phổ biến là quan hệ giữa các bộ
phận tạo thành sản phẩm hoàn thiện. Ví dụ, ổ đĩa CD-ROM trong máy tính cá nhân, bạn có
thể hình dung rằng ổ đĩa CD gồm rất nhiều linh kiện khác nhau, tuy nhiên trong toàn bộ dây
chuyền lắp ráp máy tính, các linh kiện đó không được nhìn thấy và chỉ có một bộ phận duy
nhất là ổ CD. Như vậy, một bộ phận bất kỳ có thể được tạo thành từ nhiều bộ phận khác, đồng
thời bộ phận đó có thể là một thành phần của các bộ phận khác.
Quy tắc nghiệp vụ
Quy tắc nghiệp vụ (business rule) là các chính sách, thủ tục hay những tiêu chuẩn mà một tổ chức
tuân thủ và làm theo. Quy tắc nghiệp vụ rất quan trọng trong thiết kế cơ sở dữ liệu vì nó quyết
định việc đặt các điều khiển lên dữ liệu. Trong Hình 2-1, bạn có thể thấy một quy tắc nghiệp vụ
quy định rằng, các đơn hàng chỉ được chấp nhận khi khách hàng không có dư nợ quá hạn. Hầu
hết quy tắc nghiệp vụ có thể được thực thi thông qua những thủ tục sổ sách mà nhân viên là người
được chỉ đạo làm theo, hoặc thông qua các quy tắc lôgíc trong chương trình ứng dụng. Dù vậy,
quy tắc nghiệp vụ có thể không được tuân thủ - các nhân viên có thể quên hoặc cố tình không làm
36 Nhập môn Cơ sở dữ liệu
theo các thủ tục đã được quy định trong các tài liệu liên quan. Một số người dùng được cấp quyền
đặc biệt có thể cập nhật trực tiếp cơ sở dữ liệu, bỏ qua sự kiểm soát của chương trình ứng dụng.
Cơ sở dữ liệu có thể đóng vai trò “tuyến phòng thủ cuối cùng” bảo vệ dữ liệu và thực thi các quy
tắc nghiệp vụ. Trong cơ sở dữ liệu, quy tắc nghiệp vụ được cài đặt bởi các ràng buộc (constraint),
đó là những quy tắc được định nghĩa chính thức, có tác dụng giới hạn giá trị dữ liệu trong cơ sở
dữ liệu. Những thông tin bổ sung về ràng buộc có thể được tìm thấy trong mục “Ràng buộc” của
chương này. Lưu ý, quy tắc nghiệp vụ thường không xuất hiện trong lược đồ mô hình dữ liệu khái
niệm; quy tắc nghiệp vụ trong Hình 2-1 chỉ có tính chất minh họa. Quy tắc nghiệp vụ thường được
bao gồm trong các tài liệu văn bản đi kèm lược đồ khái niệm.
Bài tập mẫu 2-1 Tìm hiểu về cơ sở dữ liệu Northwind
Trong phần còn lại của chương này cũng như ở Chương 3, chúng ta sử dụng Microsoft Access
2007 và cơ sở dữ liệu Northwind để giải thích cho các khái niệm được đề cập. Trong bài tập mẫu
này, bạn sẽ kết nối tới cơ sở dữ liệu mẫu Northwind theo một trong hai cách: Trên máy tính cá
nhân và thông qua Microsoft Office Online, sau đó làm quen với việc điều hướng trong Access
để dễ dàng theo dõi các bài tập ví dụ ở chương này và Chương 3. Bạn nên biết, Access 2007 có
giao diện và cách sử dụng hoàn toàn khác so với những phiên bản cũ, vì thế, nếu bạn sử dụng
phiên bản Access cũ thì việc theo dõi các ví dụ trong cuốn sách này có thể gặp khó khăn. Tuy
nhiên, có một giải pháp rất đơn giản là Microsoft Office Online, bạn chỉ cần một trình duyệt web
và máy tính có kết nối Internet.
Việc lựa chọn Microsoft Access để giải thích các khái niệm chỉ đơn giản nhằm mục đích
thuận tiện hơn, và ở đây không có ý định so sánh Access 2007 với những sản phẩm khác. Thực
tế, khi đề cập về SQL trong Chương 4, chúng ta sẽ sử dụng một RDBMS khác là Oracle để minh
họa các ví dụ.
Các bước tiến hành
1. Nếu bạn đã có sẵn Microsoft Access 2007, hãy tải và cài đặt cơ sở dữ liệu mẫu Northwind
theo các bước sau đây:
a. Khởi động Access 2007 từ menu Start mà không mở cơ sở dữ liệu.
b. Ở bên trái bảng điều khiển Getting Started, nhấn vào Sample nằm dưới tiêu đề From
Microsoft Office Online.
c. Nhấn vào biểu tượng Northwind 2007.
d. Ở góc dưới cùng bên phải của bảng điều khiển, nhấn vào nút Download và đáp ứng lại
bất kỳ yêu cầu nào xuất hiện.
e. Khi đã kết nối tới cơ sở dữ liệu, một màn hình như trong Hình 2-5 sẽ được hiển thị.
37Chương 2: Tìm hiểu các thành phần của cơ sở dữ liệu quan hệ
2. Nếu chưa cài đặt Microsoft Access 2007, bạn có thể truy cập thông qua Microsoft Office
Online bằng cách sử dụng trình duyệt web và làm theo các bước sau:
a. Nhập địa chỉ URL vào trình duyệt và nhấn ENTER.
b. Tại chính giữa màn hình trình duyệt, tìm và nhấn vào liên kết Try Office 2007 Online.
c. Trong trang tiếp theo, nhấn nút Launch Test Drive và phản hồi lại bất kỳ yêu cầu nào xuất
hiện. Quá trình tải phần mềm và thiết lập kết nối tới cơ sở dữ liệu có thể mất vài phút.
Hình 2-5 Màn hình khởi động của cơ sở dữ liệu Northwind.
d. Trong trang Tutorial Menu, nhấn vào Office Access 2007.
e. Ở lề trái bảng điều khiển Getting Started, hãy nhấn Sample nằm dưới tiêu đề From Mi-
crosoft Online.
f. Tại góc dưới cùng bên trái của bảng điều khiển (bạn có thể phải mở rộng trình duyệt toàn
màn hình mới có thể nhìn thấy được), nhấn nút Download và phản hồi lại bất kỳ yêu cầu
nào xuất hiện. Đặc biệt, hãy chú ý một số điều sau đây:
38 Nhập môn Cơ sở dữ liệu
● Có thể có một hoặc nhiều thông báo về việc chạy các add-on từ trang web. Những
thông báo này xuất hiện ở gần phía trên cùng màn hình, ngay bên dưới dòng các ngôi
sao màu vàng, thường có màu nền vàng nhạt (giống như thông báo Security Warning
trong Hình 2-5).
● Bạn sẽ phải phản hồi lại thông báo Security Warning trong Hình 2-5. Hãy nhấn nút
Options trên dòng thông báo và lựa chọn cho phép kích hoạt nội dung.
● Khi mở cơ sở dữ liệu lần đầu tiên, một màn hình hiển thị yêu cầu bạn đăng nhập. Nếu
điều này xảy ra, hãy nhấn vào tùy chọn Cancel.
g. Khi đã kết nối tới cơ sở dữ liệu, một màn hình như trong Hình 2-5 sẽ hiển thị.
3. Trên dải chức năng (vùng nằm dài theo phía trên cùng của bảng điều khiển, chứa các tùy
chọn), nhấn vào Database Tools và chọn Relationships. Bảng điều khiển Relationships xuất
hiện, hiển thị 18 bảng cùng quan hệ giữa các bảng đó. Các bảng được bố trí rất sát nhau, song
nếu dựa vào những đường nối giữa chúng, bạn có thể dễ dàng quan sát từng quan hệ.
4. Đóng bảng điều khiển Relationships bằng cách nhấn vào nút X ngay bên phải tab Relationships.
5. Mở rộng khung Navigation Pane (nằm dọc lề trái của bảng điều khiển) bằng cách nhấn vào
biểu tượng >> trên cùng của khung. Cơ sở dữ liệu Northwind chứa một số màn hình, báo cáo
và các đối tượng được sử dụng để minh họa cho những tính năng lập trình trong Microsoft
Access 2007. Tuy nhiên, chúng ta sẽ chỉ quan tâm tới những đối tượng liên quan tới cơ sở
dữ liệu (việc lập trình ứng dụng không thuộc phạm vi của cuốn sách này). Mở rộng nhóm
Supporting Objects để quan sát danh sách tất cả các bảng có trong cơ sở dữ liệu Northwind.
Với mỗi bảng, bạn có thể nhấn chuột phải vào tên bảng và chọn Open để xem nội dung của
bảng, hoặc Design View để xem định nghĩa của bảng. Bạn không cần hiểu mọi thứ vào thời
điểm này - các bảng điều khiển trên sẽ được giới thiệu chi tiết ở những phần tiếp theo.
6. Đóng Microsoft Access 2007 (hoặc Office 2007 Online và cửa sổ trình duyệt).
Tổng kết bài tập mẫu
Bạn vừa truy cập thành công tới cơ sở dữ liệu mẫu Northwind sẽ được sử dụng để minh họa cho
các khái niệm trong phần còn lại của chương này cũng như chương tiếp theo. Bạn cũng đã điều
hướng qua bảng điều khiển Relationships và nhóm Supporting Objects trong Navigation Pane.
Các thành phần của thiết kế cơ sở dữ liệu mức
lôgíc/mức vật lý
Thiết kế cơ sở dữ liệu mức lôgíc được thực hiện trong lớp lôgíc theo mô hình ANSI/SPARC đã
đề cập ở Chương 1. Thiết kế cơ sở dữ liệu mức vật lý được thực hiện trong lớp vật lý của mô hình
ANSI/SPARC. Tuy nhiên, lớp vật lý được cài đặt thông qua DBMS, khiến việc phân tách lớp
lôgíc và lớp vật lý trở nên khó khăn. Ví dụ, khi tạo bảng, chúng ta thêm một mệnh đề vào trong
lệnh create table để thông báo cho DBMS biết vị trí cần đặt bảng. Sau đó, DBMS sẽ tự động cấp
phát không gian cho bảng trên các file hệ điều hành đã được chỉ định. Do hầu hết phép cài đặt vật
39Chương 2: Tìm hiểu các thành phần của cơ sở dữ liệu quan hệ
lý đều diễn ra trong định nghĩa DBMS của cấu trúc lôgíc, nên chúng ta sẽ không tách riêng hai
lớp này. Trong quá trình thiết kế cơ sở dữ liệu mức lôgíc, các thuộc tính lưu trữ vật lý (như tên file
hoặc tên không gian bảng (tablespace), vị trí lưu trữ, thông tin về kích thước) có thể được gán cho
từng đối tượng trong cơ sở dữ liệu khi ánh xạ chúng từ mô hình khái niệm, hoặc chúng ta có thể
bỏ qua những thuộc tính đó và thêm vào sau trong quá trình thiết kế vật lý. Để tiết kiệm thời gian,
hầu hết các DBA đều thực hiện việc thiết kế lôgíc song song với việc thiết kế vật lý.
Bảng
Đơn vị lưu trữ cơ bản trong mô hình quan hệ là bảng (table), có cấu trúc hai chiều được tạo thành
từ các hàng và cột. Mỗi hàng tương ứng với một thể hiện của thực thể mà bảng đại diện, và mỗi
cột tương ứng với một thuộc tính của thực thể đó. Quá trình ánh xạ các thực thể trong thiết kế khái
niệm thành các bảng trong thiết kế lôgíc được gọi là chuẩn hóa (normalization), sẽ được đề cập
chi tiết ở Chương 6. Thường thì một thực thể trong mô hình khái niệm sẽ ánh xạ chính xác tới một
bảng tương ứng trong mô hình lôgíc, tuy nhiên, điều này không phải luôn đúng trong mọi trường
hợp. Lý do bạn cần hiểu rõ về quá trình chuẩn hóa là, thông thường, các thực thể được phân chia
thành nhiều bảng, nhưng trong một số ít trường hợp, nhiều thực thể lại được kết hợp thành một
bảng duy nhất. Hình 2-6 liệt kê một phần nội dung của bảng Orders trong cơ sở dữ liệu Northwind.
Bạn cần nhớ, bảng quan hệ là một cấu trúc lưu trữ lôgíc và thường không tồn tại ở dạng bảng
trong lớp vật lý. Khi người quản trị gán một bảng cho một số file hệ điều hành trong lớp vật lý
Hình 2-6 Bảng Orders trong (một phần) cơ sở dữ liệu Northwind.
40 Nhập môn Cơ sở dữ liệu
(trong hầu hết RDBMS, đơn vị lưu trữ lôgíc được tạo từ các file này được gọi là không gian bảng),
nhiều bảng có thể được đặt trong cùng một không gian bảng. Tuy nhiên, các bảng lớn có thể được
đặt trong không gian bảng riêng, hoặc được phân chia vào nhiều không gian bảng khác nhau, điều
này được gọi là phân hoạch (partitioning). Tính năng linh hoạt này thường không được hỗ trợ
trong các RDBMS trên máy tính cá nhân như Microsoft Access.
Mỗi bảng phải được gán một tên duy nhất và do DBA quy định. Độ dài tối đa của tên bảng
rất khác nhau tùy thuộc vào từng sản phẩm RDBMS, từ ít nhất là 18 ký tự tới nhiều nhất là 255 ký
tự. Nên đặt tên bảng mang tính chất mô tả và phản ánh đúng ý nghĩa của thực thể tương ứng trong
thế giới thực. Theo quy ước, một số DBA thường sử dụng danh từ số ít để đặt tên cho các thực thể
và danh từ số nhiều cho tên của các bảng, bạn sẽ thấy quy ước này trong cơ sở dữ liệu Northwind.
(Tôi thích sử dụng danh từ số ít để đặt tên cho cả thực thể và bảng, nhưng rõ ràng, các chuyên gia
khác có những ý kiến ngược lại). Bạn nên thiết lập một tiêu chuẩn đặt tên riêng nhằm đảm bảo
tính thống nhất, nếu không, rất dễ gây nhầm lẫn sau này. Thực tế, Microsoft Access cho phép sử
dụng ký tự khoảng trắng trong tên của bảng và cột, nhưng như vậy được coi là trái với tiêu chuẩn
công nghiệp. Ngoài ra, Microsoft Access, Sybase ASE, và Microsoft SQL Server đều cho phép sử
dụng kết hợp chữ thường và chữ hoa để đặt tên cho các bảng và cột, ví dụ tên bảng OrderDetails.
Trong khi đó, Oracle, DB2, MySQL trên Windows lại tự động chuyển đổi tên các đối tượng thành
dạng chữ hoa, trừ khi những tên đó được đặt trong dấu ngoặc kép (“ ”). Những tên chữ hoa như
ORDERDETAILS rất khó theo dõi, vì thế, việc sử dụng dấu gạch chân để phân tách các từ là một
lựa chọn tốt, phù hợp với tiêu chuẩn công nghiệp. Có thể bạn sẽ muốn một tiêu chuẩn cấm việc sử
dụng các tên, trong đó có cả ký tự khoảng trắng, hoặc tên có cả chữ hoa và chữ thường, vì những
tên như vậy không tuân theo tiêu chuẩn nào và khiến việc chuyển đổi dữ liệu giữa các sản phẩm
RDBMS trở nên khó khăn hơn.
Hỏi chuyên gia
Câu hỏi: Bạn đã đề cập tới cả file và không gian bảng. Vậy chúng có giống nhau
không?
Trả lời: Bạn có thể hình dung không gian bảng giống như một file lôgíc tạo thành một
lớp trừu tượng nằm giữa lớp vật lý và lớp lôgíc, do đó, không gian bảng giúp
tăng tính độc lập dữ liệu lôgíc. Một không gian bảng có thể bao gồm một hoặc
nhiều file vật lý. Và thay vì gán bảng vào file vật lý, bạn gán chúng vào không
gian bảng. Điều này cho phép xử lý linh hoạt file vật lý tạo nên cơ sở dữ liệu.
Ví dụ, khi không gian bảng đầy, người quản trị có một lựa chọn là thêm vào
không gian bảng một file từ một thiết bị lưu trữ khác (như ổ đĩa).
Các cột và kiểu dữ liệu
Như đã đề cập, mỗi cột trong bảng quan hệ biểu diễn một thuộc tính trong mô hình khái niệm.
Cột (column) là đơn vị dữ liệu nhỏ nhất được đặt tên mà có thể được tham chiếu tới trong cơ sở
41Chương 2: Tìm hiểu các thành phần của cơ sở dữ liệu quan hệ
dữ liệu quan hệ. Mỗi cột phải được gán một tên duy nhất (trong phạm vi một bảng) và một kiểu
dữ liệu xác định. Kiểu dữ liệu (data type) là kiểu định dạng cho một cột cụ thể. Kiểu dữ liệu có
những ưu điểm sau:
● Giới hạn dữ liệu trong cột để chỉ chấp nhận những ký tự phù hợp với kiểu dữ liệu (ví dụ, tất
cả các chữ số, hoặc chỉ những ký tự ngày tháng hợp lệ).
● Cung cấp một tập các hành vi hữu dụng cho người dùng cơ sở dữ liệu. Ví dụ, nếu trừ một số
cho một số khác, bạn sẽ có kết quả là một số; nhưng nếu trừ các giá trị ngày tháng cho nhau,
bạn sẽ nhận về một số biểu diễn số ngày nằm giữa hai ngày đó.
● Hỗ trợ RDBMS trong việc lưu trữ hiệu quả dữ liệu trong cột. Ví dụ, số thường được lưu dưới
định dạng số để tiết kiệm không gian lưu trữ hơn so với việc lưu số dưới dạng chuỗi ký tự.
Hình 2-7 đưa ra định nghĩa bảng Orders của Northwind được mở trong Microsoft Access
2007 (chính là bảng được liệt kê ở Hình 2-6). Kiểu dữ liệu của các cột được hiển thị ở cột thứ hai.
Tên kiểu dữ liệu rất trực quan, nhưng nếu thấy khó hiểu, bạn có thể xem định nghĩa của những
kiểu dữ liệu này trên trang trợ giúp của Microsoft Access.
Hình 2-7 Định nghĩa bảng Orders của Northwind (Microsoft Access 2007).
42 Nhập môn Cơ sở dữ liệu
LƯU Ý
Nếu so sánh Hình 2-6 và Hình 2-7, bạn có thể thấy các cột Employee Name và Customer
Name trong Hình 2-6 thay thế cho cột Employee ID và Customer ID trong định nghĩa của bảng
Orders ở Hình 2-7. Đây không phải lỗi mà là một tính năng của Microsoft Access, sẽ được đề
cập trong mục “Ràng buộc tham chiếu” ở phần sau của chương này.
Điều đáng tiếc nhất là các tiêu chuẩn công nghiệp thường tụt hậu so với sự phát triển của
RDBMS. Hầu hết nhà cung cấp đều tự phát triển các tính năng cho sản phẩm của họ trước khi
cùng ngồi lại với những nhà cung cấp khác để đưa ra tiêu chuẩn. Điều này giải thích tại sao lại
có sự khác biệt lớn về kiểu dữ liệu trong các sản phẩm RDBMS. Ngày nay, tiêu chuẩn ANSI/ISO
SQL bao hàm mọi kiểu dữ liệu quan hệ và các nhà cung cấp đều hỗ trợ tất cả hoặc hầu hết kiểu
dữ liệu tiêu chuẩn. Tuy nhiên, mỗi nhà cung cấp vẫn có những “mở rộng” riêng ngoài chuẩn, họ
không chỉ hỗ trợ những kiểu dữ liệu mới hơn các tiêu chuẩn hiện hành mà còn thêm những tính
năng đặc biệt, làm cho sản phẩm của họ trở nên đặc biệt hơn so với đối thủ. Người ta có thể nói
đùa rằng, điều tuyệt vời nhất về các tiêu chuẩn cơ sở dữ liệu là có rất nhiều tiêu chuẩn để lựa
chọn. Về mặt tiêu chuẩn công nghiệp cho cơ sở dữ liệu quan hệ, Microsoft Access có lẽ là một
trong những sản phẩm ít tuân thủ nhất. Do có rất nhiều tiêu chuẩn và mở rộng từ nhà cung cấp,
nên DBA phải là người có kiến thức chuyên sâu về những kiểu dữ liệu DBMS hiện đang hỗ trợ
để triển khai cơ sở dữ liệu thành công. Và dĩ nhiên, phải rất cẩn thận khi chuyển đổi thiết kế lôgíc
giữa các DBMS của những nhà cung cấp khác nhau.
Bảng 2-1 cho thấy các kiểu dữ liệu tương đương từ nhiều nhà cung cấp RDBMS khác nhau.
Tuy nhiên, cần nhớ rằng, những kiểu dữ liệu được liệt kê ở đây không giống hệt nhau mà chỉ
tương đương.Ví dụ, kiểu VARCHAR trong Oracle có thể có độ dài lên tới 4000 ký tự (ở các phiên
bản Oracle8i, độ dài tối đa là 2000 ký tự), tuy nhiên kiểu dữ liệu MEMO tương đương trong Mi-
crosoft Access có thể chứa hàng gigabyte ký tự (khoảng 1 tỷ ký tự)!
Ràng buộc
Ràng buộc (constraint) là quy tắc được đặt vào một đối tượng cơ sở dữ liệu (thường là một bảng
hoặc một cột) để giới hạn giá trị dữ liệu cho phép đối với đối tượng cơ sở dữ liệu đó. Bảng và cột
là các đối tượng quan trọng nhất trong cơ sở dữ liệu quan hệ mà chúng ta sử dụng các ràng buộc
thể cài đặt các quan hệ và quy tắc nghiệp vụ được chỉ ra trong thiết kế lôgíc. Mỗi ràng buộc được
gán một tên duy nhất, cho phép tham chiếu tới ràng buộc đó trong các thông báo lỗi và câu lệnh.
Một thói quen tốt đối với các DBA là luôn gán tên cho ràng buộc, bởi nếu không làm điều này,
RDBMS sẽ tự động sinh ra một tên cho ràng buộc, và tên đó thường không có tính mô tả.
43Chương 2: Tìm hiểu các thành phần của cơ sở dữ liệu quan hệ
Kiểu dữ liệu Microsoft Access Microsoft SQL Server Oracle
Chuỗi ký tự có độ dài
xác định
TEXT CHAR CHAR
Chuỗi ký tự có độ dài
biến đổi
MEMO VARCHAR VARCHAR
Văn bản dài MEMO TEXT CLOB hoặc LONG (Đã
lỗi thời, khuyến cáo
không nên sử dụng)
Số nguyên INTEGER hoặc
LONGINTEGER
INTEGER hoặc SMALLINT hoặc
TINYINT
NUMBER
Số thập phân NUMBER DECIMAL hoặc NUMERIC NUMBER
Tiền tệ CURRENCY MONEY hoặc SMALLMONEY Không có, sử dụng
NUMBER
Ngày/giờ DATE/TIME DATETIME hoặc SMALLDATE-
TIME
DATE hoặc TIME-
STAMP
Bảng 2-1 Những kiểu dữ liệu tương đương trong các sản phẩm RDBMS chính.
Ràng buộc khóa chính
Khóa chính (primary key) là một cột hoặc tập hợp các cột xác định duy nhất một dòng bản ghi
trong bảng. Định danh duy nhất trong thiết kế mức khái niệm được cài đặt bằng một khóa chính
trong thiết kế lôgíc. Biểu tượng hình chiếc khóa ngay cạnh trường Order ID trong Hình 2-7 biểu
thị rằng, cột này được định nghĩa là khóa chính của bảng Orders. Khi định nghĩa khóa chính,
RDBMS sẽ cài đặt một ràng buộc khóa chính để đảm bảo không tồn tại hai dòng trong bảng có
cùng giá trị khóa chính. Chú ý, nếu khóa chính được tạo thành từ nhiều cột, mỗi cột có thể có giá
trị trùng nhau trong bảng, nhưng khi kết hợp những giá trị trong các cột của khóa chính thì giá trị
kết hợp đó phải là duy nhất trong bảng.
Hầu hết các ràng buộc khóa chính được cài đặt trong RDBMS bằng cách sử dụng chỉ mục
(index), một kiểu đối tượng đặc biệt trong cơ sở dữ liệu, cho phép tìm kiếm nhanh các giá trị cột.
Khi thêm một dòng vào bảng, RDBMS tự động tìm kiếm trên chỉ mục để đảm bảo giá trị khóa
chính của dòng mới chưa được sử dụng trong bảng, nếu giá trị khóa đã tồn tại, dòng mới thêm vào
sẽ bị từ chối. Chỉ mục được tìm kiếm nhanh hơn so với bảng; vì thế, việc áp dụng chỉ mục cho
khóa chính trong bảng là rất cần thiết, giúp việc tìm những khóa trùng nhau khi thêm các dòng
mới trở nên nhanh chóng.
Ràng buộc tham chiếu
Để hiểu phương pháp RDBMS sử dụng ràng buộc tham chiếu thực thi các quan hệ, trước tiên, bạn
phải nắm được khái niệm khóa ngoại. Khi quan hệ một - nhiều được thực thi trong bảng, cột hoặc
tập các cột được lưu trong bảng con (bảng tương ứng với phía “nhiều” trong quan hệ) có chức
44 Nhập môn Cơ sở dữ liệu
năng liên kết bảng đó với một bảng cha (bảng tương ứng với phía “một” trong quan hệ), được gọi
là một khóa ngoại (foreign key). Được gọi là khóa ngoại bởi vì cột (các cột) được sao chép từ một
bảng khác (bảng ngoài). Trong bảng Orders (Hình 2-6), cột Employee ID là khóa ngoại liên kết
tới bảng Employees, và cột Customer ID là khóa ngoại liên kết tới bảng Customers.
Trong hầu hết cơ sở dữ liệu quan hệ, khóa ngoại phải là khóa chính của bảng cha, hoặc là
một cột hay tập các cột có định nghĩa một chỉ mục duy nhất. Điều này nhằm mục đích tăng tốc độ
xử lý. Phần lớn mọi người đều tán thành việc cột (các cột) khóa ngoại cùng tên với cột (các cột)
khóa chính trong bảng cha, tuy nhiên vẫn có những ý kiến trái chiều, và lý do được đưa ra là các
tên trùng nhau như vậy sẽ gây khó khăn trong ngôn ngữ truy vấn. Tốt nhất, ngay từ đầu, bạn nên
thiết lập một số tiêu chuẩn và tuân thủ theo những tiêu chuẩn đó trong suốt dự án cơ sở dữ liệu.
Mỗi quan hệ giữa các thực thể trong thiết kế mức khái niệm được ánh xạ tương ứng thành
một ràng buộc tham chiếu trong thiết kế lôgíc. Ràng buộc tham chiếu (referential constraint), còn
được gọi là ràng buộc toàn vẹn tham chiếu (referential integrity constraint) là ràng buộc bắt buộc
thực hiện một quan hệ giữa các bảng trong cơ sở dữ liệu quan hệ. Bắt buộc thực hiện có nghĩa là
RDBMS tự động kiểm tra để đảm bảo mỗi giá trị khóa ngoại trong bảng con luôn có một giá trị
khóa chính tương ứng trong bảng cha.
Microsoft Access cung cấp một tính năng rất thú vị đối với các cột khóa ngoại, tuy nhiên, bạn
cần chút ít thời gian để làm quen với tính năng đó. Khi định nghĩa ràng buộc tham chiếu, bạn có
thể định nghĩa một phép tìm kiếm tự động trong các dòng của bảng cha. Ở Hình 2-7, cột thứ ba
trong bảng Orders được hiển thị Customer ID. Tuy nhiên, ở Hình 2-6, bạn có thể thấy cột thứ ba
trong bảng Orders là cột Customer, hiển thị tên khách hàng. Nếu nhấn vào cột Customer ở một
dòng bất kỳ, một menu xổ xuống xuất hiện, cho phép bạn chọn những khách hàng hợp lệ (từ bảng
Customers) làm cha (chủ) của dòng đang chọn trong bảng Orders. Tương tự, cột Employee ID
của bảng Orders hiển thị tên nhân viên. Tính năng này rất dễ sử dụng và tiện lợi cho người dùng,
ngăn không cho phép kết hợp một khách hàng hay một nhân viên không tồn tại với một đơn hàng.
Tuy nhiên, tính năng này lại ẩn đi khóa ngoại, và vì thế, Hình 2-6 không hữu dụng khi minh họa
cho hoạt động của ràng buộc tham chiếu. Hình 2-8 liệt kê các phần tử trong bảng Orders với tính
năng tự động tìm kiếm đã được vô hiệu hóa, bạn có thể thấy các giá trị khóa ngoại thực sự ở cột
Employee ID và Customer ID.
Khi cập nhật bảng Orders (như ở Hình 2-8), RDBMS sẽ thực thi các ràng buộc tham chiếu mà
chúng ta đã định nghĩa trong bảng. Điểm mạnh của ràng buộc cơ sở dữ liệu là chúng được thực
thi tự động, vì thế các ràng buộc luôn có hiệu lực trừ khi bị DBA vô hiệu hóa.
Dưới đây là những sự kiện đặc biệt mà RDBMS phải xử lý khi thực thi các ràng buộc tham chiếu:
45Chương 2: Tìm hiểu các thành phần của cơ sở dữ liệu quan hệ
Hình 2-8 Bảng Orders của Northwind (với các giá trị khóa ngoại).
● Khi bạn chèn một dòng mới vào bảng con, phép chèn sẽ bị từ chối nếu không tồn tại dòng
tương ứng trong bảng cha. Ví dụ, nếu bạn chèn một dòng vào bảng Orders với giá trị cột Em-
ployee ID bằng 12345, RDBMS sẽ kiểm tra xem trong bảng Employees có nhân viên với mã
số (Employee ID) 12345 hay không. Nếu không có, phép chèn sẽ thất bại.
● Khi bạn cập nhật một khóa ngoại trong bảng con, phép cập nhật sẽ bị từ chối nếu giá trị khóa
ngoại mới không tồn tại trong bảng cha. Ví dụ, nếu bạn cố thay đổi giá trị cột Employee ID
(trong bảng Orders) của đơn hàng 48 từ giá trị 4 thành 12345, RDBMS sẽ kiểm tra trong bảng
Employees xem có nhân viên mã số 12345 hay không. Nếu không có, phép cập nhật sẽ thất bại.
● Khi bạn xóa một dòng từ bảng cha, nếu dòng này có liên quan tới một hoặc nhiều dòng khác
trong bảng con thì các dòng trong bảng con cũng phải được xóa, nếu không phép xóa sẽ thất
bại. Hầu hết RDBMS đều cung cấp tùy chọn cho phép tự động xóa các dòng trong bảng con,
gọi là cascading delete. Có thể bạn sẽ băn khoăn vì sao lại phải tự động xóa các dòng trong
bảng con. Hãy cùng xem xét các bảng Orders và Order Details. Nếu một đơn hàng bị xóa, tại
sao không xóa luôn tất cả các dòng chi tiết đơn hàng đó trong cùng một bước? Tuy nhiên, với
bảng Employees, rõ ràng, chúng ta không muốn điều này xảy ra. Nếu xóa nhân viên có mã
số 4 khỏi bảng Employees (có thể do người này không còn là nhân viên nữa), RDBMS phải
kiểm tra xem có dòng nào được gán Employee ID 4 trong bảng Orders hay không, và nếu có
thì phép xóa thất bại. Ở đây, không có bất cứ quy tắc nghiệp vụ nào quy định việc tự động xóa
đơn hàng nếu như một nhân viên rời khỏi công ty.
46 Nhập môn Cơ sở dữ liệu
Trong hầu hết các cơ sở dữ liệu quan hệ, một câu lệnh SQL được sử dụng để định nghĩa một
ràng buộc tham chiếu. SQL sẽ được giới thiệu trong Chương 4. SQL là ngôn ngữ được sử dụng
trong RDBMS để giao tiếp với cơ sở dữ liệu. Nhiều nhà cung cấp cũng hỗ trợ bảng điều khiển giao
diện đồ họa (GUI), cho phép định nghĩa đối tượng cơ sở dữ liệu, ví dụ như ràng buộc tham chiếu.
Ví dụ, trong SQL Server, bảng điều khiển GUI được đặt trong công cụ SQL Server Management
Studio, còn trong Oracle là công cụ SQL Developer. Với Microsoft Access là bảng điều khiển
Relationships, như trong Hình 2-9, được sử dụng để định nghĩa các ràng buộc tham chiếu.
Để tiện theo dõi, trong Hình 2-9 chỉ hiển thị bảng Orders và các bảng cha là Employees và
Customers. Các ràng buộc tham chiếu được biểu diễn bằng những đường nét đậm cùng với ký
tự số 1 nằm gần bảng cha (phía “một”) và ký tự vô cùng (∞) nằm gần bảng con (phía “nhiều”).
Những ràng buộc này được định nghĩa rất đơn giản bằng cách kéo tên của khóa chính trong bảng
Hình 2-9 Bảng điều khiển Relationships của Microsoft Access 2007.
47Chương 2: Tìm hiểu các thành phần của cơ sở dữ liệu quan hệ
Hình 2-10 Bảng điều khiển Edit Relationships của Microsoft Access 2007.
cha vào vị trí tên của khóa ngoại trong bảng con. Sau đó, một cửa sổ pop-up sẽ hiện ra, cho phép
xác định các tùy chọn cho ràng buộc tham chiếu, như trong Hình 2-10.
Ở trên cùng bảng điều khiển Edit Relationships, tên của hai bảng xuất hiện với bảng cha nằm
bên trái và bảng con nằm bên phải. Nếu bạn không biết bảng nào là bảng cha, bảng nào là bảng
con, trường Relationship Type trong bảng này sẽ giúp bạn. Bên dưới tên của mỗi bảng là các dòng
để chọn ra những cột tạo thành khóa chính và khóa ngoại. Hình 2-10 hiển thị cột khóa chính ID
trong bảng Customers và cột khóa ngoại Customer ID trong bảng Orders. Các hộp kiểm (checkbox)
cung cấp một số tùy chọn sau:
● Enforce Referential Integrity Nếu đánh dấu hộp kiểm này, ràng buộc sẽ là bắt buộc; việc
bỏ đánh dấu hộp kiểm này sẽ tắt chế độ bắt buộc ràng buộc.
● Cascade Update Related Fields Nếu đánh dấu hộp kiểm này, mọi thay đổi đối với khóa
chính trong bảng cha sẽ khiến những khóa ngoại tương ứng trong bảng con cũng tự động cập
nhật theo. Tuy nhiên, việc cập nhật khóa chính trong bảng cha ít khi xảy ra.
● Cascade Delete Related Records Nếu đánh dấu hộp kiểm này, khi xóa một dòng trong
bảng cha, các dòng liên quan trong bảng con tự động bị xóa. Đến đây, hãy suy nghĩ thật cẩn
thận. Có những trường hợp bạn nên sử dụng tùy chọn này, như ràng buộc giữa bảng Orders
và bảng Order Details, còn trong một số trường hợp khác, khi sử dụng tùy chọn này sẽ dẫn tới
việc xóa mất những dữ liệu không mong muốn, ví dụ như xóa đi một nhân viên, và tất cả các
đơn hàng do nhân viên đó phụ trách cũng tự động bị xóa khỏi cơ sở dữ liệu.
Bảng tương giao
Quan hệ nhiều - nhiều đã được đề cập ở các phần trước, chỉ ra rằng kiểu quan hệ này không thể
được cài đặt trực tiếp trong cơ sở dữ liệu quan hệ, do đó cần tạo ra một bảng tương giao để có thể
thiết lập được quan hệ nhiều - nhiều. Hình 2-11 đưa ra cách cài đặt của bảng tương giao Order
Details trong Microsoft Access.
48 Nhập môn Cơ sở dữ liệu
Hình 2-11 Bảng tương giao Order Details (Microsoft Access 2007).
Quan hệ nhiều - nhiều giữa đơn hàng và các sản phẩm trong thiết kế khái niệm trở thành
một bảng tương giao (bảng Order Details) trong thiết kế lôgíc. Khi đó, quan hệ nhiều - nhiều
được tách thành hai quan hệ một - nhiều, tại đó bảng tương giao nằm ở phía “nhiều” trong mỗi
quan hệ. Khóa chính của bảng Order Details có thể được tạo bằng cách kết hợp cột Order ID và
Product ID (còn gọi là khóa tự nhiên), trong đó Order ID là khóa ngoại liên kết tới bảng Orders
và Product ID là khóa ngoại liên kết tới bảng Products. Tuy nhiên, trong trường hợp này, nhà thiết
kế chọn phương án thêm vào bảng một cột mới ID làm khóa chính cho bảng Order Details. Khóa
này được gọi là khóa thay thế (surrogate key), bởi nó đã được dùng để thay thế cho khóa tự nhiên
(natural key). Hãy dành chút thời gian để kiểm tra nội dung của bảng tương giao và hai ràng buộc
tham chiếu. Việc hiểu rõ bảng tương giao và các ràng buộc tham chiếu này rất quan trọng, giúp
bạn nắm được cách thức làm việc của cơ sở dữ liệu quan hệ. Sau đây là một số điểm cần xem xét:
● Mỗi dòng trong bảng tương giao Order Details là giao của một sản phẩm và một đơn hàng.
Việc bao gồm cả trường Product Name trong bảng này không có ý nghĩa vì tên sản phẩm là
hoàn toàn như nhau ở mọi trường hợp xuất hiện sản phẩm đó trong một đơn hàng. Tương tự
như vậy, việc thêm cột Customer ID vào bảng Order Details là không cần thiết, vì mỗi dòng
chi tiết trong một đơn hàng đều thuộc về cùng một khách hàng.
49Chương 2: Tìm hiểu các thành phần của cơ sở dữ liệu quan hệ
● Mỗi dòng trong bảng Products có thể có nhiều dòng liên quan trong bảng Order Details (mỗi
sản phẩm có thể được đặt hàng nhiều lần trong các đơn hàng khác nhau), tuy nhiên, mỗi dòng
trong bảng Order Details thuộc về một và chỉ một dòng trong bảng Products.
● Mỗi dòng trong bảng Orders có thể có nhiều dòng liên quan ở bảng Order Details (mỗi đơn
hàng có thể có nhiều dòng chi tiết đơn hàng, mỗi dòng chi tiết cho một sản phẩm), tuy nhiên,
mỗi dòng trong bảng Order Details thuộc về một và chỉ một dòng tại bảng Orders.
Ràng buộc toàn vẹn
Như đã đề cập, những quy tắc nghiệp vụ trong thiết kế khái niệm trở thành các ràng buộc trong
thiết kế lôgíc. Ràng buộc toàn vẹn (integrity constraint) là ràng buộc làm tăng thêm tính chính xác
của dữ liệu trong cơ sở dữ liệu. Ưu điểm chính của ràng buộc toàn vẹn là RDBMS tự động thực
thi những ràng buộc này, tức ràng buộc luôn được duy trì, cho dù bạn kết nối tới cơ sở dữ liệu theo
cách nào đi chăng nữa (trừ khi bạn là DBA). Một số kiểu ràng buộc toàn vẹn chủ yếu là ràng buộc
NOT NULL, ràng buộc CHECK và ràng buộc bắt buộc với các trigger.
Ràng buộc NOT NULL
Khi định nghĩa cột trong cơ sở dữ liệu, bạn có thể xác định cột có được cho phép nhận giá trị null
hay không. Giá trị null (null value) trong cơ sở dữ liệu quan hệ là một mã đặc biệt, được đặt vào
một cột để biểu thị rằng giá trị của cột đó trong hàng là không xác định. Giá trị null không giống
giá trị trống, chuỗi rỗng, hay giá trị không - đây là một mã đặc biệt, không biểu thị ý nghĩa nào
khác trong cơ sở dữ liệu.
Cách xử lý thống nhất đối với giá trị null được quy định trong tiêu chuẩn ANSI/ISO SQL.
Tuy nhiên, đã có nhiều tranh luận về tính hữu ích của giá trị null, vì các cơ sở dữ liệu không
thể cho bạn biết tại sao giá trị lại không xác định. Ví dụ, nếu để giá trị cột Job Title trong bảng
Employees bằng null, bạn không thể biết liệu giá trị đó là null vì giá trị là không xác định (bạn
biết rằng, mỗi nhân viên phải có một chức danh, nhưng lại không biết đó là chức danh gì), chức
danh đó không có (có lẽ một số nhân viên không có chức danh), hay vì không được gán (các nhân
viên nhất định phải có một chức danh, song có thể người quản lý chưa nghĩ ra chức danh cho họ).
Một tình huống khác, do giá trị null là không xác định nên không thể mang ra so sánh với các giá
trị khác, kể cả giá trị null khác, điều này dẫn đến khái niệm lôgíc ba giá trị khi tìm kiếm trong cơ
sở dữ liệu. Khi sử dụng giá trị null, một phép tìm kiếm có thể trả về điều kiện true (nếu cột thỏa
mãn điều kiện tìm kiếm), false (nếu cột không thỏa mãn điều kiện tìm kiếm), hoặc không xác định
(nếu cột có giá trị null). Các nhà phát triển viết chương trình ứng dụng phải xử lý giá trị null như
một trường hợp đặc biệt. Bạn sẽ hiểu thêm về giá trị null trong Chương 4 khi học về SQL.
Trong Microsoft Access, ràng buộc NOT NULL được điều khiển bởi tùy chọn Required trong
cửa sổ thiết kế bảng. Hình 2-12 đưa ra định nghĩa cột Discount trong bảng Order Details. Cột này
là bắt buộc (không được phép nhận giá trị null) vì tùy chọn Required được thiết lập là Yes. Trong
định nghĩa bảng bằng SQL, bạn chỉ cần đặt từ khóa NULL hoặc NOT NULL vào định nghĩa cột.
Hãy chú ý tới các giá trị mặc định! Trong Oracle, nếu bạn bỏ qua ràng buộc NOT NULL thì giá
trị mặc định là NULL, có nghĩa rằng cột đó có thể nhận giá trị null.
50 Nhập môn Cơ sở dữ liệu
Hình 2-12 Cửa sổ định nghĩa bảng Order Details, cột Discount.
Nhưng trong một số RDBMS như DB2, Microsoft SQL Server, và Sybase ASE thì ngược lại: Nếu
bạn bỏ qua ràng buộc NOT NULL, giá trị mặc định là NOT NULL, có nghĩa rằng cột đó không
thể chứa giá trị null.
Ràng buộc CHECK
Ràng buộc CHECK sử dụng một câu lệnh lôgíc đơn giản để kiểm tra tính hợp lệ của giá trị cột.
Kết quả của câu lệnh lôgíc đó phải là giá trị lôgíc true hoặc false, nếu kết quả bằng true, giá trị
cột sẽ được cho phép đặt vào bảng; ngược lại, nếu kết quả bằng false, giá trị cột sẽ bị từ chối và
RDBMS sẽ đưa ra thông báo lỗi tương ứng. Trong Hình 2-12, hãy để ý ràng buộc =0
xuất hiện trong tùy chọn Validation Rule của cột Discount. Quy tắc kiểm tra này không cho phép
giá trị của cột Discount (tỷ lệ chiết khấu) lớn hơn 100% (giá trị 1,00) hoặc nhỏ hơn 0%. Mặc dù
cú pháp của tùy chọn Validation Rule có thể rất khác nhau, song mục đích thì giống nhau. Trong
Oracle SQL, ràng buộc trên được viết như sau:
CHECK (DISCOUNT =0)
51Chương 2: Tìm hiểu các thành phần của cơ sở dữ liệu quan hệ
Các ràng buộc thực thi sử dụng trigger
Một số ràng buộc phức tạp không thể sử dụng khai báo để thực thi được. Ví dụ, quy tắc nghiệp vụ
trong Hình 2-1 (Những khách hàng vẫn còn nợ quá hạn không được phép đặt đơn hàng mới) thuộc
nhóm ràng buộc phức tạp vì nó liên quan tới nhiều bảng khác nhau. Nếu kiểm tra thấy dòng trong
bảng Account Receivable của khách hàng đó có số dư nợ quá hạn lớn hơn 0, ta cần ngăn không
cho phép thêm dòng mới vào bảng Orders. Như đã nói, cách thực thi tốt nhất các quy tắc nghiệp
vụ như vậy là thực thi chúng trong lôgíc của ứng dụng. Tuy nhiên, nếu muốn thêm một ràng buộc
và yêu cầu ràng buộc này luôn được thực thi, không phụ thuộc vào cách thức cập nhật cơ sở dữ
liệu, bạn có thể chọn trigger. Trigger là một mô-đun lôgíc lập trình, được kích hoạt khi xảy ra một
sự kiện cụ thể trong cơ sở dữ liệu. Ở ví dụ này, chúng ta muốn trigger kích hoạt khi một dòng mới
được thêm vào bảng Orders. Trigger này có nhiệm vụ lấy về số dư nợ quá hạn (overdue amount)
của khách hàng từ bảng Account Receivable. Nếu số dư nợ quá hạn lớn hơn 0, trigger sẽ phát ra
một lỗi, làm dừng truy vấn thêm dòng, đồng thời trả về thông báo lỗi tương ứng.
Trong Microsoft Access, các trigger được viết dưới dạng macro sử dụng ngôn ngữ Microsoft
Visual Basic for Applications (VBA). Một số RDBMS cung cấp một ngôn ngữ đặc biệt để viết
các mô-đun chương trình như trigger: PL/SQL của Oracle, Transact SQL trong Microsoft SQL
Server và Sybase ASE. Một số RDBMS khác, ví dụ như DB2, có thể sử dụng ngôn ngữ lập trình
chung như C.
View
View (khung nhìn) là một truy vấn cơ sở dữ liệu được lưu trữ, cung cấp cho người dùng tập dữ
liệu tổng hợp từ một hoặc nhiều bảng trong cơ sở dữ liệu. Nói cách khác, view là một bảng ảo,
vì hình thức và hầu hết thành phần của view đều rất giống bảng, ngoại trừ một điều là view
không chứa dữ liệu (view đơn giản chỉ là một truy vấn được lưu trữ trong cơ sở dữ liệu). View
người dùng tạo thành lớp ngoài trong mô hình ANSI/SPARC. Trong quá trình thiết kế lôgíc,
view được tạo ra bằng cách sử dụng phương pháp tương ứng với một cơ sở dữ liệu cụ thể. Ở
hầu hết các RDBMS, view được tạo ra bằng SQL. Trong Microsoft Access, view không được
hỗ trợ trực tiếp. Tuy nhiên, Access hỗ trợ một kiểu đối tượng tương đương với view là truy vấn
(query), được tạo ra bằng cách sử dụng bảng điều khiển Query. Hình 2-13 cho thấy cách thức
Microsoft Access định nghĩa một view đơn giản để liệt kê tất cả các đơn hàng của khách hàng ở
bang Washington.
52 Nhập môn Cơ sở dữ liệu
Hình 2-13 Định nghĩa view trong Microsoft Access 2007: Liệt kê tất cả các đơn hàng của
khách hàng ở bang Washington.
View trong Hình 2-13 hiển thị hai cột từ bảng Customer cùng ba cột từ bảng Orders. View
này còn so khớp (kết nối) bảng Customers và bảng Orders, đồng thời lọc các dòng để chỉ chọn ra
những đơn hàng của khách hàng ở bang Washington. Phép lọc này được thực hiện bằng cách thiết
lập thuộc tính Criteria trong cột State/Province (= ‘WA’). Chúng ta sẽ tìm hiểu chi tiết về bảng
điều khiển Query của Microsoft Access trong Chương 3. Hình 2-14 hiển thị kết quả thực thi của
truy vấn trên. Mặc dù có hai khách hàng ở Washington, song chỉ một người trong số họ có đơn
hàng, và chỉ có hai đơn hàng xuất hiện trong bảng kết quả.
Các view phục vụ một số chức năng hữu dụng như:
● Ẩn các cột mà người dùng không cần nhìn thấy (hoặc không được phép nhìn thấy).
● Ẩn các dòng mà người dùng không cần nhìn thấy (hoặc không được phép nhìn thấy).
● Ẩn các phép xử lý phức tạp trong cơ sở dữ liệu, ví dụ như phép kết nối.
● Tăng tốc độ xử lý truy vấn (trong một số RDBMS, ví dụ như Microsoft SQL Server).
53Chương 2: Tìm hiểu các thành phần của cơ sở dữ liệu quan hệ
Hình 2-14 Kết quả thực thi của truy vấn được thể hiện trong Hình 2-13.
Bài tự trắc nghiệm kiến thức Chương 2
Chọn đáp án đúng cho các câu hỏi lựa chọn và câu hỏi điền vào chỗ trống. Chú ý, có thể có nhiều
đáp án đúng cho mỗi câu hỏi.
1. Ví dụ nào sau đây là thực thể?
A. Một khách hàng.
B. Một đơn hàng của khách hàng.
C. Tiền lương của nhân viên.
D. Tên của khách hàng.
2. Ví dụ nào sau đây là thuộc tính?
A. Một nhân viên.
B. Tên của nhân viên.
C. Tiền lương của nhân viên.
D. Một danh sách tên của các nhân viên được sắp xếp theo thứ tự ABC.
3. Dấu hiệu nào sau đây biểu thị cho lực lượng quan hệ bằng “0, 1, hoặc nhiều” trên đường biểu
diễn quan hệ?
A. Một dấu vuông góc và dấu ký hiệu hình vương miện gần vị trí kết thúc của đường quan hệ.
B. Một vòng tròn gần vị trí kết thúc của đường quan hệ và dấu ký hiệu hình vương miện ở
vị trí kết thúc của đường quan hệ.
C. Hai dấu vuông góc gần vị trí kết thúc của đường quan hệ.
D. Một vòng tròn và dấu vuông góc gần vị trí kết thúc của đường quan hệ.
54 Nhập môn Cơ sở dữ liệu
4. Đâu là kiểu quan hệ hợp lệ trong cơ sở dữ liệu quan hệ?
A. Một - nhiều.
B. Không - nhiều.
C. Nhiều - nhiều.
D. Một - một.
5. Một sản phẩm có thể được sản xuất tại nhiều nhà máy, và một nhà máy có thể sản xuất nhiều
loại sản phẩm, ví dụ này biểu diễn kiểu quan hệ nào?
A. Một - một.
B. Một - nhiều.
C. Nhiều - nhiều.
D. Đệ quy.
6. Trong các ví dụ dưới đây, ví dụ nào là quan hệ đệ quy?
A. Một đơn vị tổ chức của một phòng ban.
B. Một nhân viên quản lý các nhân viên khác.
C. Một nhân viên quản lý một phòng.
D. Một nhân viên có nhiều người cấp dưới.
7. Ví dụ nào sau đây là quy tắc nghiệp vụ?
A. Một ràng buộc tham chiếu phải tham chiếu tới khóa chính của bảng cha.
B. Tuổi của nhân viên phải lớn hơn hoặc bằng 18.
C. Một truy vấn loại bỏ các cột nhân viên không được phép xem.
D. Các nhân viên có bậc lương dưới 6 không được phép thay đổi các đơn hàng.
8. Một bảng quan hệ
A. Được tạo thành từ các cột và các hàng.
B. Phải được gán một kiểu dữ liệu xác định.
C. Phải được gán một tên duy nhất.
D. Là đơn vị lưu trữ cơ bản trong mô hình quan hệ.
9. Một cột trong bảng quan hệ
A. Phải được gán một kiểu dữ liệu xác định.
B. Phải được gán một tên duy nhất trong bảng.
C. Được kế thừa từ một thực thể trong thiết kế khái niệm.
D. Là đơn vị lưu trữ nhỏ nhất được đặt tên trong cơ sở dữ liệu quan hệ.
10. Một kiểu dữ liệu
A. Hỗ trợ DBMS trong việc lưu trữ dữ liệu hiệu quả.
55Chương 2: Tìm hiểu các thành phần của cơ sở dữ liệu quan hệ
B. Cung cấp tập các hành vi cho một cột hỗ trợ người dùng.
C. Có thể được chọn dựa vào các quy tắc nghiệp vụ đối với một thuộc tính.
D. Giới hạn các ký tự được phép sử dụng trong cột.
11. Một ràng buộc khóa chính
A. Phải tham chiếu tới một hoặc nhiều cột trong một bảng.
B. Phải được định nghĩa cho tất cả các bảng trong cơ sở dữ liệu.
C. Thường được cài đặt bằng cách sử dụng một chỉ mục.
D. Đảm bảo rằng, không có hai dòng nào trong bảng có cùng giá trị khóa chính.
12. Ràng buộc tham chiếu
A. Phải có các cột khóa chính và khóa ngoại cùng tên.
B. Đảm bảo rằng, một giá trị khóa chính không bị trùng nhau trong một bảng.
C. Định nghĩa một quan hệ nhiều - nhiều giữa hai bảng.
D. Đảm bảo rằng, một giá trị khóa ngoại tham chiếu tới một giá trị khóa chính trong bảng cha.
13. Một ràng buộc tham chiếu được định nghĩa
A. Sử dụng bảng điều khiển Relationships trong Microsoft Access.
B. Sử dụng SQL trong hầu hết các cơ sở dữ liệu quan hệ.
C. Sử dụng kiểu dữ liệu tham chiếu cho cột (các cột) khóa ngoại.
D. Sử dụng một trigger.
14. Các kiểu ràng buộc toàn vẹn là
A. Ràng buộc CHECK.
B. Quan hệ một - một.
C. Ràng buộc NOT NULL.
D. Ràng buộc bắt buộc thực thi với các trigger.
15. Bảng ___________ được sử dụng để giải quyết các quan hệ nhiều - nhiều.
16. Một thực thể trong thiết kế mức khái niệm sẽ được ánh xạ thành một ___________ trong thiết
kế mức lôgíc.
17. Một thuộc tính trong thiết kế mức khái niệm sẽ được ánh xạ thành một ___________ trong
thiết kế mức lôgíc.
18. Các phần tử bên ngoài trong mô hình ANSI/SPARC sẽ trở thành ___________ trong thiết kế
mức lôgíc.
19. Một quan hệ trong thiết kế mức khái niệm sẽ được ánh xạ thành một __________ trong thiết
kế mức lôgíc.
20. Một ràng buộc khóa chính (primary key) được thực thi bằng cách sử dụng một __________
trong thiết kế mức lôgíc.
Các file đính kèm theo tài liệu này:
- trichdan_csdl_3818.pdf