Bài giảng Cơ sở dữ liệu - ThS. Lương Thị Ngọc Khánh
Bài tập chương 1
• 1. Hãy nêu các điểm khác nhau chính giữa
một hệ xử lý tệp và một hệ quản trị CSDL.
• 2. Phân biệt các thuật ngữ sau đây:
– dữ liệu
– cơ sở dữ liệu
– hệ quản trị cơ sở dữ liệu
– hệ cơ sở dữ liệu
25 trang |
Chia sẻ: maiphuongtl | Lượt xem: 2507 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Cơ sở dữ liệu - ThS. Lương Thị Ngọc Khánh, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
CƠ SỞ DỮ LIỆU
GV: ThS. Lương Thị Ngọc Khánh
Email: ltnkhanh@it.tdt.edu.vn
Web: it.tdt.edu.vn/~ltnkhanh
Chương I
GIỚI THIỆU
- Giới thiệu các mô hình dữ liệu và
hệ CSDL
- Kiến trúc 3 mức và độc lập dữ liệu
- Ngôn ngữ CSDL
- Môi trường hệ CSDL
3 01-2014 504009 – Giới thiệu
Các hệ thống dùng phương pháp
xử lý tập tin
• Dữ liệu được lưu trữ dưới dạng file
• Hệ thống dùng phương pháp xử lý tập tin:
– được sử dụng rộng rãi trong suốt những năm
60s, 80s
– Ưu điểm:
• thời gian triển khai ngắn, ít đầu tư lớn về vật chất,
nhân sự và công sức phân tích - thiết kế, rất phù hợp
với các bài toán nhỏ.
– Tuy nhiên, đối với các bài toán có nhu cầu xử lý
dữ liệu lớn các vấn đề sau sẽ nảy sinh:
4 01-2014 504009 – Giới thiệu
Các hệ thống dùng phương pháp xử
lý tập tin (tt)
• Tính dư thừa dữ liệu:
– sự lặp đi lặp lại của những thông tin được lưu trữ
lãng phí công sức dị thường dữ liệu.
• Tính dị thường (không nhất quán):
– tại một thời điểm thông tin về cùng một đối tượng có
thể khác nhau trên các tập tin khác nhau trong cùng
một hệ thống thông tin (thường do dư thừa dữ liệu gây
ra).
5 01-2014 504009 – Giới thiệu
Các hệ thống dùng phương pháp xử
lý tập tin (tt)
• Các vấn đề về tính nguyên tố của các giao tác:
– với tệp xử lý truyền thống khó có thể đảm bảo được
tính chất “hoặc thực hiện hoàn toàn hoặc không thực
hiện gì” và khó đưa được hệ thống trở về trạng thái
nhất quán trước khi xảy ra sự cố.
– Sự thiếu chia sẻ thông tin giữa các hệ thống và khó
mở rộng hệ thống hay kết nối với các hệ thống khác.
• Các vấn đề toàn vẹn:
– khi có thêm những ràng buộc mới, khó thay đổi các
chương trình để có thể tuân thủ chúng.
6 01-2014 504009 – Giới thiệu
Các hệ thống dùng phương pháp xử
lý tập tin (tt)
• Các dị thường của truy cập tương tranh:
– để tăng tính hiệu quả và trả lời nhanh hơn, nhiều hệ
thống cho phép nhiều người dùng cập nhật dữ liệu
đồng thời dữ liệu không nhất quán.
• Tính không toàn vẹn, an toàn dữ liệu:
– Thể hiện sự không đầy đủ của các thông tin cần lưu
trữ cho các mục đích yêu cầu của hệ thống thông tin.
An toàn dữ liệu như các cơ chế bảo mật, phân cấp đối
tượng sử dụng dữ liệu và cả việc sao lưu dữ liệu dự
phòng.
Để khắc phục và giải quyết được các vấn đề
trên, buộc chúng ta phải thay đổi cách tiếp
cận hệ thống tiếp cận CSDL.
7 01-2014 504009 – Giới thiệu
Cơ sở dữ liệu - Khái niệm
• Cơ sở dữ liệu:
– Tập hợp có cấu trúc của thông tin, được lưu trữ
trên các thiết bị trữ tin để có thể thỏa mãn yêu
cầu khai thác thông tin đồng thời cho nhiều
người sử dụng hay nhiều chương trình ứng
dụng với các mục đích khác nhau.
8 01-2014 504009 – Giới thiệu
Cơ sở dữ liệu - Khái niệm (tt)
• Ưu điểm:
– Về bản thân thông tin lưu trữ:
• Giảm thiểu sự trùng lắp thông tin đến mức thấp nhất,
do đó:
– Bảo đảm tính nhất quán
– Tính toán vẹn của dữ liệu
• Đảm bảo DL có thể được truy xuất theo nhiều cách
khác nhau.
• Khả năng chia sẻ thông tin cho nhiều người sử dụng
và nhiều ứng dụng khác nhau.
9 01-2014 504009 – Giới thiệu
Cơ sở dữ liệu - Khái niệm (tt)
• Ưu điểm: (tt)
– Về hiệu quả sử dụng thông tin:
• Chia sẻ thông tin cho nhiều người dùng khác nhau
• Tiết kiệm tài nguyên
• Tăng hiệu quả khai thác
10 01-2014 504009 – Giới thiệu
Cơ sở dữ liệu - Khái niệm (tt)
• Những vấn đề nảy sinh:
– Cần xác định rõ trách nhiệm đối với
• Sự an toàn của dữ liệu
• Tính chính xác của dữ liệu
– Ai có trách nhiệm cập nhật, chỉnh sửa
– Những thông tin nào được phép sửa
– Cần một cơ chế bảo mật hay phân quyền khai
thác thông tin.
11 01-2014 504009 – Giới thiệu
Cơ sở dữ liệu - Khái niệm (tt)
• Những vấn đề nảy sinh: (tt)
– Giải quyết sự tranh chấp trong truy cập dữ liệu
khi có nhiều người dùng cùng truy cập đến một
nguồn dữ liệu.
– CSDL cũng có chu kỳ sống tương tự phần mềm
đòi hỏi người phân tích, thiết kế có chuyên
môn, nhiều kinh nghiệm.
12 01-2014 504009 – Giới thiệu
Kiến trúc 3 mức của hệ CSDL
• Theo ANSI-PARC có 3 mức biểu diễn một
CSDL:
– Mức khung nhìn (mức ngoài):
– các khung nhìn khác nhau của những người sử dụng
đặt vào CSDL
– Mức logic (mức khái niệm):
– dữ liệu nào được lưu trữ trong CSDL và mối quan hệ
giữa chúng
– Mức vật lý (mức trong):
– dữ liệu được thực sự lưu trữ như thế nào trong
CSDL
Slide 1-12
13 01-2014 504009 – Giới thiệu
Kiến trúc ba mức của một hệ
CSDL (tt)
14 01-2014 504009 – Giới thiệu
Lược đồ & thể hiện của CSDL
• Toàn bộ mô tả CSDL được gọi là lược đồ
CSDL (database schema). Có 3 loại lược đồ
tương ứng với kiến trúc 3 mức của hệ
CSDL:
– Lược đồ ngoài (lược đồ con)
– Lược đồ logic
– Lược đồ vật lý
15 01-2014 504009 – Giới thiệu
Lược đồ & thể hiện của CSDL (tt)
MaNV Hodem Ten Tuoi Luong
Khung nhìn 1
MaNV Ten Ma_chi_nhanh
Khung nhìn 2
MaNV Hodem Ten Ngay_sinh Tuoi Luong Ma_chi_nhanh
Mức logic
Mức vật lý
Struct NHANVIEN{
int MaNV; int Ma_chi_nhanh; char Hodem[15];
char Ten[15];
struct date Ngay_sinh;
float Luong;
struct NHANVIEN next; /* con trỏ đến bản ghi tiếp của tệp
NHANVIEN*/
};
16 01-2014 504009 – Giới thiệu
Lược đồ &thể hiện của CSDL (tt)
• Toàn bộ dữ liệu lưu trữ trong CSDL tại một
thời điểm nhất định được gọi là một thể
hiện của CSDL (database instance).
Nhiều thể hiện của CSDL có thể tương ứng
với cùng một lược đồ CSDL.
17 01-2014 504009 – Giới thiệu
Sự độc lập dữ liệu
• Sự độc lập dữ liệu (data independence)
– Các lược đồ ở mức trên không bị ảnh hưởng khi
có sự thay đổi các lược đồ ở mức dưới.
• Có 2 loại độc lập dữ liệu:
– Độc lập dữ liệu vật lý
– Độc lập dữ liệu logic
18 01-2014 504009 – Giới thiệu
Sự độc lập dữ liệu (tt)
Slide 1-18
19 01-2014 504009 – Giới thiệu
Các đối tượng sử dụng CSDL
• Người sử dụng không chuyên về lĩnh vực tin
học và CSDL:
– Csdl cần có các công cụ để những người này có
thể sử dụng và khái thác csdl khi cần.
• Chuyên viên tin học biết khai thác csdl:
– Những người này có thể xây dựng các ứng
dụng khác nhau phục vụ cho nhiều mục đích
khác nhau trên csdl.
20 01-2014 504009 – Giới thiệu
Các đối tượng sử dụng CSDL (tt)
• Người quản trị CSDL:
– Là người hiểu biết về tin học, về các hệ quản trị
csdl và hệ thống máy tính.
– Là người tổ chức csdl (khai báo cấu trúc, ghi
nhận yêu cầu bảo mật)
– Là người cấp quyền hạn khai thác csdl.
21 01-2014 504009 – Giới thiệu
Hê ̣ quản trị CSDL
• Hệ quản trị cơ sở dữ liệu (HQTCSDL,
database management system).
– Phần mềm dùng để tạo lập và xử lý dữ liệu.
– Các HQTCSDL thường gặp như: Oracle,
Paradox, MS Access, Sybase, Foxpro, SQL
Server….
• CSDL là một thành phần trong HQTCSDL.
22 01-2014 504009 – Giới thiệu
Hê ̣ quản trị CSDL (tt)
• Các chức năng của HQTCSDL
Một HQTCSDL phải có khả năng giải quyết
tốt những vấn đề mà cách tổ chức CSDL đặt
ra, hai khả năng cơ bản là:
– Quản lý dữ liệu ở mức xử lý tệp như một hệ
điều hành
– Truy cập các khối lượng dữ liệu lớn có hiệu quả
23 01-2014 504009 – Giới thiệu
Hê ̣ quản trị CSDL (tt)
• Các chức năng của HQTCSDL (tt)
– Cung cấp giao diện giữa users và CSDL; giữa
CSDL với các hệ thống khác.
– Cung cấp một số ngôn ngữ bậc cao
– Quản lý giao tác, phân quyền và an toàn dữ liệu
– Điều khiển sự tương hợp, tính toàn vẹn
– Kiểm tra độ tin cậy của dữ liệu.
24 01-2014 504009 – Giới thiệu
Bài tập chương 1
• 1. Hãy nêu các điểm khác nhau chính giữa
một hệ xử lý tệp và một hệ quản trị CSDL.
• 2. Phân biệt các thuật ngữ sau đây:
– dữ liệu
– cơ sở dữ liệu
– hệ quản trị cơ sở dữ liệu
– hệ cơ sở dữ liệu
25 01-2014 504009 – Giới thiệu
Bài tập chương 1 (tt)
• 3. Cho ví dụ về tính toàn vẹn dữ liệu và sự vi
phạm tính toàn vẹn dữ liệu.
• 4. Phân biệt vai trò của những người sau
đây đối với một hệ CSDL:
– Người quản trị CSDL (DBA), Người thiết kế
CSDL logic, Người thiết kế CSDL vật lí, Người
lập trình ứng dụng, Người sử dụng đầu cuối.