Rời rạc hóa dữ liệu Thu giảm số trị của một thuộc tính liên tục (continuous attribute) bằng cách chia miền trị thành các khoảng (interval) có dán nhãn. Các nhãn này được dùng thay cho các giá trị thực. Tiến hành theo hai cách: trên xuống (top down) và dưới lên (bottom up), có giám sát (supervised) và không có giám sát (unsupervised). Tạo phân ho...
56 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1972 | Lượt tải: 1
Khai phá dữ liệu được xem như là một phần của quá trình khám phá tri thức. Quá trình khám phá tri thức là một chuỗi lặp gồm các bước: làm sạch dữ liệu, tích hợp dữ liệu, chọn lựa dữ liệu, biến đổi dữ liệu, khai phá dữ liệu, đánh giá mẫu, và biểu diễn tri thức. Nhiều lĩnh vực khác nhau có liên quan với khai phá dữ liệu: công nghệ cơ sở dữ liệu, l...
61 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1879 | Lượt tải: 1
Hiểu biết - Kỹ năng đạt được Nhận dạng được các vấn đề về dữ liệu trong giai đoạn tiền xử lý cho các tác vụ khai phá dữ liệu Hiểu cách sử dụng khai phá dữ liệu để có được các quyết định tốt hơn Sử dụng được các giải thuật và công cụ khai phá dữ liệu để phát triển ứng dụng khai phá dữ liệu Được chuẩn bị về kiến thức để có thể nghiên cứu trong lĩ...
7 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1253 | Lượt tải: 1
Sports IBM Advanced Scout analyzed NBA game statistics (shots blocked, assists, and fouls) to gain competitive advantage for New York Knicks and Miami Heat Astronomy JPL and the Palomar Observatory discovered 22 quasars with the help of data mining Internet Web Surf-Aid IBM Surf-Aid applies data mining algorithms to Web access logs for market-...
154 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1624 | Lượt tải: 0
Phục hồi trong Shadow Paging • Với multi-user environment, log và checkpoint được sử dụng. • Hạn chế: • Khó kiểm soát vị trí các page trong đĩa gần nhau. • Vấn đề khi ghi directory xuống đĩa trong trường hợp directory quá lớn. • Vấn đề về garbage collection khi giao dịch commit. • Phải đảm bảo tính nguyên tử trong quá trình xử lý current và ...
74 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1642 | Lượt tải: 1
Multiversion – 2PL • Tuy nhiên, khi T muốn hoàn tất (commit), T phải đặt một khóa certify trên tất cả các giá trị mà T đang giữ khóa ghi. • Khi đó T phải đợi cho đến khi tất cả các giá trị đó được mở khóa hoàn toàn bởi các giao dịch đang giữ khóa đọc mới có thể hoàn tất việc đặt khóa Certify. • Cập nhật X bằng X’, xóa X’ và mở khóa certify.
84 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1543 | Lượt tải: 0
8. Viết stored-procedure đăng bán sản phẩm Input: mã sản phẩm, tên sản phẩm, mô tả, đơn giá, số lượng tồn, số lượng tối thiểu, mã danh mục Output: 1: Đăng bán thành công 2: Đơn giá <=0 3: Số lượng tồn <= 0 4: Số lượng tối thiểu <= 0 5: Danh mục không tồn tại -1: Đăng bán không thành công
4 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1644 | Lượt tải: 1
REPEATABLE READ • Tình huống trong khi đang truy xuất dữ liệu lại có sự cập nhật dữ liệu đó ở một giao tác khác dẫn đến sự không nhất quán về dữ liệu. • Do đó cần đến REPEATABLE READ • Cú pháp: • SET TRANSACTION ISOLATION LEVEL REPEATABLE READ
89 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 3190 | Lượt tải: 2
Nội dung môn học • Tổng quan chung về hệ CSDL • Giao tác và xử lý giao tác • Các giao tác song song • Các kĩ thuật phục hồi dữ liệu • An ninh CSDL • Cơ sở dữ liệu phân tán
7 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1355 | Lượt tải: 1
Đơn giản hóa truy vấn có tham số Đơn giản hóa truy vấn có tham số: áp dụng đại số quan hệ định tính để xác định các vị từ định tính của các biểu thức con là mâu thuẫn với nhau. Biểu diễn phép đơn giản hóa ở thời gian chạy: - Thay thế các phép hợp bởi một phép toán mới n−ngôi, được gọi là CUT. - Phép toán CUT thực hiện phép hợp của chỉ ...
46 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1492 | Lượt tải: 0