• Bài giảng Khai phá dữ liệu (Data mining) - Chương 02: Các vấn đề tiền xử lý dữ liệuBài giảng Khai phá dữ liệu (Data mining) - Chương 02: Các vấn đề tiền xử lý dữ liệu

    Rời rạc hóa dữ liệu Thu giảm số trị của một thuộc tính liên tục (continuous attribute) bằng cách chia miền trị thành các khoảng (interval) có dán nhãn. Các nhãn này được dùng thay cho các giá trị thực. Tiến hành theo hai cách: trên xuống (top down) và dưới lên (bottom up), có giám sát (supervised) và không có giám sát (unsupervised). Tạo phân ho...

    ppt56 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1972 | Lượt tải: 1

  • Bài giảng Khai phá dữ liệu (Data mining) - Chương 01: Tổng quan về khai phá dữ liệuBài giảng Khai phá dữ liệu (Data mining) - Chương 01: Tổng quan về khai phá dữ liệu

    Khai phá dữ liệu được xem như là một phần của quá trình khám phá tri thức. Quá trình khám phá tri thức là một chuỗi lặp gồm các bước: làm sạch dữ liệu, tích hợp dữ liệu, chọn lựa dữ liệu, biến đổi dữ liệu, khai phá dữ liệu, đánh giá mẫu, và biểu diễn tri thức. Nhiều lĩnh vực khác nhau có liên quan với khai phá dữ liệu: công nghệ cơ sở dữ liệu, l...

    ppt61 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1879 | Lượt tải: 1

  • Bài giảng Khai phá dữ liệu (Data mining) - Giới thiệuBài giảng Khai phá dữ liệu (Data mining) - Giới thiệu

    Hiểu biết - Kỹ năng đạt được Nhận dạng được các vấn đề về dữ liệu trong giai đoạn tiền xử lý cho các tác vụ khai phá dữ liệu Hiểu cách sử dụng khai phá dữ liệu để có được các quyết định tốt hơn Sử dụng được các giải thuật và công cụ khai phá dữ liệu để phát triển ứng dụng khai phá dữ liệu Được chuẩn bị về kiến thức để có thể nghiên cứu trong lĩ...

    ppt7 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1253 | Lượt tải: 1

  • Chapter 2: Data MiningChapter 2: Data Mining

    Sports IBM Advanced Scout analyzed NBA game statistics (shots blocked, assists, and fouls) to gain competitive advantage for New York Knicks and Miami Heat Astronomy JPL and the Palomar Observatory discovered 22 quasars with the help of data mining Internet Web Surf-Aid IBM Surf-Aid applies data mining algorithms to Web access logs for market-...

    ppt154 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1624 | Lượt tải: 0

  • Bài giảng Hệ quản trị cơ sở dữ liệu - Các kĩ thuật phục hồi CSDLBài giảng Hệ quản trị cơ sở dữ liệu - Các kĩ thuật phục hồi CSDL

    Phục hồi trong Shadow Paging • Với multi-user environment, log và checkpoint được sử dụng. • Hạn chế: • Khó kiểm soát vị trí các page trong đĩa gần nhau. • Vấn đề khi ghi directory xuống đĩa trong trường hợp directory quá lớn. • Vấn đề về garbage collection khi giao dịch commit. • Phải đảm bảo tính nguyên tử trong quá trình xử lý current và ...

    pdf74 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1642 | Lượt tải: 1

  • Bài giảng Hệ quản trị cơ sở dữ liệu - Điều khiển giao dịch đồng thờiBài giảng Hệ quản trị cơ sở dữ liệu - Điều khiển giao dịch đồng thời

    Multiversion – 2PL • Tuy nhiên, khi T muốn hoàn tất (commit), T phải đặt một khóa certify trên tất cả các giá trị mà T đang giữ khóa ghi. • Khi đó T phải đợi cho đến khi tất cả các giá trị đó được mở khóa hoàn toàn bởi các giao dịch đang giữ khóa đọc mới có thể hoàn tất việc đặt khóa Certify. • Cập nhật X bằng X’, xóa X’ và mở khóa certify.

    pdf84 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1543 | Lượt tải: 0

  • Bài giảng Hệ quản trị cơ sở dữ liệu - Bài tập Stored ProcedureBài giảng Hệ quản trị cơ sở dữ liệu - Bài tập Stored Procedure

    8. Viết stored-procedure đăng bán sản phẩm Input: mã sản phẩm, tên sản phẩm, mô tả, đơn giá, số lượng tồn, số lượng tối thiểu, mã danh mục Output: 1: Đăng bán thành công 2: Đơn giá <=0 3: Số lượng tồn <= 0 4: Số lượng tối thiểu <= 0 5: Danh mục không tồn tại -1: Đăng bán không thành công

    pdf4 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1644 | Lượt tải: 1

  • Bài giảng Hệ quản trị cơ sở dữ liệu - TransactionBài giảng Hệ quản trị cơ sở dữ liệu - Transaction

    REPEATABLE READ • Tình huống trong khi đang truy xuất dữ liệu lại có sự cập nhật dữ liệu đó ở một giao tác khác dẫn đến sự không nhất quán về dữ liệu. • Do đó cần đến REPEATABLE READ • Cú pháp: • SET TRANSACTION ISOLATION LEVEL REPEATABLE READ

    pdf89 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 3190 | Lượt tải: 2

  • Bài giảng Hệ quản trị cơ sở dữ liệu - Giới thiệuBài giảng Hệ quản trị cơ sở dữ liệu - Giới thiệu

    Nội dung môn học • Tổng quan chung về hệ CSDL • Giao tác và xử lý giao tác • Các giao tác song song • Các kĩ thuật phục hồi dữ liệu • An ninh CSDL • Cơ sở dữ liệu phân tán

    pdf7 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1355 | Lượt tải: 1

  • Bài giảng Cơ sở dữ liệu phân tán - Chương 5 Biến đổi các truy vấn toàn cục thành các truy vấn mảnhBài giảng Cơ sở dữ liệu phân tán - Chương 5 Biến đổi các truy vấn toàn cục thành các truy vấn mảnh

    Đơn giản hóa truy vấn có tham số ™ Đơn giản hóa truy vấn có tham số: áp dụng đại số quan hệ định tính để xác định các vị từ định tính của các biểu thức con là mâu thuẫn với nhau. ™ Biểu diễn phép đơn giản hóa ở thời gian chạy: - Thay thế các phép hợp bởi một phép toán mới n−ngôi, được gọi là CUT. - Phép toán CUT thực hiện phép hợp của chỉ ...

    pdf46 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1492 | Lượt tải: 0