Xem xét sự tương đồng/khác biệt giữa qui trình phát triển ứng dụng truyền thống và ứng dụng khai phá dữ liệu Sự cần thiết của các chuẩn (standards) dành cho khai phá dữ liệu Sự quan tâm của các nhà sản xuất phần mềm đối với việc hỗ trợ phát triển ứng dụng khai phá dữ liệu
22 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1562 | Lượt tải: 1
Khai phá luật kết hợp Được xem như là một trong những đóng góp quan trọng nhất từ cộng đồng cơ sở dữ liệu trong việc khám phá tri thức Các dạng luật: luật kết hợp luận lý/luật kết hợp lượng số, luật kết hợp đơn chiều/luật kết hợp đa chiều, luật kết hợp đơn mức/luật kết hợp đa mức, luật kết hợp/luật tương quan thống kê Các dạng phần tử (item)/mẫu...
67 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1727 | Lượt tải: 1
Gom cụm nhóm các đối tượng vào các cụm dựa trên sự tương tự giữa các đối tượng. Độ đo đo sự tương tự tùy thuộc vào kiểu dữ liệu/đối tượng cụ thể. Các giải thuật gom cụm được phân loại thành: nhóm phân hoạch, nhóm phân cấp, nhóm dựa trên mật độ, nhóm dựa trên lưới, nhóm dựa trên mô hình,
84 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1821 | Lượt tải: 4
Classification với Decision trees ID3, C4.5, CART Classification với mạng Bayesian Dựa trên lý thuyết xác suất thống kê Classification với mạng Neural K-nn classification Dựa trên khoảng cách
51 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1586 | Lượt tải: 1
Khai phá luật kết hợp Được xem như là một trong những đóng góp quan trọng nhất từ cộng đồng cơ sở dữ liệu trong việc khám phá tri thức Các dạng luật: luật kết hợp luận lý/luật kết hợp lượng số, luật kết hợp đơn chiều/luật kết hợp đa chiều, luật kết hợp đơn mức/luật kết hợp đa mức, luật kết hợp/luật tương quan thống kê Các dạng phần tử (item)/mẫu...
66 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 2684 | Lượt tải: 2
Rời rạc hóa dữ liệu Thu giảm số trị của một thuộc tính liên tục (continuous attribute) bằng cách chia miền trị thành các khoảng (interval) có dán nhãn. Các nhãn này được dùng thay cho các giá trị thực. Tiến hành theo hai cách: trên xuống (top down) và dưới lên (bottom up), có giám sát (supervised) và không có giám sát (unsupervised). Tạo phân ho...
56 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 2067 | Lượt tải: 1
Khai phá dữ liệu được xem như là một phần của quá trình khám phá tri thức. Quá trình khám phá tri thức là một chuỗi lặp gồm các bước: làm sạch dữ liệu, tích hợp dữ liệu, chọn lựa dữ liệu, biến đổi dữ liệu, khai phá dữ liệu, đánh giá mẫu, và biểu diễn tri thức. Nhiều lĩnh vực khác nhau có liên quan với khai phá dữ liệu: công nghệ cơ sở dữ liệu, l...
61 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1948 | Lượt tải: 1
Hiểu biết - Kỹ năng đạt được Nhận dạng được các vấn đề về dữ liệu trong giai đoạn tiền xử lý cho các tác vụ khai phá dữ liệu Hiểu cách sử dụng khai phá dữ liệu để có được các quyết định tốt hơn Sử dụng được các giải thuật và công cụ khai phá dữ liệu để phát triển ứng dụng khai phá dữ liệu Được chuẩn bị về kiến thức để có thể nghiên cứu trong lĩ...
7 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1297 | Lượt tải: 1
Sports IBM Advanced Scout analyzed NBA game statistics (shots blocked, assists, and fouls) to gain competitive advantage for New York Knicks and Miami Heat Astronomy JPL and the Palomar Observatory discovered 22 quasars with the help of data mining Internet Web Surf-Aid IBM Surf-Aid applies data mining algorithms to Web access logs for market-...
154 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1730 | Lượt tải: 0
Phục hồi trong Shadow Paging • Với multi-user environment, log và checkpoint được sử dụng. • Hạn chế: • Khó kiểm soát vị trí các page trong đĩa gần nhau. • Vấn đề khi ghi directory xuống đĩa trong trường hợp directory quá lớn. • Vấn đề về garbage collection khi giao dịch commit. • Phải đảm bảo tính nguyên tử trong quá trình xử lý current và ...
74 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1700 | Lượt tải: 1