Tổng hợp tài liệu, ebook Cơ Sở Dữ Liệu tham khảo.
The fact scheme derived is shown in Fig. 11. Dimension month is defined as a range on attribute date; Dimension age5 as a range of attribute age (5 years intervals). The hierarchies on dimensions month and age5 is defined by adopting progressively wider ranges. Dimension type of surgery is optional. The grossary for the fact attributes is as ...
48 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1018 | Lượt tải: 1
MOLAP Operations Roll up (drill-up): summarize data by climbing up hierarchy or by dimension reduction Drill down (roll down): reverse of roll-up from higher level summary to lower level summary or detailed data, or introducing new dimensions Slice and dice: project and select
63 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1154 | Lượt tải: 0
Khai phá dữ liệu trong lĩnh vực mạng (network) và giao tiếp dữ liệu (data communications) Khai phá dữ liệu trong lĩnh vực môi trường (environmental area) Khai phá dữ liệu trong lĩnh vực sinh học (biological area)
8 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1130 | Lượt tải: 1
Xem xét sự tương đồng/khác biệt giữa qui trình phát triển ứng dụng truyền thống và ứng dụng khai phá dữ liệu Sự cần thiết của các chuẩn (standards) dành cho khai phá dữ liệu Sự quan tâm của các nhà sản xuất phần mềm đối với việc hỗ trợ phát triển ứng dụng khai phá dữ liệu
22 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1295 | Lượt tải: 1
Khai phá luật kết hợp Được xem như là một trong những đóng góp quan trọng nhất từ cộng đồng cơ sở dữ liệu trong việc khám phá tri thức Các dạng luật: luật kết hợp luận lý/luật kết hợp lượng số, luật kết hợp đơn chiều/luật kết hợp đa chiều, luật kết hợp đơn mức/luật kết hợp đa mức, luật kết hợp/luật tương quan thống kê Các dạng phần tử (item)/mẫu...
67 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1309 | Lượt tải: 1
Gom cụm nhóm các đối tượng vào các cụm dựa trên sự tương tự giữa các đối tượng. Độ đo đo sự tương tự tùy thuộc vào kiểu dữ liệu/đối tượng cụ thể. Các giải thuật gom cụm được phân loại thành: nhóm phân hoạch, nhóm phân cấp, nhóm dựa trên mật độ, nhóm dựa trên lưới, nhóm dựa trên mô hình,
84 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1385 | Lượt tải: 4
Classification với Decision trees ID3, C4.5, CART Classification với mạng Bayesian Dựa trên lý thuyết xác suất thống kê Classification với mạng Neural K-nn classification Dựa trên khoảng cách
51 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1177 | Lượt tải: 1
Khai phá luật kết hợp Được xem như là một trong những đóng góp quan trọng nhất từ cộng đồng cơ sở dữ liệu trong việc khám phá tri thức Các dạng luật: luật kết hợp luận lý/luật kết hợp lượng số, luật kết hợp đơn chiều/luật kết hợp đa chiều, luật kết hợp đơn mức/luật kết hợp đa mức, luật kết hợp/luật tương quan thống kê Các dạng phần tử (item)/mẫu...
66 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 2155 | Lượt tải: 2
Rời rạc hóa dữ liệu Thu giảm số trị của một thuộc tính liên tục (continuous attribute) bằng cách chia miền trị thành các khoảng (interval) có dán nhãn. Các nhãn này được dùng thay cho các giá trị thực. Tiến hành theo hai cách: trên xuống (top down) và dưới lên (bottom up), có giám sát (supervised) và không có giám sát (unsupervised). Tạo phân ho...
56 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1477 | Lượt tải: 1
Khai phá dữ liệu được xem như là một phần của quá trình khám phá tri thức. Quá trình khám phá tri thức là một chuỗi lặp gồm các bước: làm sạch dữ liệu, tích hợp dữ liệu, chọn lựa dữ liệu, biến đổi dữ liệu, khai phá dữ liệu, đánh giá mẫu, và biểu diễn tri thức. Nhiều lĩnh vực khác nhau có liên quan với khai phá dữ liệu: công nghệ cơ sở dữ liệu, l...
61 trang | Chia sẻ: vutrong32 | Ngày: 19/10/2018 | Lượt xem: 1295 | Lượt tải: 1