Tổng hợp tài liệu, ebook Cơ Sở Dữ Liệu tham khảo.
Sample range pairs or sample object to copy, Replace “@all” with the beginning and ending dates you want e.g., “2001q1” for the first date, a space “@last”.
11 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 728 | Lượt tải: 0
Phương pháp lựa chọn thuộc tính Dùng heuristic để chọn tiêu chí rẽ nhánh tại một nút: Phân hoạch tập dữ liệu học D thành các phân hoạch con với các nhãn phù hợp: Xếp hạng mỗi thuộc tính. Thuộc tính được chọn để rẽ nhánh là thuộc tính có trị số điểm (score) là lớn nhất. Độ đo để chọn thuộc tính phân tách (splitting attribute) là Information Gain...
34 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 1777 | Lượt tải: 3
Với độ đo group-average: Tính toán khoảng cách của 2 cụm dựa trên khoảng cách của toàn bộ các cặp phần tử trong 2 cụm chứ không chỉ dựa trên một cặp phần tử duy nhất ⟹ tránh được nhược điểm của single-link và complete-link. Với độ đo centroid-link: Khắc phục được nhược điểm của single/complete-link. Vẫn có nhược điểm là khoảng cách giữa các ...
47 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 1156 | Lượt tải: 2
Luật {(outlook=sunny),(temperature=hot)}→{(play=no)} có: sup = 2/14 = 14.3% conf = 2/2 = 100% Luật này có thể biểu diễn dưới dạng: (outlook=sunny)^(temperature=hot)→(play=no) Nếu outlook = sunny và temparature = hot thì play = no với xác suất 100%
70 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 860 | Lượt tải: 1
1.5.4. Giảm biểu diễn số lớn (Numerosity reduction): Dữ liệu sẽ được thay thế hoặc tính toán thông qua những cách thức biểu diễn dữ liệu khác gọn hơn, ví dụ như các mô hình tham số (parametric models) hoặc các phương pháp không tham số (nonparametric methods) như phân cụm, lấy mẫu, sử dụng histogram. 1.5.5. Rời rạc hóa dữ liệu (discretization) và ...
44 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 1573 | Lượt tải: 1
Phân tích dữ liệu và hỗ trợ quyết định Phân tích và quản lý thị trường Tiếp thị định hướng, quản lý quan hệ khách hàng (CRM), phân tích thói quen mua hàng, bán hàng chéo, phân đoạn thị trường. Phân tích và quản lý rủi ro Dự báo, duy trì khách hàng, cải thiện bảo lãnh, kiểm soát chất lượng, phân tích cạnh tranh. Phát hiện gian lận và phát hiện ...
41 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 887 | Lượt tải: 1
Tóm tắt 3.2. Sắp xếp topo trên DAG: Thuật toán của Tarjan 3.3. Tìm đường đi ngắn nhất Single-source: Thuật toán tham ăn Dijsktra All-pairs: Thuật toán quy hoạch động Floyd 3.4. Tìm cây bao trùm ngắn nhất Thuật toán tham ăn Prim Thuật toán tham ăn Kruskal
34 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 776 | Lượt tải: 0
Đi qua đồ thị theo bề rộng Sử dụng kĩ thuật tìm kiếm theo bề rộng Breadth-First Search Ý tưởng của tìm kiếm theo bề rộng xuất phát từ đỉnh v Từ đỉnh v ta lần lượt đi thăm tất cả các đỉnh u kề đỉnh v mà u chưa được thăm. Sau đó, đỉnh nào được thăm trước thì các đỉnh kề nó cũng sẽ được thăm trước. Quá trình trên sẽ được tiếp tục ...
35 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 745 | Lượt tải: 0
Sắp xếp trong thời gian tuyến tính 65 diepht@vnu Thuật toán sắp xếp đếm counting sort không so sánh các cặp phần tử Giả sử dãy số nguyên nằm trong một khoảng nào đó
87 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 698 | Lượt tải: 0
Bài toán ba lô: bài toán con 27 diepht@vnu Khảo sát các tập con các đồ vật: nếu có các đồ vật { i0, i1 . in } thì ta xét tập con các đồ vật i0 . ik. Khảo sát tất cả khối lượng cực đại nhỏ hơn: nếu khối lượng cực đại của bài toán gốc là m thì với mỗi số nguyên w trong khoảng 0.m, tìm giá trị cực đại của tập con của i0 . ik có khố...
34 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 774 | Lượt tải: 0