Tổng hợp tài liệu, ebook Cơ Sở Dữ Liệu tham khảo.
Với độ đo group-average: Tính toán khoảng cách của 2 cụm dựa trên khoảng cách của toàn bộ các cặp phần tử trong 2 cụm chứ không chỉ dựa trên một cặp phần tử duy nhất ⟹ tránh được nhược điểm của single-link và complete-link. Với độ đo centroid-link: Khắc phục được nhược điểm của single/complete-link. Vẫn có nhược điểm là khoảng cách giữa các ...
47 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 948 | Lượt tải: 2
Luật {(outlook=sunny),(temperature=hot)}→{(play=no)} có: sup = 2/14 = 14.3% conf = 2/2 = 100% Luật này có thể biểu diễn dưới dạng: (outlook=sunny)^(temperature=hot)→(play=no) Nếu outlook = sunny và temparature = hot thì play = no với xác suất 100%
70 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 736 | Lượt tải: 1
1.5.4. Giảm biểu diễn số lớn (Numerosity reduction): Dữ liệu sẽ được thay thế hoặc tính toán thông qua những cách thức biểu diễn dữ liệu khác gọn hơn, ví dụ như các mô hình tham số (parametric models) hoặc các phương pháp không tham số (nonparametric methods) như phân cụm, lấy mẫu, sử dụng histogram. 1.5.5. Rời rạc hóa dữ liệu (discretization) và ...
44 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 1358 | Lượt tải: 1
Phân tích dữ liệu và hỗ trợ quyết định Phân tích và quản lý thị trường Tiếp thị định hướng, quản lý quan hệ khách hàng (CRM), phân tích thói quen mua hàng, bán hàng chéo, phân đoạn thị trường. Phân tích và quản lý rủi ro Dự báo, duy trì khách hàng, cải thiện bảo lãnh, kiểm soát chất lượng, phân tích cạnh tranh. Phát hiện gian lận và phát hiện ...
41 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 680 | Lượt tải: 1
Tóm tắt 3.2. Sắp xếp topo trên DAG: Thuật toán của Tarjan 3.3. Tìm đường đi ngắn nhất Single-source: Thuật toán tham ăn Dijsktra All-pairs: Thuật toán quy hoạch động Floyd 3.4. Tìm cây bao trùm ngắn nhất Thuật toán tham ăn Prim Thuật toán tham ăn Kruskal
34 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 671 | Lượt tải: 0
Đi qua đồ thị theo bề rộng Sử dụng kĩ thuật tìm kiếm theo bề rộng Breadth-First Search Ý tưởng của tìm kiếm theo bề rộng xuất phát từ đỉnh v Từ đỉnh v ta lần lượt đi thăm tất cả các đỉnh u kề đỉnh v mà u chưa được thăm. Sau đó, đỉnh nào được thăm trước thì các đỉnh kề nó cũng sẽ được thăm trước. Quá trình trên sẽ được tiếp tục ...
35 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 639 | Lượt tải: 0
Sắp xếp trong thời gian tuyến tính 65 diepht@vnu Thuật toán sắp xếp đếm counting sort không so sánh các cặp phần tử Giả sử dãy số nguyên nằm trong một khoảng nào đó
87 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 599 | Lượt tải: 0
Bài toán ba lô: bài toán con 27 diepht@vnu Khảo sát các tập con các đồ vật: nếu có các đồ vật { i0, i1 . in } thì ta xét tập con các đồ vật i0 . ik. Khảo sát tất cả khối lượng cực đại nhỏ hơn: nếu khối lượng cực đại của bài toán gốc là m thì với mỗi số nguyên w trong khoảng 0.m, tìm giá trị cực đại của tập con của i0 . ik có khố...
34 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 656 | Lượt tải: 0
Thuật toán Huffman Với mỗi ký tự xuất hiện trong xâu nguồn, ta tạo ra một đỉnh chứa ký tự đó gắn với giá trị ưu tiên bằng tần suất Từ tập các cây chỉ có một đỉnh, tại mỗi bước ta kết hợp hai cây thành một cây đỉnh cha sẽ gắn với giá trị ưu tiên bằng tổng độ ưu tiên các con ta cần chọn hai cây nhị phân có mức ưu tiên nhỏ nhất đ...
45 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 660 | Lượt tải: 0
Nhận xét (2/2) Thăm dò bình phương Ưu điểm: tránh được nhược điểm của thăm dò tuyến tính Nhược điểm: không cho phép ta tìm đến tất cả các vị trí trong mảng phép insert có thể không thực hiện được nếu cỡ của mảng là số nguyên tố, thì thăm dò bình phương cho phép ta tìm đến một nửa số vị trí trong mảng Băm kép nếu cỡ của mảng ...
21 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 733 | Lượt tải: 0