• Bài giảng Khai phá dữ liệu - Chương 4: Phân cụm dữ liệu - Nguyễn Vương ThịnhBài giảng Khai phá dữ liệu - Chương 4: Phân cụm dữ liệu - Nguyễn Vương Thịnh

    Với độ đo group-average: Tính toán khoảng cách của 2 cụm dựa trên khoảng cách của toàn bộ các cặp phần tử trong 2 cụm chứ không chỉ dựa trên một cặp phần tử duy nhất ⟹ tránh được nhược điểm của single-link và complete-link. Với độ đo centroid-link: Khắc phục được nhược điểm của single/complete-link. Vẫn có nhược điểm là khoảng cách giữa các ...

    pptx47 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 939 | Lượt tải: 2

  • Bài giảng Khai phá dữ liệu - Chương 3: Khai phá luật kết hợp - Nguyễn Vương ThịnhBài giảng Khai phá dữ liệu - Chương 3: Khai phá luật kết hợp - Nguyễn Vương Thịnh

    Luật {(outlook=sunny),(temperature=hot)}→{(play=no)} có: sup = 2/14 = 14.3% conf = 2/2 = 100% Luật này có thể biểu diễn dưới dạng: (outlook=sunny)^(temperature=hot)→(play=no) Nếu outlook = sunny và temparature = hot thì play = no với xác suất 100%

    pptx70 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 731 | Lượt tải: 1

  • Bài giảng Khai phá dữ liệu - Chương 2: Tiền xử dữ liệu - Nguyễn Vương ThịnhBài giảng Khai phá dữ liệu - Chương 2: Tiền xử dữ liệu - Nguyễn Vương Thịnh

    1.5.4. Giảm biểu diễn số lớn (Numerosity reduction): Dữ liệu sẽ được thay thế hoặc tính toán thông qua những cách thức biểu diễn dữ liệu khác gọn hơn, ví dụ như các mô hình tham số (parametric models) hoặc các phương pháp không tham số (nonparametric methods) như phân cụm, lấy mẫu, sử dụng histogram. 1.5.5. Rời rạc hóa dữ liệu (discretization) và ...

    pptx44 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 1344 | Lượt tải: 1

  • Bài giảng Khai phá dữ liệu - Chương 1: Tổng quan về khai phá dữ liệu - Nguyễn Vương ThịnhBài giảng Khai phá dữ liệu - Chương 1: Tổng quan về khai phá dữ liệu - Nguyễn Vương Thịnh

    Phân tích dữ liệu và hỗ trợ quyết định Phân tích và quản lý thị trường Tiếp thị định hướng, quản lý quan hệ khách hàng (CRM), phân tích thói quen mua hàng, bán hàng chéo, phân đoạn thị trường. Phân tích và quản lý rủi ro Dự báo, duy trì khách hàng, cải thiện bảo lãnh, kiểm soát chất lượng, phân tích cạnh tranh. Phát hiện gian lận và phát hiện ...

    pptx41 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 673 | Lượt tải: 1

  • Bài giảng Cấu trúc dữ liệu và giải thuật - Bài 14: Đồ thị (2/2) - Hoàng Thị ĐiệpBài giảng Cấu trúc dữ liệu và giải thuật - Bài 14: Đồ thị (2/2) - Hoàng Thị Điệp

    Tóm tắt 3.2. Sắp xếp topo trên DAG: Thuật toán của Tarjan 3.3. Tìm đường đi ngắn nhất  Single-source: Thuật toán tham ăn Dijsktra  All-pairs: Thuật toán quy hoạch động Floyd 3.4. Tìm cây bao trùm ngắn nhất  Thuật toán tham ăn Prim  Thuật toán tham ăn Kruskal

    pdf34 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 665 | Lượt tải: 0

  • Bài giảng Cấu trúc dữ liệu và giải thuật - Bài 14: Đồ thị (1/2) - Hoàng Thị ĐiệpBài giảng Cấu trúc dữ liệu và giải thuật - Bài 14: Đồ thị (1/2) - Hoàng Thị Điệp

    Đi qua đồ thị theo bề rộng  Sử dụng kĩ thuật tìm kiếm theo bề rộng  Breadth-First Search  Ý tưởng của tìm kiếm theo bề rộng xuất phát từ đỉnh v  Từ đỉnh v ta lần lượt đi thăm tất cả các đỉnh u kề đỉnh v mà u chưa được thăm.  Sau đó, đỉnh nào được thăm trước thì các đỉnh kề nó cũng sẽ được thăm trước.  Quá trình trên sẽ được tiếp tục ...

    pdf35 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 634 | Lượt tải: 0

  • Bài giảng Cấu trúc dữ liệu và giải thuật - Bài 13: Các thuật toán sắp xếp - Hoàng Thị ĐiệpBài giảng Cấu trúc dữ liệu và giải thuật - Bài 13: Các thuật toán sắp xếp - Hoàng Thị Điệp

    Sắp xếp trong thời gian tuyến tính 65 diepht@vnu  Thuật toán sắp xếp đếm  counting sort  không so sánh các cặp phần tử  Giả sử dãy số nguyên nằm trong một khoảng nào đó

    pdf87 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 595 | Lượt tải: 0

  • Bài giảng Cấu trúc dữ liệu và giải thuật - Bài 12: Các chiến lược thiết kế thuật toán - Hoàng Thị ĐiệpBài giảng Cấu trúc dữ liệu và giải thuật - Bài 12: Các chiến lược thiết kế thuật toán - Hoàng Thị Điệp

    Bài toán ba lô: bài toán con 27 diepht@vnu  Khảo sát các tập con các đồ vật:  nếu có các đồ vật { i0, i1 . in } thì  ta xét tập con các đồ vật i0 . ik.  Khảo sát tất cả khối lượng cực đại nhỏ hơn:  nếu khối lượng cực đại của bài toán gốc là m thì  với mỗi số nguyên w trong khoảng 0.m, tìm giá trị cực đại của tập con của i0 . ik có khố...

    pdf34 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 650 | Lượt tải: 0

  • Bài giảng Cấu trúc dữ liệu và giải thuật - Bài 11: Hàng ưu tiên - Hoàng Thị ĐiệpBài giảng Cấu trúc dữ liệu và giải thuật - Bài 11: Hàng ưu tiên - Hoàng Thị Điệp

    Thuật toán Huffman  Với mỗi ký tự xuất hiện trong xâu nguồn, ta tạo ra một đỉnh chứa ký tự đó  gắn với giá trị ưu tiên bằng tần suất  Từ tập các cây chỉ có một đỉnh, tại mỗi bước ta kết hợp hai cây thành một cây  đỉnh cha sẽ gắn với giá trị ưu tiên bằng tổng độ ưu tiên các con  ta cần chọn hai cây nhị phân có mức ưu tiên nhỏ nhất đ...

    pdf45 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 655 | Lượt tải: 0

  • Bài giảng Cấu trúc dữ liệu và giải thuật - Bài 10: Bảng băm - Hoàng Thị ĐiệpBài giảng Cấu trúc dữ liệu và giải thuật - Bài 10: Bảng băm - Hoàng Thị Điệp

    Nhận xét (2/2)  Thăm dò bình phương  Ưu điểm: tránh được nhược điểm của thăm dò tuyến tính  Nhược điểm: không cho phép ta tìm đến tất cả các vị trí trong mảng  phép insert có thể không thực hiện được  nếu cỡ của mảng là số nguyên tố, thì thăm dò bình phương cho phép ta tìm đến một nửa số vị trí trong mảng  Băm kép  nếu cỡ của mảng ...

    pdf21 trang | Chia sẻ: thucuc2301 | Ngày: 20/11/2020 | Lượt xem: 730 | Lượt tải: 0