Bài giảng Khai phá dữ liệu (Data mining) - Chương 7: Phát triển ứng dụng khai phá dữ liệu
Xem xét sự tương đồng/khác biệt giữa qui trình phát triển ứng dụng truyền thống và ứng dụng khai phá dữ liệu
Sự cần thiết của các chuẩn (standards) dành cho khai phá dữ liệu
Sự quan tâm của các nhà sản xuất phần mềm đối với việc hỗ trợ phát triển ứng dụng khai phá dữ liệu
22 trang |
Chia sẻ: vutrong32 | Lượt xem: 1311 | Lượt tải: 1
Bạn đang xem trước 20 trang tài liệu Bài giảng Khai phá dữ liệu (Data mining) - Chương 7: Phát triển ứng dụng khai phá dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
*Chương 7: Phát triển ứng dụng khai phá dữ liệuKhai phá dữ liệu(Data mining)Học kỳ 1 – 2009-2010Khoa Khoa Học & Kỹ Thuật Máy TínhTrường Đại Học Bách Khoa Tp. Hồ Chí Minh*Nội dung7.1. Tổng quan về vấn đề phát triển ứng dụng khai phá dữ liệu7.2. Qui trình phát triển ứng dụng khai phá dữ liệu7.3. Các chuẩn dành cho khai phá dữ liệu7.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu7.5. Tóm tắt *Tài liệu tham khảo[1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006.[2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data Mining”, MIT Press, 2001.[3] David L. Olson, Dursun Delen, “Advanced Data Mining Techniques”, Springer-Verlag, 2008.[4] Graham J. Williams, Simeon J. Simoff, “Data Mining: Theory, Methodology, Techniques, and Applications”, Springer-Verlag, 2006.[5] ZhaoHui Tang, Jamie MacLennan, “Data Mining with SQL Server 2005”, Wiley Publishing, 2005.[6] Oracle, “Data Mining Concepts”, B28129-01, 2008.[7] Oracle, “Data Mining Application Developer’s Guide”, B28131-01, 2008. *7.1. Tổng quan về vấn đề phát triển ứng dụng khai phá dữ liệuVấn đề dữ liệuLượng và chất lượng dữ liệuKiểu dữ liệuVấn đề tri thức từ quá trình khai pháBiểu diễn và tích hợp vào ứng dụngVấn đề kỹ thuật khai pháLựa chọn giải thuật khai pháVấn đề hiệu quả (effective) và hiệu suất (efficient)*7.2. Qui trình phát triển ứng dụng khai phá dữ liệuQui trình phát triển ứng dụngQui trình phát triển ứng dụng khai phá dữ liệu Tương đồng và khác biệt*7.3. Các chuẩn dành cho khai phá dữ liệuThe Predictive Model Markup Language (PMML – www.dmg.org)Standard application programming interfaces (APIs)The Cross-Industry Standard Process for Data Mining (CRISP-DM – www.crisp-dm.org)Nguồn: R. L. Grossman, M. F. Hornick, G. Meyer, Data Mining Standards Initiatives, Communications of the ACM 45 (8) 2002 59-61.*7.3. Các chuẩn dành cho khai phá dữ liệuThe Predictive Model Markup Language (PMML – www.dmg.org)Chuẩn dựa trên XMLMô tả các mô hình thống kê và khai phá dữ liệu, các tác vụ làm sạch và biến đổi dữ liệuCác thành phần của PMMLData dictionaryMining schemaTransformation dictionaryModel statisticsModels*7.3. Các chuẩn dành cho khai phá dữ liệu*7.3. Các chuẩn dành cho khai phá dữ liệu*7.3. Các chuẩn dành cho khai phá dữ liệu*7.3. Các chuẩn dành cho khai phá dữ liệuStandard application programming interfaces (APIs)SQL/MM Part 6: Data MiningThe Java Specification Request-73 (JSR-73)Jcp.org/jsr/detail/073.jspMicrosoft APIsMicrosoft.AnalysisServices.AdomdClient*7.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệuCác công cụ mã nguồn mở (open-source tools)Các công cụ thương mại*7.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệuCác công cụ mã nguồn mở (open-source)R (www.r-project.org)Tanagra (eric.univ-lyon2.fr/~ricco/tanagra/)Weka (www.cs.waikato.ac.nz/ml/weka)YALE (rapid-i.com)KNIME (www.knime.org)Orange (www.ailab.si/orange)Nguồn: B. Zupan, J. Demsar, “Open-Source Tools for Data Mining”, Clinics in Laboratory Medicine 28(2008) 37-54. *7.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu*7.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu*7.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu*7.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu*7.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu*7.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệu*7.4. Các công cụ hỗ trợ phát triển ứng dụng khai phá dữ liệuCác công cụ thương mạiHỗ trợ từ Intelligent Miner (IBM)Hỗ trợ từ Microsoft data mining tools (MS SQL Server 2000/2005/2008)Hỗ trợ từ Oracle Data MiningHỗ trợ từ Enterprise Miner (SAS Institute)*7.5. Tóm tắtXem xét sự tương đồng/khác biệt giữa qui trình phát triển ứng dụng truyền thống và ứng dụng khai phá dữ liệuSự cần thiết của các chuẩn (standards) dành cho khai phá dữ liệuSự quan tâm của các nhà sản xuất phần mềm đối với việc hỗ trợ phát triển ứng dụng khai phá dữ liệu*Hỏi & Đáp
Các file đính kèm theo tài liệu này:
- data_mining_chapter_7_2642.ppt