Data Warehouse and Business Intelligence - Chương 2: Qui trình phát triển kho dữ liệu
Tập trung vào phía bên trong để chắc chắn tính tin cậy
của KDL
Các chỉ số chấp nhận và hiệu suất nên được đo lường
nhiều lần và ghi log để hỗ trợ tiếp thị cho KDL
Những thay đổi nên được xem xét như dấu hiệu của thành
công chứ không phải là thất bại
Các tiến trình ưu tiên nên được thiết lập sao cho thỏa mãn
các nhu cầu tăng thêm
Sau khi các ưu tiên được xác định, quay lại từ đầu của
chu trình
52 trang |
Chia sẻ: thucuc2301 | Lượt xem: 1285 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Data Warehouse and Business Intelligence - Chương 2: Qui trình phát triển kho dữ liệu, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Data Warehouse and Business
Intelligence
Data Warehouse and Business Intelligence 2
Chương 2:
Qui trình phát triển kho dữ liệu
Data Warehouse and Business Intelligence 3
Mục tiêu
Xem xét những hoạt động cơ bản trong lập kế hoạch kho
dữ liệu
Chu trình cho một dự án kho dữ liệu
Thảo luận về tổ chức, vai trò và trách nhiệm của nhóm dự
án
Xem xét các dấu hiệu cảnh báo và nhân tố thành công
Data Warehouse and Business Intelligence 4
Nội dung
1. Tổng quan
2. Các phương pháp luận phát triển kho dữ liệu
3. Hoạch định kho dữ liệu
4. Business Dimensional Lifecycle
5. Chuyển đổi dữ liệu
6. Quản trị kho dữ liệu
7. Các công cụ kỹ thuật cho kho dữ liệu
Data Warehouse and Business Intelligence 5
1. Tổng quan
Một số câu hỏi quan trọng cần được xem xét trước khi
quyết định xây dựng kho dữ liệu :
Theo các tiếp cận Top-down hay bottom-up ?
Dùng cho mức doanh nghiệp hay phòng ban ?
Cái nào trước - data warehouse hay data mart ?
Build pilot or go with a full-fledged implementation?
Data mart phục thuộc hay độc lập ?
Data Warehouse and Business Intelligence 7
2. Các phương pháp phát triển KDL
Có 2 phương pháp phát triển chính:
Top-Down
Bottom-Up
Data Warehouse and Business Intelligence 8
2.1 Top-Down
Cách tiếp cận của Bill Inmon
Dữ liệu trong KDL được lưu trữ ở mức “hạt”
(granularity) thấp nhất dựa trên mô hình dữ liệu đã
chuẩn hóa
KDL là trung tâm của “Xưởng thông tin công ty”
(Corporate Information Factory-CIF) cung cấp một
khung nền luận lý (logical framework) cho việc chuyển
giao kinh doanh thông minh đến doanh nghiệp. Các hoạt
động kinh doanh cung cấp dữ liệu cho CIF.
KDL được tập trung hóa sẽ cung cấp các data mart phụ
thuộc có thể được thiết kế dựa trên mô hình dữ liệu có
chiều
Data Warehouse and Business Intelligence 9
2.1 Top-Down (tt)
Nguồn: A Managers Guide to Data Warehousing
Data Warehouse and Business Intelligence 10
2.1 Top-Down (tt)
Thuận lợi:
Có được cái nhìn toàn diện (mức doanh nghiệp) về dữ liệu
Có kiến trúc rõ ràng, không phải là việc hợp nhất các data mart
khác nhau
Lưu trữ tập trung
Các luật và kiểm soát tập trung
Có thể thấy kết quả nhanh chóng nếu được thực hiện bằng các
bước lặp
Hạn chế:
Mất nhiều thời gian
Tiềm ẩn rủi ro và thất bại cao
Cần có những kỹ năng của nhiều lĩnh vực ở mức cao
Tốn chi phí
Data Warehouse and Business Intelligence 11
2.2 Bottom-Up
Cách tiếp cận của Ralph Kimball
KDL công ty như là tập hợp của các data mart được làm
cho phù hợp
Data mart được tạo ra trước để cung cấp khả năng phân
tích và báo cáo cho những việc kinh doanh chuyên biệt
dựa trên mô hình dữ liệu chiều
Data Warehouse and Business Intelligence 12
2.2 Bottom-Up (tt)
Nguồn: A Managers Guide to Data Warehousing
Data Warehouse and Business Intelligence 13
2.2 Bottom-Up (tt)
Thuận lợi:
Thực hiện nhanh và dễ hơn với những phần có thể quản lí
ROI có triển vọng và có thể thực hiện
Rủi ro thất bại ít
Có thể phát triển theo hướng tăng dần, các data mart quan
trọng có thể phát triển trước.
Cho phép nhóm dự án học tập và tăng trưởng
Hạn chế:
Mỗi data mart cho thấy góc nhìn hẹp về dữ liệu
Có quá nhiều dữ liệu dư thừa trong mỗi data mart
Có quá nhiều dữ liệu không tương thích và bất thường
Gia tăng các giao diện không thể quản lí
Data Warehouse and Business Intelligence 14
3. Hoạch định cho KDL
3.1 Các vấn đề then chốt
3.2 Các yêu cầu nghiệp vụ phi công nghệ
3.3 Hỗ trợ của quản lí cấp cao
3.4 Biện minh cho KDL
3.5 Kế hoạch tổng thể
Data Warehouse and Business Intelligence 15
3.1 Các vấn đề then chốt (Key Issues)
Giá trị và những mong đợi
Đánh giá rủi ro
Top-Down hoặc Bottom-Up
Xây dựng hoặc mua
Single Vendor hoặc Best-of-Breed
Data Warehouse and Business Intelligence 17
3.2 Các yêu cầu nghiệp vụ phi công nghệ
Các yêu cầu nghiệp vụ chi phối KDL chứ không phải
công nghệ
Giải quyết nhu cầu người dùng về thông tin chiến lược
Không lập kế hoạch xây dựng KDL trước khi hiểu yêu
cầu
Bắt đầu bằng việc xác định thông tin cần thiết chứ không
phải cách để cung cấp thông tin
Không đặt nặng vào công cụ
Cấu trúc cơ bản và kiến trúc để hỗ trợ yêu cầu người dùng
là quan trọng hơn
Làm nghiên cứu sơ bộ
Data Warehouse and Business Intelligence 18
Nghiên cứu sơ bộ
Mission and functions of each user group
Computer systems used by the group
Key performance indicators
Factors affecting success of the user group
Who the customers are and how they are classified
Types of data tracked for the customers, individually and as groups
Products manufactured or sold
Categorization of products and services
Locations where business is conducted
Levels at which profits are measured—per customer, per product,
per district
Levels of cost details and revenue
Current queries and reports for strategic information
At a minimum,obtain
general information on
the following from
each group of users
Data Warehouse and Business Intelligence 19
3.3 Hỗ trợ của quản lí cấp cao
Để khởi tạo thành công cần có sự hỗ trợ của các nhà quản lí
(senior management)
Những nhà quản lí cấp cao nhất (top management) phải hỗ trợ
đầy đủ ngay từ đầu
KDL thường phải thỏa mãn các yêu cầu có tính xung đột.
Data Warehouse and Business Intelligence 20
3.5 Biện minh cho KDL
Một phác thảo của cấu trúc chi phí:
Hardware: 31%
Software (gồm DBMS): 24%
Nhân viên và người tích hợp hệ thống: 35%
Quản trị:10%
Làm sao để chứng minh về rủi ro và lợi ích (vô hình và
hữu hình) ?
Làm sao tính toán ROI và ROA ?
Xây dựng tình huống nghiệp vụ (business case) như thế
nào ?
Data Warehouse and Business Intelligence 22
3.6 Kế hoạch tổng thể
Có nhiều cách thức khác nhau để phát triển KDL
Cần có những khuyến cáo đối với CEO hoặc những nhà
điều hành cấp cao để đề xuất KDL như là giải pháp cho
các vấn đề về thông tin của công ty
Có kế hoach thảo luận về kiểu KDL và danh sách những
kỳ vọng
Data Warehouse and Business Intelligence 23
4. The Business Dimensional Lifecycle
(Ralph Kimball,etc, 2001, The Data Warehouse Lifecycle Toolkit)
Data Warehouse and Business Intelligence 24
4. The Business Dimensional Lifecycle (cont.)
Minh họa luồng tổng thể của việc thực hiện KDL
Xác định tuần tự các nhiệm vụ và các hoạt động chính
thực hiện đồng thời
Có thể chỉnh sửa được để đáp ứng những nhu cầu đặc biệt
của tổ chức
Mỗi dự án sẽ thực hiện các tác vụ chi tiết khác nhau
Data Warehouse and Business Intelligence 25
4.1 Hoạch định dự án
Hoạch định dự án nhấn vào định nghĩa và phạm vi dữ liệu
bao gồm việc đánh giá sự sẵn sàng và minh chứng về mặt
kinh doanh
Tập trung vào nguồn lực và cấp độ kỹ năng của nhân viên
Hoạch định dự án phụ thuộc vào các yêu cầu kinh doanh
Data Warehouse and Business Intelligence 26
4.2 Xác định các yêu cầu kinh doanh
Hiểu yêu cầu kinh doanh của người dùng là trở ngại lớn
nhất đối với sự thành công của KDL
Các yêu cầu kinh doanh thiết lập thông qua 3 luồng song
song tập trung vào công nghệ, dữ liệu và các ứng dụng
người dùng
Data Warehouse and Business Intelligence 27
Ba luồng song song
Application
Track
Technology
Track
Data Track
Data Warehouse and Business Intelligence 28
Ba luồng song song (tt)
Luồng dữ liệu (Data Track)
Mô hình chiều
Thiết kê vật lý
Thiết kế và phát triển giai đoạn dữ liệu (Data Staging)
Luồng công nghệ (Technology Track)
Thiết kế kiến trúc kỹ thuật
Chọn lựa và cài đặt kết quả
Luồng ứng dụng (Application Track)
Đặc tả ứng dụng người dùng cuối
Phát triển ứng dụng người dùng cuối
Data Warehouse and Business Intelligence 29
4.4 Mô hình chiều
Thiết kế mô hình dữ liệu để hỗ trợ doanh nghiệp phân
tích các yêu cầu có một cách tiếp cận khác so với thiết kế
hệ thống hoạt động (tác nghiệp)
Bắt đầu xây dựng ma trận gồm có các khóa của qui trình
kinh doanh và chiều của nó
Tiếp theo phân tích dữ liệu chi tiết hơn tương thích với
các hệ thống nguồn
Sau đó phát triển một mô hình chiều, trong đó xác định
các hạt (grain) bảng sự kiện, các chiều liên quan, các
thuộc tính và các kế thừa
Data Warehouse and Business Intelligence 30
Bus matrix
Data Warehouse and Business Intelligence 31
Qui trình 4 bước thiết kế mô hình chiều
Bước 1: Chọn qui trình nghiệp vụ (Choose the Business
Process)
Bước 2: Khai báo phần tử (Declare the Grain )
Bước 3: Xác định các chiều (Identify the Dimensions)
Bước 4: Xác định sự kiện (Identify the Facts)
Data Warehouse and Business Intelligence 32
Một số loại chiều
Chiều ngày tháng (Date and Time)
Chiều suy biến (Degenerate Dimensions)
Chiều thay đổi chậm (Slowly Changing Dimensions)
Chiều nhập vai (Role-Playing Dimensions)
Chiều hỗn hợp/hỗn tạp (Junk Dimensions)
Data Warehouse and Business Intelligence 33
Chiều ngày tháng
Data Warehouse and Business Intelligence 34
Chiều suy biến
Data Warehouse and Business Intelligence 35
Chiều nhập vai
Data Warehouse and Business Intelligence 36
Chiều thay đổi chậm
Data Warehouse and Business Intelligence 37
Chiều hỗn hợp
Data Warehouse and Business Intelligence 38
Các dạng bảng sự kiện
Bảng sự kiện giao dịch (Transaction Fact Table)
Bảng sự kiện lưu ảnh theo chu kỳ (Periodic Snapshot
Fact Table)
Bảng sự kiện lưu ảnh tích lũy (Accumulating Snapshot
Fact Table)
Bảng sự kiện yếu (Factless Fact Table)
Data Warehouse and Business Intelligence 39
Order fulfillment pipeline diagram
Data Warehouse and Business Intelligence 40
Characteristic Transaction Fact
Table
Periodic
Snapshot Fact
Table
Accumulating
Snapshot Fact
Table
Time period
represented
Point in time
Regular
predictable
intervals
Indeterminate time
span, typically
short-lived
Grain
One row per
transaction event
One row per
period
One row per life
Fact table loads Insert Insert Insert and update
Fact row
updates
Not revisited Not revisited Revisited whenever
activity
Date dimension Transaction date
End-of-period
date
Multiple dates for
standard milestones
Facts
Transaction
activity
Performance for
predefined time
interval
Performance over
finite lifetime
Data Warehouse and Business Intelligence 41
Bảng sự kiện yếu
Data Warehouse and Business Intelligence 42
4.5 Thiết kế vật lý
Tập trung vào các cấu trúc vật lí cần thiết để hỗ trợ cho
thiết kế luận lý
Bao hàm các tiêu chuẩn định danh và thiết lập môi trường
cơ sở dữ liệu
Các chiến lược đánh chỉ mục (indexing) và phân hoạch
(partitioning) sơ bộ cũng cần được xem xét
Data Warehouse and Business Intelligence 43
4.6 Thiết kế và phát triển vùng dữ liệu tạm
Thường bị đánh giá thấp nhất trong dự án KDL
Bao gồm 3 bước chính: rút trích, chuyển đổi và nạp
Quá trình rút trích luôn bộc lộ những vấn đề về chất
lượng dữ liệu trong hệ thống tác nghiệp
Vấn đề chất lượng dữ liệu luôn cần phải được lưu ý trong
giai đoạn xây dựng vùng dữ liệu tạm
Data Warehouse and Business Intelligence 44
4.7 Thiết kế kiến trúc kỹ thuật
KDL yêu cầu việc tích hợp của nhiều công nghệ
Những nhân tố then chốt cần xem xét:
Yêu cầu nghiệp vụ
Môi trường công nghệ hiện tại
Kỹ thuật chiến lược
Data Warehouse and Business Intelligence 45
4.8 Chọn lựa và cài đặt kết quả
Dùng các kiến trúc kỹ thuật như framework
Qui trình đánh giá tiêu chuẩn kỹ thuật đi theo những nhân
tố lượng giá cho mỗi thành phần kiến trúc được định
nghĩa
Sau chọn lựa và cài đặt, yêu cầu có quá trình kiểm tra để
chắc chắn việc tích hợp tương thích
Data Warehouse and Business Intelligence 46
4.9 Đặc tả ứng dụng người dùng cuối
Xác định một tập tiêu chuẩn các ứng dụng người dùng
cuối hơn là cho một ứng dụng đơn lẻ
Các đặc tả ứng dụng mô tả mẫu báo cáo, các thông số
hướng người dùng và các yêu cầu tính toán
Các đặc tả phải chắc chắn rằng nhóm phát triển và người
dùng có cùng cách hiểu đối với ứng dụng được chuyển
giao
Data Warehouse and Business Intelligence 47
4.10 Phát triển ứng dụng người dùng cuối
Việc phát triển bao gồm cấu hình công cụ siêu dữ liệu và
xây dựng các báo báo cáo đặc tả
Các ứng dụng có thể xây dựng dùng công cụ truy xuất dữ
liệu nâng cao để cung cấp những sản phẩm có ý nghĩa
Dùng các công cụ truy xuất dữ liệu nâng cao cũng thường
đưa ra một cơ cấu mạnh mẽ cho người dùng dễ dàng
chỉnh sửa các mẫu báo cáo sẵn có
Data Warehouse and Business Intelligence 48
4.11 Cài đặt
Cài đặt thể hiện sụ hội tụ của công nghệ, dữ liệu và các
ứng dụng người dùng cuối
Huấn luyện người dùng là rất quan trọng
Hỗ trợ người dùng, qui trình giao tiếp, chiến lược phản
hồi nên thiết lập trước khi người dùng truy xuất đến KDL
Cài đặt nên hoãn lại nếu tất cả các mảng công việc chưa
sẵn sàng
Data Warehouse and Business Intelligence 49
4.12 Bảo trì và phát triển
Tập trung vào phía bên trong để chắc chắn tính tin cậy
của KDL
Các chỉ số chấp nhận và hiệu suất nên được đo lường
nhiều lần và ghi log để hỗ trợ tiếp thị cho KDL
Những thay đổi nên được xem xét như dấu hiệu của thành
công chứ không phải là thất bại
Các tiến trình ưu tiên nên được thiết lập sao cho thỏa mãn
các nhu cầu tăng thêm
Sau khi các ưu tiên được xác định, quay lại từ đầu của
chu trình
Data Warehouse and Business Intelligence 50
4.13 Quản lí dự án
Tập trung theo dõi trạng thái của dự án, ghi nhận vấn đề
và thay đổi kiểm soát
Giao tiếp liên tục là mang tính then chốt
Data Warehouse and Business Intelligence 51
Các công cụ kỹ thuật cho KDL
Kimball Lifecycle và các công nghệ của Microsoft
Data Warehouse and Business Intelligence 52
Kimball Lifecycle và các công nghệ của Microsoft
Data Warehouse and Business Intelligence 53
The Microsoft DW/BI Toolset
The relational engine (RDBMS) to manage and store the dimensional data
warehouse database.
SQL Server Integration Services (SSIS) to build the extract,transformation,
and load (ETL) system.
SQL Server Analysis Services (SSAS) analytic database to support users’
queries, particularly ad hoc use.
SQL Server Analysis Services data mining to develop statistical data mining
models, and also to include those models in advanced analytic applications.
SQL Server Reporting Services (SSRS) to build predefined reports. The
majority of the Reporting Services features are most appropriate for the
DW/BI team, but you may provide some ad hoc query and report building
functionality with Report Builder.
Data Warehouse and Business Intelligence 54
The Microsoft DW/BI Toolset
Master Data Services (MDS) to create a range of master
data management applications to feed the data
warehouse, and possibly integrate that data management
with the source transaction systems.
Development and management tools, especially SQL
Server BI Development Studio (BIDS) and SQL Server
Management Studio to build and manage your DW/BI
system.
Data Warehouse and Business Intelligence 55
The Microsoft DW/BI Toolset
Excel
PowerPivot
SharePoint
PowerPivot for SharePoint
Master Data Services
Các file đính kèm theo tài liệu này:
- dw_bi_chuong_02_qui_trinh_phat_trien_kho_du_lieu_full_4748_2045346.pdf