Kĩ năng Rational Data Architect - Phần 1: Truy cập và tích hợp siêu dữ liệu doanh nghiệp với Rational Data Architect

Tóm tắt: Tích hợp dữ liệu trong một doanh nghiệp từ các nguồn dữ liệu là một trong những yêu cầu phổ biến nhất đối với bất cứ một ứng dụng cơ sở dữ liệu nào. Người dùng cần truy cập tích hợp yêu cầu vào rất nhiều nguồn dữ liệu đa dạng ví dụ như tài sản dữ liệu truyền thống như bảng tính Excel và dữ liệu di sản, và vào các công nghệ mới nổi như là lưu trữ dữ liệu XML. IBM ® WebSphere® Information Integrator cung cấp một giao diện đơn nhất cho phép người dùng cuối và các nhà quản lí cơ sở dữ liệu truy cập ảo và dễ nhìn vào số lượng lớn các nguồn dữ liệu này. Rational Data Architect của IBM® làm việc với WebSphere Information Integrator (Bộ Tích hợp Thông tin Websphere) để đưa các kiến trúc dữ liệu và các nhà phát triển ứng dụng khả năng có thể phát hiện, mô hình hóa, trực quan hóa, lập quan hệ và phát triển các tài sản qua các nguồn dữ liệu phân phối đa dạng. Trong bài hướng dẫn này, các bạn hãy theo dõi một tình huống đơn giản để học cách Rational Data Architect có thể được sử dụng để cung cấp một công cụ thiết kế và mô hình nhằm tạo ra một khung nhìn ảo và thống nhất qua các nguồn dữ liệu không đồng nhất.

pdf49 trang | Chia sẻ: tlsuongmuoi | Lượt xem: 1872 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Kĩ năng Rational Data Architect - Phần 1: Truy cập và tích hợp siêu dữ liệu doanh nghiệp với Rational Data Architect, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Kĩ năng Rational Data Architect, Phần 1: Truy cập và tích hợp siêu dữ liệu doanh nghiệp với Rational Data Architect Farnaz Erfan, Kỹ sư phần mềm, EMC Mary Roth, Kiến trúc sư Giải pháp CNTT, IBM 硅谷实验室 Tóm tắt: Tích hợp dữ liệu trong một doanh nghiệp từ các nguồn dữ liệu là một trong những yêu cầu phổ biến nhất đối với bất cứ một ứng dụng cơ sở dữ liệu nào. Người dùng cần truy cập tích hợp yêu cầu vào rất nhiều nguồn dữ liệu đa dạng ví dụ như tài sản dữ liệu truyền thống như bảng tính Excel và dữ liệu di sản, và vào các công nghệ mới nổi như là lưu trữ dữ liệu XML. IBM ® WebSphere® Information Integrator cung cấp một giao diện đơn nhất cho phép người dùng cuối và các nhà quản lí cơ sở dữ liệu truy cập ảo và dễ nhìn vào số lượng lớn các nguồn dữ liệu này. Rational Data Architect của IBM® làm việc với WebSphere Information Integrator (Bộ Tích hợp Thông tin Websphere) để đưa các kiến trúc dữ liệu và các nhà phát triển ứng dụng khả năng có thể phát hiện, mô hình hóa, trực quan hóa, lập quan hệ và phát triển các tài sản qua các nguồn dữ liệu phân phối đa dạng. Trong bài hướng dẫn này, các bạn hãy theo dõi một tình huống đơn giản để học cách Rational Data Architect có thể được sử dụng để cung cấp một công cụ thiết kế và mô hình nhằm tạo ra một khung nhìn ảo và thống nhất qua các nguồn dữ liệu không đồng nhất. Trước khi bắt đầu Giới thiệu Tình huống trong bài hướng dẫn này sử dụng các hệ thống quản lý cơ sở dữ liệu quan hệ DB2 và Oracle. Bạn nên làm quen với các cơ sở dữ liệu quan hệ và các khái niệm mô hình hóa dữ liệu, bao gồm: Mô hình dữ liệu: Một cơ sở dữ liệu phải được trình bày dựa trên các khái niệm của các kiến trúc dữ liệu. Các kiến trúc dữ liệu bao gồm các đối tượng dữ liệu, các liên kết giữa các đối tượng dữ liệu, và các quy tắc để xác định các thao tác trên những đối tượng đó. Mô hình dữ liệu này tập trung vào dữ liệu nào đuợc yêu cầu và nó sẽ nên được tổ chức như thế nào, hơn là các thao tác nào sẽ được thực hiện trên dữ liệu. Đây là kế hoạch xây dựng một cơ sở dữ liệu. Mô hình quan hệ thực thể (Entity Relation): Một mô hình dữ liệu dựa trên khái niệm. Mô hình thể hiện rõ ràng các khái niệm này bằng biểu đồ quan hệ thực thể. Điểm cốt yếu để xây dựng lên mô hình ER là các thực thể, các quan hệ, và các thuộc tính. Thực thể là các khái niệm (thực hoặc trừu tượng) về loại thông tin nào được thu thập. Quan hệ là các mối quan hệ giữa các thực thể. Thuộc tính là những đặc tính miêu tả các thực thể đó. Thay đổi tên sản phẩm Ngày 16 tháng 12 năm 2008, IBM công bố rằng phiên bản 7.5.1, Rational Data Architect được đổi lại tên thành InfoSphere Data Architect (Kiến trúc Dữ liệu InfoSphere) nhằm đặc trưng cho vai trò của nó trong InfoSphere Foundation Tools (Công cụ nền tảng InfoSphere). Khung nhìn cơ sở dữ liệu (Database view): Một bảng ảo chỉ đọc (read-only) bao gồm bộ kết quả của một truy vấn. Một khung nhìn có thể nhóm tập hợp con dữ liệu được chứa trong một hay nhiều bảng mà không có bất kì lưu trữ khác phía trên. Máy chủ liên hợp (Federated server): Một bộ quản lý cơ sở dữ liệu hoạt động như một lớp ảo trình các truy vấn từ các ứng dụng người dùng tới nhiều nguồn dữ liệu thông qua một giao diện thống nhất và phổ biến. Đây là máy chủ được cài đặt bằng WebSpehere Information Integrator. Bí danh (Nickname): Một định danh được sử dụng bởi máy chủ để tham chiếu tới một đối tượng được đặt ở nguồn dữ liệu từ xa. Ánh xạ người dùng: Thông thường đuợc yêu cầu để xác định mối quan hệ giữa ID quyền hạn máy chủ liên hợp và ID người dùng nguồn dữ liệu và mật khẩu. Định nghĩa máy chủ: Một từ định danh được sử dụng bởi máy chủ liên hợp để tham chiếu một cơ sở dữ liệu hoặc nút từ xa. Về bài hướng dẫn này Bài hướng dẫn này chỉ cho bạn từng bước cách:  Tạo ra một mô hình dữ liệu luận lý mới (logical data model).  Biến đổi mô hình dữ liệu luận lý thành một mô hình dữ liệu vật lý (physical data model).  Phát hiện và duyệt các nguồn dữ liệu từ xa sử dụng khả năng có sẵn của WebSphere Information Integrator.  Đảo ngược các cơ sở dữ liệu kỹ nghệ từ xa thành các mô hình dữ liệu vật lý.  Ánh xạ các mô hình vật lý được trích xuất tới mô hình dữ liệu luận lý mới.  Tạo ra một khung nhìn xác định các cơ sở dữ liệu từ xa đó về phương diện mô hình mới.  Triển khai khung nhìn đã được tạo ra đó tới một cơ sở dữ liệu và sử dụng nó để truy cập dữ liệu tích hợp qua hai cơ sở dữ liệu về phương diện mô hình mới. Mục tiêu Sau khi đọc xong bài hướng dẫn này, bạn sẽ hiểu được cách mà các năng lực Rational Data Architect tăng cường khả năng liên hợp của WebSphere Information Integrator. Các hướng dẫn từng bước được đưa ra để cung cấp cho bạn những kinh nghiệm sẵn có khi sử dụng công cụ mô hình này. Các điều kiện tiên quyết Giải nén các tệp Kiến trúc dữ liệu ar-wbirdacode.zip vào một đường dẫn. Bạn cần sử dụng các tệp sau từ tệp nén (zip) theo đúng thứ tự chúng được liệt kê: db2dj.ini Chứa biến môi trường ORACLE_HOME. Chỉnh sửa tệp này để sử dụng đường dẫn nơi mà phần mềm khách Oracle được cài đặt trên máy chủ liên hợp. Ví dụ, ORACLE_HOME=C:\Oracle\Ora10g. Đặt tệp này vào trong đường dẫn %DB2PATH%\cfg. Ví dụ, C:\Program Files\IBM\SQLLIB. Đưa ra một db2stop và db2start từ dòng lệnh DB2 của bạn. tnsnames.ora Chỉnh sửa tệp %ORACLE_HOME%\NETWORK\ADMIN\tnsnames.ora của phần mềm khách Orcale của bạn trên máy chủ liên hợp để chứa một máy chủ còn hiệu lực với tên gọi SANTA_CLARA_COUNTY, như được thể hiện trong tệp này. Máy chủ này sẽ được sử dụng như hệ thống thư viện của máy SANTA_CLARA_COUNTY trong tình huống của chúng ta. federation_setup.sql Trong tập lệnh này, bạn sẽ tạo ra một máy chủ liên hợp mà có thể đuợc sử dụng như một lớp ảo để liên kết với cả hai cơ sở dữ liệu LIBRARY DB2 và cơ sở dữ liệu SANTA_CLARA_COUNTY trên Oracle. Tệp lệnh này tạo ra một máy chủ liên hợp được gọi là FEDERATE, tạo ra các bảng cho thư viện nhà trường trên cơ sở dữ liệu LIBRARY, tạo ra các bảng cho thành phố trên cơ sở dữ liệu SANTA_CLARA_COUNTY và đặt cùng một dữ liệu ở cả hai bộ bảng. Chỉnh sửa tập lệnh để sử dụng các ID và mật khẩu người dùng cho các cơ sở dữ liệu LIBRARY và SANTA_CLARA_COUNTY. Ví dụ, nếu ID người dùng của bạn là farnaz với một mật khẩu tab0uli, thay thế ID người dùng DB2 trong tập lệnh với farnaz và mật khẩu DB2 với tab0uli. Chạy tập lệnh này bằng cách đưa ra db2 -tvf federation_setup.sql từ một dòng lệnh DB2 trên một máy chủ liên hợp. new library system.ldm Các bạn sẽ nhập mô hình dữ liệu luận lý này Tạo ra một mô hình dữ liệu luận lý mới. newlibraryfinal.msl Bạn sẽ nhập mô hình ánh xạ này Khám phá ra các quan hệ. location_and_number_of_c++_books.sql Bạn sẽ sử dụng tập lệnh này trong Triển khai. books_by_negeen_sahari.sql Bạn sẽ sử dụng tập lệnh này trong Triển khai. Những yêu cầu hệ thống Bài hướng dẫn này sử dụng phiên bản đã được công bố rộng rãi Rational Data Architect V6.1, WebSphere Information Integrator V8.2, và phần mềm Oracle. Tuy nhiên, bất cứ nguồn dữ liệu quan hệ sau nào, cũng đều được hỗ trợ bởi Kiến trúc Dữ liệu và có thể được sử dụng thay thế: DB2 Universal Database (UDB), DB2 UDB iSeries, DB2 UDB zSeries, Oracle, Sybase, Informix, và Microsoft® SQL Server. Tổng quan Rational Data Architect được xây dựng trên nền tảng Eclipse. Khi Rational Data Architect được chạy, bạn sẽ thấy khung làm việc của Eclipse, đề xuất cho bạn những phối cảnh và khung nhìn phức tạp nơi mà bạn làm việc. Phần này giới thiệu cho bạn những phối cảnh và khung nhìn của Rational Data Architect. Nếu cài đặt Rational Data Architect là mới, những phối cảnh của bạn (trừ Database Explorer) sẽ là trống rỗng. Trong các phần sau, chúng ta sẽ tạo ra các đối tượng trong các phối cảnh khác nhau. Để bắt đầu Rational Data Architect: 1. Từ màn hình desktop, nhấn vào danh mục Start. Chọn Start > All Programs > IBM Rational > IBM Rational Data Architect V6.1 > Rational Data Architect. 2. Chọn không gian làm việc mặc định hoặc thay đổi tới một thư mục theo lựa chọn của bạn. Không gian làm việc sẽ là nơi dành cho tất cả các tệp dữ liệu và tài nguyên của bạn. 3. Đóng khung nhìn Welcome (nếu xuất hiện). Chọn X trên thanh tab khung nhìn Welcome. Phối cảnh mặc định cho một cài đặt mới của sản phẩm là Data, như trong Ví dụ 1. Ví dụ 1. Phối cảnh mặc định Data Trong bài hướng dẫn này, bạn sẽ làm việc chủ yếu với 5 khung nhìn  Khung nhìn Data Project Explorer  Khung nhìn Database Explorer  Khung nhìn Properties  Khung nhìn Model Editor  Khung nhìn Data Output Khung nhìn Data Project Explore Khung nhìn Data Project Explorer, trong góc trái phía trên của phối cảnh Data trong Hình 1, được sử dụng để làm việc cục bộ với các đối tượng dữ liệu quan hệ. Với khung nhìn này, bạn có thể:  Tạo ra các Data Design Project được sử dụng cho thiết kế cơ sở dữ liệu và tích hợp dữ liệu. Nó bao gồm cả các mô hình dữ liệu luận lý, mô hình dữ liệu vật lý, các tập lệnh và tương tự.  Tạo ra các mô hình dữ liệu luận lý. Một mô hình dữ liệu luận lý là một mô hình không phải dành riêng cho một cơ sở dữ liệu nào. Nó miêu tả các đối tượng dữ liệu và các mối quan hệ giữa các đối tượng đó.  Tạo ra các mô hình dữ liệu vật lý có thể được sử dụng để tạo ra các câu lệnh Ngôn ngữ Định nghĩa Dữ liệu (Data Definition Language - DDL) mà có thể được triển khai tới máy chủ cơ sở dữ liệu.  Biến đổi các mô hình dữ liệu luận lý thành các mô hình dữ liệu vật lý.  Tạo ra DDL cho các đối tượng dữ liệu và các mô hình dữ liệu.  Kéo và thả, hoặc sao chép các đối tượng từ Database Explorer hoặc từ trong Data Project Explorer.  Tạo ra các câu lệnh SQL sử dụng bộ xây dựng SQL hoặc bộ biên soạn SQL. Khung nhìn Database Explorer Khung nhìn Database Explorer được sử dụng để:  Tạo ra các liên kết cơ sở dữ liệu mới.  Liên kết với các cơ sở dữ liệu hiện có.  Xem và duyệt các đối tượng cơ sở dữ liệu.  Chạy các đối tượng cơ sở dữ liệu với những kết quả xuất hiện trong khung nhìn Data Output (Đầu ra dữ liệu).  Xác định các bộ lọc cơ sở dữ liệu.  Tạo ra các câu lệnh SQL DDL. Khung nhìn này nằm ở góc trên bên trái của phối cảnh Data trong Hình 1. Khung nhìn Properties Khung nhìn Properties, ở góc dưới bên phải của phối cảnh Data. Hình 1, thể hiện các đặc tính cơ bản của tài nguyên được chọn. Khung nhìn Model Editor Model Editor được sử dụng để xem các sơ đồ xây dựng cho việc biên soạn các mô hình dữ liệu,bao gồm các mô hình luận lý và mô hình vật lý. Khung nhìn này nằm ở bảng giữa của phối cảnh Data trong Hình 1. (Không có mô hình nào hoạt động trong hình 1) Khung nhìn Data Ouput Khung nhìn Data Output bao gồm một danh sách hoạt động bên trái của khung nhìn và một vài trang được chia thẻ ở bên phải. Các trang bên phải hiển thị thông tin liên quan đến hoạt động mà đã được chọn trong danh sách hoạt động trên:  Một trang Messages hiển thị các thông điệp, bao gồm quá trình của các hoạt động.  Một trang Parameters hiển thị các tham số cho một thường trình hoặc một đối tượng.  Một trang Results hiển thị các kết quả của các câu lệnh SQL, ví dụ như là dữ liệu mẫu của một truy vấn. Bên trái của khung nhìn Data Output chứa các trường sau:  Trạng thái: Thể hiện tình trạng hiện tại của câu lệnh.  Hoạt động: Thể hiện loại hoạt động đã xảy ra.  Tên đối tượng: Thể hiện tên của đối tượng. Khung nhìn này là một thanh tab, cùng với khung nhìn Properties, ở góc dưới bên phải của phối cảnh Data trong Hình 1. ( Bạn sẽ rõ chi tiết hơn nữa ở khung nhìn này trong các hình Hình 33 và Hình 34.) Tình huống của chúng ta Đối với tình huống ca sử dụng (use-case) của chúng ta, một trường đại học cơ sở đang thiết kế một ứng dụng Web cho sinh viên của họ, ứng dụng này cho phép sinh viên có thể duyệt những cuốn sách từ thư viện trường cũng như là thư viện Santa Clara County của thành phố. Thư viện trường là trong một cơ sở dữ liệu DB2, và thư viện Santa Clara Country là một cơ sở dữ liệu Oracle. Trường này đã tiến hành một dự án để thiết kế lại cơ sở dữ liệu quan hệ đại diện cho hệ thống thư viện hiện có. Họ sử dụng Rational Data Architect để mô hình hóa một lược đồ tích hợp hệ thống thư viện hiện có với hệ thống thư viện Santa Clara County. Tạo ra một mô hình dữ liệu luận lý mới Một mô hình dữ liệu luận lý (Logical Data Model - LDM) không phải là một mô hình riêng biệt cho bất cứ loại cơ sở dữ liệu cụ thể nào. Nó đại diện cho các thực thể và các thuộc tính, các loại trên và dưới của các thực thể, và những quan hệ giữa các thực thể này. Một LDM cũng có thể chứa các đối tượng mô hình tên miền và các mô hình bảng chú giải. (Những khái niệm này không được nói trong bài hướng dẫn này) Bạn có thể sử dụng thủ thuật New Logical Data Model để tạo ra một mô hình dữ liệu luận lý. 1. Chọn File > New > Logical Data Model từ thực đơn chính, như trong Hình 3. Thủ thuật New Logical Data Model mở ra. 2. Hãy để tất cả ở chế độ mặc định. Thay đổi tên tệp của mô hình thành new library system. 3. Chọn Finish để tạo ra một mô hình trống. Hình 3. Tạo ra một mô hình dữ liệu lô-gíc mới LDM được tạo ra và hiển thị trong thư mục Data Models dưới Data Design Project New Library System (mô hình này có đuôi mở rộng là .ldm để tượng trưng cho mô hình dữ liệu luận lý.) Một khung nhìn sơ đồ được mở ra cho bạn thiết kế hệ thống thư viện mới. Bạn có thể sử dụng sơ đồ để minh họa và biên tập một LDM. Bạn cũng có thể sử dụng bảng màu (diagram palette) sơ đồ, khung nhìn Properties, và các lệnh cảm ngữ cảnh để thêm hoặc xóa đi các đối tượng từ sơ đồ LDM. Như bạn có thể thấy trong Hình 4, chúng ta đã thêm hai thực thể vào trong thiết kế và tạo ra một mối quan hệ giữa chúng. Hình 4. Sử dụng sơ đồ, bảng màu, và khung nhìn Properties để thiết kế một LDM Bạn có thể sử dụng bảng màu để thiết kế đồ họa cho mô hình hoặc bạn có thể nhập một mô hình tương tự từ bài hướng dẫn này. Để bài hướng dẫn này đơn giản, chúng tôi khuyên bạn chọn cách thứ 2. Ban đầu, chúng ta hãy dọn sạch không gian làm việc bằng cách xóa mô hình này đi: 1. Nhấn chuột phải new library system.ldm và chọn Delete. 2. Chọn Accept trên hộp thoại xác nhận. Để nhập một LDM đã có sẵn: 1. Chọn File > Import. Thủ thuật Import sẽ mở ra. 2. Chọn File system, sau đó Next. 3. Với nút duyệt, hãy chọn thư mục mà bạn đã tải về và giải nén tài liệu cho bài hướng dẫn này. 4. Chọn new library system.ldm, như trong Hình 5. 5. Chọn New Library System cho thư mục Into 6. Chọn Finish. Hình 5. Nhập LDM LDM sau khi đã được nhập sẽ xuất hiện trong dự án của bạn. Nhấn đúp new library system.ldm để mở mô hình, như trong Hình 6. Hình 6. LDM đã được nhập Sơ đồ của mô hình này sẽ hiển thị các quan hệ giữa các thực thể, như trong Hình 7. Hình 7. LDM mới Bạn có thể điều khiển các chi tiết trong sơ đồ bằng cách chọn hoặc không chọn các ô thích hợp trong khung nhìn đặc tính của sơ đồ, như trong Hình 8. Hình 8. Khung nhìn đặc tính của LDM Sau khi các đối tượng luận lý và các quan hệ đã được xác định trong một LDM, bạn có thể biến đổi mô hình luận lý thành một mô hình dữ liệu vật lý có cơ sở dữ liệu cụ thể. Một Data Design Project ban đầu được sử dụng để lưu trữ các đối tượng mô hình hóa bao gồm các mô hình dữ liệu luận lý và vật lý, các tập lệnh DDL, các mô hình ánh xạ, và tương tự. Để tạo ra một Data Design Project: 1. Trên thanh thực đơn chính, chọn File > New > Data Design Project, như trong Hình 2. Hoặc, bạn có thể nhấn chuột phải vào bất cứ khoảng trống nào trong Data Project Explorer và chọn New > Project > Data Design Project. Thủ thuật New Data Design Project sẽ mở ra. 2. Đặt tên cho Dự án New Library System và chọn Finish. Hình 2. Tạo ra một dự ánh thiết kế dữ liệu mới Data Design Project mới được hiển thị trong khung nhìn Data Project Explorer. Biến đổi thành một mô hình dữ liệu vật lý Một mô hình dữ liệu vật lý (Physical Data Model - PDM) là một mô hình cơ sở dữ liệu cụ thể đại diện cho các đối tượng dữ liệu quan hệ như là các bảng, cột, các khóa chính (primary key) và khóa ngoại (foreign key). Một PDM có thể được sử dụng để tạo ra các câu lệnh DDL mà sau này có thể được triển khai tới một máy chủ cơ sở dữ liệu. Sử dụng khung làm việc, bạn có thể biến đổi một mô hình luận lý để tạo ra một mô hình vật lý có thể triển khai thành một loại cơ sở dữ liệu cụ thể. Trong bài hướng dẫn này, bạn triển khai mô hình này với DB2 UDB V8.2. Để biến đổi một LDM thành một PDM: 1. Chọn new library system.ldm trong Data Project Explorer. 2. Chọn Data > Transform > Physical Data Model từ thực đơn chính, như trong Hình 9. 3. Trên hộp thoại (panel) thứ nhất của thủ thuật, hãy định rõ để tạo ra một mô hình mới. 4. Trên hộp thoại thứ 2, hãy chú ý rằng cơ sở dữ liệu được chọn là DB2 UDM V8.2. Hãy để nó như vậy. 5. Mở hộp thoại thứ 3, thay đổi tên lược đồ từ lược đồ thành Library. Nó sẽ được sử dụng trong các tên có đầy đủ tư cách trong bảng mà chúng ta đã tạo ra. 6. Hãy để tất cả những thứ còn lại ở chế độ mặc định và hoàn tất thủ thuật. Hình 9. Biến đổi LDM thành PDM PDM được thêm vào cây trong Data Project Explorer. Mô hình này có đuôi mở rộng là .dbm. Sơ đồ vật lý của bạn sẽ trông giống như Hình 10 . Hình 10. PDM mới Mô hình này đại diện cho lược đồ mà trường đại học đó sẽ sử dụng cho hệ thống thư viện mới của họ. Trong mô hình này:  Mỗi sách có một ID, tựa đề, và tên nhà xuất bản.  Mỗi sách sẽ được quan hệ với một hoặc nhiều tác giả.  Mỗi sách sẽ được quan hệ với 0 hoặc nhiều bản sao chép.  Mỗi sách sẽ được quan hệ với 0 hoặc 1 lần mượn.  Mỗi tác giả sách sẽ có một ID sách và một tên.  Mỗi bản sao chép sách sẽ có một ID sách, ID địa điểm, và số lượng bản sao.  Mỗi một lần mượn sách sẽ có ID sách, ID sinh viên, ID địa điểm, ngày tháng mượn, và ngày trả.  Mỗi sinh viên có một ID, tên, và địa chỉ thư điện tử (email).  Mỗi sinh viên sẽ được quan hệ với 0 hoặc nhiều lần mượn sách.  Mỗi địa điểm có một ID địa điểm, một tên, và một địa chỉ.  Mỗi địa điểm sẽ được quan hệ với 0 hoặc nhiều bản sao chép sách.  Mỗi một địa điểm sẽ được quan hệ với 0 hoặc nhiều lần mượn sách. Như vậy, đến đây bạn đã xác định được một mô hình mới cho thư viện của trường. Bước tiếp theo là xác định địa điểm và tích hợp các lược đồ cơ sở dữ liệu của thư viện hiện có và thư viện Santa Clara County, và xác định lại chúng trong mô hình mới. Chúng ta sẽ sử dụng cơ sở dữ liệu FEDERATE mà bạn đã cấu hình trong Các điều kiện tiên quyết để liên kết với hệ thống thư viện trường học và thư viện Santa Clara County. Liên kết tới cơ sở dữ liệu liên hợp Bạn có thể duyệt các đối tượng hiện có bằng cách liên kết một cơ sở dữ liệu trong Database Explorer. Để liên kết với một cơ sở dữ liệu: 1. Nhấn chuột phải trong Database Explorer và chọn New Connection từ menu pop-up. 2. Ở trang đầu tiên của thủ thuật, hãy chọn DB2 UDB > V8.2, như trong Hình 11. 3. Để tất cả tham số ở mặc định. IBM DB2 Universal sẽ phải được chọn như bộ điều khiển JDBC. 4. Chỉ định: o Cơ sở dữ liệu (database): FEDERATE o Chủ (host): Tên của hệ thống nơi mà WebSphere Information Integrator được cài đặt. o Số cổng (port number): Cổng máy chủ cơ sở dữ liệu mà máy hiện tại đang sử dụng để nghe những giao tiếp từ các nốt khách từ xa. Số này được xác định trong tệp dịch vụ. Với một cài đặt phổ biến, số này là 50000. o ID người dùng và Mật khẩu phù hợp 5. Chọn Finish . Hình 11. Thủ thuật liên kết mới Liên kết được hiển thị trong Database Explorer. Khám phá các cơ sở dữ liệu từ xa Tại thời điểm này, các cơ sở dữ liệu chứa hệ thống thư viện của trường và của thư viện Santa Clara County chưa được máy chủ FEDERATE nhận biết. Trong bước này, chúng ta sẽ sử dụng khả năng khám phá của máy chủ FEDERATE để xác định địa điểm của hệ thống thư viện trường và thư viện của thành phố để đăng kí chúng vào máy chủ liên hợp. Từ Database Explorer, hãy dẫn tới thư mục Remove Servers dưới máy chủ FEDERATE, như trong Hình 12. Từ đây, bạn sẽ thấy được một thư mục được gọi là Undefined Remote Servers. Nếu bạn mở rộng thư mục này, bạn sẽ thấy các thư mục chứa các loại nguồn dữ liệu khác nhau. Mở rộng thư mục có tên DB2 Data Sources. Bạn sẽ thấy ngay một máy chủ tên là LIBRARY, đó chính là cơ sở dữ liệu hiện tại của trường. Hãy mởi rộng thư mục có tên Oracle Data Sources, và bạn sẽ thấy một máy chủ có tên là SANTA_CLARA_COUNTY. Hình 12. Các máy chủ từ xa được khám phá Đăng kí các cơ sở dữ liệu từ xa Bây giờ, chúng ta đã tìm ra các cơ sở dữ liệu của trường và của thành phố, chúng ta có thể xác định chúng tới máy chủ FEDERATE. Để xác định máy chủ LIBRARY:  Nhấn phải chuột lên LIBRARY và chọn Create Server. Thủ thuật Create Server sẽ mở ra, như trong Hình 13 .  Chỉ định loại và phiên bản của cơ sở dữ liệu từ xa này là DB2/UDB và V8.2.  Bởi vì đây là một nguồn dữ liệu họ DB2, nên phải có một ID người dùng và mật khẩu để đăng kí máy chủ. Hãy nhập vào ID người dùng và mật khẩu đúng cho cơ sở dữ liệu LIBRARY.  Ở trên hộp thoại tiếp theo, hãy chỉ định ID người dùng và mật khẩu để xác định ánh xạ người dùng.  Chọn Finish . Hình 13. Tạo ra thủ thuật Server Thủ thuật tạo ra việc xác định máy chủ và ánh xạ người dùng. Bạn sẽ thấy rằng LIBRARY bây giờ được thêm vào thư mục Defined Remote Server và được chọn, như trong Hình 14 . Hình 14. Xác định một máy chủ mới Lặp lại các bước tương tự cho máy chủ SANTA_CLARA_COUNTY xuất hiện trong Undefined Remote Servers > Oracle Data Sources. Chỉ định Oracle là một loại máy chủ. Chọn phiên bản phù hợp cho máy chủ Oracle của bạn. Cần phải có ID người dùng và mật khẩu cho cơ sở dữ liệu SANTA_CLARA_COUNTY ở hộp thoại thứ 2 để xác định ánh xạ người dùng. Duyệt dữ liệu từ xa Bây giờ, bạn có thể duyệt các bảng trên các cơ sở dữ liệu LIBRARY và SANTA_CLARA_COUNTY sử dụng Database Explorer. Đây là những bảng mà bạn đã đặt trong Các điều kiện tiên quyết. Chúng ta hãy nhìn vào thư viện của trường trước. Bạn sẽ thấy 3 bảng: BOOK, BOOK_AUTHORS, và LOCATION, như trong Hình 15 . Những bảng này được xác định trong lược đồ SCHOOL. Hình 15. Các bảng của trường học Bây giờ, chúng ta hãy nhìn vào thư viện Santa Clara County. Ở đây, bạn sẽ thấy 7 bảng: BOOK, BOOK_AUTHORS, BOOK_COPIES, BOOK_LOANS, BORROWER, BRANCH, và PUBLISHER, như trong Hình 16 . Các bảng này được liệt kê dưới tên lược đồ sử dụng ID người dùng trong thủ thuật Create Server trong Đăng kí các cơ sở dữ liệu từ xa . Hình 16. Các bảng Santa Clara County Như vậy, bạn đã:  Xác định được một mô hình mới cho thư viện trường  Xác định địa điểm được cho các lược đồ cơ sở dữ liệu của thư viện hiện tại và thư viện Santa Clar County  Đăng kí được chúng trong cơ sở dữ liệu FEDERATE Bước tiếp theo đó là bạn sẽ phải xác định lại các lược đồ cơ sở dữ liệu này ở mô hình mới. Bạn cần phải ánh xạ các cơ sở dữ liệu hiện có này tới mô hình mới mà bạn đã thiết kế. Đảo ngược dữ liệu vật lý từ cơ sở dữ liệu Để ánh xạ các lược đồ cơ sở dữ liệu hiện có tới một mô hình mới, bạn cần đặt chúng trong Data Design Project của bạn. Để tăng cường tốc độ của quá trình này, bạn có thể sử dụng các bộ lọc ở trên các lược đồ từ xa của cả bạn và các bảng từ xa, như sau: 1. Trong Database Explorer, nhấn chuột phải vào thư mụcRemote Schemas dưới máy chủ SANTA_CLARA_COUNTY và chọn Filter để mở cửa sổ Filter ra. 2. Không đánh dấu chọn Disable filter - Vô hiệu hóa bộ lọc, và chỉ định Lựa chọn để bao hàm lược đồ Oracle mà bạn đã tạo các bảng Oracle trong đó. Trong trường hợp này, nó là J15USER1, như trong Hình 17. 3. Chọn Finish . Hình 17. Lọc các lược đồ Oracle từ xa Sau khi bạn lọc lược đồ từ xa, sử dụng các bước tương tụ đối với thư mục Remote Tables để lọc các bảng máy chủ mà bạn đã tạo ra cho cơ sở dữ liệu SANTA_CLARA_COUNTY trong Các điều kiện tiên quyết. Các bảng này là BOOK, BOOK_AUTHORS, BOOK_COPIES, BOOK_LOANS, BORROWER, BRANCH, và PUBLISHER, như trong Hình 18. Hình 18. Lọc các bảng Oracle từ xa Lặp lại các bước tương tự cho các bảng từ xa và các lược đồ từ xa dưới máy chủ LIBRARY. Lọc trên lược đồ SCHOOL và các bảng từ xa BOOK, BOOK_AUTHORS, và LOCATION. Kéo cả hai máy chủ LIBRARY và SANTA_CLARA_COUNTY từ thư mục Defined Remote Servers trong Database Explorer tới New Library System Data Design Project trong Data Project Explorer. Bạn sẽ thấy rằng 3 tệp với các đuôi mở rộng là .dbm được thêm vào Design Project: FEDERATE.dbm, LIBRARY.dbm, và SANTA_CLARA_COUNTY.dbm. Nếu bạn mở rộng tệp LIBRARY.dbm và tệp SANTA_CLARA_COUNTY.dbm, bạn sẽ thấy các bảng mà bạn đã tạo ra trong suốt Các điều kiện tiên quyết. Các bảng này là các đối tượng mô hình đã được trích ra từ kĩ thuật đảo ngược hai cơ sở dữ liệu vật lý, như trong Hình 19 . Hình 19. Các mô hình trích ra từ kĩ thuật đảo ngược các cơ sở dữ liệu vật lý Ánh xạ các lược đồ hiện có tới hệ thống thư viện mới Bây giờ, tất cả các mô hình nằm trong cùng một địa điểm thiết kế, bạn có thể sử dụng bộ biên soạn ánh xạ để xác định quan hệ giữa các bảng từ các lược đồ LIBRARY và SANTA_CLARA_COUNTY tới một mô hình thư viện mới trong dự án của chúng ta. 1. Chọn File > New > Mapping Model từ menu chính 2. Ở hộp thoại đầu tiên của thủ thuật, chọn New Library System từ danh sách. Trong trường File name, chỉ định newlibrary.msl. 3. Trên hộp thoại thứ 2, hãy chọn Add . chỉ định LIBRARY.dbm và SANTA_CLARA_COUNTY.dbm làm các nguồn ánh xạ. 4. Ở hộp thoại tiếp theo, hãy chọn tất cả các lược đồ từ danh sách các lược đồ nguồn ánh xa. 5. Ở hộp thoại tiếp theo, duyệt và chỉ định new library system.dbm làm mục tiêu ánh xạ. 6. Chọn Finish. Mô hình ánh xạ sẽ được tạo ra dưới thư mục ảo Mappings trong Data Project Explorer. Một bộ biên soạn giống với Hình 20 sẽ chỉ ra các lược đồ nguồn và mục tiêu. Hình 20. Bộ biên soạn ánh xạ thể hiện các lược đồ nguồn và mục tiêu. Bạn có thể thực hiện mô hình hóa tích hợp từ bộ biên soạn ánh xạ. Bạn có thể ánh xạ thủ công các quan hệ hoặc bạn có thể sử dụng chức năng khám phá để tìm ra các quan hệ. Các quan hệ ánh xạ được trình bày trong bộ biên soạn ánh xạ bằng các dòng được vẽ giữa các phần tử nguồn và mục tiêu. Để tạo ra ánh xạ thủ công: 1. Từ ô Source, chọn BOOK > BOOKID dưới LIBRARY.dbm. 2. Từ ô Target, chọn BOOK > BOOKID dưới new library system.dbm. 3. Nhấn chuột phải vào ô Ánh xạ (giữa) và chọn Create Mapping, như trong Hình 21. Hình 21. Tạo ra một ánh xạ thủ công Khám phá các quan hệ Chức năng khám phá có thể giúp bạn tự động tìm ra các phần tử khớp nối vì thế bạn không phải thủ công chỉ định chúng. Chức năng khám phá có thể gợi ý các quan hệ mà có thể ban đầu còn chưa rõ ràng hoặc khó có thể nhìn thấy trên màn hình. Để khám phá các quan hệ: 1. Nhấn chuột phải trong ô giữa của bộ biên soạn ánh xạ. 2. Chọn Discover Relationships và Find Best Fit để tìm ra khớp nối thỏa mãn nhất trong số tất cả các phần tử trong mô hình. Phương pháp này sẽ tìm ở khớp nối quan trọng nhất giữa một bên là mục tiêu với một bên là nguồn mà bạn đã chọn. 3. Bạn buộc phải chỉ định phạm vi để khám phá các quan hệ. Trong trường Source và Target, chọn các phần tử đứng đầu nhất và chắc chắn rằng tất cả các phần tử nhỏ sẽ được lựa chọn, như trong Hình 22. 4. Chọn Finish . Hình 22. Các phần tử nguồn và mục tiêu để khám phá ánh xạ Các kết quả được trình bày như các ánh xạ được khám phá bên trong bộ biên soạn ở ô trung tâm, như trong Hình 23. Hình 23. Ánh xạ được khám phá Bạn có thể chấp nhận hay từ chối các ánh xạ mà chức năng khám phá gợi ý. Để chấp nhận một ánh xạ, nhấn chuột phải vào ánh xạ đó và chọn Accept Mapping, như trong Hình 24. Ví dụ, bạn có thể chọn BORROWER > NAME từ tệp the SANTA_CLARA_COUNTY.dbm tới STUDENT > NAME trong hệ thống thư viện mới. dbm. Tương tự như vậy, để từ chối một ánh xạ, nhấn chuột phải vào ánh xạ đó và chọn Reject Mapping. Ví dụ, bạn có thể từ chối ánh xạ giữa BOOK > TITLE từ tệp SANTA_CLARA_COUNTY.dbm tới STUDENT > EMAIL trong new library system.dbm. Hình 24. Chấp nhận một ánh xạ đã khám phá Để đơn giản hóa quá trình đi qua từng ánh xạ này, chúng tôi đã cung cấp cho bạn phiên bản cuối cùng của ánh xạ trong Các điều kiện tiên quyết, mà bạn có thể đơn giản nhập và sử dụng. 1. Chọn File > Import. Thủ thuật Import sẽ mở ra. 2. Chọn File system, sau đó Next. 3. Trong From directory, , chỉ định thư mục nơi mà bạn đã tải về các tệp từ Các điều kiện tiên quyết. 4. Chọn newlibraryfinal.msl từ danh sách. 5. Duyệt và chọn New Library System cho thư mục Into. 6. Chọn Finish. Tệp newlibraryfinal.msl sẽ được thêm vào thư mục Mapping. Bộ soạn thảo ánh xạ sẽ trông giống như Hình 25. Hình 25. Mô hình ánh xạ cuối cùng Tạo ra các khung nhìn (view) kết hợp Như vậy, đến đây bạn đã tạo ra một mô hình mới để xác định hệ thống thư viện mới của nhà trường. Sau đó bạn đã tìm ra các giống nhau giữa mô hình mới và các mô hình mà bạn đã trích xuất từ các cơ sở dữ liệu LIBRARY và SANTA_CLARA_COUNTY. Ví dụ bạn đã tạo ra một ánh xạ xác định BOOK trong mô hình mới của bạn, giống như BOOK trong thư viện của nhà trường cũng như BOOK trong hệ thống thư viện của thành phố. Bây giờ, bạn có thể sử dụng các ánh xạ này để tạo ra các khung nhìn tích hợp giữa hai cơ sở dữ liệu này. Để tạo ra một khung nhìn như vậy: 1. Trong thư mục Mappings, nhấn chuột phải mô hình newlibraryfinal.msl và chọn Generate Script. Thủ thuật Generate Script sẽ mở ra. 2. Đảm bảo rằng nền tảng Deployment được thiết lập tới /New Library System/FEDERATE.dbm. 3. Như trong Hình 26, chọn Create a View Statement làm loại Truy vấn. Hình 26. Tạo ra Generate Script 4. Ở hộp thoại thứ 2 của thủ thuật, bạn sẽ thấy những tên bí danh mà sẽ chỉ tới các bảng trên máy chủ LIBRARY và SANTA_CLARA_COUNTY. Thay đổi các bí danh mà chỉ tới BOOK của thành phố Santa Clara và BOOK_AUTHORS tới BOOKNN2 và BOOK_AUTHORSNN2 để tránh sự sao lại các tên trong các bí danh như trong Hình 27. 5. Ở hộp thoại thứ 3 của thủ thuật, bạn sẽ thấy các tên khung nhìn đã được tạo ra. 6. Chọn Finish để hoàn thành thủ thuật. Hình 27. Đặt tên các tên nickname của các bảng từ xa Bạn có thể mở và xem các tập lệnh SQL mà đã được tạo ra thông qua thủ thuật bằng cách mở ra tập lệnh newlibraryfinal.sql trong thư mục SQL Scripts. Các khung nhìn này cùng với các bí danh đã được tạo ra được lưu trữ trong mô hình FEDERATE.dbm (như bạn có thể thấy, tệp FEDERATE.dbm của bạn bây giờ có một dấu sao, có nghĩa là nội dung của nó đã được chỉnh sửa). Nếu bạn mở rộng lược đồ GeneratedSchema mà đã được tạo thông qua thủ thuật Generate Script, bạn sẽ thấy một danh sách các bí danh và khung nhìn được tạo ra nhờ kết quả của những hoạt động của bạn, như trong Hình 28. Các bí danh được tạo ra để cho phép bạn truy cập vào các bảng từ xa. Các khung nhìn liên hợp được tạo ra dựa trên mô hình mới để thiết lập một sự kết hợp thông qua các máy chủ từ xa sử dụng các bí danh đó. Hình 28. Các bí danh được tạo ra và các khung nhìn liên hợp Triển khai Bạn có thể triển khai các bí danh và khung nhìn tới một cơ sở dữ liệu và sử dụng chúng để truy vấn hai nguồn từ xa. 1. Nhấn chuột phải lên GeneratedSchema trong FEDERATE.dbm và chọn Generate DDL từ thực đơn kéo xuống. Thủ thuật Generate DDL mở ra. 2. Trên hộp thoại đầu tiên, hãy chọn lựa chọn Fully qualified. Để các lựa chọn khác mặc định. 3. Trên ô thứ 2, chỉ chọn Nicknames và Views, như trong Hình 29. Hình 29. Chỉ tạo ra các bí danh và khung nhìn 4. Ở ô thứ 3, chọn Run DDL on server như trong Hình 30. 5. Ở ô thứ tư, sử dụng liên kết có sẵn: FEDERATE. 6. Chọn Next và Finish để kết thúc thủ thuật. Hình 30. Chạy tập lệnh trên máy chủ Trong khung nhìn Data Output, bạn sẽ thấy rằng tất cả các bí danh và khung nhìn đều được tạo ra thành công, như trong Hình 31. Hình 31. Khung nhìn Data Output tạo ra các bí danh và khung nhìn Khi đã triển khai, bạn có thể xem các bí danh và khung nhìn này trong Database Explorer, như trong Hình 32, và có thể sử dụng chúng để truy cập từ cả hai bảng LIBRARY và SANTA_CLARA_COUNTY đối với mô hình mới. Hình 32. Các bí danh và khung nhìn được triển khai tới cơ sở dữ liệu FEDERATE Cặp truy vấn mẫu được đi kèm với bài hướng dẫn này. Để nhập các mẫu này: 1. Chọn File > Import. Thủ thuật Import mở ra. 2. Chọn File system, sau đó Next. 3. Trong From directory , chỉ định ra đường dẫn nơi mà bạn đã tải về các tệp từ Các điều kiện tiên quyết. 4. Chọn location_and_number_of_c++_books.sql và books_by_negeen_sahari.sql. 5. Chọn New Library System cho trường thư mục Into. 6. Chọn Finish để kết thúc thủ thuật. Các tập lệnh được thêm vào thư mục SQL Scripts trong Data Project Explorer. Bạn có thể chạy chúng bằng cách nhấn phải chuột và chọn Run SQL. Chọn cơ sở dữ liệu FEDERATE như một liên kết hiện có. Truy vấn đầu tiên có thể được sử dụng để tìm các sách về C ++. Các kết quả sẽ được hiển thị trong khung nhìn Data Output, như trong Hình 33. Nếu bạn không có khung nhìn này, bạn có thể tới Window > Show View > Data Output. Hình 33. Các kết quả trả lại từ việc tìm kiếm tất cả các sách về chủ đề C++ Như đã chỉ ra trong ví dụ này, hai dòng được trả lại trong khung nhìn Data Output. Một từ phòng Khoa học Máy tính của cơ sở dữ liệu LIBRARY và một dòng từ cơ sở dữ liệu SANTA_CLARA_COUNTY. Có 10 bản sao của cuốn sách này có sẵn trong nhánh Blossom Valley của thư viện Santa Clara County. Truy vấn thứ 2 tìm ra tất cả các sách được viết bởi Negeen Sahari. Nếu bạn chạy tập lệnh, bạn sẽ thấy các kết quả được thể hiện trong Hình 34. Hình 34. Các kết quả được trả lại từ việc tìm kiếm tất cả các sách do Negeen Sahari viết. Kết luận Điều mà bạn đã học được Rational Data Architect đã củng cố và mở rộng khả năng của WebSphere Information Integrator để giới thiệu một công cụ mô hình dữ liệu có thể giúp bạn tạo ra và duy trì các cơ sở dữ liệu và các mô hình dữ liệu doanh nghiệp từ các loại nguồn dữ liệu không đồng nhất. Với Rational Data Architect, bạn có thể tạo ra các mô hình mới hoặc kết nối với các nguồn dữ liệu đã có sẵn và tự động tạo ra các mô hình từ lược đồ của chúng. Công nghệ ánh xạ thông minh của Rational Data Architect có thể khám phá ra cách dữ liệu quan hệ với nhau giữa các cơ sở dữ liệu không đồng nhất, để bạn nhanh chóng thiết kế một cơ sở dữ liệu tổng hợp mới. Trong bài hướng dẫn này, bạn đã học được cách tạo ra một mô hình dữ liệu luận lý mới và cách biến đổi nó thành một mô hình dữ liệu vật lý mà bạn có thể xây dựng trên và triển khai tới một cơ sở dữ liệu theo lựa chọn của bạn. Bạn đã khám phá hai loại nguồn dữ liệu khác nhau và duyệt qua các bảng từ xa của chúng sử dụng các khả năng sẵn có của WebSphere Information Integrator Sau đó, bạn sắp đặt các cơ sở dữ liệu từ xa này tới các mô hình dữ liệu vật lý. Bạn sử dụng khả năng ánh xạ và khám phá để ánh xạ các mô hình vật lý đã được trích xuất tới mô hình dữ liệu mới và tạo ra một khung nhìn xác định các cơ sở dữ liệu từ xa đó đối với mô hình mới. Cuối cùng bạn đã triển khai khung nhìn đã tạo ra đó tới một cơ sở dữ liệu và sử dụng nó để truy cập dữ liệu tích hợp thông qua hai cơ sở dữ liệu đối với mô hình mới.

Các file đính kèm theo tài liệu này:

  • pdfKĩ năng Rational Data Architect, Phần 1- Truy cập và tích hợp siêu dữ liệu doanh nghiệp với Rationa_.pdf