Bài giảng Cơ sở dữ liệu GIS

Đặc điểm  Phần cứng và phần mềm không lệ thuộc  Những mô tả & định nghĩa các thực thể  Xác định thực thể biểu diễn trong CSDL ▪ Vd. chọn các đối tượng không gian - points, lines, areas, raster cells  Những yêu cầu qui mô biểu diễn & những mối quan hệ sẽ biểu diễn ▪ Dựa trên cơ sở quá trình xử lý trên các đối tượng ▪ Vd. Cần biểu diễn tòa nhà như diện tích hay point? ▪ Vd. nên chia nhỏ đường giao thông như thế nào để liên kết trong CSDL?

pdf71 trang | Chia sẻ: tuanhd28 | Lượt xem: 2424 | Lượt tải: 3download
Bạn đang xem trước 20 trang tài liệu Bài giảng Cơ sở dữ liệu GIS, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Bài giảng CƠ SỞ DỮ LIỆU GIS KHÁI NIỆM VỀ CƠ SỞ DỮ LIỆU (CSDL)  CSDL là gì ?  Hệ Quản Trị CSDL là gì ?  Các mô hình CSDL ?  CSDL là gì ?  Là sự tập hợp một hay nhiều file dữ liệu hay dữ liệu bảng được lưu trữ theo một kiểu cấu trúc.  Có mối quan hệ bên trong giữa các thông tin hay giữa các dữ liệu.  Được quản trị bằng phần mềm (DBMS)  Sử dụng phục vụ dữ liệu cho những yêu cầu dữ liệu khác nhau  Mục đích:  Là phương pháp lưu trữ dữ liệu của các chương trình truy xuất dữ liệu  Điều khiển và chuẩn hóa quá trình nhập và cập nhật dữ liệu  Bảo mật dữ liệu truy xuất  Cho phép đa người sử dụng trên những trường hay bảng dữ liệu xác định  Nhân của hệ  điều khiển quá trình chất vấn (Query), truy xuất dữ liệu, lưu trữ, quản lý đa người dùng  Liên kết  Giao tiếp ngôn ngữ chất vấn SQL (structured query language)  Hiển thị dữ liệu  Hệ thống quản lý các dạng màn hình  Điều khiển các menu  Các báo cáo và giao tiếp ngôn ngữ lập trình  Mô hình bảng (danh sách)  Mô hình quan hệ  Mô hình mạng  Mô hình phân nhánh  Mô hình hướng đối tượng  Là “ một hiện tượng trong thực tế mà không được phân chia nhỏ ra thành những hiện tượng cùng loại”  Vd. Thành phố là một thực thể và được chia nhỏ ra thành các bộ phận hợp phần nhưng các phần này không được gọi là thành phố, chúng được gọi là quận.  Rừng cây phân chia thành các mảnh rừng nhỏ hơn.  Là “ sự trình bày dạng số của tất cả hoặc một phần của thực thể”  Các hiện tượng phụ thuộc vào tỷ lệ.  Vd. Một thành phố được trình bày như một điểm (point) nếu như diện tích nghiên cứu ở qui mô lục địa.  Thành phố đó có thể được trình bày như một vùng (area) nếu như diện tích nghiên cứu một quốc gia.  Kiểu thực thể là nhóm hiện tượng tương tự được thể hiện và lưu trữ cùng kiểu  Vd. đường giao thông, sông suối...  Xác định kiểu thực thể nhằm:  Giúp cho việc chồng xếp các nhóm thông tin.  Trợ giúp cho việc kiểm chứng nội dung của cơ sở dữ liệu.  Là đặc điểm của thực thể biểu diễn  Thường là phi không gian.  Một số có thể liên quan tới đặc điểm không gian  Vd. diện tích, chu vi...  Lớp trình bày một kiểu thực thể hoặc một nhóm kiểu thực thể quan hệ  Vd. Lớp có các đoạn sông hoặc có sông, hồ, bờ biển.  Một số CSDL không gian kết hợp các thực thể vào một lớp.  Thế giới thực quá phức tạp trong những nhận thức trực tiếp  Chúng ta tạo "model" thực tế với nỗ lực có một số nét tương tự với thế giới thực  Những CSDL (databases) được tạo ra từ những "models" như là những buớc cơ sở tiến tới hiểu biết về bản chất và trạng thái thế giới thực  CSDL không gian (spatial database) là sự tập hợp dữ liệu có tham chiếu không gian và nó là những mô hình của thực tế.  CSDL không gian là một mô hình của thực tế với ý nghĩa là CSDL biểu diễn có lựa chọn các hiện tượng rất gần với thực tế  Những hiện tượng chọn lựa biểu diễn trong dạng số  GIS kết hợp chặt chẽ DBMS truyền thống với nhiều tiện ích để quản lý hợp phần không gian và thuộc tính các dữ liệu địa lý. Dữ liệu số Đường xá Thùy văn Địa chính Nhà cửa Phân vùng Tiện ích Ranh giới hành chính  Dữ liệu được tổ chức theo lớp.  Mỗi lớp biểu diễn những yếu tố có đặc điểm chung.  Các lớp được tích hợp trong không gian thống nhất trên bề mặt Trái đất  Vị trí địa lý là cơ sở tổ chức dữ liệu  Mô hình bảng (danh sách)  Mô hình quan hệ  Mô hình mạng  Mô hình phân nhánh  Mô hình hướng đối tượng  Không có cấp bậc của trường dữ liệu, mỗi trường dữ liệu được dùng như là key.  Thuộc tính quan hệ được lưu trữ trong những bảng khác nhau  Tìm kiếm thực hiện nối hai hoặc nhiều bảng dùng thuộc tính giống nhau.  Hệ thống linh động và thích hợp cho việc sử dụng SQL.  Dữ liệu được tổ chức theo cấu trúc hình cây. Cấp bậc cao nhất gọi là gốc  Mô hình có lớp trên, lớp dưới.  Mọi quan hệ là quan hệ nhiều – một hoặc quan hệ một – một.  Truy tìm dữ liệu hiệu qủa nếu không có nhiều cấp trung gian. MÔ HÌNH VÀ CẤU TRÚC DỮ LIỆU KHÔNG GIAN  1. Mô hình dữ liệu (Spaghetti)  Đơn giản nhất.  Về bản chất là mô hình vẽ bản đồ.  Điểm, đường, vùng và ký tự được biểu diễn đơn thuần là vị trí.  Không có mô tả rõ ràng quan hệ không gian.  Ranh giới chung giữa 2 polygon kề nhau được ghi 2 lần.  Không hữu hiệu trong phân tích không gian  Ưu điểm trong việc tái sản xuất bản đồ số mà không cần lưu trữ quan hệ không gian.  2. Mô hình topology Cấu trúc topology còn được gọi là cấu trúc cung-nút (arc- node) với phần tử cơ bản là cung.  Sử dụng mã hóa các mối quan hệ không gian  Topology dùng để định nghĩa các quan hệ không gian.  Dữ liệu thuộc tính được lưu trữ trong các bảng quan hệ  Trong cấu trúc này: - Nút là điểm giao nhau của hai hay nhiều cung, đối với những cung độc lập, nút là điểm cuối cùng của cung, không nối liền với bất kỳ cung nào khác. - Cung (arc) được mô tả như là một chuỗi những đoạn thẳng nối liền nhau, điểm đầu và cuối gọi là nút (node), những điểm giữa cung gọi là đỉnh (vertex). - Vùng là một chuỗi những cung nối liền nhau và khép kín, những cung này chính là đường biên của vùng. Một vùng có thể được giới hạn bởi hai đường cong khép kín lồng vào nhau và không cắt nhau. Các đối tượng địa lý trong cấu trúc topology được mô tả trong bốn bảng:  Ba bảng đầu lưu trữ các phần tử không gian vùng, nút, cung.  Bảng thứ tư lưu trữ tọa độ nút, nút cuối và đỉnh.  Các bảng Topology: - Bảng topology vùng - xác định những cung làm đường biên của vùng, phần bên ngoài bản đồ cũng được xem như một vùng không xác định cung đường biên. - Bảng topology nút - xác định mỗi nút thuộc những cung nào. - Bảng topology cung - xác định quan hệ của nút và vùng với cung. - Bảng dữ liệu tọa độ - lưu trữ tọa độ của các cung bằng cách lưu trữ tọa độ của các nút và đỉnh của cung, để từ đó vị trí của mỗi phần tử trên bản đồ được liên hệ với thế giới thực.  Các bảng Topology: - Bảng topology vùng - xác định những cung làm đường biên của vùng, phần bên ngoài bản đồ cũng được xem như một vùng không xác định cung đường biên. - Bảng topology nút - xác định mỗi nút thuộc những cung nào. - Bảng topology cung - xác định quan hệ của nút và vùng với cung. - Bảng dữ liệu tọa độ - lưu trữ tọa độ của các cung bằng cách lưu trữ tọa độ của các nút và đỉnh của cung, để từ đó vị trí của mỗi phần tử trên bản đồ được liên hệ với thế giới thực. 0 10 30 20 40 50 60 70 0 70 40 30 60 50 20 10 A C B E D,a6,N5 a1 a2 a2 a3 a5 a7 a7 a7 a7 a2 a3 N2 N1 N3 N4 N6 Topology vuøng Vuøng Cung A B C D E a1, a5, a3 a2, a5, 0, a6, 0, a7 a7 a6 vuøng ngoaøi Topology cung Cung Nuùt ñaàu Nuùt cuoái Vuøng traùi Vuøng phaûi a1 a2 a3 a4 a5 a6 a7 N1 N2 N3 N4 N3 N5 N6 N2 N3 N1 N1 N2 N5 N6 E E E A A B B A B A A B D C Topology nuùt Nuùt Cung N1 N2 N3 N4 N5 N6 a1, a3, a4 a1, a2, a5 a2, a3, a5 a4 a6 a7 Döõ lieäu toaï ñoä cung Cung Nuùt ñaàu (x,y) Ñænh (vertex) (x,y) Nuùt cuoái (x,y) a1 a2 a3 a4 a5 a6 a7 40,60 70,50 10,25 40,60 10,25 30,20 55,27 70,60 70,10;10,10 10,60 30,50 20,27;30,30;50,32 55,15;40,15;45,27 70,50 10,25 40,60 30,40 70,50 30,20 55,27 Bài tập 1. Xây dựng dữ liệu cung (dữ liệu tọa độ cung) và các bảng cung – nút – vùng cho mô hình dữ liệu không gian sau: Bài tập2. Cho bảng dữ liệu tọa độ cung sau: Cung (Arc) Điểm đầu (From node) Đỉnh (Verties) Điểm cuối (To node) a 2,5 2,8 5,8 b 5,8 8,8 8,5 c 8,5 8,1; 2,1 2,5 d 5,8 5,5 8,5 e 4,3 4,2; 3,2; 3,3 4,3 f 2,5 3,5 4,6 a. Hãy xây dựng mô hình dữ liệu không gian của bảng dữ liệu tọa độ trên b. Hãy xây dựng các bảng Topology vùng, Topology nút, Topolygy cung. Yêu cầu: 1. Thống nhất trong các ký hiệu khi làm bài: - Điểm (node): N1, N2, N3,. - Cung (arc): a,b,c,.... - Vùng (polygon): A, B, C, 2. Thể hiện chiều mũi tên từ điểm đầu đến điểm cuối trên các cung của mô hình cơ sở dữ liệu không gian (hình vẽ).  Ưu điểm Các bảng Topology cung, nút, vùng cho phép phân tích các quan hệ giữa các phần tử trên bản đồ mà khộng cần đến dữ liệu tọa độ. Do đó, cấu trúc topology rất thích hợp với những toán tử phân tích không gian, nhất là những bài toán kề (contiguity) và kết nối (connectivity).  Nhược điểm Phần lớn dữ liệu nhập vào GIS không tồn tại ở dạng cấu trúc dữ liệu topology, việc xây dựng topology bởi phần mềm GIS có thể tốn thời gian và sử dụng nhiều nguồn lực máy tính. Mỗi khi có sự biên tập tác động đến dữ liệu hình học, topology phải xây dựng lại. Các mối quan hệ Topology giữa các đối tượng không gian Các mối quan hệ Topology giữa các đối tượng không gian Quan hệ điểm-điểm - “Trong giới hạn (is within)”: Nằm trong giới hạn một khoảng cách cụ thể. - “Gần nhất với (is nearest to)”: Gần nhất so với một điểm cụ thể. Quan hệ điểm-đường - “ Nằm trên đường (on line)”: điểm nằm trên một đường. - “ Gần nhất với (is nearest to)”: Điểm gần nhất so với một đường. Quan hệ điểm-vùng - “Chứa bên trong vùng (is contained in)”: Điểm chứa bên trong vùng. - “Nằm trên biên (on border of area)”: Một điểm nằm trên đường biên của vùng. Các mối quan hệ Topology giữa các đối tượng không gian Quan hệ đường-đường - “Giao nhau (intersects)”: Hai đường giao nhau. - “Băng qua (crosses)”: Hai đường băng qua mà không giao nhau. - “Chảy vào (flow into)”: Một nhánh sông chảy vào một dòng sông. Quan hệ đường-vùng - “Giao nhau (intersects)”: Một đường giao (cắt) với một vùng. - “Đường biên (borders)”: Đường là một phần biên của vùng. Quan hệ vùng-vùng - “Chồng lớp (overlaps)”: Hai vùng chồng lên nhau. - “Nằm bên trong (is within)”: Một vùng nằm bên trong một vùng khác. - “Kế cận (is adjacent to)”: Hai vùng cùng có một đường biên chung Dữ liệu raster được tạo thành bằng cách chồng lưới các ô lên trên các đối tượng địa lý. Baûn ñoà goác Löôùi choàng lôùp (grid overlay) 1 6 7 5 Baûn ñoà daïng oâ löôùi Coät Doøng 8 7 6 5 4 3 2 1 1 2 3 4 5 7 8 9 7 7 7 7 7 7 6 6 6 6 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 5 5 5 5 10 5 5 5 5 5 5 5 5 5 5 5 5 5 5 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 6 Giá trị ô chính là giá trị đo hoặc ghi nhận được của đối tượng nằm đầy trong ô. Trong trường hợp đối tượng không nằm đầy ô, giá trị ô được gán theo các nguyên tắc: - Đối tượng chiếm đa số về diện tích - Đối tượng tại tâm ô - Đối tượng chạm ô – đối với đối tượng đường - hoặc chọn theo trọng số để đảm bảo các đối tượng có đặc tính quý hiếm được biểu diễn Giá trị của ô có thể là chữ hoặc là số tùy theo đối tượng được biểu diễn. Giá trị trong “ô lưới” tương ứng với đặc tính của hiện tượng trong không gian tại vị trí ô. Sự thay đổi của giá trị phản ánh sự thay đổi của hiện tượng. Một ô đơn được gán chỉ 1 giá trị, do vậy để có thể biểu diễn nhiều đặc tính của cùng 1 đối tượng, 1 hệ thống các lớp dữ liệu raster được sủ dụng. Mỗi lớp raster thể hiện 1 loại đặc tính. Lưới ô thường có gốc tọa độ bắt đầu tại vị trí trên trái. Vị trí hình học của các ô được xác định bởi số hàng và số cột. Dữ liệu raster có thể đến từ ảnh viễn thám, ảnh chụp máy bay, hoặc raster hóa từ nguồn dữ liệu vector Các đối tượng điểm, đường vùng trong mô hình Raster được biểu diễn như sau:  Đối tượng điểm được biểu diễn bằng các điểm ảnh đơn.  Đối tượng đường được biểu diễn bằng một chuỗi các điểm ảnh liên tục và có độ rộng không đều, có đường biên zic-zac tùy kích thước của điểm ảnh.  Đối tượng vùng được biểu diễn bằng 1 mảng các điểm ảnh liên tục.  Độ phân giải không gian của mô hình Raster là kích thước của một pixel trên mặt đất. Một ô 10m thể hiện bề mặt diện tích 10x10 = 100m2. Một ô 30m thể hiện bề mặt diện tích là 900m2. Như vậy ô 10m có độ phân giải không gian tốt hơn ô 30m.  Kích thước ô lớn không thể biểu diễn chính xác vị trí của các đối tượng không gian do có nhiều đối tượng không gian cùng tồn tại trong 1 ô.  Kích thước ô nhỏ có thể biểu diễn chính xác vị trí của các đối tượng không gian sẽ làm tăng dung lượng lưu trữ và thời gian xử lý dữ liệu.  Dung lượng lưu trữ của mô hình raster theo độ phân giải Ví dụ: Với độ phân giải 100m, một vùng vuông 100km cần một raster có 1000 hàng và 1000 cột tương ứng với 1 triệu pixel, nếu dùng 1byte để biểu diễn 1 pixel thì dung lượng cần thiết là 0,96MB. và để có độ phân giải 10m thì cần 100triệu pixel, khoảng 96 MB.  Mô hình Raster thường được biểu diễn với các cấu trúc có sử dụng các phương pháp nén dữ liệu để giảm bớt dung lương lưu trữ.  Trong cấu trúc raster, đường được biểu diễn bằng những pixel có cùng giá trị f(x,y) liên tiếp nhau. Vì trong cấu trúc raster, các pixel được xếp theo hàng, cột như một ma trận điểm nên đường ở đây không trơn mà có dạng zic-zac.  Vùng được xác định bằng một mảng gồm nhiều điểm ảnh có cùng giá trị thuộc tính f(x,y) trải rộng ra theo nhiều phương. Đối tượng điểm (point objects) Mỗi đối tượng điểm là một điểm ảnh được gán ID điểm, toạ độ (i, j) và các thuộc tính. Soá pixel i Soá haøng j (i,j) = (5,3);(7,5);(8,2) Đối tượng đường (line objects) Mỗi đối tượng đường được gán ID đường, chuỗi tọa độ định dạng đường và các thuộc tính. (1,3);(2,2);(3,2) ;(4,3); (5,4) ;(6,5) ;(7,5) ;(8,4) Đối tượng vùng (polygon objects) - Mỗi đối tượng vùng được gán ID vùng, nhóm tọa độ định dạng vùng và thuộc tính.  Mã hóa từng ô Là phương pháp mã hóa đơn giản nhất. Một lưới Raster được lưu trữ như 1 ma trận và giá trị ô được ghi vào một tập tin theo hàng và theo cột. Phương pháp này áp dụng rất tốt trong trường hợp giá trị ô biến thiên liên tục. Mô hình độ cao số DEM sử dụng phương pháp này để lưu trữ bởi vì giá trị độ cao của các ô lân cận ít khi nào giống nhau. ảnh vệ tinh cũng sử dụng phương pháp này để lưu trữ.  Mã hóa đoạn chạy – Run length - Mã run - length lợi dụng sự giống nhau của các pixel lân cận để biểu diễn chúng từng loạt pixel có giá trị giống nhau theo từng hàng từ trái qua phải, từ trên xuống dưới. - Mỗi loạt pixel có giá trị giống nhau được biểu diễn bằng một cặp số (chiều dài chuỗi, giá trị của pixel). - Mã này rất hữu hiệu khi thuộc tính của lớp dữ liệu ảnh (giá trị của pixel) ít thay đổi. Ngược lại, nếu giá trị thuộc tính thay đổi nhiều, đôi khi việc dùng mã này còn làm tăng dung lượng dữ liệu. Bieåu dieãn maõ run-length cuûa lôùp döõ lieäu aûnh raster hình beân: (10,A) (10,A) (4,A) (6,B) (3,A) (7,B) (4,D) (6,B) (5,D) (5,B) (5,D) (5,C) (5,D) (5,C) (5,D) (5,C) (5,D) (5,C). B 1 2 3 4 0 A B B A A A A 2 A A A A 1 A 6 A A 3 B B B A A 5 A 5 4 A A A A 8 7 0 B B A A A A 8 7 6 B 9 9 A A B A A B B B B B B B B B B B B B B D D D D D D D D D D D D D D D D D D D D D D D D CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD D D D D D Höôùng ñoïc caùc pixel theo maõ run-length - Mã run-length tuy có thuật toán nén và giải mã đơn giản nhưng tỉ số nén không cao, - Thao tác tìm kiếm thường chậm vì lưu trữ theo hàng không lưu ý tới tính lân cận. - Để khắc phục tình trạng này, mã run-length được cải biên theo những đường đọc dữ liệu khác nhau. Mã hóa run length cải biên (24,A) (13,B) (3,A) (13,B) (4,D) (11,B) (10,D) (10,C) (10,D) (10,C) (5,D). B 1 2 3 4 0 A B B A A A A 2 A A A A 1 A 6 A A 3 B B B A A 5 A 5 4 A A A A 8 7 0 B B A A A A 8 7 6 B 9 9 A A B A A B B B B B B B B B B B B B B D D D D D D D D D D D D D D D D D D D D D D D D CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD CD D D D D D Mã hóa phần tư – cây tứ phân - Mã tứ phân cũng dựa theo nguyên lý sự giống nhau của nhiều pixel trong những vùng có cùng thuộc tính. - Mỗi vùng chỉ cần gán một giá trị. - Vùng được xác định bằng cách chia nhỏ diện tích làm 4 phần bằng nhau, mỗi phần lại được chia nhỏ thành 4 phần, v.v.... - Việc chia nhỏ này sẽ không thực hiện ở những vùng có cùng thuộc tính. Mã hóa phần tư – cây tứ phân 3 0 0 2 1 2 0 1 3 1 2 3 Baûn ñoà 0 1 2 3 310 311 312 313 Mã hóa phần tư – cây tứ phân Bảng thuộc tính Möùc cuûa caây Thuoäc tính 1 2 3 0 Coâng nghieäp 1 Coâng nghieäp 2 Noâng thoân 3 0 Nhaø ôû 1 0 Dòch vuï thöông maïi 1 Dòch vuï thöông maïi 2 Dòch vuï coâng coäng 3 Khu giaûi trí 2 Bieät thöï 3 Bieät thöï Mã hóa phần tư – cây tứ phân Các thành phần của cây tứ phân - Gốc: từ đó các nhánh khác được mở rộng - Lá là điểm mà từ đó quá trình phân nhánh không xảy ra - Tất cả các điểm còn lại trong cây gọi là nút Nhiều hệ thống đánh mã đã được phát triển để chỉ định mã nhận dạng đến các nút, trong đó có hệ thống đánh mã Morton. Mã chỉ định cho mỗi nút là sự kết hợp của nút ở cấp độ cao hơn và mã ở cấp độ hiện hành. VD nút 212 là sự kết hợp của mã 21 ở cấp độ trên và mã 2 ở cấp độ hiện hành. Hệ thống đánh mã này có ưu điểm là lân cận của mỗi nút có thể được tìm ra từ hệ thống đánh mã. VD lân cận của nút 212 là các nút 21x(0, 1, 3) và các nút 2x(20, 21, 22, 23). Mã hóa phần tư – cây tứ phân Ưu điểm: cho phép tổng quát hóa dữ liệu đến mức độ chi tiết tùy chọn. Hạn chế: tốn nhiều thời gian cho việc tạo ra và hiệu chỉnh. Khi bản đồ trở nên phức tạp và dữ liệu phải cập nhật thường xuyên thì tính hiệu quả trong lưu trữ sẽ mất đi. Bài tập 1. Cho mô hình dữ liệu không gian sau: 0 1 2 3 4 5 6 7 0 CS CS CS CS CS CS CS CS 1 CS CS CS CS CS CS CS CS 2 CS CS Đ Đ Đ AT AT AT 3 CS CS Đ Đ Đ AT AT AT 4 CS CS Đ Đ Đ Đ Đ Đ 5 Đ Đ Đ Đ Đ Đ Đ Đ 6 Đ Đ Đ T T T CS CS 7 Đ Đ T T T T CS CS Ghi chú: CS – cao su, Đ – điều, T – tiêu, AT – ăn trái Hãy mã hóa lớp dữ liệu không gian trên theo: a. phương pháp mã hóa đoạn chạy b. phương pháp mã hóa đoạn chạy cải tiến c. phương pháp mã hóa phần tư Bài tập 2. Cho mô hình dữ liệu không gian sau: 0 1 2 3 4 5 6 7 0 M M M M M M M M 1 M M M M M M M M 2 P PS PS PS M M P P 3 P PS PS PS M M P P 4 P X M Đ M M P P 5 P PS P Đ Đ Đ P P 6 X X M M P P X M 7 X X M M P P X X Ghi chú: M – Đất mặn, P – đất phèn, PS – đất phù sa, X – đất xám Hãy mã hóa lớp dữ liệu không gian trên theo: a. phương pháp mã hóa đoạn chạy b. phương pháp mã hóa đoạn chạy cải tiến c. phương pháp mã hóa phần tư  Chỉ những hiện tượng quan trọng thu thập biểu diễn trong CSDL.  Vd: Con đường có bề dày, nhưng không quan trọng bằng chiều rộng và dài  Xác định rõ hiện tượng, đối tượng và chọn dữ liệu thích hợp biểu diễn chúng là một phần của quá trình thiết kế CSDL  Vd: trên bản đồ 1:100.000 những ngôi nhà không phân biệt  Mục đích đảm bảo dữ liệu được nhận dạng và mô tả trong tính toàn vẹn chính xác.  Kiểu cách, hình thức được người phân tích dữ liệu chấp nhận Mục tiêu:  Nhận biết, nhận diện nội dung CSDL và mô tả nó trong dạng tóm tắt, hay khái niệm  Xác định mục tiêu CSDL  Cần làm gì ?  Làm sao sẽ thực hiện được ?  Trên cơ sở đó, xác định tất cả các dạng nhu cầu về dữ liệu nhằm thực hiện mục tiêu nói trên.  Đặc điểm  Phần cứng và phần mềm không lệ thuộc  Những mô tả & định nghĩa các thực thể  Xác định thực thể biểu diễn trong CSDL ▪ Vd. chọn các đối tượng không gian - points, lines, areas, raster cells  Những yêu cầu qui mô biểu diễn & những mối quan hệ sẽ biểu diễn ▪ Dựa trên cơ sở quá trình xử lý trên các đối tượng ▪ Vd. Cần biểu diễn tòa nhà như diện tích hay point? ▪ Vd. nên chia nhỏ đường giao thông như thế nào để liên kết trong CSDL?  Mục tiêu  CSDL được mô tả chi tiết, bao gồm các hạng mục tin, các mối quan hệ dữ liệu, độ chính xác, các thủ tục đảm bảo sự toàn vẹn dữ liệu  Phần mềm cần xác định nhưng phần cứng không lệ thuộc  Thiết đặt cấu trúc logic các yếu tố CSDL, Xác định bởi hệ quản trị dữ liệu-DBMS sử dụng bởi phần mềm  Đặc điểm  Cả phần cứng & mềm đều yêu cầu.  Yêu cầu tổ chức file trên máy tính  Triển khai kết quả của mức logic trên các phần cứng, phần mềm cụ thể.

Các file đính kèm theo tài liệu này:

  • pdfbai_giang_3_csdl_gis_5358.pdf
Tài liệu liên quan