Đặc điểm
Phần cứng và phần mềm không lệ thuộc
Những mô tả & định nghĩa các thực thể
Xác định thực thể biểu diễn trong CSDL
▪ Vd. chọn các đối tượng không gian - points, lines, areas,
raster cells
Những yêu cầu qui mô biểu diễn & những mối quan
hệ sẽ biểu diễn
▪ Dựa trên cơ sở quá trình xử lý trên các đối tượng
▪ Vd. Cần biểu diễn tòa nhà như diện tích hay point?
▪ Vd. nên chia nhỏ đường giao thông như thế nào để liên kết
trong CSDL?
71 trang |
Chia sẻ: tuanhd28 | Lượt xem: 2560 | Lượt tải: 3
Bạn đang xem trước 20 trang tài liệu Bài giảng Cơ sở dữ liệu GIS, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
Bài giảng
CƠ SỞ DỮ LIỆU GIS
KHÁI NIỆM VỀ
CƠ SỞ DỮ LIỆU (CSDL)
CSDL là gì ?
Hệ Quản Trị CSDL là gì ?
Các mô hình CSDL ?
CSDL là gì ?
Là sự tập hợp một hay nhiều file dữ liệu hay dữ
liệu bảng được lưu trữ theo một kiểu cấu trúc.
Có mối quan hệ bên trong giữa các thông tin hay
giữa các dữ liệu.
Được quản trị bằng phần mềm (DBMS)
Sử dụng phục vụ dữ liệu cho những yêu cầu dữ
liệu khác nhau
Mục đích:
Là phương pháp lưu trữ dữ liệu của các chương
trình truy xuất dữ liệu
Điều khiển và chuẩn hóa quá trình nhập và cập
nhật dữ liệu
Bảo mật dữ liệu truy xuất
Cho phép đa người sử dụng trên những trường
hay bảng dữ liệu xác định
Nhân của hệ
điều khiển quá trình chất vấn
(Query), truy xuất dữ liệu, lưu trữ,
quản lý đa người dùng
Liên kết
Giao tiếp ngôn ngữ chất vấn SQL
(structured query language)
Hiển thị dữ liệu
Hệ thống quản lý các dạng màn
hình
Điều khiển các menu
Các báo cáo và giao tiếp ngôn ngữ
lập trình
Mô hình bảng (danh sách)
Mô hình quan hệ
Mô hình mạng
Mô hình phân nhánh
Mô hình hướng đối tượng
Là “ một hiện tượng trong thực tế mà không
được phân chia nhỏ ra thành những hiện
tượng cùng loại”
Vd. Thành phố là một thực thể và được chia nhỏ
ra thành các bộ phận hợp phần nhưng các phần
này không được gọi là thành phố, chúng được gọi
là quận.
Rừng cây phân chia thành các mảnh rừng nhỏ
hơn.
Là “ sự trình bày dạng số của tất cả hoặc một
phần của thực thể”
Các hiện tượng phụ thuộc vào tỷ lệ.
Vd. Một thành phố được trình bày như một điểm
(point) nếu như diện tích nghiên cứu ở qui mô lục
địa.
Thành phố đó có thể được trình bày như một
vùng (area) nếu như diện tích nghiên cứu một
quốc gia.
Kiểu thực thể là nhóm hiện tượng tương tự
được thể hiện và lưu trữ cùng kiểu
Vd. đường giao thông, sông suối...
Xác định kiểu thực thể nhằm:
Giúp cho việc chồng xếp các nhóm thông tin.
Trợ giúp cho việc kiểm chứng nội dung của cơ sở
dữ liệu.
Là đặc điểm của thực thể biểu diễn
Thường là phi không gian.
Một số có thể liên quan tới đặc điểm không
gian
Vd. diện tích, chu vi...
Lớp trình bày một kiểu thực thể hoặc một
nhóm kiểu thực thể quan hệ
Vd. Lớp có các đoạn sông hoặc có sông, hồ, bờ
biển.
Một số CSDL không gian kết hợp các thực thể
vào một lớp.
Thế giới thực quá phức tạp trong những nhận
thức trực tiếp
Chúng ta tạo "model" thực tế với nỗ lực có
một số nét tương tự với thế giới thực
Những CSDL (databases) được tạo ra từ
những "models" như là những buớc cơ sở
tiến tới hiểu biết về bản chất và trạng thái thế
giới thực
CSDL không gian (spatial database) là sự tập
hợp dữ liệu có tham chiếu không gian và nó là
những mô hình của thực tế.
CSDL không gian là một mô hình của thực tế với ý
nghĩa là CSDL biểu diễn có lựa chọn các hiện tượng
rất gần với thực tế
Những hiện tượng chọn lựa biểu diễn trong dạng số
GIS kết hợp chặt chẽ DBMS truyền thống với
nhiều tiện ích để quản lý hợp phần không gian
và thuộc tính các dữ liệu địa lý.
Dữ liệu số
Đường xá
Thùy văn
Địa chính
Nhà cửa
Phân vùng
Tiện ích
Ranh giới hành chính
Dữ liệu được tổ chức theo lớp.
Mỗi lớp biểu diễn những yếu tố có đặc điểm
chung.
Các lớp được tích hợp trong không gian
thống nhất trên bề mặt Trái đất
Vị trí địa lý là cơ sở tổ chức dữ liệu
Mô hình bảng (danh sách)
Mô hình quan hệ
Mô hình mạng
Mô hình phân nhánh
Mô hình hướng đối tượng
Không có cấp bậc của trường dữ
liệu, mỗi trường dữ liệu được dùng
như là key.
Thuộc tính quan hệ được lưu trữ
trong những bảng khác nhau
Tìm kiếm thực hiện nối hai hoặc
nhiều bảng dùng thuộc tính giống
nhau.
Hệ thống linh động và thích hợp cho
việc sử dụng SQL.
Dữ liệu được tổ chức theo
cấu trúc hình cây. Cấp bậc
cao nhất gọi là gốc
Mô hình có lớp trên, lớp
dưới.
Mọi quan hệ là quan hệ
nhiều – một hoặc quan hệ
một – một.
Truy tìm dữ liệu hiệu qủa
nếu không có nhiều cấp
trung gian.
MÔ HÌNH VÀ CẤU TRÚC DỮ LIỆU
KHÔNG GIAN
1. Mô hình dữ liệu (Spaghetti)
Đơn giản nhất.
Về bản chất là mô hình vẽ bản đồ.
Điểm, đường, vùng và ký tự được biểu diễn đơn
thuần là vị trí.
Không có mô tả rõ ràng quan hệ không gian.
Ranh giới chung giữa 2 polygon kề nhau được
ghi 2 lần.
Không hữu hiệu trong phân tích không gian
Ưu điểm trong việc tái sản xuất bản đồ số mà
không cần lưu trữ quan hệ không gian.
2. Mô hình topology
Cấu trúc topology còn được
gọi là cấu trúc cung-nút (arc-
node) với phần tử cơ bản là
cung.
Sử dụng mã hóa các mối
quan hệ không gian
Topology dùng để định
nghĩa các quan hệ không
gian.
Dữ liệu thuộc tính được lưu
trữ trong các bảng quan hệ
Trong cấu trúc này:
- Nút là điểm giao nhau của hai hay nhiều cung, đối
với những cung độc lập, nút là điểm cuối cùng của
cung, không nối liền với bất kỳ cung nào khác.
- Cung (arc) được mô tả như là một chuỗi những đoạn
thẳng nối liền nhau, điểm đầu và cuối gọi là nút (node),
những điểm giữa cung gọi là đỉnh (vertex).
- Vùng là một chuỗi những cung nối liền nhau và khép
kín, những cung này chính là đường biên của vùng. Một
vùng có thể được giới hạn bởi hai đường cong khép kín
lồng vào nhau và không cắt nhau.
Các đối tượng địa lý trong cấu trúc topology được
mô tả trong bốn bảng:
Ba bảng đầu lưu trữ các phần tử không gian vùng,
nút, cung.
Bảng thứ tư lưu trữ tọa độ nút, nút cuối và đỉnh.
Các bảng Topology:
- Bảng topology vùng - xác định những cung
làm đường biên của vùng, phần bên ngoài bản đồ cũng
được xem như một vùng không xác định cung đường
biên.
- Bảng topology nút - xác định mỗi nút thuộc
những cung nào.
- Bảng topology cung - xác định quan hệ của
nút và vùng với cung.
- Bảng dữ liệu tọa độ - lưu trữ tọa độ của các
cung bằng cách lưu trữ tọa độ của các nút và đỉnh của
cung, để từ đó vị trí của mỗi phần tử trên bản đồ được
liên hệ với thế giới thực.
Các bảng Topology:
- Bảng topology vùng - xác định những cung
làm đường biên của vùng, phần bên ngoài bản đồ cũng
được xem như một vùng không xác định cung đường
biên.
- Bảng topology nút - xác định mỗi nút thuộc
những cung nào.
- Bảng topology cung - xác định quan hệ của
nút và vùng với cung.
- Bảng dữ liệu tọa độ - lưu trữ tọa độ của các
cung bằng cách lưu trữ tọa độ của các nút và đỉnh của
cung, để từ đó vị trí của mỗi phần tử trên bản đồ được
liên hệ với thế giới thực.
0 10 30 20 40 50 60 70
0
70
40
30
60
50
20
10
A
C
B
E
D,a6,N5
a1
a2
a2
a3
a5
a7
a7
a7
a7
a2
a3
N2
N1
N3
N4
N6
Topology vuøng
Vuøng Cung
A
B
C
D
E
a1, a5, a3
a2, a5, 0, a6, 0,
a7
a7
a6
vuøng ngoaøi
Topology cung
Cung Nuùt ñaàu Nuùt cuoái Vuøng traùi Vuøng phaûi
a1
a2
a3
a4
a5
a6
a7
N1
N2
N3
N4
N3
N5
N6
N2
N3
N1
N1
N2
N5
N6
E
E
E
A
A
B
B
A
B
A
A
B
D
C
Topology nuùt
Nuùt Cung
N1
N2
N3
N4
N5
N6
a1, a3, a4
a1, a2, a5
a2, a3, a5
a4
a6
a7
Döõ lieäu toaï ñoä cung
Cung Nuùt ñaàu
(x,y)
Ñænh (vertex)
(x,y)
Nuùt cuoái
(x,y)
a1
a2
a3
a4
a5
a6
a7
40,60
70,50
10,25
40,60
10,25
30,20
55,27
70,60
70,10;10,10
10,60
30,50
20,27;30,30;50,32
55,15;40,15;45,27
70,50
10,25
40,60
30,40
70,50
30,20
55,27
Bài tập 1. Xây dựng
dữ liệu cung (dữ liệu
tọa độ cung) và các
bảng cung – nút –
vùng cho mô hình
dữ liệu không gian
sau:
Bài tập2. Cho bảng dữ liệu tọa độ cung sau:
Cung (Arc)
Điểm đầu
(From node)
Đỉnh
(Verties)
Điểm cuối
(To node)
a 2,5 2,8 5,8
b 5,8 8,8 8,5
c 8,5 8,1; 2,1 2,5
d 5,8 5,5 8,5
e 4,3 4,2; 3,2; 3,3 4,3
f 2,5 3,5 4,6
a. Hãy xây dựng mô hình dữ liệu không gian của bảng dữ liệu tọa độ trên
b. Hãy xây dựng các bảng Topology vùng, Topology nút, Topolygy cung.
Yêu cầu:
1. Thống nhất trong các ký hiệu khi làm bài:
- Điểm (node): N1, N2, N3,.
- Cung (arc): a,b,c,....
- Vùng (polygon): A, B, C,
2. Thể hiện chiều mũi tên từ điểm đầu đến điểm cuối trên các cung của
mô hình cơ sở dữ liệu không gian (hình vẽ).
Ưu điểm
Các bảng Topology cung, nút, vùng cho phép phân tích các quan hệ giữa các phần
tử trên bản đồ mà khộng cần đến dữ liệu tọa độ. Do đó, cấu trúc topology rất thích hợp
với những toán tử phân tích không gian, nhất là những bài toán kề (contiguity) và kết
nối (connectivity).
Nhược điểm
Phần lớn dữ liệu nhập vào GIS không tồn tại ở dạng cấu trúc dữ liệu topology, việc
xây dựng topology bởi phần mềm GIS có thể tốn thời gian và sử dụng nhiều nguồn lực
máy tính.
Mỗi khi có sự biên tập tác động đến dữ liệu hình học, topology phải xây dựng lại.
Các mối quan hệ Topology giữa các đối tượng không gian
Các mối quan hệ Topology giữa các đối tượng không gian
Quan hệ điểm-điểm
- “Trong giới hạn (is within)”: Nằm trong giới hạn một khoảng cách cụ thể.
- “Gần nhất với (is nearest to)”: Gần nhất so với một điểm cụ thể.
Quan hệ điểm-đường
- “ Nằm trên đường (on line)”: điểm nằm trên một đường.
- “ Gần nhất với (is nearest to)”: Điểm gần nhất so với một đường.
Quan hệ điểm-vùng
- “Chứa bên trong vùng (is contained in)”: Điểm chứa bên trong vùng.
- “Nằm trên biên (on border of area)”: Một điểm nằm trên đường biên của vùng.
Các mối quan hệ Topology giữa các đối tượng không gian
Quan hệ đường-đường
- “Giao nhau (intersects)”: Hai đường giao nhau.
- “Băng qua (crosses)”: Hai đường băng qua mà không giao nhau.
- “Chảy vào (flow into)”: Một nhánh sông chảy vào một dòng sông.
Quan hệ đường-vùng
- “Giao nhau (intersects)”: Một đường giao (cắt) với một vùng.
- “Đường biên (borders)”: Đường là một phần biên của vùng.
Quan hệ vùng-vùng
- “Chồng lớp (overlaps)”: Hai vùng chồng lên nhau.
- “Nằm bên trong (is within)”: Một vùng nằm bên trong một vùng khác.
- “Kế cận (is adjacent to)”: Hai vùng cùng có một đường biên chung
Dữ liệu raster được tạo thành bằng cách chồng lưới các ô lên trên
các đối tượng địa lý.
Baûn ñoà goác
Löôùi choàng lôùp
(grid overlay)
1
6 7
5
Baûn ñoà daïng oâ löôùi
Coät
Doøng
8
7
6
5
4
3
2
1
1 2 3 4 5 7 8 9
7 7 7 7 7 7 6 6 6 6
7 7 7 7 7 7
7
7 7
7
7
7
7
7 7
6 6 6 6
6 6 6 6 6
6 6 6 6 6 6
6
6
6
6
5
5
5
5
10
5 5 5
5 5 5
5 5 5
5 5 5
5
5
1
1
1
1
1 1 1
1
1 1 1 1
1 1 1 1
1
1
6
Giá trị ô chính là giá trị đo hoặc ghi
nhận được của đối tượng nằm đầy
trong ô. Trong trường hợp đối tượng
không nằm đầy ô, giá trị ô được gán
theo các nguyên tắc:
- Đối tượng chiếm đa số về diện tích
- Đối tượng tại tâm ô
- Đối tượng chạm ô – đối với đối
tượng đường
- hoặc chọn theo trọng số để đảm bảo
các đối tượng có đặc tính quý hiếm
được biểu diễn
Giá trị của ô có thể là chữ hoặc là số tùy theo đối tượng được biểu
diễn.
Giá trị trong “ô lưới” tương ứng với đặc tính của hiện tượng trong
không gian tại vị trí ô. Sự thay đổi của giá trị phản ánh sự thay đổi của
hiện tượng.
Một ô đơn được gán chỉ 1 giá trị, do vậy để có thể biểu diễn nhiều
đặc tính của cùng 1 đối tượng, 1 hệ thống các lớp dữ liệu raster được sủ
dụng. Mỗi lớp raster thể hiện 1 loại đặc tính.
Lưới ô thường có gốc tọa độ bắt đầu tại vị trí trên trái. Vị trí hình
học của các ô được xác định bởi số hàng và số cột.
Dữ liệu raster có thể đến từ ảnh viễn thám, ảnh chụp máy bay, hoặc
raster hóa từ nguồn dữ liệu vector
Các đối tượng điểm, đường vùng trong mô hình Raster được biểu diễn như
sau:
Đối tượng điểm được biểu diễn bằng các điểm ảnh đơn.
Đối tượng đường được biểu diễn bằng một chuỗi các điểm ảnh liên tục và
có độ rộng không đều, có đường biên zic-zac tùy kích thước của điểm ảnh.
Đối tượng vùng được biểu diễn bằng 1 mảng các điểm ảnh liên tục.
Độ phân giải không gian của mô hình Raster là kích thước
của một pixel trên mặt đất. Một ô 10m thể hiện bề mặt diện tích
10x10 = 100m2. Một ô 30m thể hiện bề mặt diện tích là 900m2.
Như vậy ô 10m có độ phân giải không gian tốt hơn ô 30m.
Kích thước ô lớn không thể biểu diễn chính xác vị trí của các
đối tượng không gian do có nhiều đối tượng không gian cùng tồn
tại trong 1 ô.
Kích thước ô nhỏ có thể biểu diễn chính xác vị trí của các đối
tượng không gian sẽ làm tăng dung lượng lưu trữ và thời gian
xử lý dữ liệu.
Dung lượng lưu trữ của mô hình raster theo độ phân giải
Ví dụ: Với độ phân giải 100m, một vùng vuông 100km cần
một raster có 1000 hàng và 1000 cột tương ứng với 1 triệu pixel,
nếu dùng 1byte để biểu diễn 1 pixel thì dung lượng cần thiết là
0,96MB.
và để có độ phân giải 10m thì cần 100triệu pixel, khoảng 96
MB.
Mô hình Raster thường được biểu diễn với các cấu trúc có sử
dụng các phương pháp nén dữ liệu để giảm bớt dung lương lưu
trữ.
Trong cấu trúc raster, đường
được biểu diễn bằng những pixel có
cùng giá trị f(x,y) liên tiếp nhau. Vì
trong cấu trúc raster, các pixel được
xếp theo hàng, cột như một ma trận
điểm nên đường ở đây không trơn
mà có dạng zic-zac.
Vùng được xác định bằng một
mảng gồm nhiều điểm ảnh có cùng
giá trị thuộc tính f(x,y) trải rộng ra
theo nhiều phương.
Đối tượng điểm (point objects)
Mỗi đối tượng điểm là một điểm ảnh được gán ID điểm, toạ
độ (i, j) và các thuộc tính.
Soá pixel i
Soá haøng j
(i,j) = (5,3);(7,5);(8,2)
Đối tượng đường (line objects)
Mỗi đối tượng đường được gán ID đường, chuỗi tọa độ định dạng
đường và các thuộc tính.
(1,3);(2,2);(3,2) ;(4,3);
(5,4) ;(6,5) ;(7,5) ;(8,4)
Đối tượng vùng (polygon objects)
- Mỗi đối tượng vùng được gán ID vùng, nhóm tọa độ định dạng
vùng và thuộc tính.
Mã hóa từng ô
Là phương pháp mã hóa đơn giản nhất. Một lưới Raster được lưu trữ
như 1 ma trận và giá trị ô được ghi vào một tập tin theo hàng và theo
cột.
Phương pháp này áp dụng rất tốt trong trường hợp giá trị ô biến
thiên liên tục.
Mô hình độ cao số DEM sử dụng phương pháp này để lưu trữ bởi vì
giá trị độ cao của các ô lân cận ít khi nào giống nhau. ảnh vệ tinh cũng
sử dụng phương pháp này để lưu trữ.
Mã hóa đoạn chạy – Run length
- Mã run - length lợi dụng sự giống nhau của các pixel lân cận để
biểu diễn chúng từng loạt pixel có giá trị giống nhau theo từng hàng từ
trái qua phải, từ trên xuống dưới.
- Mỗi loạt pixel có giá trị giống nhau được biểu diễn bằng một
cặp số (chiều dài chuỗi, giá trị của pixel).
- Mã này rất hữu hiệu khi thuộc tính của lớp dữ liệu ảnh (giá trị
của pixel) ít thay đổi. Ngược lại, nếu giá trị thuộc tính thay đổi nhiều,
đôi khi việc dùng mã này còn làm tăng dung lượng dữ liệu.
Bieåu dieãn maõ run-length
cuûa lôùp döõ lieäu aûnh raster
hình beân: (10,A) (10,A)
(4,A) (6,B) (3,A) (7,B)
(4,D) (6,B) (5,D) (5,B)
(5,D) (5,C) (5,D) (5,C)
(5,D) (5,C) (5,D)
(5,C).
B
1 2 3 4
0 A
B B A A A A 2
A
A
A A
1
A
6
A A 3 B B
B
A
A
5
A
5
4
A A
A A
8 7 0
B B
A A
A
A
8
7
6
B
9
9
A
A
B
A A
B B
B B B
B
B B
B B B
B
B B
D
D D D D D
D D D D
D
D D D D D
D D D D
D D D D CD CD
CD CD CD CD
CD CD CD CD
CD CD
CD
CD
CD
CD
CD
CD CD CD D D D D D
Höôùng ñoïc caùc pixel
theo maõ run-length
- Mã run-length tuy có thuật toán nén và giải mã đơn
giản nhưng tỉ số nén không cao,
- Thao tác tìm kiếm thường chậm vì lưu trữ theo hàng
không lưu ý tới tính lân cận.
- Để khắc phục tình trạng này, mã run-length được cải
biên theo những đường đọc dữ liệu khác nhau.
Mã hóa run length cải biên
(24,A) (13,B) (3,A)
(13,B) (4,D) (11,B)
(10,D) (10,C) (10,D)
(10,C) (5,D).
B
1 2 3 4
0 A
B B A A A A 2
A
A
A A
1
A
6
A A 3 B B
B
A
A
5
A
5
4
A A
A A
8 7 0
B B
A A
A
A
8
7
6
B
9
9
A
A
B
A A
B B
B B B
B
B B
B B B
B
B B
D
D D D D D
D D D D
D
D D D D D
D D D D
D D D D CD CD
CD CD CD CD
CD CD CD CD
CD CD
CD
CD
CD
CD
CD
CD CD CD D D D D D
Mã hóa phần tư – cây tứ phân
- Mã tứ phân cũng dựa theo nguyên lý sự giống nhau
của nhiều pixel trong những vùng có cùng thuộc tính.
- Mỗi vùng chỉ cần gán một giá trị.
- Vùng được xác định bằng cách chia nhỏ diện tích
làm 4 phần bằng nhau, mỗi phần lại được chia nhỏ thành
4 phần, v.v....
- Việc chia nhỏ này sẽ không thực hiện ở những
vùng có cùng thuộc tính.
Mã hóa phần tư – cây tứ phân
3
0
0
2
1
2
0
1
3
1
2
3
Baûn ñoà
0 1 2 3
310 311 312 313
Mã hóa phần tư – cây tứ phân
Bảng thuộc tính
Möùc cuûa caây Thuoäc tính
1 2 3
0 Coâng nghieäp
1 Coâng nghieäp
2 Noâng thoân
3 0 Nhaø ôû
1 0 Dòch vuï thöông maïi
1 Dòch vuï thöông maïi
2 Dòch vuï coâng coäng
3 Khu giaûi trí
2 Bieät thöï
3 Bieät thöï
Mã hóa phần tư – cây tứ phân
Các thành phần của cây tứ phân
- Gốc: từ đó các nhánh khác được mở rộng
- Lá là điểm mà từ đó quá trình phân nhánh không xảy ra
- Tất cả các điểm còn lại trong cây gọi là nút
Nhiều hệ thống đánh mã đã được phát triển để chỉ định mã nhận
dạng đến các nút, trong đó có hệ thống đánh mã Morton. Mã chỉ định cho
mỗi nút là sự kết hợp của nút ở cấp độ cao hơn và mã ở cấp độ hiện
hành. VD nút 212 là sự kết hợp của mã 21 ở cấp độ trên và mã 2 ở cấp
độ hiện hành. Hệ thống đánh mã này có ưu điểm là lân cận của mỗi nút
có thể được tìm ra từ hệ thống đánh mã. VD lân cận của nút 212 là các
nút 21x(0, 1, 3) và các nút 2x(20, 21, 22, 23).
Mã hóa phần tư – cây tứ phân
Ưu điểm: cho phép tổng quát hóa dữ liệu đến mức độ chi tiết
tùy chọn.
Hạn chế: tốn nhiều thời gian cho việc tạo ra và hiệu chỉnh. Khi
bản đồ trở nên phức tạp và dữ liệu phải cập nhật thường xuyên thì
tính hiệu quả trong lưu trữ sẽ mất đi.
Bài tập 1. Cho mô hình dữ liệu không gian sau:
0 1 2 3 4 5 6 7
0 CS CS CS CS CS CS CS CS
1 CS CS CS CS CS CS CS CS
2 CS CS Đ Đ Đ AT AT AT
3 CS CS Đ Đ Đ AT AT AT
4 CS CS Đ Đ Đ Đ Đ Đ
5 Đ Đ Đ Đ Đ Đ Đ Đ
6 Đ Đ Đ T T T CS CS
7 Đ Đ T T T T CS CS
Ghi chú: CS – cao su, Đ – điều, T – tiêu, AT – ăn trái
Hãy mã hóa lớp dữ liệu không gian trên theo:
a. phương pháp mã hóa đoạn chạy
b. phương pháp mã hóa đoạn chạy cải tiến
c. phương pháp mã hóa phần tư
Bài tập 2. Cho mô hình dữ liệu không gian sau:
0 1 2 3 4 5 6 7
0 M M M M M M M M
1 M M M M M M M M
2 P PS PS PS M M P P
3 P PS PS PS M M P P
4 P X M Đ M M P P
5 P PS P Đ Đ Đ P P
6 X X M M P P X M
7 X X M M P P X X
Ghi chú: M – Đất mặn, P – đất phèn, PS – đất phù sa, X – đất xám
Hãy mã hóa lớp dữ liệu không gian trên theo:
a. phương pháp mã hóa đoạn chạy
b. phương pháp mã hóa đoạn chạy cải tiến
c. phương pháp mã hóa phần tư
Chỉ những hiện tượng quan trọng thu thập biểu
diễn trong CSDL.
Vd: Con đường có bề dày, nhưng không quan trọng
bằng chiều rộng và dài
Xác định rõ hiện tượng, đối tượng và chọn dữ
liệu thích hợp biểu diễn chúng là một phần của
quá trình thiết kế CSDL
Vd: trên bản đồ 1:100.000 những ngôi nhà không
phân biệt
Mục đích đảm bảo dữ liệu được nhận dạng và
mô tả trong tính toàn vẹn chính xác.
Kiểu cách, hình thức được người phân tích dữ
liệu chấp nhận
Mục tiêu:
Nhận biết, nhận diện nội dung CSDL và mô tả nó
trong dạng tóm tắt, hay khái niệm
Xác định mục tiêu CSDL
Cần làm gì ?
Làm sao sẽ thực hiện được ?
Trên cơ sở đó, xác định tất cả các dạng nhu cầu về
dữ liệu nhằm thực hiện mục tiêu nói trên.
Đặc điểm
Phần cứng và phần mềm không lệ thuộc
Những mô tả & định nghĩa các thực thể
Xác định thực thể biểu diễn trong CSDL
▪ Vd. chọn các đối tượng không gian - points, lines, areas,
raster cells
Những yêu cầu qui mô biểu diễn & những mối quan
hệ sẽ biểu diễn
▪ Dựa trên cơ sở quá trình xử lý trên các đối tượng
▪ Vd. Cần biểu diễn tòa nhà như diện tích hay point?
▪ Vd. nên chia nhỏ đường giao thông như thế nào để liên kết
trong CSDL?
Mục tiêu
CSDL được mô tả chi tiết, bao gồm các hạng mục
tin, các mối quan hệ dữ liệu, độ chính xác, các thủ
tục đảm bảo sự toàn vẹn dữ liệu
Phần mềm cần xác định nhưng phần cứng không
lệ thuộc
Thiết đặt cấu trúc logic các yếu tố CSDL, Xác định
bởi hệ quản trị dữ liệu-DBMS sử dụng bởi phần
mềm
Đặc điểm
Cả phần cứng & mềm đều yêu cầu.
Yêu cầu tổ chức file trên máy tính
Triển khai kết quả của mức logic trên các phần
cứng, phần mềm cụ thể.
Các file đính kèm theo tài liệu này:
- bai_giang_3_csdl_gis_5358.pdf