KẾT LUẬN
Dự báo chuỗi thời gian mờ là một hướng
nghiên cứu hoàn toàn mới. Trên thực tế,
những dữ liệu thu được theo thời gian thường
chịu ảnh hưởng của các yếu tố khách quan và
chủ quan. Chính vì vậy xem xét chuỗi thời
gian trên quan điểm biến ngôn ngữ của Song
& Chissom và Chen là hoàn toàn đúng đắn.
Bài báo nghiên cứu đưa ra mô hình dự báo
chuỗi thời gian mờ dựa trên tiếp cận ĐSGT
và so sánh với các mô hình dự báo truyền
thống đã có. Hiệu quả dự báo tốt hơn của mô
hình mới được khẳng định trên cơ sở giải
quyết cùng một bài toán dự báo số sinh viên
nhập học đã được Song & Chissom, Chen và
nhiều tác giả khác sử dụng. Đây là nghiên cứu
quan trọng ban đầu khẳng định giá trị khoa
học của tiếp cận ĐSGT trong một lĩnh vực
ứng dụng mới về dự báo. Kết quả nhận được
của bài báo mở ra hướng nghiên cứu ứng
dụng mới của tiếp cận ĐSGT trong lĩnh vực
dự báo.
7 trang |
Chia sẻ: thucuc2301 | Lượt xem: 572 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Dự báo chuỗi thời gian mờ sử dụng đại số gia tử - Vũ Như Lân, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101
95
DỰ BÁO CHUỖI THỜI GIAN MỜ SỬ DỤNG ĐẠI SỐ GIA TỬ
Vũ Như Lân1*, Nguyễn Tiến Duy2, Trịnh Thúy Hà3
1Viện công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam
2Đại học Kỹ thuật công nghiệp - ĐH Thái Nguyên,
3Đại học Công nghệ thông tin &Truyền thông -ĐH Thái Nguyên
TÓM TẮT
Song, Chissom [1, 2] lần đầu tiên đã đưa ra khái niệm mới về chuỗi thời gian mờ. Tuy nhiên mô
hình tính toán nhóm quan hệ mờ trong mô hình dự báo chuỗi thời gian mờ quá phức tạp và do đó
độ chính xác của dự báo không cao. Chen [3] đã thay đổi cách tính toán nhóm quan hệ mờ bằng
các phép tính số học đơn giản để có được kết quả dự báo tốt hơn. Đại số gia tử (ĐSGT) là một tiếp
cận mới được các tác giả N.C.Ho và W. Wechler xây dựng vào những năm 1990, 1992[6,7] khi
đưa ra một mô hình xử lí các giá trị ngôn ngữ của biến ngôn ngữ hoàn toàn khác biệt so với tiếp
cận mờ. Bài báo là sự tiếp tục những nghiên cứu ứng dụng ĐSGT trong lĩnh vực dự báo chuỗi thời
gian mờ, một lĩnh vực mới đang được nhiều nhà khoa học trên thế giới đi sâu nghiên cứu. Trên cơ
sở chuỗi dữ liệu về số lượng sinh viên nhập học tại trường Đại học Alabama qua các năm 1971
đến 1992, bài báo đề xuất phương pháp dự báo hoàn toàn mới dựa trên ĐSGT và so sánh với kết
quả của Song, Chissom [1,2], Chen [3], Hwang [5]và Huarng [4]. Qua đó thấy rằng: sai số dự báo
được đánh giá qua tiêu chuẩn bình phương trung bình (MSE) theo tiếp cận ĐSGT nhỏ hơn nhiều
so với MSE trong mô hình dự báo chuỗi thời gian mờ củacác tác giả nêu trên.
Từ khoá: Tập mờ, Chuỗi thời gian mờ, Quan hệ logic mờ, Đại số gia tử
MỞ ĐẦU*
Trong những năm gần đây, có rất nhiều tác
giả trên thế giới quan tâm nghiên cứu mô hình
dự báo chuỗi thời gian mờ do Song, Chissom
đưa ra đầu tiên [1,2] và được Chen [3] cải
tiến. Tuy nhiên, độ chính xác dự báo còn phụ
thuộc vào quá nhiều yếu tố. Vì vậy cho đến
nay, mô hình dự báo chuỗi thời gian mờ luôn
được nhiều chuyên gia trên thế giới cải tiến
để có được kết quả tốt hơn.
Tiếp cận ĐSGT là tiếp cận khác biệt so với
tiếp cận mờ và đã có một số ứng dụng thể
hiện rõ tính đột phá trong một số lĩnh vực
công nghệ của tiếp cận này so với tiếp cận mờ
truyền thống. Có thể kể đến một số lĩnh vực
ứng dụng có hiệu quả như điều khiển và, công
nghệ thông tin [8]. Bên cạnh đó, ĐSGT cũng
cần được nghiên cứu cho một lĩnh vực ứng
dụng mới, đó là bài toán dự báo chuỗi thời
gian mờ. Liệu ĐSGT có thể tiếp tục khẳng
định được tính ưu việt của nó trong bài toán
bài toán dự báo chuỗi thời gian mờ nêu trên
hay không? Đó cũng chính là nội dung nghiên
cứu trong bài báo này.
* Tel: 0986 437050, E-mail: vnlan@ioit.ac.vn
Bài báo được trình bày theo thứ tự sau đây:
Sau mục 1 Mở đầu là Mục 2 giới thiệu về
phương pháp dự báo chuỗi thời gian mờ của
Song, Chissom [1,2] và Chen [3]. Mục 3 nêu
một số nội dung quan trọng của ĐSGT cần
thiết cho bài toán dự báo chuỗi thời gian mờ.
Mục 4 trình bày mô hình dự báo chuỗi thời
gian mờ sử dụng ĐSGT để ứng dụng cho bài
toán dự báo số sinh viên nhập học của trường
đại học Alabama và so sánh với các phương
pháp của Song, Chissom và Chen.
MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ
Một số khái niệm cơ bản của mô hình dự
báo chuỗi thời gian mờ
Định nghĩa 2.1 [1,2]: Chuỗi thời gian mờ
Giả sử Y(t), (t = ..., 0, 1, 2, ...), là tập các số
thực và cũng là tập nền trên đó xác định các
tập mờ f i(t), (i = 1, 2, ...). Biến t là thời gian.
Nếu F(t) là một chuỗi các tập mờ của fi(t), (i
= 1, 2, ...), thì F(t) được gọi là chuỗi thời gian
mờ trên Y(t), (t = ..., 0, 1, 2, ...).
Định nghĩa 2.2 [1,2]: Quan hệ mờ
Nếu tồn tại quan hệ mờ R(t−1, t), sao cho F(t) =
F(t−1)*R(t−1, t), trong đó dấu * kí hiệu toán tử
nào đó, thì F(t) được suy ra từ F(t−1). Quan hệ
giữa F(t) và F(t−1) được xác định bằng kí hiệu:
Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101
96
F(t−1)F(t) (2.1)
Toán tử * có thể là phép kết hợp MaxMin [1]
hoặc MinMax [2] hay phép tính số học [3].
Nếu F(t−1) = Ai and F(t) = Aj, quan hệ logic
giữa F(t) and F(t−1) được kí hiệu bằng
AiAj, trong đó Ai là vế trái và Aj là vế phải
của quan hệ mờ mô tả tập mờ dự báo.
Định nghĩa 2.3 [1, 2]: Nhóm quan hệ mờ
Các quan hệ mờ với cùng một tập mờ bên vế
trái có thể đưa vào một nhóm gọi là nhóm
quan hệ mờ (NQHM). Giả sử có các quan hệ
mờ sau: AiAj1; AiAj2;...; AiAjn
Các quan hệ mờ trên có thể đưa vào một
nhóm được kí hiệu như sau:
AiAj1, Aj2, ..., Ajn (2.2)
Tập mờ Ajk (k = 1, 2, ..., n) chỉ được xuất hiện
1 lần bên vế phải.
Mô hình dự báo Song và Chissom [1, 2]
Bước 1. Xác định tập nền
Bước 2. Chia miền xác định của tập nền
thành những khoảng bằng nhau.
Bước 3. Xây dựng các tập mờ trên tập nền
Bước 4. Mờ hoá chuỗi dữ liệu
Bước 5. Xác định các quan hệ mờ
Bước 6. Dự báo bằng phương trình Ai = Ai−1*
R, ở đây kí hiệu * là toán tử max-min
Bước 7. Giải mờ các kết quả dự báo.
Trong bước 5, quan hệ mờ R được xác định
bằng biểu thức Ri = AsT×Aq, với mọi quan hệ
mờ k,
(2.3)
Ở đây × là toán tử min, T là phép chuyển vị
và ∪ là phép hợp.
Mô hình dự báo Chen[3]
Bước 1. Chia miền xác định của tập nền
thành những khoảng bằng nhau.
Bước 2. Xây dựng các tập mờ trên tập nền
Bước 3. Mờ hoá chuỗi dữ liệu.
Bước 4. Xác định các quan hệ mờ.
Bước 5. Tạo lập nhóm quan hệ mờ.
Bước 6. Giải mờ đầu ra dự báo.
Luật dự báo chuỗi thời gian mờ
Giả sử dữ liệu của chuỗi thời gian F(t-1) được
mờ hoá bằng Aj, khi đó, đầu ra dự báo củaF(t)
được xác định theo những nguyên tắc sau đây:
1. Nếu tồn tại quan hệ một-một, kí hiệu là
AjAk, và mức độ thuộc cao nhất của Ak tại
khoảng uk, thì đầu ra dự báo của F(t) là điểm
giữa của uk.
2. Nếu Aj là trống, có nghĩa là Aj và Aj có
mức độ thuộc cao nhất tại khoảng uj, thì đầu
ra dự báo là điểm giữa của uj.
3. Nếu tồn tại quan hệ một - nhiều, kí hiệu là
AjA1, A2, ..., An, và mức độ thuộc cao nhất
của A1, A2, ..., An tại các khoảng u1, u2, ..., un
tương ứng, thì đầu ra dự báo được tính bằng
trung bình các điểm giữa m1, m2, ..., mn của
u1, u2, ..., un. Phương trình dự báo có dạng:
(m1+m2+ ... +mn)/n.
TÓM TẮT MÔ HÌNH TÍNH TOÁN CỦA
ĐẠI SỐ GIA TỬ
Gọi AX = (X, G, C, H, ) là một cấu trúc đại
số, với X là tập nền của AX; G = {c, c+} là
tập các phần tử sinh; C = {0, W, 1}, trong đó
0, W và 1 tương ứng là cận trái, trung hòa và
cận phải; H là tập các toán tử một ngôi được
gọi là các gia tử; là biểu thị quan hệ thứ tự
trên các giá trị ngôn ngữ. Gọi H là tập hợp
các gia tử âm và H+ là tập hợp các gia tử
dương của AX. Kí hiệu H = {h-1, h-2, h-q},
trong đó h-1< h-2< < h-q và H+ = {h1, h2, ,
hp}, trong đó h1< h2< < hp.
Định nghĩa 3.1 [7,8]: Độ đo tính mờ.
fm: X [0, 1] gọi là độ đo tính mờ nếu thỏa
mãn các điều kiện sau:
fm(c)+fm(c+) = 1 và
( )
h H
fm hx
= fm(x), với x X (3.1)
Với các phần tử 0, W và 1,
fm(0) = fm(W) = fm(1) = 0 (3.2)
Và với x, y X, hH,
( ) ( )
( ) ( )
fm hx fm hy
fm x fm y
(3.3)
Đẳng thức (3.3) không phụ thuộc vào các
phần tử x, y và do đó ta có thể kí hiệu là (h)
Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101
97
và đây là độ đo tính mờ của gia tử h. Tính
chất của fm(x) và (h) như sau:
fm(hx) = (h)fm(x), xX (3.4)
, 0
( ) ( )
p
i
i q i
fm h c fm c
, với c {c, c+} (3.5)
, 0
( ) ( )
p
i
i q i
fm h x fm x
(3.6)
1
( )
q
i
i
h
và
1
( )
p
i
i
h
, với , > 0
và + = 1 (3.7)
Định nghĩa 3.2 [7,8]: Hàm dấu
Hàm Sign: X{-1, 0, 1} là một ánh xạ được
gọi là hàm dấu với h, h'H và c {c, c+}
trong đó:
Sign(c) = 1, Sign(c+) = +1 (3.8)
Sign(hc)=Sign(c), nếu h là âm đối với c (3.9)
Sign(hc)=+Sign(c), nếu h là dương đối với c (3.10)
Sign(h'hx) = Sign(hx), nếu h’hx ≠ hx và h' là
âm đối với h (3.11)
Sign(h'hx) = +Sign(hx), nếu h’hx ≠ hx và h' là
dương đối với h (3.12)
Sign(h'hx) = 0 nếu h’hx = hx (3.13)
Gọi fm là một độ đo tính mờ trên X, ánh xạ
ngữ nghĩa định lượng : X [0, 1], được
sinh ra bởi fm trên X, được xác định như sau:
(W) ( ),v fm c (3.14)
( ) ( ) ( )v c fm c fm c (3.15)
( ) ( ) 1 ( )v c fm c fm c (3.16)
( )
( ) ( ) ( )
{ ( ) ( ) ( )}
j j
j
i j ji sign j
v h x v x sign h x
fm h x h x fm h x
(3.17)
1
( ) [1 ( )
2
( )( )] { , }
j j
p j
h x Sign h x
sign h h x
(3.18)
j [-q^p], j 0.
Giả sử rằng miền tham chiếu thông thường
của các biến ngôn ngữ X là đoạn [a, b] còn
miền tham chiếu ngữ nghĩa Xs là đoạn [as, bs]
(0≤as<bs≤1). Việc chuyển đổi tuyến tính từ [a,
b] sang [as, bs] được gọi là phép ngữ nghĩa
hoá (semantization), còn việc chuyển ngược
lại từ đoạn [as, bs]sang [a, b] được gọi là phép
giải nghĩa (desemantization). Trong nhiều
ứng dụng của ĐSGT, đã sử dụng miền ngữ
nghĩa là đoạn [as = 0, bs = 1], khi đó phép ngữ
nghĩa hoá được gọi là phép chuẩn hoá
(Semantization = Normalization) và phép giải
nghĩa được gọi là phép giải chuẩn
(Desemantization = Denormalization).
MÔ HÌNH DỰ BÁO CHUỖI THỜI
GIAN MỜ SỬ DỤNG ĐSGT
Bước 1. Chia miền xác định của tập nền
thành những khoảng bằng nhau.
Bước 2. Xây dựng các nhãn ngữ nghĩa trên
tập nền.
Bước 3. Ngữ nghĩa hoá chuỗi dữ liệu.
Bước 4. Xác định các quan hệ ngữ nghĩa theo
nhãn ngữ nghĩa.
Bước 5. Tạo lập nhóm quan hệ ngữ nghĩa
theo nhãn ngữ nghĩa.
Bước 6. Giải nghĩa đầu ra dự báo.
Bài toán được chọn để làm rõ hiệu quả dự báo
của mô hình trên là bài toán dự báo số lượng
sinh viên nhập học tại trường Đại học
Alabama trên cơ sở các số liệu có từ năm
1971 đến năm 1992 tương tự bài toán dự báo
của Song & Chissom [1, 2] và Chen [3] với
các bước như sau:
Bước 1: Xác định tập nền, chia miền xác định
của tập nền thành những khoảng bằng nhau.
Tập nền U đã được Chen chọn có khoảng xác
định: [Dmin−D1, Dmax−D2] với Dmin và
Dmax là số sinh viên nhập học thấp nhất và
cao nhất theo dữ liệu lịch sử nhập học của
trường. Cụ thể Dmin = 13055 và Dmax =
19337. Các biến D1 và D2 là các số dương
được chọn sao cho khoảng [Dmin−D1,
Dmax−D2] bao được số sinh viên nhập học
thấp nhất và cao nhất trong tương lai. Sử dụng
cách chọn của Chen, D1 = 55 và D2 = 663,
như vậy U = [13000, 20000]. Khoảng xác
định tập nền U được Chen và nhiều tác giả
khác chia thành 7 khoảng bằng nhau u1, u2,
Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101
98
u3, u4, u5, u6 và u7. Trong đó u1 = [13000,
14000], u2 = [14000, 15000], u3 = [15000,
16000], u4 = [16000, 17000], u5 = [17000,
18000], u6 = [18000, 19000] vàu7 = [19000,
20000].
Bước 2: Xây dựng các nhãn ngữ nghĩa trên
tập nền.
Trong bài toán dự báo số sinh viên nhập học
tại trường Đại học Alabama, Chen sử dụng
các giá trị ngôn ngữ A1 = (not many), A2 =
(not too many), A3 = (many), A4 = (many
many), A5 = (very many), A6 = (too many)
và A7 = (too many many). Bài toán dự báo
này theo tiếp cận ĐSGT, sử dụng 2 gia tử
"very" và "little" tác động lên 2 phần tử sinh
"small" và "large" để tạo ra 7 nhãn ngữ nghĩa
tương ứng với 7 giá trị ngữ nghĩa của Chen
như sau: A1 = (very small), A2 = (small), A3
= (little small), A4 = (midle), A5 = (little
large), A6 = (large) và A7 = (very large).
Bước 3: Ngữ nghĩa hoá chuỗi dữ liệu.
Kí hiệu: SA = Semantization (A) là giá trị
ngữ nghĩa định lượng theo nhãn ngữ nghĩa A,
khi đó: SA1 = ν(very small); SA2 = ν(small);
SA3 = ν(little small); SA4 = ν(midle);
SA5 = ν(little large); SA6 = ν(large) và SA7
= ν(very large) là các giá trị ngữ nghĩa định
lượng theo các tham số được chon trước α, θ.
Sau 3 bước trên, xây dựng được Bảng 1: Ngữ
nghĩa hoá dữ liệu lịch sử số sinh viên nhập
học tại trường Alabama.
Từ Bảng 1 xây dựng được phân bố 22 dữ liệu
theo 22 năm tính từ 1971 đến 1992 thuộccác
khoảng ui.
Bước 4: Xác định các quan hệ ngữ nghĩa theo
nhãn ngữ nghĩa.
Nếu đặt chuỗi thời gian mờ F(t-1) là Ak có
ngữ nghĩa định lượng SAk và F(t) là Am có
ngữ nghĩa định lượng SAm, thì Ak có quan
hệ với Am và dẫn đến SAk có quan hệ với
SAm. Quan hệ này được gọi là quan hệ ngữ
nghĩa theo nhãn ngữ nghĩa và được kí hiệu là:
SAk SAmhoặc
Semantization(Aj)Semantization(Ak)(3.21)
Bảng 1: Ngữ nghĩa hoá dữ liệu lịch sử số sinh
viên nhập học
Năm
Số sinh viên
nhập học
Thuộc
khoảng
Ngữ nghĩa
định lượng
1971 13055 u1 SA1
1972 13563 u1 SA1
1973 13867 u1 SA1
1974 14696 u2 SA2
1975 15460 u3 SA3
1976 15311 u3 SA3
1977 15603 u3 SA3
1978 15861 u3 SA3
1979 16807 u4 SA4
1980 16919 u4 SA4
1981 16388 u4 SA4
1982 15433 u3 SA3
1983 15497 u3 SA3
1984 15145 u3 SA3
1985 15163 u3 SA3
1986 15984 u3 SA3
1987 16859 u4 SA4
1988 18150 u6 SA6
1989 18970 u6 SA6
1990 19328 u7 SA7
1991 19337 u7 SA7
1992 18876 u6 SA6
Bảng 2: Phân bố số năm trên các khoảng ui
Khoảng u1 u2 u3 u4 u5 u6 u7
Sốnăm 3 1 9 4 0 3 2
Trên cơ sở Bảng 1 xây dựng được các quan
hệ ngữ nghĩa sau đây:
SA1 → SA1 (2 lần); SA1 → SA2;SA2 →
SA3;SA3 → SA3 (7 lần);
SA3 → SA4 (2 lần); SA4 → SA4 (2 lần);SA4
→ SA3;SA4 → SA6;
SA6 → SA6;SA6 → SA7; SA7 → SA7
vàSA7 → SA6 (3.22)
Bước 5: Tạo lập nhóm quan hệ ngữ nghĩa
theo nhãn ngữ nghĩa.
Nhóm 1: SA1 → (SA1, SA1, SA2)
Nhóm 2: SA2 → (SA3)
Nhóm 3: SA3 → (SA3, SA3, SA3, SA3, SA3,
SA3, SA3, SA4, SA4)
Nhóm 4: SA4 → (SA4, SA4, SA3, SA6)
Nhóm 5: SA6 → (SA6, SA7)
Nhóm 6: SA7 → (SA7, SA6)
Bước 6:Giải nghĩa đầu ra dự báo.
Giả sử số sinh viên nhập học tại năm (t-1) của
chuỗi thời gian mờ F(t-1) được ngữ nghĩa hoá
theo (3.19) là SAj, khi đó đầu ra dự báo của
F(t) hay số sinh viên nhập học dự báo tại năm
Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101
99
t được xác định theo các nguyên tắc (luật) sau
đây:
1. Nếu tồn tại quan hệ 1-1 trong nhóm quan
hệ ngữ nghĩa theo nhãn ngôn ngữ Aj:
SAj SAk, haytheo (3.19): Semantization
(Aj) Semantization (Ak), thì đầu ra dự báo
được tính theo (3.20): DSAj =
Desemantization (SAj) trên khoảng uj.
2. Nếu SAj là rỗng, (SAj = ) SAk, thì
đầu ra dự báo là điểm giữa khoảng uj
3. Nếu tồn tại quan hệ 1-nhiều trong nhóm
quan hệ ngữ nghĩa (kể cả quan hệ trùng) theo
nhãn ngôn ngữ Aj: SAj (SAi, SAk,..., SAr),
hay theo (3.19): Semantization(Aj)
(Semantization(Ai), Semantization(Ak), ...,
Semantization(Ar)), thì đầu ra dự báo được
xác định theo (3.20): DSAj =
Desemantization(WSAiAj x SAi+WSAkAj x
SAk+ ... +WSArAj x SAr) trên khoảng bất kỳ
trong khoảng chung bao gồm từ ui, uk, đến
ur của NQHNN. Trong đó WSAiAj,
WSAkAj..., WSArAj là trọng số ngữ nghĩa
của từng thành phần trong NQHNN theo nhãn
ngữ nghĩa Aj được tính bằng tỷ số giữa số
năm thuộc khoảng ui và tổng số năm thuộc
các khoảng ui, uk, ..., ur với ui < uk < ... < ur.
Lưu ý: WSAiAj+WSAkAj+...+WSArAj=1.
Các tham số trong mô hình dự báo chuỗi thời
gian mờ theo tiếp cận ĐSGT được chọn cụ
thể như sau:
a/ Các tham số của phép ngữ nghĩa hoá:
α = θ = 0.5.
b/ Các khoảng của phép giải ngữ nghĩa cho 6
nhóm quan hệ ngữ nghĩa gồm:
Nhóm 1 [13500 – 14500]
Nhóm 2[15000 – 16000]
Nhóm 3 [15500 – 16500]
Nhóm 4 [16000 – 17000]
Nhóm 5 [18500 – 19500]
Nhóm 6 [18500 – 19500]
Kết quả so sánh các phương pháp dự báo bậc
nhất khác nhau trên cơ sở sai số trung bình
bình phương MSE giữa tiếp cận ĐSGT và các
phương pháp dự báo khác của Song &
Chissom [1,2], Chen [3], Hwang [5] và
Huarng [4] được mô tả trong Bảng 3:
Bảng 3: So sánh các phương pháp dự báo bậc nhất khác nhau
Năm
Số sinh
viên
nhập học
Phươngpháp
Song & Chissom
Phươngpháp
Song &
Chissom
Phương
phápChen
Phương
pháp
Hwang
Phương
pháp
Huarng
Phươngpháp
ĐSGT
1971 13055
1972 13563 14000 Không có 14000 Không có 14000 13643
1973 13867 14000 Không có 14000 Không có 14000 13643
1974 14696 14000 Không có 14000 Không có 14000 15143
1975 15460 15500 14700 15500 Không có 15500 15875
1976 15311 16000 14800 16000 16260 15500 15889
1977 15603 16000 15400 16000 15511 16000 15889
1978 15861 16000 15500 16000 16003 16000 15889
1979 16807 16000 15500 16000 16261 16000 16389
1980 16919 16813 16800 16833 17407 17500 16481
1981 16388 16813 16200 16833 17119 16000 16481
1982 15433 16789 16400 16833 16188 16000 15981
1983 15497 16000 16800 16000 14833 16000 15889
1984 15145 16000 16400 16000 15497 15500 15889
1985 15163 16000 15500 16000 14745 16000 15889
1986 15984 16000 15500 16000 15163 16000 15889
1987 16859 16000 15500 16000 16384 16000 16389
1988 18150 16813 16800 16833 17659 17500 18981
1989 18970 19000 19300 19000 19150 19000 19300
1990 19328 19000 17800 19000 19770 19000 19300
1991 19337 19000 19300 19000 19928 19500 19300
1992 18876 Không có 19600 19000 19537 19000 19300
MSE 423027 775687 407507 321418 226611 188910
Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101
100
(3.23)
Trong đó: MSE (Mean Square Error) là sai số
trung bình bình phương; SSVNHTT i là số
sinh viên nhập học thực tế năm I; còn
SSVNHDB i là số sinh viên nhập học dự báo
năm i, i = 1, 2, , 21
Từ Bảng 3 có thể thấy rõ tính ưu việt của mô
hình dự báo bậc nhất chuỗi thời gian mờ theo
tiếp cận ĐSGT so với nhiều mô hình dự báo
khác cùng bậc nhất. Sai số trung bình bình
phương của phương pháp dự báo theo tiếp
cận ĐSGT có giá trị MSE = 188910 là nhỏ
nhất so với tất cả các phương pháp khác.
KẾT LUẬN
Dự báo chuỗi thời gian mờ là một hướng
nghiên cứu hoàn toàn mới. Trên thực tế,
những dữ liệu thu được theo thời gian thường
chịu ảnh hưởng của các yếu tố khách quan và
chủ quan. Chính vì vậy xem xét chuỗi thời
gian trên quan điểm biến ngôn ngữ của Song
& Chissom và Chen là hoàn toàn đúng đắn.
Bài báo nghiên cứu đưa ra mô hình dự báo
chuỗi thời gian mờ dựa trên tiếp cận ĐSGT
và so sánh với các mô hình dự báo truyền
thống đã có. Hiệu quả dự báo tốt hơn của mô
hình mới được khẳng định trên cơ sở giải
quyết cùng một bài toán dự báo số sinh viên
nhập học đã được Song & Chissom, Chen và
nhiều tác giả khác sử dụng. Đây là nghiên cứu
quan trọng ban đầu khẳng định giá trị khoa
học của tiếp cận ĐSGT trong một lĩnh vực
ứng dụng mới về dự báo. Kết quả nhận được
của bài báo mở ra hướng nghiên cứu ứng
dụng mới của tiếp cận ĐSGT trong lĩnh vực
dự báo.
TÀI LIỆU THAM KHẢO
1. Song Q, Chissom B.S: Forecasting enrollments
with fuzzy time series – part 1. Fuzzy Sets and
Syst. 54, 1–9, 1993.
2. Song Q, Chissom B.S.: Forecasting enrollments
with fuzzy time series – part 2. Fuzzy Sets and
Syst. 62, 1–8, 1994
3. Chen S.M.: Forecasting Enrollments Based on
Fuzzy Time Series. Fuzzy Sets and Syst. 81, 311–
319, 1996.
4. Huarng, K.: Heuristic Models of Fuzzy Time
Series for Forecasting. Fuzzy Sets and Syst. 123
369–386, 2001.
5. HwangJ.R.,Chen,S.M., Lee, C.H., Handling
Forecasting problems using fuzzy time series.
Fuzzy Sets and Systems 100, 217-228, 1998
6. N.C Ho and W. Wechler, Hedge algebras: An
algebraic approach to structures of sets of
linguistic domains of linguistic truth variable,
Fuzzy Sets and Systems, 35, 281-293, 1990.
7. N.C Ho and W. Wechler, Extended hedge
algebras and their application to Fuzzy logic,
Fuzzy Sets and Systems, 52, 259-281, 1992.
8. Nguyen Cat Ho, Vu Nhu Lan, Le Xuan Viet,
Optimal hedge-algebras-based controller: Design
and Application, Fuzzy Sets and Systems 159,
968– 989, 2008.
Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101
101
SUMMARY
HEDGE-ALGEBRA-BASED FUZZY TIME-SERIES
Vu Nhu Lan1*, Nguyen Tien Duy2, Trinh Thuy Ha3
1Institute of Information Technology – Vietnam Academy of Science an Technology,
2College of Technology – TNU, 3College of Information and Communication Technology - TNU
Song and Chissom [1-2] presented thenew concept of fuzzy time series for the first time. However,
computational method of the fuzzy logical relationship groups in the fuzzy time series forecasting
model is too complicated to apply. Thus, the forecasting accuracy is not high. Chen [3] changed
the way to compute fuzzy relationship groups by simple numbers arithmetic operations in order to
bring a betterforecasting result.Hedge algebra (HA) is a new approachbuilt by N.C.Ho and W.
Wechlerx in the 1990s, 1992s [6,7] as giving a dealing model of linguistic value of linguistic
variable and it is completely different from fuzzy approach. As an application, this paper is a
continuous process of the studies using hedge algebra in the field of fuzzy time series forecasting.
This is a new field which is being studied by many scientists all over the world.Basing on data
series of the historical enrollments of the University of Alabama from 1971 to 1992, the paper
proposes a new forecasting method based on hedge algebra and compares to the results of Song,
Chissom's [1,2], Chen's [3], Hwang's [5]và Huarng's [4]. Meanwhile, it can be shown that the
mean squared error (MSE) by approaching hedge algebra is much less than the one in fuzzy time
series forecasting model of the above authors.
Key words: Fuzzy set, Fuzzy time series, Fuzzy logicalrelationship, Hedge Algebra
Ngày nhận bài:04/5/2014; Ngày phản biện:18/5/2014; Ngày duyệt đăng: 25/8/2014
Phản biện khoa học: PGS.TS Lại Khắc Lãi – Đại học Thái Nguyên
* Tel: 0986 437050, E-mail: vnlan@ioit.ac.vn
Các file đính kèm theo tài liệu này:
- brief_48436_52351_99201515352815_8917_2046551.pdf