Bài báo này đưa ra một cải biên cho thuật toán
bậc cao của Singh. Tuy chỉ là một cải biên nhỏ
nhưng hiệu quả đạt được là khá tốt. Điều này
thể hiện thông qua sai số trung bình bình
phương (MSE) của phương pháp chỉ bằng ½
sai số theo phương pháp nguyên thuỷ của
Singh. So sánh với kết quả của Huarng và các
phương pháp khác có thể xem trong [1]-[3].
Đường dự báo của chúng tôi đưa ra bám khá
sát với giá trị thực tế nên có thể sử dụng
phương pháp cải tiến này cho dự báo cho một
số chuỗi thời gian trong thực tiễn
8 trang |
Chia sẻ: dntpro1256 | Lượt xem: 727 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Cải biên thuật toán bậc cao của singh và ứng dụng trong dự báo chuỗi thời gian, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 59
CẢI BIÊN THUẬT TOÁN BẬC CAO CỦA SINGH VÀ ỨNG DỤNG
TRONG DỰ BÁO CHUỖI THỜI GIAN
Nguyễn Công Điều1, Trần Thanh Thương2*
1Viện Công nghệ thông tin - VAST, 2Đại học Thái Nguyên
TÓM TẮT
Mô hình chuỗi thời gian mờ đang có nhiều ứng dụng trong công tác dự báo. Tuy nhiên kết quả dự
báo của các phương pháp đề xuất còn chưa cao. Do đó việc tìm tòi các mô hình có độ chính xác cao
hơn và thuật toán đơn giản hơn đang là một ưu tiên. Trong những năm gần đây một số công trình
đã được hoàn thành theo hướng nâng cao độ chính xác và giảm khối lượng tính toán trong mô hình
chuỗi thời gian mờ như các công trình của Chen và Hsu, Huarng, Singh,... Một cách tiếp cận khác
cho mô hình chuỗi thời gian mờ là sử dụng những kỹ thuật khác trong khai phá dữ liệu như phân
cụm, mạng nơ ron, để xây dựng mô hình. Ngoài ra còn có thể sử dụng các thuật toán bậc cao dự
báo. Singh [10] đã đề xuất một thuật toán như vậy.
Trong bài báo này, chúng tôi cải tiến thuật toán bậc cao của Singh cho mô hình chuỗi thời gian mờ.
Cải tiến này đã cho thấy hiệu quả được tăng lên rõ rệt thông qua các tính toán số cho chuỗi thời gian.
Từ khóa: Chuỗi thời gian mờ, biến ngôn ngữ, mối quan hệ mờ
MỞ ĐẦU
Chuỗi thời gian mờ và mô hình chuỗi thời
gian mờ bậc nhất do Song và Chissom [4]-[6]
phát triển từ năm 1993. Sau công trình này,
một loạt các bài báo của nhiều tác giả khác
nhau tiếp tục dựa trên ý tưởng này để dự báo
chuỗi thời gian và ứng dụng trong nhiều lĩnh
vực khác nhau như dự báo dân số, tài chính,
nhiệt độ, nhu cầu điện, vv... Gần đây có rất
nhiều tác giả liên tục cải tiến mô hình chuỗi thời
gian mờ để dự báo đạt kết quả chính xác hơn.
Chen [7] đã đưa ra phương pháp mới đơn
giản và hữu hiệu hơn so với phương pháp của
Song và Chissom bằng cách sử dụng các phép
tính số học thay vì các phép tính hợp max-
min phức tạp trong xử lý mối quan hệ mờ.
Phương pháp của Chen cho hiệu quả cao hơn về
mặt sai số dự báo và độ phức tạp của thuật toán.
Nhiều công trình tiếp theo đã sử dụng cách tiếp
cận này để dự báo cho chuỗi thời gian.
Một trong các hướng được phát triển là sử
dụng mối quan hệ mờ bậc cao trong mô hình
chuỗi thời gian mờ. Singh [10] đã đưa ra một
thuật toán mới khá đơn giản để dự báo số
lượng sinh viên nhập học và sản lượng mùa
màng trong nông nghiệp bằng cách sử dụng
Tel: 0944550008; Email: thuong.cym@gmail.com
sai phân các thông số như là mối quan hệ mờ
để dự báo. Phát triển tiếp tục theo hướng sử
dụng các thuật toán đơn giản để dự báo,
trong [10] Singh đã sử dụng thuật toán này
cho mô hình chuỗi thời gian mờ bậc cao.
Trong bài báo này, chúng tôi cải tiến thuật
toán bậc cao của Singh nhằm tăng mức độ
chính xác của dự báo.
MỘT SỐ KHÁI NIỆM
Trong phần này, chúng ta sẽ sử dụng khái
niệm và phương pháp dự báo của chuỗi thời
gian mờ được Song và Chissom [4]-[6] phát
triển và được Chen [7] cải tiến để xây dựng
thuật toán dự báo cho chuỗi thời gian.
Giả sử U là không gian nền: U = u1,u2,....,um.
Tập A là mờ trên không gian nền U nếu A
được xác định bởi hàm: A : U [0.1]
A được gọi là hàm thuộc (Membership
function). Còn với bất kỳ một phần tử u nào
của A thì hàm A (u) được gọi là độ thuộc
của u vào tập mờ A.
Tập mờ A trên không gian nền U được viết
như sau:
Một số định nghĩa sau liên quan đến chuỗi
thời gian mờ [5].
n
nAAA
u
u
u
u
u
u
A
)(
...
)()(
2
2
1
1
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 60
Định nghĩa 1: Y(t) (t =...0,1,2,...) là một tập
con của R1. Y(t) là tập nền trên đó xác định
các tập mờ fi(t). F(t) là tập chứa các tập fi(t)
(i = 1,2,...). Khi đó ta gọi F(t) là chuỗi thời
gian mờ xác định trên tập nền Y(t).
Định nghĩa 2: Tại các thời điểm t và t-1 có tồn
tại một mối quan hệ mờ giữa F(t) và F(t-1) sao
cho F(t) = F(t-1) * R(t-1, t) trong đó * là ký
hiệu của một toán tử xác định trên tập mờ.
R(t-1, t) là mối quan hệ mờ. Ta cũng có thể ký
hiệu mối quan hệ mờ giữa F(t) và F(t-1) bằng
F(t-1) F(t).Nếu đặt F(t-1) = Ai và F(t) = Aj
thì ta ký hiệu mối quan hệ logic mờ giữa
chúng như sau: Ai Aj.
Định nghĩa 3:
Giả sử F(t) suy ra từ F(t-1) và F(t) = F(t-1) *
R(t-1, t) cho mọi t. Nếu R(t-1, t) không phụ
thuộc vào t thì F(t) được gọi là chuỗi thời
gian mờ dừng, còn ngược lại ta có chuỗi thời
gian mờ không dừng.
Định nghĩa 4:
Giả sử F(t) suy đồng thời từ F(t-1), F(t-2),,
F(t-m) m>0 và là chuỗi thời gian mờ dừng.
Khi đó mối quan hệ mờ có thể viết được F(t-1),
F(t-2),, F(t-m) F(t) và gọi đó là mô hình
dự báo bậc m của chuỗi thời gian mờ.
THUẬT TOÁN BẬC CAO CỦA SINGH
Singh đã phát triển các phương thức tính toán
để tìm ra một phương pháp tiếp cận tốt hơn
nhằm khắc phục những nhược điểm của hiện
tại của mô hình chuỗi thời gian mờ bậc cao.
Sự đơn giản của phương pháp này nằm ở chỗ
sử dụng sự sai phân để thay thế cho sự tính
toán phức tạp trong quan hệ logic mờ.
Phương pháp của Singh như sau:
Bước 1: Xác định tập nền. Tập nền U được
xác định như sau: lấy giá trị lớn nhất fmax và
nhỏ nhất fmin của chuỗi thời gian và U =[fmin-
f1, fmax+f2] trong đó f1,f2 là những giá trị
dương nào đó.
Bước 2: Chia đoạn U thành m khoảng con
bằng nhau u1, u2,...um.
Bước 3: Xây dựng các tập mờ Ai tương ứng
với các khoảng con như trong trong bước 2 và
sử dụng các hàm thuộc tam giác cho mỗi
khoảng con của phép chia.
Bước 4: Mờ hoá các giá trị của chuỗi thời
gian và thiết lập mối quan hệ mờ theo quy
tắc: nếu Ai là giá trị mờ hoá tại thời điểm t và
Aj là giá trị mờ hoá tại thời điểm tiếp theo t+1
thì ta có mối quan hệ mờ Ai Aj như tại
Định nghĩa 2. Ai là trạng thái hiện thời còn Aj
là trạng thái tiếp theo.
Bước 5: Tính toán và dự báo dựa trên các mối
quan hệ mờ được thiết lập
Thiết lập mối quan hệ mờ của các bậc khác
nhau như đưa ra dưới đây:
(i) Nếu cho thời điểm t - 2, t - 1 và t , giá trị
chuỗi thời gian được mờ hóa tương ứng là
Ai1, Ai và Aj, khi đó có mối quan hệ mờ bậc 2
như sau: Ai1, Ai → Aj.
(ii) Nếu cho thời điểm t - 3, t - 2, t - 1 và t,
giá trị chuỗi thời gian được mờ hóa tương ứng
là Ai2, Ai1, Ai và Aj, khi đó có mối quan hệ
mờ bậc 3 như sau: Ai2, Ai1, Ai → Aj.
(iii) Tương tự như vậy nếu cho thời điểm t -
4, t - 3, t - 2, t - 1 và t, giá trị chuỗi thời gian
được mờ hóa tương ứng là Ai3, Ai2, Ai1, Ai và
Aj, khi đó có mối quan hệ mờ bậc 3 như sau:
Ai3, Ai2, Ai1, Ai → Aj.
Theo cách tương tự chúng ta có thể xác định
được các cao hơn nhiều như: bậc năm, bậc
sáu, bậc bảy, bậc tám và các mối quan hệ mờ
tương ứng.
Tính toán các tham số dn, n = 2, 3, 4,. . . của
các bậc khác nhau:
(i) khảo sát một toán tử khác d2 yi = |yi | và
được định nghĩa là
d
2
Ei = |Ei - Ei -1|
d
3
Ei = |d
2
Ei - d
2
Ei -1|
d
4
Ei = |d
3
Ei – d3Ei -1|
d
5
Ei = |d
4
Ei – d4Ei -1|
d
6
Ei = |d
5
Ei – d5Ei -1|
d
7
Ei = |d
6
Ei – d6Ei -1|
d
n
Ei= |d
n-1
Ei – dn-1Ei -1|
Do đó, d3 Ei= ||Ei - Ei -1| - |Ei -1 - Ei -2 || and
d
4
Ei= |||Ei - Ei -1| -| Ei -1 - Ei -2 || - ||Ei -1 -
Ei -2| - |Ei -2 - Ei -3 ||| and d
5
Ei = ||||Ei– Ei–1|
– |Ei–1– Ei–2||– ||Ei–1– Ei–2 | – |Ei–2– Ei–3
||| - |||Ei–1– Ei–2 | – |Ei–2– Ei–3 || – ||Ei–2–
Ei–3| – |Ei–3– Ei–4 |||| và cứ tiếp tục như vậy.
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 61
(ii) Số bước w của dự báo mờ = int (số lượng
khoảng / 2) thu được là: int (7/2) = 3.
Tính toán và dự báo:
Một số ký hiệu được sử dụng được định nghĩa
như sau:
[*Aj ] là khoảng tương ứng Uj mà hàm thuộc
trong Aj đạt giá trị Supremum
L[*Aj ] là giới hạn dưới của khoảng Uj
U[*Aj ] là giới hạn trên của khoảng Uj
l[*Aj ] là độ dài khoảng Uj trong đó hàm
thuộc của Aj đạt Supremum
M[*Aj ] là giá trị trung bình của khoảng Uj
trong đó hàm thuộc của Aj đạt Supremum
Đối với một mối quan hệ mờ Ai → Aj:
Ai là giá trị mờ tại thời điểm t-1
Aj là giá trị mờ tại thời điểm t
Ei là giá trị của chuỗi thời gian tại thời điểm t-1
Ei-1 là giá trị của chuỗi thời gian tại thời điểm t-2
Ei-2 là giá trị của chuỗi thời gian tại thời điểm t-3
Ei-3 là giá trị của chuỗi thời gian tại thời điểm t-4
Ei-4 là giá trị của chuỗi thời gian tại thời điểm t-5
Fj là giá trị dự báo của chuỗi thời gian tại thời
điểm t
Ở đây, sử dụng mô hình bậc 2 với các giá trị
của chuỗi thời gian tại thời điểm t - 2, t - 1
cho khung quy tắc để thực hiện về mối quan
hệ logic mờ, Ai → Aj, với Ai, trạng thái hiện
hành, là mờ hóa số liệu tại thời điểm t - 1 và
Aj, trạng thái kế tiếp, là mờ hóa số liệu tại
thời điểm t.
Thuật toán tính toán:
Đối với dự báo chuỗi thời gian mờ của mô
hình bậc hai, có thể dự báo từ năm thứ ba của
dữ liệu chuỗi thời gian và do đó cần phải đặt
n = 2 và t = 3.
Đặt n = 2, t = 3
For t = 3 đến T (kết thúc dữ liệu chuỗi thời gian)
Thu được mờ quan hệ từ thời điểm t – 1(Ai)
đến t (Aj): Ai → Aj
R = 0 và S = 0
Tính toán
d
n
Ei= |d
n-1
Ei- d
n-1
Ei–1|
Xi= Ei + d
n
Ei/2
XXi= Ei – d
n
Ei/2
Yi= Ei + d
n
Ei
YYi= Ei - d
n
Ei
Pi = Ei + d
n
Ei/4
PPi = Ei - d
n
Ei/4
Qi= Ei + 2*d
n
Ei
QQi = Ei - 2*d
n
Ei
Gi= Ei + d
n
Ei/6
GGi = Ei - d
n
Ei/6
Hi = Ei + 3*d
n
Ei
HHi = Ei - 3*d
n
Ei
If Xi ≥ L [* Aj] and Xi ≤ U [*Aj]
Then R = R + Xi and S = S + 1
If XXi ≥ L [* Aj] and XXi ≤ U [* Aj]
Then R = R + XXi and S = S + 1
If Yi ≥ L [* Aj] and Yi ≤ U [*Aj]
Then R = R + Yi and S = S + 1
If YYi ≥ L [* Aj] and YYi ≤ U [* Aj]
Then R = R + YYi and S = S + 1
If Pi ≥ L [* Aj] and Pi ≤ U [*Aj]
Then R = R + Pi and S = S + 1
If PPi ≥ L [* Aj] and PPi ≤ U [* Aj]
Then R = R + PPi and S = S + 1
If Qi ≥ L [*Aj] and Qi ≤ U [* Aj]
Then R = R + Qi and S = S + 1
If QQi ≥ L [* Aj] and QQi ≤ U [* Aj]
Then R = R + QQi and S = S + 1
If Gi ≥ L [*Aj] and Gi ≤ U [* Aj]
Then R = R + Gi and S = S + 1
If GGi ≥ L [*Aj] and GGi ≤ U [*Aj]
Then R = R + GGi and S = S + 1
If Hi ≥ L [*Aj] and Hi ≤ U [* Aj]
Then R = R + Hi and S = S + 1
If HHi ≥ L [* Aj] and HHi ≤ U [* Aj]
Then R = R + HHi and S = S + 1
Fj=(R + M(* Aj))=(S + 1)
Next t
Tương tự như vậy, thiết lập n = 3 và t = 4, ta
có thể nhận được dự đoán bởi mô hình bậc ba
và n = 4, t = 5 để có được dự đoán bởi mô
hình bậc 4 và cứ tiếp tục như vậy. Như vậy
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 62
giá trị dự báo có thể thu được bằng các mô
hình bậc cao khác nhau.
Đề xuất cải biên cho thuật toán của Singh
Chúng tôi đề xuất một cải biên đơn giản cho
thuật toán bậc cao của Singh ở bước 2 của
thuật toán. Chúng tôi thực hiện một thay đổi
nhỏ trong bước 2 của thuật toán trên để phân
bố các điểm rơi vào từng khoảng được đều
hơn. Các bước còn lại được giữ nguyên như
thuật toán của Singh. Cụ thể: sau khi chia U
thành m đoạn con bằng nhau, có một vấn đề
đặt ra là số liệu chuỗi thời gian sẽ phân bố
không đều trong các khoảng đã chia. Có thể
có những khoảng không có giá trị chuỗi thời
gian đang xét rơi vào nhưng cũng có thể có
những khoảng có rất nhiều giá trị sẽ quy tập
tại đó. Như vậy dự báo sẽ có nhiều sai số do
sự phân bố không đều này. Vì vậy sẽ nảy sinh
ra vấn đề cần chia lại khoảng sao cho phân bố
của chuỗi thời gian rơi vào các khoảng đã
chia sẽ được đều hơn. Vấn đề này đã được
quan tâm trong [6]. Nội dung chủ yếu của lập
luận là tính toán phân bố của giá trị chuỗi thời
gian trong từng khoảng con.Giả sử số lượng
các giá trị chuỗi thời gian là p điểm. Số lượng
khoảng cần chia là m. Khi đó trung bình mỗi
khoảng chứa n=p/m giá trị chuỗi thời gian.
Nếu khoảng nào có số lượng giá trị chuỗi thời
gian rơi vào nhỏ hơn hoặc bằng n thì không
chia nhỏ ra, còn số lượng điểm rơi vào
khoảng này lớn hơn n bao nhiêu lần thì sẽ
chia nhỏ khoảng đó ra làm từng đó lần. Kết
quả, sau bước này việc chia khoảng sẽ không
thành các khoảng đều nhau nữa nhưng giá trị
chuỗi thời gian lại được phân bố đồng đều
hơn trong từng khoảng con.
ỨNG DỤNG TRONG DỰ BÁO CHỈ SỐ
CHỨNG KHOÁN ĐÀI LOAN
Xét bài toán dự báo cho chuỗi dữ liệu chỉ số
thị trường chứng khoán Đài Loan TAIFEX
[2,3]. Cụ thể như sau:
Áp dụng thuật toán cải biên cho số liệu này
như sau:
Bước 1. Xây dựng tập nền U. Xác định giá trị
lớn nhất và nhỏ nhất của chuỗi thời gian trên
là 6200 và 7560 điểm. Do vậy tập nền U
được xác định là giá trị trong khoảng
[6200,7600].
Bước 2. Chia khoảng. Ta sẽ chia U thành 14
khoảng u1, u2, ..., u14 với độ rộng là 100, như
vậy các khoảng sẽ là: u1 = [6200,6300], u2 =
[6300,6400], , u14 = [7500,7600].
Chia lại khoảng
Tính phân bố của các giá trị chuỗi thời gian
rơi vào các khoảng đã chia. Điều này thực
hiện để biết các khoảng nào có nhiều giá trị
rơi vào để có thể phân khoảng tiếp làm tăng
độ chính xác khi dự báo.
Bảng sau đây sẽ cho thấy sự phân bố các giá
trị của chuỗi thời gian rơi vào từng khoảng:
Bảng 2. Phân bố giá trị trong từng khoảng
Khoảng
Số
lượng
Khoảng
Số
lượng
6200-6300 1 6900-7000 5
6300-6400 0 7000-7100 1
6400-6500 3 7100-7200 0
6500-6600 1 7200-7300 6
6600-6700 2 7300-7400 5
6700-6800 9 7400-7500 2
6800-6900 9 7500-7600 3
Xem xét bảng trên thấy sự phân bố các giá trị
tại các khoảng khác nhau là không đều nhau.
Có 47 giá trị trong 14 khoảng nên số lượng
trung bình rơi vào mỗi khoảng là hơn 3. Vì
vậy những khoảng nào có 5, 6 giá trị rơi vào
ta chia tiếp làm 2 khoảng con, còn những
đoạn nào có 8, 9 giá trị rơi vào ta tiếp tục chia
thành 3 khoảng để sao cho mỗi khoảng con
đó có xấp xỉ 3 giá trị rơi vào. Kết quả sẽ hình
thành 21 khoảng sau:
Bảng 3. Phân khoảng
u1=[6200-6300] u8=[6766-6800] u15=[7100-7200]
u2=[6300-6400] u9=[6800-6833] u16=[7200-7250]
u3=[6400-6500] u10=[6833-6866] u17=[7250-7300]
u4=[6500-6600] u11=[6866-6900] u18=[7300-7350]
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 63
u5=[6600-6700] u12=[6900-6950] u19=[7350-7400]
u6=[6700-6733] u13=[6950-7000] u20=[7400-7500]
u7=[6733-6766] u14=[7000-7100] u21=[7500-7600]
Bảng 1. Giá trị chỉ số chứng khoán Đài Loan
Năm Giá trị thực Năm Giá trị thực Năm
Giá trị
thực
3/8/1998 7552 24/08/1998 6955 11/9/1998 6726.5
4/8/1998 7560 25/08/1998 6949 14/09/1998 6774.55
5/8/1998 7487 26/08/1998 6790 15/09/1998 6762
6/8/1998 7462 27/08/1998 6835 16/09/1998 6952.75
7/8/1998 7515 28/08/1998 6695 17/09/1998 6906
10/8/1998 7365 29/08/1998 6728 18/09/1998 6842
11/8/1998 7360 31/08/1998 6566 19/08/1998 7039
12/8/1998 7330 1/9/1998 6409 21/09/1998 6861
13/08/1998 7291 2/9/1998 6430 22/09/1998 6926
14/08/1998 7320 3/9/1998 6200 23/09/1998 6852
15/08/1998 7300 4/9/1998 6403.2 24/09/1998 6890
17/08/1998 7219 5/9/1998 6697.5 25/09/1998 6871
18/08/1998 7220 7/9/1998 6722.3 28/09/1998 6840
19/08/1998 7283 8/9/1998 6859.4 29/09/1998 6806
20/08/1998 7274 9/9/1998 6769.6 30/09/1998 6787
21/08/1998 7225 10/9/1998 6709.75
Bước 3. Xây dựng các hàm mờ trên khoảng
đã chia:
Trong bước này ta xác định lại các tập mờ Ai
tương ứng với từng khoảng và có thể gán lại
các giá trị ngôn ngữ cho từng tập mờ này. Các
tập mờ Ai i=1,2,...,21 được định nghĩa thông
qua các hàm thuộc để đơn giản có dạng hình
nón nhận 3 giá trị 0, 0.5 và 1 được viết như
sau:
A1 = 1/u1 + 0.5/u2 + 0/u3 +....+ 0/u20 + 0/u21
A2 = 0.5/u1 + 1/u2 + 0.5/u3 +...+ 0/u20 + 0/u21
A3 = 0/u1 + 0.5/u2 + 1/u3 + 0.5/u4 +...+ 0/u20 +
0/u21
...
A19 = 0/u1 + 0./u2 +... + 0.5/u18 + 1/u19 +
0.5/u20 + 0/u21
A20 = 0/u1 + 0./u2 + ...+ 0.5/u19 + 1/u20 +
0.5/u21
A21 = 0/u1 + 0/u2 + ...+ 0/u19 + 0.5/u20 + 1/u21
Bước 4. Mờ hoá các giá trị của chuỗi thời
gian và thiết lập mối quan hệ mờ:
Kết quả mờ hóa các giá trị của chuỗi thời gian
thể hiện trong Bảng 4.
Theo định nghĩa phần trên ta lập chuỗi thời
gian mờ tương ứng với các tập mờ ở trên và
xác định mối quan hệ mờ tại thời điểm t
=1,2,...,47. Có thể thấy ngay được các mối
quan hệ đầu tiên như sau: A21 A21 , A21
A20 , A20 A21 ,..., A9 A8.
Bước 5. Tính toán và dự báo dựa trên các mối
quan hệ mờ được thiết lập:
Bảng 4. Mối quan hệ mờ
Năm Giá trị thực Quan hệ mờ Năm Giá trị thực Quan hệ mờ
3/8/1998 7552 A22 2/9/1998 6430 A4
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 64
4/8/1998 7560 A22 3/9/1998 6200 A1
5/8/1998 7487 A21 4/9/1998 6403.2 A4
6/8/1998 7462 A21 5/9/1998 6697.5 A6
7/8/1998 7515 A22 7/9/1998 6722.3 A7
10/8/1998 7365 A20 8/9/1998 6859.4 A11
11/8/1998 7360 A20 9/9/1998 6769.6 A9
12/8/1998 7330 A19 10/9/1998 6709.75 A7
13/08/1998 7291 A18 11/9/1998 6726.5 A7
14/08/1998 7320 A19 14/09/1998 6774.55 A9
15/08/1998 7300 A19 15/09/1998 6762 A8
17/08/1998 7219 A17 16/09/1998 6952.75 A14
18/08/1998 7220 A17 17/09/1998 6906 A13
19/08/1998 7283 A18 18/09/1998 6842 A11
20/08/1998 7274 A18 19/08/1998 7039 A15
21/08/1998 7225 A17 21/09/1998 6861 A11
24/08/1998 6955 A14 22/09/1998 6926 A13
25/08/1998 6949 A13 23/09/1998 6852 A11
26/08/1998 6790 A9 24/09/1998 6890 A12
27/08/1998 6835 A11 25/09/1998 6871 A12
28/08/1998 6695 A6 28/09/1998 6840 A11
29/08/1998 6728 A7 29/09/1998 6806 A10
31/08/1998 6566 A5 30/09/1998 6787 A9
1/9/1998 6409 A4
Trong bước này, chỉ ứng dụng tính toán với
mô hình bậc 2 (nghĩa là n=2 và t=3). Kết quả
tính toán và dự báo theo thuật toán biểu diễn
ở Bảng 5. Sai số trung bình bình phương
MSE được tính theo công thức:
Ta có thể thấy rằng kết quả dự báo với thuật
toán Singh là rất tốt, nhất là khi so sánh với
các kết quả của Chen hay của Huarng. Kết
quả khi sử dụng thuật toán cải biên còn tốt
hơn nhiều, sai số MSE của phương pháp chỉ
bằng 1/2 sai số theo phương pháp ban đầu
Singh đưa ra. Trong đồ thị ở Hình 1, ta có thể
nhận thấy giá trị dự báo gần như trùng khớp
hoàn toàn với giá trị thực.
KẾT LUẬN
Bài báo này đưa ra một cải biên cho thuật toán
bậc cao của Singh. Tuy chỉ là một cải biên nhỏ
nhưng hiệu quả đạt được là khá tốt. Điều này
thể hiện thông qua sai số trung bình bình
phương (MSE) của phương pháp chỉ bằng ½
sai số theo phương pháp nguyên thuỷ của
Singh. So sánh với kết quả của Huarng và các
phương pháp khác có thể xem trong [1]-[3].
Đường dự báo của chúng tôi đưa ra bám khá
sát với giá trị thực tế nên có thể sử dụng
phương pháp cải tiến này cho dự báo cho một
số chuỗi thời gian trong thực tiễn.
TÀI LIỆU THAM KHẢO
[1]. Nguyễn Công Điều (2008), Một thuật toán
mới cho mô hình chuỗi thời gian mờ heuristic
trong dự báo chứng khoán, Báo cáo tại Đại hội
Toán học toàn tại Quy Nhơn. Bài gửi đăng tại Tạp
chí Toán học ứng dụng.
[2]. Nguyễn Công Điều (2009), “Cải biên cho
một thuật toán đơn giản trong mô hình chuỗi thời
gian mờ”, Báo cáo khoa học tại Viện Công nghệ
thông tin.
[3]. Q. Song, B.S. Chissom (1993), “Fuzzy Time
Series and its Model”, Fuzzy set and system, vol.
54, pp. 269-277.
[4]. Q.Song, B.S. Chissom (1993), “Forecasting
Enrollments with Fuzzy Time Series – Part I,” Fuzzy
set and system, vol. 54, pp. 1-9.
[5]. Q.Song, B.S. Chissom (1994), “Forecasting
Enrollments with Fuzzy Time Series – Part II,”
Fuzzy set and system, vol. 62, pp. 1-8.
416
n
)g(f
MSE
n
1i
2
ii
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 65
[6]S.M.Chen (1996), “Forecasting Enrollments
based on Fuzzy Time Series,” Fuzzy set and
system, vol. 81, pp. 311-319.
[7]S.M.Chen (2002), “Forecasting Enrollments
based on hight-order Fuzzy Time Series”, Inter.
Jurnal: Cybernetic and Systems, N.33, pp. 1-16.
[9]. S.R. Singh (2007), “A simple method of
forecasting based on fuzzy time series”, Applied
Mathematics and Computation, 186, pp. 330-339.
[10]. S.R. Singh (2009), “A computational
method of forecasting based on high-order fuzzy
time series”, Expert Systems with Applications,
36 pp.10551–10559.
Bảng 5. Kết quả khi sử dụng thuật toán cải biên
Algorithms/
MSE
Heuristic cải tiến Chen Huarng Singh Singh cải tiến
MSE 1700 9737 5437 884 416
Hình 1. Đồ thị so sánh kết quả dự báo bằng thuật toán Singh cải biên với giá trị thực và giá trị dự báo bằng
thuật toán nguyên thuỷ của Singh
SUMMARY
MODIFICATION OF SINGH'S HIGH ORDER ALGORITHM AND ITS
APPLICATION IN FORECASTING TIME SERIES
Nguyen Cong Dieu
1
, Tran Thanh Thuong
21
1Institute of Information Technology - VAST,2Thai Nguyen University
Fuzzy time series models have many applications in forecastings. However, the predictive results of the
proposed method were not very accurate. Thus the search for the more accurate models and simpler
algorithm is in a priority. In recent years, a number of works have been completed under the direction
of improving the accuracy and reducing the amount calculated in fuzzy time series models such as the
works of Chen and Hsu, Huarng, Singh, ... A different approach for fuzzy time series model is to use
these techniques in data mining such as clustering, Neural networking, ... to build the models. There is
also possible to use high-order prediction algorithm. Singh [10] has proposed such an algorithm. In this
paper, we modified the algorithm of Singh for high order fuzzy time series model. The modification
method has showed a very good efficiency.
Key words: Fuzzy time series, Linguistic variables, Fuzzy logical relations
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên | 66
Các file đính kèm theo tài liệu này:
- brief_32710_36551_2082012156465965_3203_2052719.pdf