Dự báo chuỗi thời gian mờ sử dụng đại số gia tử - Vũ Như Lân

KẾT LUẬN Dự báo chuỗi thời gian mờ là một hướng nghiên cứu hoàn toàn mới. Trên thực tế, những dữ liệu thu được theo thời gian thường chịu ảnh hưởng của các yếu tố khách quan và chủ quan. Chính vì vậy xem xét chuỗi thời gian trên quan điểm biến ngôn ngữ của Song & Chissom và Chen là hoàn toàn đúng đắn. Bài báo nghiên cứu đưa ra mô hình dự báo chuỗi thời gian mờ dựa trên tiếp cận ĐSGT và so sánh với các mô hình dự báo truyền thống đã có. Hiệu quả dự báo tốt hơn của mô hình mới được khẳng định trên cơ sở giải quyết cùng một bài toán dự báo số sinh viên nhập học đã được Song & Chissom, Chen và nhiều tác giả khác sử dụng. Đây là nghiên cứu quan trọng ban đầu khẳng định giá trị khoa học của tiếp cận ĐSGT trong một lĩnh vực ứng dụng mới về dự báo. Kết quả nhận được của bài báo mở ra hướng nghiên cứu ứng dụng mới của tiếp cận ĐSGT trong lĩnh vực dự báo.

pdf7 trang | Chia sẻ: thucuc2301 | Ngày: 26/11/2020 | Lượt xem: 103 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Dự báo chuỗi thời gian mờ sử dụng đại số gia tử - Vũ Như Lân, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101 95 DỰ BÁO CHUỖI THỜI GIAN MỜ SỬ DỤNG ĐẠI SỐ GIA TỬ Vũ Như Lân1*, Nguyễn Tiến Duy2, Trịnh Thúy Hà3 1Viện công nghệ thông tin, Viện Hàn lâm Khoa học và Công nghệ Việt Nam 2Đại học Kỹ thuật công nghiệp - ĐH Thái Nguyên, 3Đại học Công nghệ thông tin &Truyền thông -ĐH Thái Nguyên TÓM TẮT Song, Chissom [1, 2] lần đầu tiên đã đưa ra khái niệm mới về chuỗi thời gian mờ. Tuy nhiên mô hình tính toán nhóm quan hệ mờ trong mô hình dự báo chuỗi thời gian mờ quá phức tạp và do đó độ chính xác của dự báo không cao. Chen [3] đã thay đổi cách tính toán nhóm quan hệ mờ bằng các phép tính số học đơn giản để có được kết quả dự báo tốt hơn. Đại số gia tử (ĐSGT) là một tiếp cận mới được các tác giả N.C.Ho và W. Wechler xây dựng vào những năm 1990, 1992[6,7] khi đưa ra một mô hình xử lí các giá trị ngôn ngữ của biến ngôn ngữ hoàn toàn khác biệt so với tiếp cận mờ. Bài báo là sự tiếp tục những nghiên cứu ứng dụng ĐSGT trong lĩnh vực dự báo chuỗi thời gian mờ, một lĩnh vực mới đang được nhiều nhà khoa học trên thế giới đi sâu nghiên cứu. Trên cơ sở chuỗi dữ liệu về số lượng sinh viên nhập học tại trường Đại học Alabama qua các năm 1971 đến 1992, bài báo đề xuất phương pháp dự báo hoàn toàn mới dựa trên ĐSGT và so sánh với kết quả của Song, Chissom [1,2], Chen [3], Hwang [5]và Huarng [4]. Qua đó thấy rằng: sai số dự báo được đánh giá qua tiêu chuẩn bình phương trung bình (MSE) theo tiếp cận ĐSGT nhỏ hơn nhiều so với MSE trong mô hình dự báo chuỗi thời gian mờ củacác tác giả nêu trên. Từ khoá: Tập mờ, Chuỗi thời gian mờ, Quan hệ logic mờ, Đại số gia tử MỞ ĐẦU* Trong những năm gần đây, có rất nhiều tác giả trên thế giới quan tâm nghiên cứu mô hình dự báo chuỗi thời gian mờ do Song, Chissom đưa ra đầu tiên [1,2] và được Chen [3] cải tiến. Tuy nhiên, độ chính xác dự báo còn phụ thuộc vào quá nhiều yếu tố. Vì vậy cho đến nay, mô hình dự báo chuỗi thời gian mờ luôn được nhiều chuyên gia trên thế giới cải tiến để có được kết quả tốt hơn. Tiếp cận ĐSGT là tiếp cận khác biệt so với tiếp cận mờ và đã có một số ứng dụng thể hiện rõ tính đột phá trong một số lĩnh vực công nghệ của tiếp cận này so với tiếp cận mờ truyền thống. Có thể kể đến một số lĩnh vực ứng dụng có hiệu quả như điều khiển và, công nghệ thông tin [8]. Bên cạnh đó, ĐSGT cũng cần được nghiên cứu cho một lĩnh vực ứng dụng mới, đó là bài toán dự báo chuỗi thời gian mờ. Liệu ĐSGT có thể tiếp tục khẳng định được tính ưu việt của nó trong bài toán bài toán dự báo chuỗi thời gian mờ nêu trên hay không? Đó cũng chính là nội dung nghiên cứu trong bài báo này. * Tel: 0986 437050, E-mail: vnlan@ioit.ac.vn Bài báo được trình bày theo thứ tự sau đây: Sau mục 1 Mở đầu là Mục 2 giới thiệu về phương pháp dự báo chuỗi thời gian mờ của Song, Chissom [1,2] và Chen [3]. Mục 3 nêu một số nội dung quan trọng của ĐSGT cần thiết cho bài toán dự báo chuỗi thời gian mờ. Mục 4 trình bày mô hình dự báo chuỗi thời gian mờ sử dụng ĐSGT để ứng dụng cho bài toán dự báo số sinh viên nhập học của trường đại học Alabama và so sánh với các phương pháp của Song, Chissom và Chen. MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ Một số khái niệm cơ bản của mô hình dự báo chuỗi thời gian mờ Định nghĩa 2.1 [1,2]: Chuỗi thời gian mờ Giả sử Y(t), (t = ..., 0, 1, 2, ...), là tập các số thực và cũng là tập nền trên đó xác định các tập mờ f i(t), (i = 1, 2, ...). Biến t là thời gian. Nếu F(t) là một chuỗi các tập mờ của fi(t), (i = 1, 2, ...), thì F(t) được gọi là chuỗi thời gian mờ trên Y(t), (t = ..., 0, 1, 2, ...). Định nghĩa 2.2 [1,2]: Quan hệ mờ Nếu tồn tại quan hệ mờ R(t−1, t), sao cho F(t) = F(t−1)*R(t−1, t), trong đó dấu * kí hiệu toán tử nào đó, thì F(t) được suy ra từ F(t−1). Quan hệ giữa F(t) và F(t−1) được xác định bằng kí hiệu: Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101 96 F(t−1)F(t) (2.1) Toán tử * có thể là phép kết hợp MaxMin [1] hoặc MinMax [2] hay phép tính số học [3]. Nếu F(t−1) = Ai and F(t) = Aj, quan hệ logic giữa F(t) and F(t−1) được kí hiệu bằng AiAj, trong đó Ai là vế trái và Aj là vế phải của quan hệ mờ mô tả tập mờ dự báo. Định nghĩa 2.3 [1, 2]: Nhóm quan hệ mờ Các quan hệ mờ với cùng một tập mờ bên vế trái có thể đưa vào một nhóm gọi là nhóm quan hệ mờ (NQHM). Giả sử có các quan hệ mờ sau: AiAj1; AiAj2;...; AiAjn Các quan hệ mờ trên có thể đưa vào một nhóm được kí hiệu như sau: AiAj1, Aj2, ..., Ajn (2.2) Tập mờ Ajk (k = 1, 2, ..., n) chỉ được xuất hiện 1 lần bên vế phải. Mô hình dự báo Song và Chissom [1, 2] Bước 1. Xác định tập nền Bước 2. Chia miền xác định của tập nền thành những khoảng bằng nhau. Bước 3. Xây dựng các tập mờ trên tập nền Bước 4. Mờ hoá chuỗi dữ liệu Bước 5. Xác định các quan hệ mờ Bước 6. Dự báo bằng phương trình Ai = Ai−1* R, ở đây kí hiệu * là toán tử max-min Bước 7. Giải mờ các kết quả dự báo. Trong bước 5, quan hệ mờ R được xác định bằng biểu thức Ri = AsT×Aq, với mọi quan hệ mờ k, (2.3) Ở đây × là toán tử min, T là phép chuyển vị và ∪ là phép hợp. Mô hình dự báo Chen[3] Bước 1. Chia miền xác định của tập nền thành những khoảng bằng nhau. Bước 2. Xây dựng các tập mờ trên tập nền Bước 3. Mờ hoá chuỗi dữ liệu. Bước 4. Xác định các quan hệ mờ. Bước 5. Tạo lập nhóm quan hệ mờ. Bước 6. Giải mờ đầu ra dự báo. Luật dự báo chuỗi thời gian mờ Giả sử dữ liệu của chuỗi thời gian F(t-1) được mờ hoá bằng Aj, khi đó, đầu ra dự báo củaF(t) được xác định theo những nguyên tắc sau đây: 1. Nếu tồn tại quan hệ một-một, kí hiệu là AjAk, và mức độ thuộc cao nhất của Ak tại khoảng uk, thì đầu ra dự báo của F(t) là điểm giữa của uk. 2. Nếu Aj là trống, có nghĩa là Aj và Aj có mức độ thuộc cao nhất tại khoảng uj, thì đầu ra dự báo là điểm giữa của uj. 3. Nếu tồn tại quan hệ một - nhiều, kí hiệu là AjA1, A2, ..., An, và mức độ thuộc cao nhất của A1, A2, ..., An tại các khoảng u1, u2, ..., un tương ứng, thì đầu ra dự báo được tính bằng trung bình các điểm giữa m1, m2, ..., mn của u1, u2, ..., un. Phương trình dự báo có dạng: (m1+m2+ ... +mn)/n. TÓM TẮT MÔ HÌNH TÍNH TOÁN CỦA ĐẠI SỐ GIA TỬ Gọi AX = (X, G, C, H, ) là một cấu trúc đại số, với X là tập nền của AX; G = {c, c+} là tập các phần tử sinh; C = {0, W, 1}, trong đó 0, W và 1 tương ứng là cận trái, trung hòa và cận phải; H là tập các toán tử một ngôi được gọi là các gia tử;  là biểu thị quan hệ thứ tự trên các giá trị ngôn ngữ. Gọi H là tập hợp các gia tử âm và H+ là tập hợp các gia tử dương của AX. Kí hiệu H = {h-1, h-2, h-q}, trong đó h-1< h-2< < h-q và H+ = {h1, h2, , hp}, trong đó h1< h2< < hp. Định nghĩa 3.1 [7,8]: Độ đo tính mờ. fm: X  [0, 1] gọi là độ đo tính mờ nếu thỏa mãn các điều kiện sau: fm(c)+fm(c+) = 1 và ( ) h H fm hx  = fm(x), với x X (3.1) Với các phần tử 0, W và 1, fm(0) = fm(W) = fm(1) = 0 (3.2) Và với x, y X, hH, ( ) ( ) ( ) ( ) fm hx fm hy fm x fm y  (3.3) Đẳng thức (3.3) không phụ thuộc vào các phần tử x, y và do đó ta có thể kí hiệu là (h) Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101 97 và đây là độ đo tính mờ của gia tử h. Tính chất của fm(x) và (h) như sau: fm(hx) = (h)fm(x), xX (3.4) , 0 ( ) ( ) p i i q i fm h c fm c    , với c {c, c+} (3.5) , 0 ( ) ( ) p i i q i fm h x fm x    (3.6) 1 ( ) q i i h     và 1 ( ) p i i h    , với , > 0 và + = 1 (3.7) Định nghĩa 3.2 [7,8]: Hàm dấu Hàm Sign: X{-1, 0, 1} là một ánh xạ được gọi là hàm dấu với h, h'H và c {c, c+} trong đó: Sign(c) = 1, Sign(c+) = +1 (3.8) Sign(hc)=Sign(c), nếu h là âm đối với c (3.9) Sign(hc)=+Sign(c), nếu h là dương đối với c (3.10) Sign(h'hx) = Sign(hx), nếu h’hx ≠ hx và h' là âm đối với h (3.11) Sign(h'hx) = +Sign(hx), nếu h’hx ≠ hx và h' là dương đối với h (3.12) Sign(h'hx) = 0 nếu h’hx = hx (3.13) Gọi fm là một độ đo tính mờ trên X, ánh xạ ngữ nghĩa định lượng : X  [0, 1], được sinh ra bởi fm trên X, được xác định như sau: (W) ( ),v fm c   (3.14) ( ) ( ) ( )v c fm c fm c       (3.15) ( ) ( ) 1 ( )v c fm c fm c        (3.16) ( ) ( ) ( ) ( ) { ( ) ( ) ( )} j j j i j ji sign j v h x v x sign h x fm h x h x fm h x     (3.17) 1 ( ) [1 ( ) 2 ( )( )] { , } j j p j h x Sign h x sign h h x          (3.18) j  [-q^p], j  0. Giả sử rằng miền tham chiếu thông thường của các biến ngôn ngữ X là đoạn [a, b] còn miền tham chiếu ngữ nghĩa Xs là đoạn [as, bs] (0≤as<bs≤1). Việc chuyển đổi tuyến tính từ [a, b] sang [as, bs] được gọi là phép ngữ nghĩa hoá (semantization), còn việc chuyển ngược lại từ đoạn [as, bs]sang [a, b] được gọi là phép giải nghĩa (desemantization). Trong nhiều ứng dụng của ĐSGT, đã sử dụng miền ngữ nghĩa là đoạn [as = 0, bs = 1], khi đó phép ngữ nghĩa hoá được gọi là phép chuẩn hoá (Semantization = Normalization) và phép giải nghĩa được gọi là phép giải chuẩn (Desemantization = Denormalization). MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ SỬ DỤNG ĐSGT Bước 1. Chia miền xác định của tập nền thành những khoảng bằng nhau. Bước 2. Xây dựng các nhãn ngữ nghĩa trên tập nền. Bước 3. Ngữ nghĩa hoá chuỗi dữ liệu. Bước 4. Xác định các quan hệ ngữ nghĩa theo nhãn ngữ nghĩa. Bước 5. Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa. Bước 6. Giải nghĩa đầu ra dự báo. Bài toán được chọn để làm rõ hiệu quả dự báo của mô hình trên là bài toán dự báo số lượng sinh viên nhập học tại trường Đại học Alabama trên cơ sở các số liệu có từ năm 1971 đến năm 1992 tương tự bài toán dự báo của Song & Chissom [1, 2] và Chen [3] với các bước như sau: Bước 1: Xác định tập nền, chia miền xác định của tập nền thành những khoảng bằng nhau. Tập nền U đã được Chen chọn có khoảng xác định: [Dmin−D1, Dmax−D2] với Dmin và Dmax là số sinh viên nhập học thấp nhất và cao nhất theo dữ liệu lịch sử nhập học của trường. Cụ thể Dmin = 13055 và Dmax = 19337. Các biến D1 và D2 là các số dương được chọn sao cho khoảng [Dmin−D1, Dmax−D2] bao được số sinh viên nhập học thấp nhất và cao nhất trong tương lai. Sử dụng cách chọn của Chen, D1 = 55 và D2 = 663, như vậy U = [13000, 20000]. Khoảng xác định tập nền U được Chen và nhiều tác giả khác chia thành 7 khoảng bằng nhau u1, u2, Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101 98 u3, u4, u5, u6 và u7. Trong đó u1 = [13000, 14000], u2 = [14000, 15000], u3 = [15000, 16000], u4 = [16000, 17000], u5 = [17000, 18000], u6 = [18000, 19000] vàu7 = [19000, 20000]. Bước 2: Xây dựng các nhãn ngữ nghĩa trên tập nền. Trong bài toán dự báo số sinh viên nhập học tại trường Đại học Alabama, Chen sử dụng các giá trị ngôn ngữ A1 = (not many), A2 = (not too many), A3 = (many), A4 = (many many), A5 = (very many), A6 = (too many) và A7 = (too many many). Bài toán dự báo này theo tiếp cận ĐSGT, sử dụng 2 gia tử "very" và "little" tác động lên 2 phần tử sinh "small" và "large" để tạo ra 7 nhãn ngữ nghĩa tương ứng với 7 giá trị ngữ nghĩa của Chen như sau: A1 = (very small), A2 = (small), A3 = (little small), A4 = (midle), A5 = (little large), A6 = (large) và A7 = (very large). Bước 3: Ngữ nghĩa hoá chuỗi dữ liệu. Kí hiệu: SA = Semantization (A) là giá trị ngữ nghĩa định lượng theo nhãn ngữ nghĩa A, khi đó: SA1 = ν(very small); SA2 = ν(small); SA3 = ν(little small); SA4 = ν(midle); SA5 = ν(little large); SA6 = ν(large) và SA7 = ν(very large) là các giá trị ngữ nghĩa định lượng theo các tham số được chon trước α, θ. Sau 3 bước trên, xây dựng được Bảng 1: Ngữ nghĩa hoá dữ liệu lịch sử số sinh viên nhập học tại trường Alabama. Từ Bảng 1 xây dựng được phân bố 22 dữ liệu theo 22 năm tính từ 1971 đến 1992 thuộccác khoảng ui. Bước 4: Xác định các quan hệ ngữ nghĩa theo nhãn ngữ nghĩa. Nếu đặt chuỗi thời gian mờ F(t-1) là Ak có ngữ nghĩa định lượng SAk và F(t) là Am có ngữ nghĩa định lượng SAm, thì Ak có quan hệ với Am và dẫn đến SAk có quan hệ với SAm. Quan hệ này được gọi là quan hệ ngữ nghĩa theo nhãn ngữ nghĩa và được kí hiệu là: SAk SAmhoặc Semantization(Aj)Semantization(Ak)(3.21) Bảng 1: Ngữ nghĩa hoá dữ liệu lịch sử số sinh viên nhập học Năm Số sinh viên nhập học Thuộc khoảng Ngữ nghĩa định lượng 1971 13055 u1 SA1 1972 13563 u1 SA1 1973 13867 u1 SA1 1974 14696 u2 SA2 1975 15460 u3 SA3 1976 15311 u3 SA3 1977 15603 u3 SA3 1978 15861 u3 SA3 1979 16807 u4 SA4 1980 16919 u4 SA4 1981 16388 u4 SA4 1982 15433 u3 SA3 1983 15497 u3 SA3 1984 15145 u3 SA3 1985 15163 u3 SA3 1986 15984 u3 SA3 1987 16859 u4 SA4 1988 18150 u6 SA6 1989 18970 u6 SA6 1990 19328 u7 SA7 1991 19337 u7 SA7 1992 18876 u6 SA6 Bảng 2: Phân bố số năm trên các khoảng ui Khoảng u1 u2 u3 u4 u5 u6 u7 Sốnăm 3 1 9 4 0 3 2 Trên cơ sở Bảng 1 xây dựng được các quan hệ ngữ nghĩa sau đây: SA1 → SA1 (2 lần); SA1 → SA2;SA2 → SA3;SA3 → SA3 (7 lần); SA3 → SA4 (2 lần); SA4 → SA4 (2 lần);SA4 → SA3;SA4 → SA6; SA6 → SA6;SA6 → SA7; SA7 → SA7 vàSA7 → SA6 (3.22) Bước 5: Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa. Nhóm 1: SA1 → (SA1, SA1, SA2) Nhóm 2: SA2 → (SA3) Nhóm 3: SA3 → (SA3, SA3, SA3, SA3, SA3, SA3, SA3, SA4, SA4) Nhóm 4: SA4 → (SA4, SA4, SA3, SA6) Nhóm 5: SA6 → (SA6, SA7) Nhóm 6: SA7 → (SA7, SA6) Bước 6:Giải nghĩa đầu ra dự báo. Giả sử số sinh viên nhập học tại năm (t-1) của chuỗi thời gian mờ F(t-1) được ngữ nghĩa hoá theo (3.19) là SAj, khi đó đầu ra dự báo của F(t) hay số sinh viên nhập học dự báo tại năm Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101 99 t được xác định theo các nguyên tắc (luật) sau đây: 1. Nếu tồn tại quan hệ 1-1 trong nhóm quan hệ ngữ nghĩa theo nhãn ngôn ngữ Aj: SAj SAk, haytheo (3.19): Semantization (Aj)  Semantization (Ak), thì đầu ra dự báo được tính theo (3.20): DSAj = Desemantization (SAj) trên khoảng uj. 2. Nếu SAj là rỗng, (SAj = )  SAk, thì đầu ra dự báo là điểm giữa khoảng uj 3. Nếu tồn tại quan hệ 1-nhiều trong nhóm quan hệ ngữ nghĩa (kể cả quan hệ trùng) theo nhãn ngôn ngữ Aj: SAj (SAi, SAk,..., SAr), hay theo (3.19): Semantization(Aj) (Semantization(Ai), Semantization(Ak), ..., Semantization(Ar)), thì đầu ra dự báo được xác định theo (3.20): DSAj = Desemantization(WSAiAj x SAi+WSAkAj x SAk+ ... +WSArAj x SAr) trên khoảng bất kỳ trong khoảng chung bao gồm từ ui, uk, đến ur của NQHNN. Trong đó WSAiAj, WSAkAj..., WSArAj là trọng số ngữ nghĩa của từng thành phần trong NQHNN theo nhãn ngữ nghĩa Aj được tính bằng tỷ số giữa số năm thuộc khoảng ui và tổng số năm thuộc các khoảng ui, uk, ..., ur với ui < uk < ... < ur. Lưu ý: WSAiAj+WSAkAj+...+WSArAj=1. Các tham số trong mô hình dự báo chuỗi thời gian mờ theo tiếp cận ĐSGT được chọn cụ thể như sau: a/ Các tham số của phép ngữ nghĩa hoá: α = θ = 0.5. b/ Các khoảng của phép giải ngữ nghĩa cho 6 nhóm quan hệ ngữ nghĩa gồm: Nhóm 1 [13500 – 14500] Nhóm 2[15000 – 16000] Nhóm 3 [15500 – 16500] Nhóm 4 [16000 – 17000] Nhóm 5 [18500 – 19500] Nhóm 6 [18500 – 19500] Kết quả so sánh các phương pháp dự báo bậc nhất khác nhau trên cơ sở sai số trung bình bình phương MSE giữa tiếp cận ĐSGT và các phương pháp dự báo khác của Song & Chissom [1,2], Chen [3], Hwang [5] và Huarng [4] được mô tả trong Bảng 3: Bảng 3: So sánh các phương pháp dự báo bậc nhất khác nhau Năm Số sinh viên nhập học Phươngpháp Song & Chissom Phươngpháp Song & Chissom Phương phápChen Phương pháp Hwang Phương pháp Huarng Phươngpháp ĐSGT 1971 13055 1972 13563 14000 Không có 14000 Không có 14000 13643 1973 13867 14000 Không có 14000 Không có 14000 13643 1974 14696 14000 Không có 14000 Không có 14000 15143 1975 15460 15500 14700 15500 Không có 15500 15875 1976 15311 16000 14800 16000 16260 15500 15889 1977 15603 16000 15400 16000 15511 16000 15889 1978 15861 16000 15500 16000 16003 16000 15889 1979 16807 16000 15500 16000 16261 16000 16389 1980 16919 16813 16800 16833 17407 17500 16481 1981 16388 16813 16200 16833 17119 16000 16481 1982 15433 16789 16400 16833 16188 16000 15981 1983 15497 16000 16800 16000 14833 16000 15889 1984 15145 16000 16400 16000 15497 15500 15889 1985 15163 16000 15500 16000 14745 16000 15889 1986 15984 16000 15500 16000 15163 16000 15889 1987 16859 16000 15500 16000 16384 16000 16389 1988 18150 16813 16800 16833 17659 17500 18981 1989 18970 19000 19300 19000 19150 19000 19300 1990 19328 19000 17800 19000 19770 19000 19300 1991 19337 19000 19300 19000 19928 19500 19300 1992 18876 Không có 19600 19000 19537 19000 19300 MSE 423027 775687 407507 321418 226611 188910 Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101 100 (3.23) Trong đó: MSE (Mean Square Error) là sai số trung bình bình phương; SSVNHTT i là số sinh viên nhập học thực tế năm I; còn SSVNHDB i là số sinh viên nhập học dự báo năm i, i = 1, 2, , 21 Từ Bảng 3 có thể thấy rõ tính ưu việt của mô hình dự báo bậc nhất chuỗi thời gian mờ theo tiếp cận ĐSGT so với nhiều mô hình dự báo khác cùng bậc nhất. Sai số trung bình bình phương của phương pháp dự báo theo tiếp cận ĐSGT có giá trị MSE = 188910 là nhỏ nhất so với tất cả các phương pháp khác. KẾT LUẬN Dự báo chuỗi thời gian mờ là một hướng nghiên cứu hoàn toàn mới. Trên thực tế, những dữ liệu thu được theo thời gian thường chịu ảnh hưởng của các yếu tố khách quan và chủ quan. Chính vì vậy xem xét chuỗi thời gian trên quan điểm biến ngôn ngữ của Song & Chissom và Chen là hoàn toàn đúng đắn. Bài báo nghiên cứu đưa ra mô hình dự báo chuỗi thời gian mờ dựa trên tiếp cận ĐSGT và so sánh với các mô hình dự báo truyền thống đã có. Hiệu quả dự báo tốt hơn của mô hình mới được khẳng định trên cơ sở giải quyết cùng một bài toán dự báo số sinh viên nhập học đã được Song & Chissom, Chen và nhiều tác giả khác sử dụng. Đây là nghiên cứu quan trọng ban đầu khẳng định giá trị khoa học của tiếp cận ĐSGT trong một lĩnh vực ứng dụng mới về dự báo. Kết quả nhận được của bài báo mở ra hướng nghiên cứu ứng dụng mới của tiếp cận ĐSGT trong lĩnh vực dự báo. TÀI LIỆU THAM KHẢO 1. Song Q, Chissom B.S: Forecasting enrollments with fuzzy time series – part 1. Fuzzy Sets and Syst. 54, 1–9, 1993. 2. Song Q, Chissom B.S.: Forecasting enrollments with fuzzy time series – part 2. Fuzzy Sets and Syst. 62, 1–8, 1994 3. Chen S.M.: Forecasting Enrollments Based on Fuzzy Time Series. Fuzzy Sets and Syst. 81, 311– 319, 1996. 4. Huarng, K.: Heuristic Models of Fuzzy Time Series for Forecasting. Fuzzy Sets and Syst. 123 369–386, 2001. 5. HwangJ.R.,Chen,S.M., Lee, C.H., Handling Forecasting problems using fuzzy time series. Fuzzy Sets and Systems 100, 217-228, 1998 6. N.C Ho and W. Wechler, Hedge algebras: An algebraic approach to structures of sets of linguistic domains of linguistic truth variable, Fuzzy Sets and Systems, 35, 281-293, 1990. 7. N.C Ho and W. Wechler, Extended hedge algebras and their application to Fuzzy logic, Fuzzy Sets and Systems, 52, 259-281, 1992. 8. Nguyen Cat Ho, Vu Nhu Lan, Le Xuan Viet, Optimal hedge-algebras-based controller: Design and Application, Fuzzy Sets and Systems 159, 968– 989, 2008. Vũ Như Lân và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 95 - 101 101 SUMMARY HEDGE-ALGEBRA-BASED FUZZY TIME-SERIES Vu Nhu Lan1*, Nguyen Tien Duy2, Trinh Thuy Ha3 1Institute of Information Technology – Vietnam Academy of Science an Technology, 2College of Technology – TNU, 3College of Information and Communication Technology - TNU Song and Chissom [1-2] presented thenew concept of fuzzy time series for the first time. However, computational method of the fuzzy logical relationship groups in the fuzzy time series forecasting model is too complicated to apply. Thus, the forecasting accuracy is not high. Chen [3] changed the way to compute fuzzy relationship groups by simple numbers arithmetic operations in order to bring a betterforecasting result.Hedge algebra (HA) is a new approachbuilt by N.C.Ho and W. Wechlerx in the 1990s, 1992s [6,7] as giving a dealing model of linguistic value of linguistic variable and it is completely different from fuzzy approach. As an application, this paper is a continuous process of the studies using hedge algebra in the field of fuzzy time series forecasting. This is a new field which is being studied by many scientists all over the world.Basing on data series of the historical enrollments of the University of Alabama from 1971 to 1992, the paper proposes a new forecasting method based on hedge algebra and compares to the results of Song, Chissom's [1,2], Chen's [3], Hwang's [5]và Huarng's [4]. Meanwhile, it can be shown that the mean squared error (MSE) by approaching hedge algebra is much less than the one in fuzzy time series forecasting model of the above authors. Key words: Fuzzy set, Fuzzy time series, Fuzzy logicalrelationship, Hedge Algebra Ngày nhận bài:04/5/2014; Ngày phản biện:18/5/2014; Ngày duyệt đăng: 25/8/2014 Phản biện khoa học: PGS.TS Lại Khắc Lãi – Đại học Thái Nguyên * Tel: 0986 437050, E-mail: vnlan@ioit.ac.vn

Các file đính kèm theo tài liệu này:

  • pdfbrief_48436_52351_99201515352815_8917_2046551.pdf