Áp dụng thuật toán DTW cho ứng dụng nhận dạng mẫu tiếng việt Đọc thêm

Hiện nay với sự trợ giúp của các hệ thống máy tính có rất nhiều xu hướng nhằm áp dụng các mô hình ngôn ngữ trong các hệ thống sử dụng công nghệ nhận dạng tiếng nói, trong đó có thể kể đến như mô hình từ, âm tiết và mô hình âm vị, mô hình âm đầu+vần. Việc lựa chọn các mô hình này để giải quyết các bài toán cụ thể phụ thuộc vào yêu cầu của các ứng dụng. Nó quyết định đến độ phức tạp, tính bao trùm và chất lượng của hệ thống. Hệ thống nhận dạng áp dụng các mô hình ngôn ngữ trên đều có thể sử dụng công nghệ nhận dạng mẫu theo từ, âm tiết, âm vị hoặc theo các âm đầu và vần. Để có thể so sánh giữa tín hiệu đầu vào và mẫu, người ta thường pháp áp dụng thuật toán DTW. Thuật toán DTW được ứng dụng để giải quyết việc so sánh giữa hai mẫu tín hiệu có độ dài khác nhau theo thời gian. Như ta biết, kết quả của quá trình phân tích tính hiệu theo phương pháp mã hoá dự báo tuyến tính (Linear Predictive Coding LPC) hay ngân hàng bộ lọc (Filter Bank) bao giờ cũng cho ta kết quả dạng chuỗi các véctơ đặc trưng. Độ dài của chuỗi véc tơ này phụ thuộc vào độ dài của của hai tín hiệu mà ta phân tích. Như vậy, quá trình so sánh hai tín hiệu sẽ tương ứng với quá trình so sánh 2 chuỗi véc tơ đặc trưng của hai tín hiệu. Thuật toán DTW sẽ thực hiện việc so sánh 2 chuỗi véc tơ này theo một số luật sao cho tổng độ lệch giữa hai chuỗi là nhỏ nhất tương ứng với đường đi giữa các cặp véc tơ của hai chuỗi là tối ưu nhất. Việc chọn lựa luật chọn đường đi và giới hạn biên của các đường đi sẽ cho ta kết quả tính toán là nhỏ nhất và hiệu quả nhất.

doc11 trang | Chia sẻ: tlsuongmuoi | Lượt xem: 2321 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Áp dụng thuật toán DTW cho ứng dụng nhận dạng mẫu tiếng việt Đọc thêm, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
¸p dông thuËt to¸n Dynamic Time wraping (dtW) cho øng dông nhËn d¹ng mÉu TiÕng ViÖt ThS.§oµn Phan Long Trung t©m C«ng nghÖ th«ng tin Tãm t¾t: Tù ®éng nhËn d¹ng tiÕng nãi (Automatic Speech Recognition ASR) lµ mét lÜnh vùc nghiªn cøu quan träng ®Ó ®­a c¸c øng dông tiÕng nãi vµo nhiÒu ngµnh. Mét vÊn ®Ò liªn quan cÇn nghiªn cøu trong lÜnh vùc nµy ®­îc dùa trªn c¬ së l­u tr÷ mét hoÆc nhiÒu mÉu tÝn hiÖu cho mçi tõ cÇn nhËn d¹ng. Qu¸ tr×nh nhËn d¹ng lµ qu¸ tr×nh thùc hiÖn viÖc so s¸nh hai mÉu tÝn hiÖu cña cïng mét ©m ®Ó tÝm ra mÉu cã sai sè nhá nhÊt. Bëi v× tÝn hiÖu ©m thanh ®­îc t¹o ra t¹i c¸c thêi ®iÓm kh¸c nhau kh«ng bao giõo gièng nhau hoµn toµn. Nã lu«n cã sù sai lÖch do c¸c yÕu tè vÒ träng ©m, ng÷ ®iÖu, tèc ®é,... V× vËy cÇn ph¶i thùc hiÖn sã s¸nh hai mÉu theo c¸c thuËt to¸n biÕn d¹ng nh»m gi¶m thiÓu sai sè. ThuËt to¸n DTW (Dynamic Time Wraping) lµ thuËt to¸n hiÖu qu¶ nhÊt cho viÖc øng dông sao s¸nh hai mÉu tÝn hiÖu cã chiÒu dµi kh¸c nhau vµ cho sai sè nhá nhÊt [4]. Tuy nhiªn viÖc øng dông DTW cã nhiÒu h­íng kh¸c nhau vµ cho c¸c kÕt qu¶ kh¸c nhau, viÖc lùa chän ph­¬ng ph¸p ¸p dông cã hiÖu qu¶ ®èi víi ng«n ng÷ tiÕng ViÖt lµ mét vÊn ®Ò cÇn quan t©m. Më ®Çu: HiÖn nay víi sù trî gióp cña c¸c hÖ thèng m¸y tÝnh cã rÊt nhiÒu xu h­íng nh»m ¸p dông c¸c m« h×nh ng«n ng÷ trong c¸c hÖ thèng sö dông c«ng nghÖ nhËn d¹ng tiÕng nãi, trong ®ã cã thÓ kÓ ®Õn nh­ m« h×nh tõ, ©m tiÕt vµ m« h×nh ©m vÞ, m« h×nh ©m ®Çu+vÇn. ViÖc lùa chän c¸c m« h×nh nµy ®Ó gi¶i quyÕt c¸c bµi to¸n cô thÓ phô thuéc vµo yªu cÇu cña c¸c øng dông. Nã quyÕt ®Þnh ®Õn ®é phøc t¹p, tÝnh bao trïm vµ chÊt l­îng cña hÖ thèng. HÖ thèng nhËn d¹ng ¸p dông c¸c m« h×nh ng«n ng÷ trªn ®Òu cã thÓ sö dông c«ng nghÖ nhËn d¹ng mÉu theo tõ, ©m tiÕt, ©m vÞ hoÆc theo c¸c ©m ®Çu vµ vÇn. §Ó cã thÓ so s¸nh gi÷a tÝn hiÖu ®Çu vµo vµ mÉu, ng­êi ta th­êng ph¸p ¸p dông thuËt to¸n DTW. ThuËt to¸n DTW ®­îc øng dông ®Ó gi¶i quyÕt viÖc so s¸nh gi÷a hai mÉu tÝn hiÖu cã ®é dµi kh¸c nhau theo thêi gian. Nh­ ta biÕt, kÕt qu¶ cña qu¸ tr×nh ph©n tÝch tÝnh hiÖu theo ph­¬ng ph¸p m· ho¸ dù b¸o tuyÕn tÝnh (Linear Predictive Coding LPC) hay ng©n hµng bé läc (Filter Bank) bao giê còng cho ta kÕt qu¶ d¹ng chuçi c¸c vÐct¬ ®Æc tr­ng. §é dµi cña chuçi vÐc t¬ nµy phô thuéc vµo ®é dµi cña cña hai tÝn hiÖu mµ ta ph©n tÝch. Nh­ vËy, qu¸ tr×nh so s¸nh hai tÝn hiÖu sÏ t­¬ng øng víi qu¸ tr×nh so s¸nh 2 chuçi vÐc t¬ ®Æc tr­ng cña hai tÝn hiÖu. ThuËt to¸n DTW sÏ thùc hiÖn viÖc so s¸nh 2 chuçi vÐc t¬ nµy theo mét sè luËt sao cho tæng ®é lÖch gi÷a hai chuçi lµ nhá nhÊt t­¬ng øng víi ®­êng ®i gi÷a c¸c cÆp vÐc t¬ cña hai chuçi lµ tèi ­u nhÊt. ViÖc chän lùa luËt chän ®­êng ®i vµ giíi h¹n biªn cña c¸c ®­êng ®i sÏ cho ta kÕt qu¶ tÝnh to¸n lµ nhá nhÊt vµ hiÖu qu¶ nhÊt. Kh¸i qu¸t vÒ tiÕng ViÖt C¸c d©n téc vµ ng«n ng÷ ë ViÖt Nam Trong sè 54 d©n téc ë ViÖt Nam th× d©n téc ViÖt (cßn gäi lµ Kinh) chiÕm sè l­îng tuyÖt ®èi, tæng sè d©n lªn tíi trªn 70 triÖu ng­êi. D©n téc Tµy cã 1,2 triÖu, d©n téc Th¸i trªn 1 triÖu, c¸c d©n téc Hoa, Kh¬ me, M­êng, C¬ Ho, Chµm, S¸n D×u trªn 900 ngh×n ng­êi. C¨n cø vµo ng«n ng÷, ch÷ viÕt ta cã thÓ ph©n bè c¸c thµnh phÇn d©n téc nh­ sau: TiÕng N«m - Kh¬me. Gåm nhiÒu nhãm ng­êi ë T©y B¾c, T©y Nguyªn, Qu¶ng TrÞ vv... TiÕng Th¸i. Gåm ng­êi Th¸i T©y B¾c, Th­îng du Thanh Hãa, NghÖ An, khu ViÖt B¾c, Qu¶ng Ninh. Ngoµi ra cßn cã nhãm ng­êi Gi¸y, Cao Lan, Lù vv... TiÕng Anh-®«-nª-diªng. Gåm ng­êi Chµm, Gia rai, £-®ª (T©y Nguyªn). TiÕng MÌo-Dao. Gåm ng­êi MÌo Dao (ViÖt B¾c, Hßa B×nh Thanh Hãa) TiÕng T¹ng - MiÕn: Gåm ng­êi L« L« (Hµ Giang), Hµ Nh×, La Khu, Cèng, Xila (T©y B¾c). TiÕng H¸n: Ng­êi Hoa (Qu¶ng Ninh), S¸n D×u (B¾c Giang, B¾c C¹n, Th¸i Nguyªn vv....). TiÕng ViÖt lµ ng«n ng÷ céng ®ång cña d©n téc ViÖt vµ còng lµ c«ng cô giao tiÕp chung cho c¸c d©n téc sèng trong n­íc ViÖt Nam. NhiÒu c«ng tr×nh nghiªn cøu theo ph­¬ng ph¸p lÞch sö so s¸nh ®Òu ®i ®Õn kÕt luËn c¸c ng«n ng÷ ë ViÖt Nam thuéc vµo c¸c hä H¸n T¹ng, Th¸i, MÌo-Dao, Nam §¶o, Nam ¸; riªng tiÕng ViÖt thuéc hä tiÕng Nam ¸. Hä Nam ¸ (austroasiatique) lµ mét hä ng«n ng÷ kh¸ lín bao gåm mét phÇn Ên ®é, mét phÇn Malaysia, mét phÇn MiÕn ®iÖn, phÇn lín Campuchia, phÇn lín ViÖt Nam. Hä nµy l¹i ph©n thµnh nhiÒu nhãm: ViÖt-M­êng, M«ng-Khmer, Kh¬ mó, C¬ tu, Bana, Mn«ng, Ka®ai. Hä Nam §¶o (austronesien hay malayo-polyesien) còng lµ mét hä lín, víi nhiÒu ng«n ng÷, trªn mét khu vùc réng bao gåm quÇn ®¶o Madagascar, Malaysia, Indonesia, Philippines, New Guinea, Taiwan vµ phÝa Nam ViÖt Nam. VÒ ng«n ng÷ thuéc hä nµy ë ViÖt Nam cã Chµm, Raglai, Chru, £®ª, Giarai, tÊt c¶ ®Òu thuéc nhãm Ch¨m. Hä H¸n T¹ng bao gåm tiÕng Hoa vµ mét sè ng«n ng÷ phÝa T©y nam Trung hoa vµ phÇn lín MiÕn §iÖn. C¸c ng«n ng÷ thuéc hä nµy ë ViÖt Nam bao gåm L« L«, Phï L¸, Hµ Nh×, La Hñ, Cèng, Si La thuéc nhãm T¹ng-MiÕn, c¸c tiÕng Hoa, S¸n ChØ, S¸n D×u thuéc nhãm H¸n. Vµi nÐt vÒ lÞch sö ph¸t triÓn cña tiÕng ViÖt Theo mét sè tµi liÖu nghiªn cøu th× tiÕng ViÖt thêi th­îng cæ lµ thø tiÕng ch­a cã thanh ®iÖu. HÖ thèng phô ©m ®Çu trong tiÕng ViÖt cã nh÷ng phô ©m ®¬n vµ phô ©m kÐp nh­ bl, tl, pr, pl ... C¸c ©m cuèi bÞ mÊt dÇn mét sè trong qu¸ tr×nh ph¸t triÓn (nh­ ©m cuèi l mÊt ®i, ©m cuèi r chuyÓn thµnh i), nãi riªng ©m h mÊt ®i vµ xuÊt hiÖn dÊu ng· trong tiÕng ViÖt. HÖ thèng thanh ®iÖu ®· xuÊt hiÖn dÇn. Vµo ®Çu c«ng nguyªn, tiÕng ViÖt ch­a cã thanh ®iÖu, ®Õn thÕ kØ VI xuÊt hiÖn ba thanh vµ ®Õn thÕ kØ XII míi cã ®ñ s¸u thanh nh­ hiÖn nay. Sù biÕn ®æi cña ©m ®Çu vµ cuèi lµ nguyªn nh©n lµm xuÊt hiÖn hÖ thèng thanh ®iÖu trong tiÕng ViÖt. Sù biÕn ®æi trong hÖ thèng c¸c ©m ®Çu diÔn ra t­¬ng ®èi râ h¬n trong hÖ thèng nguyªn ©m: ©m v« thanh chuyÓn thµnh h÷u thanh (p à b, t à d vµ k à g). C¸c phô ©m kÐp kl, tl, bl, khl ... mÊt dÇn, lµm xuÊt hiÖn c¸c ©m uèn l­ìi tr vµ s (tl¨m à tr¨m (thÕ kØ 17); bl¨ng à tr¨ng (thÕ kØ 18), khl«ng (thÕ kØ 15) à s«ng (thÕ kØ 17), nhãm ml chuyÓn thµnh l hoÆc nh­ (nlÇm à lÇm, nhÇm, mlÏ à lÏ, nhÏ) Kho tõ vùng tiÕng ViÖt phong phó víi nh÷ng tõ c¬ b¶n cã nguån gèc Nam ¸ vµ Tµy Th¸i cæ. Kho tõ vùng trong qu¸ tr×nh ph¸t triÓn cßn tiÕp nhËn vµ thuÇn ho¸ c¶ vÒ ng÷ ©m lÉn ý nghÜa mét bé phËn kh¸ nhiÒu tõ gèc H¸n (nh­ ®òa, ®ôc, mu«n, mòi, mãc, mïa...). HÖ thèng ng÷ ph¸p tá ra bÒn v÷ng h¬n hÖ thèng tõ vùng, trËt tù có ph¸p, trËt tù tæ hîp tõ gi÷ ®Æc ®iÓm riªng cña tiÕng ViÖt. Mét sè ®Æc ®iÓm cña tiÕng ViÖt TiÕng ViÖt lµ lo¹i h×nh ng«n ng÷ ®¬n lËp (ng«n ng÷ kh«ng biÕn h×nh - amorphous) vµ cã thanh ®iÖu. TiÕng ViÖt lµ tiÕng ®¬n ©m cã ranh giíi cè ®Þnh, mang thanh ®iÖu, cã cÊu tróc ®¬n gi¶n, thanh ®iÖu vµ cã ©m tiÕt trïng víi h×nh vÞ, ®¬n vÞ nhá nhÊt cã tæ chøc mang ý nghÜa ng÷ ph¸p. Do mçi ©m tiÕt lµ vá ng÷ ©m cña h×nh vÞ nªn kh¸c víi c¸c ng«n ng÷ ¢u-Ên, tiÕng ViÖt cã sè l­îng ©m tiÕt h÷u h¹n víi 17.000 vá ng÷ ©m vµ 6.900 ©m tiÕt tån t¹i thùc [3]. ¢m tiÕt, h×nh vÞ trong tiÕng ViÖt lµ cè ®Þnh, kh«ng biÕn ®æi h×nh th¸i theo ng÷ ph¸p vµ thêi, gièng vµ sè nh­ c¸c ng«n ng÷ kh¸c. Tõ th­êng cã hai lo¹i lµ ®¬n tiÕt vµ ®a tiÕt. Mét phÇn rÊt lín tõ ®a tiÕt lµ H¸n ViÖt (kÓ c¶ tõ míi). Trong c¸c tõ ®a tiÕt th­êng cã d¹ng l¸y ©m hoÆc ghÐp c¸c tõ ®¬n tiÕt. ¢m tiÕng ViÖt cã cÊu tróc chÆt chÏ víi c¸c lo¹i ©m ë c¸c vÞ trÝ cè ®Þnh trong thµnh phÇn ©m tiÕt. TiÕng ViÖt lµ ng«n ng÷ cã thanh ®iÖu, tiÕng ViÖt cã 6 thanh (tiÕng Th¸i, Lµo cã 5 thanh, tiÕng H¸n 4 thanh, tiÕng MiÕn §iÖn 3 thanh, Trung Quèc cã 4 thanh) lµ ngang (kh«ng dÊu), huyÒn, ng·, hái, s¾c vµ nÆng. Mçi thanh ®Òu cã thÓ tham gia vµo viÖc cÊu t¹o tõ vµ t¹o nghÜa cho tõ. Thanh ®iÖu tiÕng ViÖt cã tÝnh nh¹c, c©u v¨n cã vÇn, nhÞp ®iÖu, trÇm bæng nhÞp nhµng. Mçi ©m tiÕt ®Òu mang mét thanh ®iÖu nhÊt ®Þnh. Thanh ®iÖu kÕt hîp víi thµnh phÇn cña ©m tiÕt t¹o thµnh c¸c tõ kh¸c nhau, vÝ dô nh­ /ma, mµ, m¸, m¶, m·, m¹/. Trong tiÕng ViÖt kh«ng ph¶i vÇn nµo còng ph¸t ©m ®­îc ®ñ s¸u thanh. §èi víi ©m tiÕt ®ãng chØ cã hai thanh lµ s¾c vµ nÆng ¢m tiÕt tiÕng ViÖt ë d¹ng ®Çy ®ñ bao gåm 3 thµnh phÇn cã møc ®é ®éc lËp kh¸c nhau lµ ©m ®Çu (phô ©m), phÇn vÇn vµ thanh ®iÖu. Víi phÇn vÇn bao gåm 3 thµnh phÇn lµ ©m ®Öm (b¸n nguyªn ©m), ©m chÝnh (nguyªn ©m ®¬n hoÆc nguyªn ©m ®«i) vµ ©m cuèi (phô ©m ®¬n hoÆc b¸n nguyªn ©m). Trong ®ã nguyªn ©m vµ thanh ®iÖu lµ h¹t nh©n cña ©m tiÕt. Trõ phô ©m ®Çu, phÇn cßn l¹i cña ©m tiÕt tiÕng ViÖt ®­îc gäi lµ vÇn. TiÕng ViÖt cã 512 vÇn (Theo thèng kª trong mét sè tµi liÖu cña GS. Hoµng Phª). VÇn vµ thanh t¹o nªn sù hµi hoµ vÒ ng÷ ©m vµ ng÷ nghÜa trong c¸c tõ t­îng h×nh, t­îng thanh. Tõ song tiÕt chiÕm phÇn kh¸ lín trong tæng sè tõ. Tõ ghÐp ®a tiÕt chia ra thµnh c¸c lo¹i tõ ghÐp nghÜa, tõ l¸y, tõ ghÐp tù do, c¸c tõ vay m­în n­íc ngoµi. Vèn tõ vùng tiÕng ViÖt bao gåm c¸c tõ, c¸c thµnh ng÷, thuËt ng÷. Mét bé phËn tõ tiÕng ViÖt cã gèc H¸n. Ph­¬ng tiÖn biÓu hiÖn ý nghÜa ng÷ ph¸p trong tiÕng ViÖt lµ trËt tù c¸c thµnh tè (tõ vµ c©u), ng÷ ®iÖu, d¹ng l¸y, ng÷ c¶nh. Tõ vµ côm tõ lµ c¸c ®¬n vÞ cÊu t¹o nªn c©u. Ng«n ng÷ nãi vµ ng«n ng÷ viÕt kh«ng c¸ch xa nhau vÒ qui t¾c ng÷ ©m, ng÷ ph¸p. Mèi quan hÖ gi÷a ch÷ c¸i, thanh vµ ©m tiÕt, tõ ChØ c¸c nguyªn ©m míi cã quyÒn mang dÊu thanh trong biÓu diÔn ©m tiÕt hay tõ. Mçi nguyªn ©m cã thÓ ®­îc mang nhiÒu nhÊt lµ mét trong c¸c dÊu thanh trªn. C¸c dÊu thanh: huyÒn, hái, ng·, s¾c ®­îc ®Æt ë phÝa trªn cña nguyªn ©m mang dÊu. DÊu nÆng ®­îc ®Æt ë phÝa d­íi nguyªn ©m mang dÊu. C¸c ©m tiÕt ch÷ ViÖt ®­îc t¹o ra trªn c¬ së biÓu diÔn h×nh ¶nh cho c¸c ©m ph¸t ra cã mang thanh ®iÖu. Mçi ©m tiÕt ®Òu ®­îc biÓu diÔn b»ng viÖc viÕt liÒn c¸c ch÷ c¸i m« t¶ cho ©m tiÕt ®ã vµ ®­îc mang nhiÒu nhÊt lµ mét thanh, ®Æt trªn mét nguyªn ©m. C¸c ©m tiÕt t¸ch lÉn nhau b»ng dÊu c¸ch. Thanh lµ thuéc tÝnh cña ©m tiÕt, kh«ng ph¶i lµ thuéc tÝnh cña nguyªn ©m. Thanh ®­îc ®Æt vµo vÞ trÝ cña nguyªn ©m ®Ó ph©n biÖt trong c¸ch ph¸t ©m. Mét tõ trong tiÕng ViÖt lµ mét ®¬n vÞ ng÷ nghÜa, mang mét ý nghÜa nµo ®ã, vµ bao gåm mét hai, ba hay nhiÒu ©m tiÕt. Dùa trªn c¸ch biÓu diÔn ch÷ ViÖt theo ch÷ c¸i vµ thanh nµy, cã thÓ nªu ra ®­îc c¸c tËp sinh kh¸c cho ch÷ ViÖt, nh­: TËp sinh d­íi d¹ng tæ hîp cña c¸c phô ©m ®Çu vµ vÇn theo sau TËp sinh víi 33 ch÷ c¸i vµ 5 thanh TËp sinh víi c¸c phô ©m ®Çu vµ kho¶ng 800 vÇn MÆc dÇu c¸ch biÓu diÔn theo phô ©m vµ vÇn cã thÓ cã mét sè Ých lîi trong xö lÝ nh­ng Ých lîi ®ã khã bï ®­îc cho nh÷ng bÊt lîi mµ nã ®em l¹i nh­: Víi ®Æc thï ph¸t ©m cña tiÕng ViÖt khã biÓu diÔn nh÷ng t×nh huèng cã chen lÉn tiÕng ViÖt vµ kh«ng ph¶i tiÕng ViÖt. ViÖc lµm nµy ®i ng­îc víi xu thÕ hoµ ®ång c¸c ng«n ng÷ trªn thÕ giíi, do ®ã khã kh¨n cho viÖc tiÕp thu nh÷ng tiÕn bé c«ng nghÖ míi. Ch÷ viÕt Theo c¸c tµi liÖu lÞch sö §¹i ViÖt sö l­îc, An nam chÝ nguyªn, ViÖt sö th«ng gi¸m tæng luËn th× ®Òu cã chÐp thêi Hïng v­¬ng "chÝnh sù dïng lèi kÕt nót." Tuy nhiªn ch­a cã tµi liÖu nµo cho biÕt râ h¬n vÒ viÖc khi nµo cã ch÷ viÕt ®­îc b¾t ®Çu dïng ë ViÖt Nam. ViÖc sö dông ch÷ H¸n ®i kÌm víi viÖc v¨n ho¸ Trung quèc lan xuèng phÝa Nam ®Õn cïng víi viÖc chinh phôc vµ th«n tÝnh ®Êt ®ai cña c¸c triÒu ®¹i phong kiÕn Trung quèc. CÊu tróc ©m tiÕt trong tiÕng ViÖt Nh­ ®· nªu trªn, ¢m tiÕt cña tiÕng viÖt ë d¹ng ®Çy ®ñ ®­îc t¹o bëi 5 thµnh phÇn lµ phô ©m ®Çu, ©m ®Öm (b¸n nguyªn ©m), ©m chÝnh (nguyªn ©m ®¬n hoÆc nguyªn ©m ®«i) vµ ©m cuèi (phô ©m ®¬n hoÆc b¸n nguyªn ©m) vµ thanh ®iÖu. VÒ cÊu tróc, ©m tiÕt tiÕng ViÖt cã cÊu tróc hai bËc. BËc mét gåm ba thµnh phÇn lµ thanh ®iÖu, phô ©m ®Çu vµ vÇn. BËc hai lµ c¸c thµnh tè cña phÇn vÇn gåm ©m ®Öm lµ b¸n nguyªn ©m, nguyªn ©m chÝnh vµ phô ©m hoÆc b¸n nguyªn ©m cuèi. C¸c thµnh phÇn ©m tiÕt ®­îc thÓ hiÖn ë h×nh 1. Thanh ®iÖu ¢m ®Çu VÇn ¢m ®Öm ¢m chÝnh ¢m cuèi H×nh 1: S¬ ®å ©m tiÕt tiÕng ViÖt ¢m ®Çu Phô ©m më ®Çu ©m tiÕt gåm cã 22 vÇn. C¸c phô ©m ®Çu ®­îc ph©n biÖt theo c¸c tiªu chÝ vÒ ph­¬ng thøc cÊu ©m (t¾c, x¸t), vÒ thanh tÝnh (vang, ån)... phô ©m vang ®­îc ph©n biÖt gi÷a phô ©m mòi vµ phô ©m bªn (phô ©m kh«ng mòi). Trong phô ©m ån ®­îc chia thµnh lo¹i ©m v« thanh vµ ©m h÷u thanh. Nh­ vËy ph©n theo líp ng÷ ©m r«ng ta cã thÓ chia phô ©m ®Çu tiÕng ViÖt thµnh b¶y lo¹i theo h×nh 2 d­íi ®©y. Ph­¬ng thøc cÊu ©m C¸c phô ©m ån T¾c V« thanh BËt h¬i th Kh«ng bËt h¬i (p), t, tr, ch, k, c H÷u thanh b, ® X¸t V« thanh ph, x, s, kh H÷u thanh v, d, r, g-gh, h Vang Mòi m, n, nh, ng-ngh Kh«ng mòi l H×nh 2: Ph©n lo¹i phô ©m ®Çu PhÇn vÇn PhÇn vÇn cã 3 thµnh phÇn lµ ©m ®Öm, ©m chÝnh vµ ©m cuèi. VÝ dô ©m tiÕt /to¸n/ cã phÇn vÇn lµ oan, trong ®ã ©m vÞ ©m ®Öm lµ /o/, ©m chÝnh lµ /a/ vµ ©m cuèi lµ /n/. ¢m ®Öm ®ãng vai trß lµm biÕn ®æi ©m s¾c cña ©m tiÕt nh­ng nã kh«ng t¹o nªn ®Ønh cña ©m tiÕt. ¢m ®Öm ®­îc viÕt b»ng ch÷ c¸i /o/ khi ®øng tr­íc 3 nguyªn ©m /e/, /a/, /¨/ vµ b»ng ch÷ c¸i /u/ trong c¸c tr­êng hîp cßn l¹i. NÕu ®øng sau phô ©m ®Çu /k/ th× chØ ®­îc viÕt lµ /u/ vµ /k/ ®­îc viÕt lµ /q/ ¢m chÝnh lµ mét ©m trong hÖ thèng nguyªn ©m gåm 11 nguyªn ©m ®¬n lµ /a/, /¨/, /©/, /e/, /ª/, /o/, /«/, /¬/, /u/, /­/, /i/ vµ 3 nguyªn ©m ®«i lµ /iª/, /­¬/, /­a/. ¢m chÝnh lµ yÕu tè t¹o nªn ®Ønh ©m tiÕt, cã biªn ®é vµ c­êng ®é lín nhÊt trong c¸c thµnh phÇn ©m tiÕt. ¢m cuèi lµ ©m kÕt thóc ©m tiÕt. Nã biÕn ®æi ©m s¾c cña ©m chÝnh do t¸c ®éng t¸c khÐp l¹i cña bé m¸y ph¸t ©m. HÖ thèng ©m cuèi trong tiÕng ViÖt gåm hai b¸n nguyªn ©m lµ /i/ vµ /o/ vµ s¸u phô ©m. C¸c phô ©m nµy lµ /m/, /n/, /ng (nh)/, /p/, /t/, /c/. Thanh ®iÖu Thanh ®iÖu lµ lo¹i ©m vÞ siªu ®o¹n tÝnh, nã ®­îc biÓu hiÖn trong tiµn bé phÇn h÷u thanh cña ©m tiÕt. ë møc vËt lý, phÇn thanh cña thanh ®iÖu chÝnh lµ ®­êng nÐt cña tÇn sè ©m c¬ b¶n F0. VÒ c¶m thô, thanh ®iÖu lµ sù c¶m nhËn vÒ ®é thay ®æi cao ®é tÇn sè c¬ b¶n F0 cña ©m tiÕt. S¸u thanh ®iÖu trong tiÕng ViÖt ®­îc chia thµnh hai nhãm lín lµ b»ng vµ tr¾c. Thanh kh«ng dÊu vµ thanh huyÒn thuéc lo¹i thanh b»ng cã ®­êng nÐt t­¬ng ®èi ®¬n gi¶n. Thanh ng·, thanh hái, thanh s¾c vµ thanh nÆng lµ nh÷ng thanh tr¾c cã ®­êng nÐt thanh ®iÖu phøc t¹p. C¸c thanh ngang, s¾c, ng· thuéc ©m vùc cao cßn c¸c ©m huyÒn, hái vµ nÆng thuéc ©m vùc thÊp. Ngoµi tÝnh chÊt thanh tÝnh, c¸c thanh ®iÖu cßn cã mét sè ®Æc tr­ng phi ®iÖu tÝnh nh­ hiÖn t­îng yÕt hÇu ho¸, thanh hÇu ho¸ ... t¹o thµnh c¸c hÖ thèng c¸c ®Æc tr­ng phô ®Ó ph©n biÖt c¸c thanh ®iÖu ®Æc biÖt cña thanh ng· vµ s¾c, thanh hái vµ thanh nÆng. Lo¹i ©m tiÕt Phô thuéc vµo c¸ch thøc kÕt thóc, ©m tiÕt tiÕng ViÖt ®­îc chia thµnh 4 lo¹i nh­ sau: ¢m tiÕt më: Lµ lo¹i ©m tiÕt kh«ng cã ©m cuèi, kÕt thóc ©m tiÕt b»ng nguyªn ©m chÝnh, vÝ dô cha, mÑ ¢m tiÕt nöa më: Khi ©m cuèi kÕt thóc ©m tiÕt lµ mét b¸n nguyªn ©m, vÝ dô mai, sau ¢m tiÕt nöa ®ãng: Khi ©m cuèi lµ mét phô ©m mòi /n/, /m/, /ng/, /nh/, vÝ dô lµm, ngµnh, m«ng. ¢m tiÕt ®ãng: Khi ©m cuèi lµ mét phô ©m t¾c v« thanh /p/, /t/, /c/, vÝ dô: tËp, häc, mÖt. §¬n vÞ nhËn d¹ng c¬ b¶n cho c¸c hÖ thèng nhËn d¹ng lêi ViÖt M« h×nh tõ vµ ©m tiÕt ViÖc lùa chän tõ lµm ®¬n vÞ nhËn d¹ng lµ ph­¬ng ph¸p th«ng th­êng vµ dÔ dµng nhÊt, nã bao trïm ®­îc tÝnh biÕn thÓ ©m vÞ. §èi víi mét sè øng dông nhËn d¹ng tiÕng nãi cÇn sè tõ kh«ng lín nh­ hÖ thèng ®iÒu khiÓn häc, ®Õm sè ... cã thÓ ¸p dông tèt m« h×nh tõ ®Ó nhËn d¹ng do dÔ dµng thu thËp ®ñ sè mÉu huÊn luyÖn cho mçi tõ. Xem h×nh 3 d­íi ®©y. Trong tÊt c¶ c¸c ng«n ng÷, tõ lµ ®¬n vÞ tù nhiªn nhá nhÊt cña tiÕng nãi vµ tõ lµ môc tiªu cña c¸c hÖ thèng nhËn d¹ng tiÕng nãi. TiÕng ViÖt lµ ng«n ng÷ ®¬n ©m tiÕt. Trong tiÕng ViÖt, ©m tiÕt lµ nh÷ng ®¬n vÞ ©m thanh nhá nhÊt vµ nh­ vËy ©m tiÕt lµ môc tiªu cña c¸c hÖ thèng nhËn d¹ng lêi ViÖt. Do vËy nã cã thÓ ®­îc lùa chän lµm ®¬n vÞ nhËn d¹ng tiÕng nãi cho c¸c øng dông nhËn d¹ng lêi ViÖt. Tuy nhiªn, do trong tiÕng ViÖt, sè l­îng ©m tiÕt rÊt lín trªn 10.000 ©m tiÕt nªn rÊt khã cã thÓ ¸p dông cho c¸c hÖ thèng nhËn d¹ng tiÕng viÖt cì lín do viÖc thu thËp mÉu tiÕng nãi cÇn thiÕt cho c¸c ©m tiÕt sÏ gÆp nhiÒu khã kh¨n do sã l­îng mÉu qu¸ lín vµ thêi gian xö lý so s¸nh, lùa chän mÉu trong c¬ së d÷ liÖu l©u. Ngoµi ra , mçi mÉu huÊn luyÖn cña mét ©m tiÕt chØ cã thÓ sö dông ®Ó huÊn luyÖn vµ so s¸nh lùa chän cho chÝnh ©m tiÕt ®ã chø kh«ng thÓ sö dông chung ®Ó huÊn luyÖn vµ lùa chän cho c¸c ©m tiÕt kh¸c. Xong bï l¹i, ph­¬ng ph¸p nµy cã nhiÒu ®¬n gi¶n do kh«ng cÇn ph¶i sö dông mét sè c¸c ph­¬ng ph¸p ®Ó ph©n ®o¹n vµ g¸n nh·n. TiÕng ViÖt th«ng th­êng 300.000 M¸y viÕt chÝnh t¶ 20.000 - 50.000 Nãi chuyÖn hµng ngµy 8.000 - 20.000 Héi tho¹i cung cÊp th«ng tin 500-2000 §iÒu khiÓn, vËn hµnh m¸y mãc 20-200 §Õm, sè 10 + x §iÒu khiÓn häc (cã/kh«ng) 2 §ång hå b¸o thøc 1 H×nh 1.1. Sè tõ trong c¸c øng dông cô thÓ H×nh 3. Vèn tõ trung b×nh theo c¸c øng dông M« h×nh ©m vÞ Nh»m gi¶m bít sè l­îng mÉu huÊn luyÖn, nhËn d¹ng vµ ®Ó sö dông chung c¸c mÉu nµy, m« h×nh ©m vÞ th­êng ®­îc sö dông lµm ®¬n vÞ nhËn d¹ng c¬ b¶n cho c¸c hÖ thèng nhËn d¹ng tiÕng nãi. Trong tiÕng ViÖt chØ cã 38 ©m vÞ trong ®ã cã 22 phô ©m vµ 16 nguyªn ©m ®¬n vµ ®«i [1], khi kÕt hîp víi thanh ®iÖu (huyÒn, hái, ng·, s¾c, nÆng, kh«ng dÊu) th× tæng céng cã 228 ©m vÞ cã thanh ®iÖu. Víi sè l­îng ©m vÞ h¹n chÕ nh­ vËy, hoµn toµn cã thÓ x©y dùng mét m« h×nh nhËn d¹ng tiÕng ViÖt víi tõ ®iÓn cì lín kh«ng h¹n chÕ víi kho¶ng 1.500 - 2000 c©u huÊn luyÖn. Mét ®Æc ®iÓm n÷a lµ c¸c tõ trong tiÕng ViÖt cã sè l­îng ©m vÞ rÊt Ýt, nhiÒu nhÊt còng chØ tíi 6 ©m vÞ (vÝ dô khuÕch tr­¬ng). Tuy nhiªn, m« h×nh ©m vÞ cã mét sè nh­îc ®iÓm chÝnh: C¸c ©m vÞ nh­ nhau ë c¸c vÞ trÝ kh¸c nhau kh«ng h¼n ®· cã ®Æc tÝnh ©m häc, ng÷ ©m häc nh­ nhau. Mét sè ©m vÞ võa ®ãng vai trß ©m chÝnh, võa ®ãng vai trß ©m phô. ¢m vÞ lµ ®¬n vÞ ©m nhá nhÊt cña mét tõ, viÖc x¸c ®Þnh gianh giíi cña c¸c ©m vÞ rÊt khã, do ®ã viÖc ph©n ®o¹n vµ g¸n nh·n chÝnh x¸c ë møc ©m vÞ rÊt khã kh¨n nh­ng l¹i rÊt quan träng vµ ¶nh h­ëng nhiÒu ®Õn chÊt l­îng cña hÖ thèng. ¢m ®Çu +VÇn TiÕng ViÖt lµ ng«n ng÷ ®¬n ©m tiÕt. ¢m tiÕt tuy ®­îc ph¸t ©m liÒn nh­ng l¹i cã cÊu t¹o l¾p ghÐp vµ hÇu nh­ theo mét quy luËt nhÊt ®Þnh. §iÒu nµy dÔ thÊy ë c¸c em bÐ häc ®¸nh vÇn trong n¨m ®Çu ®i häc. Mçi tõ trong tiÕng ViÖt cã 3 bé phËn chÝnh lµ thanh ®iÖu, ©m ®Çu vµ vÇn. ¢m ®Çu cã mét ©m vÞ tham gia cÊu t¹o, vÇn ®­îc cÊu t¹o bíi ©m ®Öm, ©m chÝnh vµ ©m cuèi. Theo [4] th× trong tiÕng ViÖt cã 22 ©m ®Çu vµ 155 vÇn. KÕt hîp víi thanh ®iÖu th× tæng sè ©m ®Çu+vÇn cã thanh ®iÖu nhá h¬n (22+155)*6=1062 v× cã nhiÒu ©m ®Çu, vÇn vµ thanh ®iÖu kh«ng kÕt hîp ®­îc víi nhau. M« h×nh ©m ®Çu+vÇn cho phÐp gi¶m bít nhiÒu khã kh¨n cho viÖc ph©n ®o¹n, g¸n nh·n trong qu¸ tr×nh lËp c¬ së d÷ liÖu vµ gi¶m bít yªu cÇu tÝnh to¸n cña m¸y khi ph¶i ph©n ®o¹n tõ thu nhËn tõ Micro. VÊn ®Ò nhËn d¹ng mÉu Trong c¸c ph­¬ng ph¸p nhËn d¹ng mÉu, ng­êi ta th­êng hay sö dông nhËn d¹ng mÉu cho c¸c tõ ®¬n lÎ. HÖ thèng kh¸ ®¬n gi¶n do kh«ng ph¶i qua c¸c c«ng ®o¹n ph©n ®o¹n vµ g¸n nh·n. Nh­ trªn ®· tr×nh bµy, ph­¬ng ph¸p nµy th­êng chØ ¸p dông cho c¸c hÖ thèng nhËn d¹ng víi th­ viÖn tõ h¹n chÕ. Ta cã thÓ ¸p dông nhËn d¹ng mÉu cho m« h×nh nhËn d¹ng theo ©m vÞ, hoÆc ©m ®Çu+vÇn. Víi ph­¬ng ph¸p nµy, c¸c tõ ®­îc ph©n ®o¹n, g¸n nh·n vµ tÝnh to¸n c¸c ®Æc tÝnh. ¢m thanh thu ®­îc còng sÏ ®­îc ph©n ®o¹n vµ so s¸nh víi th­ viÖn mÉu vµ quyÕt ®Þnh lùa chän mÉu cã ®Æc tÝnh gièng ®o¹n ©m thu ®­îc nhÊt (h×nh 4). Do ©m thanh ®­îc t¹o ra t¹i c¸c thêi ®iÓm kh¸c nhau lu«n cã sù sai kh¸c bëi c¸c yÕu tè träng ©m, ng÷ ®iÖu, tèc ®é... Do vËy ©m thanh thu ®­îc cÇn ®­îc so s¸nh víi ©m mÉu víi thuËt to¸n biÕn d¹ng DTW nh»m gi¶m thiÓu sai sè. X MNIMUM Wl* TÝnh to¸n ®é sai sè D(X,Yl) Ph©n ®o¹n G¸n nh·n §Æc tÝnh TÝn hiÖu ©m thanh vµo MÉu so s¸nh Y1, ....., Yl H×nh 4: NhËn d¹ng theo ph­¬ng ph¸p so s¸nh mÉu ThuËt to¸n Dynamic Time Wraping (DTW) Cho chuçi ©m tiÕt ®Çu vµo cã ®é dµi L vµ cã chuçi vector ®Æc tÝnh , nhiÖm vô cña hÖ thèng lµ ph¶i nhËn d¹ng xem chuçi ©m ®Çu vµo lµ c¸c ký tù g× vµ trong qu¸ tr×nh xö lý cÇn ph¶i gi¶m thiÓu tèi ®a c¸c sai sè quyÕt ®Þnh. Mçi tÝn hiÖu ©m tiÕt ®Çu vµo Wl sÏ ®­îc so s¸nh víi c¸c mÉu Yl. Mçi Yl lµ chuçi c¸c vector ®Æc tÝnh cña tÝn hiÖu ©m tiÕt Wl . Nh»m t¨ng kh¶ n¨ng nhËn d¹ng, mçi ©m tiÕt cã mét tËp hîp c¸c mÉu kh¸c nhau: . Qu¸ tr×nh quyÕt ®Þnh ©m tiÕt phï hîp víi mét mÉu dùa theo nguyªn t¾c sau: Nh­ vËy ©m tiÕt Wl* lµ ©m tiÕt phï hîp nhÊt víi mÉu Yl t×m ®­îc. Kho¶ng c¸ch D(X,Y) gi÷a d÷ liÖu ®Çu vµo vµ d÷ liÖu mÉu Y=y1….ys cã ®é dµi thêi gian kh¸c nhau S ¹ T ®­îc x¸c ®Þnh b»ng tæng c¸c kho¶ng c¸ch côc bé trªn c¶ ®­êng ®i cña qu¸ tr×nh biÕn d¹ng thêi gian. Kho¶ng c¸ch tÝch luü ®­îc x¸c ®Þnh theo c«ng thøc Vµ kho¶ng c¸ch tæng D(X,Y)=DTS. Gi¶ sö cho hai chuçi vec t¬ t­¬ng øng víi mÉu tÝn hiÖu lµ vµ . Cho r»ng tÝn hiÖu mÉu cã chiÒu dµi lín h¬n mÉu tøc lµ gi¸ trÞ (I > J). ThuËt to¸n sÏ thùc hiÖn viÖc t×m ®­êng ®i tèi ­u cña chuçi b theo chuçi a (tøc lµ c¸c vÞ trÝ kh¸c nhau gi÷a hai chuçi theo thêi gian) sao cho tæng chªnh lÖch gi÷a hai chuçi vec t¬ lµ nhá nhÊt. §Ó thùc hiÖn ®­îc ®iÒu nµy thuËt to¸n dïng ma trËn l­íi c¸c ®iÓm h×nh 5. H×nh 1: L­íi ma trËn H×nh 5: Ma trËn l­íi c¸c ®iÓm H×nh 6: H×nh d¹ng ®­êng ®i trong ma trËn Hai chuçi vÐc t¬ sÏ t­¬ng øng víi hai c¹nh cña ma trËn. Gi¶ sö , vÐc t¬ a theo trôc x vµ vÐc t¬ b theo trôc y. C¸c nót cña ma trËn t­¬ng øng víi kho¶ng c¸ch tÝnh ®­îc cña hai chuçi vÐc t¬ t¹i c¸c thêi ®iÓm thø i cña vÐc t¬ a t­¬ng øng thêi ®iÓm thø j cña vÐc t¬ b t­¬ng øng nót (i,j). Nh­ vËy, ®­êng ®i tèi ­u trong ma trËn sÏ cã d¹ng nh­ h×nh 6. ViÖc x¸c ®Þnh ®­êng ®i tèi ­u trong ma trËn l­íi ®­îc thùc hiÖn sao tæng kho¶ng c¸ch sai lÖch gi÷a c¸c cÆp vÐc t¬ cña hai chuçi lµ nhá nhÊt. Ký hiÖu, d(i,j) lµ ®é chªnh lÖch cña hai vÐc t¬ a vµ b t¹i thêi ®iÓm i vµ j t­¬ng øng. Yªu cÇu cña thuËt to¸n DTW cho hai chuçi vec t¬ bÊt kú lµ cïng b¾t ®Çu t¹i c¸c vÞ trÝ (0,0) vµ kÕt thóc t¹i vÞ trÝ (I,J). Gi¸ trÞ t¹i nót (0,0) x¸c ®Þnh b»ng 0. §­êng ®i ®­îc x¸c ®Þnh theo c¸c cÆp nót liªn tiÕp (ik-1,jk-1) ® (ik,jk) . Dïng ký hiÖu ik ®Ó biÓu diÔn chØ sè cña vÐc t¬ a t¹i thêi ®iÓm k vµ jk lµ chØ sè cña vÐc t¬ b t¹i thêi ®iÓm k. Nh­ vËy tæng kho¶ng c¸ch gi÷a hai chuçi vÐc t¬ lµ : ViÖc t×m gi¸ trÞ min D(i,j) theo c«ng thøc sau: Mét sè b¾t buéc cña DTW: - ChØ sè cña i ph¶i t¨ng ®Òu tøc lµ : ik - ik-1 =1 - ChØ sè cña j t¨ng theo i víi ®iÒu kiÖn: jk -jk-1 ³ 0 Giíi h¹n cña ®­êng ®i kh«ng thÓ tuú ý ®­îc v× nh­ thÕ nã sÏ g©y ra kÕt qu¶ sai lÖch vµ lµm t¨ng khèi l­îng tÝnh to¸n (nÕu xÐt trªn toµn bé ma trËn ®iÓm). V× vËy, cÇn ph¶i giíi h¹n ph¹m vi cña ®­êng ®i sao cho viÖc tÝnh to¸n gi¶m vµ ®é chÝnh x¸c cao. Ph¹m vi cho ®­êng ®i ®­îc chän nh­ h×nh vÏ 7: H×nh 3: §­êng ®i trong ma trËn theo thuËt to¸n DTW H×nh 7: Ph¹m vi cho ®­êng ®i LuËt ®­êng ®i ®­îc lùa chän theo nh­ h×nh 8 : H×nh 8: LuËt ®­êng ®i Gi¶ sö vÞ trÝ hiÖn t¹i ®ang ë thêi ®iÓm ik-1 vµ ®iÓm ®i tiÕp lµ ik. Nh­ vËy c¸c gi¸ trÞ jk cã thÓ lµ jk, jk+1, jk+2 t­¬ng øng víi c¸c mòi tªn trªn ma trËn. KÕt qu¶: KÕt qu¶ ®­îc so s¸nh víi ph­¬ng ph¸p biÕn d¹ng kh¸c lµ biÕn d¹ng tuyÕn tÝnh theo thêi gian hay cßn gäi lµ ®ång bé theo thêi gian víi thuËt to¸n biÕn d¹ng nh­ sau: ChØ sè theo thêi gian cña tÝn hiÖu b liªn quan ®Õn chØ sè theo thêi gian cña tÝn hiÖu a lµ : vµ kÕt qu¶ cho nh­ trªn h×nh 8. Trªn h×nh vÏ thÓ hiÖn ®­êng ®Æc tr­ng cña ©m sè 2 (“hai”) cã ®é dµi kh¸c nhau (a) vµ (b). Víi ph­¬ng ph¸p biÕn d¹ng tuyÕn tÝnh th× gi¸ trÞ thêi gian chØ sè mÉu b ®­îc gi·n ®Òu theo chØ sè thêi gian cña mÉu tÝn hiÖu a. Nh­ vËy, hai kho¶ng thêi gian ®­îc kÐo d·n b»ng nhau song c¸c gi¸ trÞ th× vÉn cßn ®é sai lÖch lín do tû lÖ biÕn d¹ng lµ ®Òu mµ kh«ng cã sù chän lùa theo gi¸ trÞ h×nh (c). ThÓ hiÖn viÖc kÐo gi·n t¹i c¸c ®iÓm cã ®­êng nèi ngang gi÷a hai tÝn hiÖu. H×nh 8. BiÓu diÔn thuËt to¸n biÕn d¹ng ©m “hai” (a)(b) Hai tÝn hiÖu cã chiÒu dµi kh¸c nhau. (c) BiÕn d¹ng tuyÕn tÝnh theo thêi gian (d) BiÕn d¹ng DTW (a) (b) (d) (c) Cßn sö dông thuËt to¸n DTW ta thÊy tû lÖ biÕn d¹ng kh«ng ®ång ®Òu t¹i c¸c thêi ®iÓm tuú thuéc vµo gi¸ trÞ tÝch luü tõ tr­íc nªn hai mÉu so s¸nh sÏ cã ®é chªnh lÖch lµ nhá nhÊt h×nh (d), c¸c ®­êng nèi chÐo thÓ hiÖn sù biÕn d¹ng kh«ng tuyÕn tÝnh theo thêi gian. KÕt luËn Trªn ®©y lµ øng dông cña thuËt to¸n DTW cho hÖ thèng nhËn d¹ng tiÕng nãi ®ang ®­îc nghiªn cøu vµ triÓn khai. øng dông luËt ®­êng ®i vµ c¸ch x¸c ®Þnh ®­êng giíi h¹n cho thuËt to¸n DTW ®· gãp phÇn n©ng cao chÊt l­îng cña bé nhËn d¹ng. Tuy nhiªn, luËt ®­êng ®i vµ giíi h¹n cña ®­êng ®i cßn cã thÓ cã nhiÒu d¹ng kh¸c cÇn nghiªn cøu thªm, song víi øng dông nhËn d¹ng mÉu rêi r¹c th× luËt ®­êng ®i x¸c ®Þnh theo ph­¬ng ph¸p trªn lµ cã chÊt l­îng h¬n c¶. Tµi liÖu tham kh¶o [1]. §oµn ThiÖn ThuËt - Ng÷ ©m tiÕng ViÖt, Nhµ xuÊt b¶n §¹i häc vµ Trung häc chuyªn nghiÖp, Hµ néi. 1977 [2]. H.Sakoe and S.Chiba - Dynamic programming optimization for spoken word recognition. 1978. [3]. Hoang Tue and Hoang Minh, “Remarks on the phonological Structure of vietnamese”, Vietnamese Studies, Ha noi, 1979 [4]. Lawrence Rabiner, Biing – Hwang Juang; Fundamentals of speech recognition. 1999. [5]. R. M Gray, A. Buzo, A.H.Gray, Jr., and Y. Matsuyama - Distortion measures for speech processing. 1980. S¬ l­îc t¸c gi¶ §oµn Phan Long, Tèt nghiÖp §¹i häc t¹i tr­êng ®¹i häc tæng hîp Karl-Marx-Stadt –CHLB §øc t¹i Thµnh phè Chemnitz khoa tù ®éng ho¸, chuyªn ngµnh ®iÒu khiÓn häc n¨m 1985, hiÖn nay c«ng t¸c t¹i Trung t©m C«ng nghÖ Th«ng tin – CDIT, Häc viÖn C«ng nghÖ B­u chÝnh ViÔn th«ng – Tæng C«ng ty BCVT ViÖt nam. Nh÷ng vÊn ®Ò ®ang quan t©m bao trïm c¸c lÜnh vùc tù ®éng nhËn d¹ng tiÕng nãi, h×nh ¶nh... vµ tæng hîp tiÕng nãi ¸p dông trong c¸c hÖ thèng cung cÊp dÞch vô trong ngµnh B­u chÝnh-ViÔn th«ng.

Các file đính kèm theo tài liệu này:

  • docÁp dụng thuật toán DTW cho ứng dụng nhận dạng mẫu tiếng việt Đọc thêm.doc
Tài liệu liên quan