Luận văn Tích hộp thông tin hình thái từ vào hệ dịch máy thống kê Anh - Việt

Một dự_án để xây_dựng Hạ_Long thành một không khói thuốc thành_phố du_lịch đã bắt_đầu tại thành_phố Hạ_Long , ven biển phía bắc tỉnh Quảng_Ninh vào tháng 9 . Do khô nhất tỉnh trong nƣớc với lƣợng mƣa hàng năm khoảng 700 và 1.100 mm , Ninh_Thuận đƣợc ƣu_đãi với một bờ biển , đồng_bằng , núi , các con sông , và cồn cát . Nó , tuy_nhiên , đã cảnh_báo rằng việc tăng mực nƣớc biển sẽ tốn môi_trƣờng sống nhƣ vậy quý_hiếm , đang bị đe_doạ và đặc_hữu loài nhƣ leopard tắc_kè , mà chỉ sống trong các khu_vực đất thấp của khu_vực . Các Bộ_trƣởng Bộ Tài_nguyên và Môi_trƣờng Phạm_Khôi_Nguyên , sau đó sẽ chủ_trì một hội_thảo về những gì Việt_Nam đã đƣợc làm để đối_phó với các vấn_đề đƣa vào do sự nóng lên toàn_cầu và mực nƣớc biển dâng cao . Tam_Nông thành_lập cho bị đe_doạ khỉ mũi tẹt trong Hà_Giang . Giao_thông mƣa và gió mạnh pounded Ý vào ngày thứ hai , làm thiệt_mạng cuộc_sống của bốn ngƣời , ANSA tin_tức cơ_quan báo_cáo . Một lỗ với chiều dài của hai mét là trên chặn đƣờng Phainam - đƣờng gần Sân_vận_động Chao_Anuvong . Hoạt_động câu_lạc_bộ là rất khó_khăn cho tôi bởi_vì chúng_tôi thiếu tiền , nhƣng với sự hỗ_trợ từ các thành_viên , chúng_tôi vẫn quản_lý câu_lạc_bộ có hiệu_quả .

pdf92 trang | Chia sẻ: aloso | Lượt xem: 1856 | Lượt tải: 2download
Bạn đang xem trước 20 trang tài liệu Luận văn Tích hộp thông tin hình thái từ vào hệ dịch máy thống kê Anh - Việt, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
to|NNP has|have|VBZ stated|state|VBN that|that|IN he|he|PRP will|will|MD not|not|RB risk|risk|VB his|his|PRP$ player|player|NN .|.|. Tuy nhiên , nó không rõ ràng nếu Hoàng sẽ chơi ngày hôm nay vì Calisto đã tuyên bố rằng ông sẽ không mạo hiểm đối thủ . Tuy nhiên, thông tin từ loại đã dẫn đến kết quả dịch tệ hơn hệ cơ sở do các lý do sau: o Mỗi từ tiếng Anh có thể có nhiều hơn một nhãn từ loại. Nhƣng ngữ liệu không thể bao quát đƣợc hết mọi trƣờng hợp. Do đó, với cùng một từ đã xuất hiện trong ngữ liệu huấn luyện nhƣng đƣợc đánh nhãn từ loại chƣa gặp, hệ dịch xem nhƣ là một từ mới và không dịch đƣợc. Ví dụ: Ngữ liệu The Control Board may use independent consultants to perform assigned duties . Ban kiểm soát có thể sử dụng các nhà tƣ vấn tự do để thực hiện các nhiệm vụ đƣợc giao . Baseline Ban kiểm soát có thể sử dụng độc lập consultants để thực hiện Trang 58 các nhiệm vụ đƣợc giao . Thêm từ loại tiếng Anh The|the|DT Control|control|NNP Board|board|NNP may|may|MD use|use|VB independent|independent|JJ consultants|consultant|NNS to|to|TO perform|perform|VB assigned|assign|JJ duties|duty|NNS .|.|. Ban kiểm soát có thể sử dụng độc lập consultants để thực hiện assigned nhiệm vụ . Từ “assigned” trong ngữ liệu huấn luyện đƣợc đánh nhãn VBN, động từ ở dạng quá khứ phân từ nhƣng chƣa gặp trƣờng hợp từ “assigned” đƣợc đánh nhãn JJ, tính từ. o Trƣờng hợp công cụ gán nhãn sai cũng tạo nên câu dịch tệ hơn. Vì khi kết hợp với nhãn sai, từ tiếng Anh cũng tạo nên từ chƣa gặp trong ngữ liệu. Xét ví dụ sau: Ngữ liệu Hitler also has a devastating new weapon to unveil - the magnetic mine , dropped into the sea from the air to cling to a passing vessel and explode . Hitler cũng có một loại vũ khí tàn phá mới để công bố - mỏ từ trƣờng , bị bỏ vào trong biển từ trên không để bám víu vào một con tàu đi qua và nổ . Baseline Hitler cũng đã tàn phá vũ khí mới để công bố - magnetic mỏ , giảm xuống vào biển từ không khí để cling đến một thông qua các tàu và explode . Thêm từ loại tiếng Anh Hitler|hitler|NNP also|conjurer|RB has|have|VBZ a|a|DT devastating|devastate|VBG new|new|JJ weapon|weapon|NN to|to|TO unveil|unveil|VB -|-|: the|the|DT magnetic|magnetic|JJ mine|mine|NN ,|,|, dropped|drop|VBD into|into|IN the|the|DT sea|sea|NN from|from|IN the|the|DT air|air|NN to|to|TO cling|cling|VB to|to|TO a|a|DT passing|pass|NN vessel|vessel|NN Trang 59 and|and|CC explode|explode|VB .|.|. Hitler cũng có một tàn phá vũ khí mới để công bố - magnetic mỏ , giảm xuống vào biển từ không khí để cling đến một passing tàu và explode . o Ngoài ra, do hệ dịch chọn lựa ngữ dịch tƣơng ứng dựa trên nhãn từ loại nên nhãn từ loại sai dẫn đến câu dịch cũng sai. Ví dụ: Ngữ liệu When Spring comes , Sa Dec bonsai village also starts its festival . Khi mùa xuân đến , làng cây cảnh Sa Đéc cũng bắt đầu lễ hội của nó . Baseline Khi mùa xuân đến , Sa Đéc cây cảnh làng cũng bắt đầu của nó lễ hội . Thêm từ loại tiếng Anh When|when|WRB Spring|spring|NNP comes|come|VBZ ,|,|, Sa|Sa|NNP Dec|Dec|NNP bonsai|bonsai|NN village|village|NN also|conjurer|RB starts|start|VBZ its|its|PRP$ festival|festival|NN .|.|. Khi Lƣơng đến , Sa Đéc cây cảnh làng cũng bắt đầu của nó lễ hội . Từ đƣợc đánh nhãn sai làm ảnh hƣởng kết quả gióng hàng từ. Nếu từ không đƣợc gióng hàng sẽ không đƣợc thống kê, do đó khi dịch hệ thống không gặp khi tra phrase-table dẫn đến từ không đƣợc dịch. ii. Ảnh hƣởng của biến đổi từ thành nguyên mẫu và phụ tố Mặc dù việc phân tích từ tiếng Anh sang nguyên mẫu và phụ tố có cải thiện kết quả dịch so với hệ dịch cơ sở. Nhƣng kết quả phân tích cũng tạo nên từ/ngữ chƣa gặp trong ngữ liệu huấn luyện nên kết quả dịch nhìn chung bị giảm. Trang 60 Sau đây là hai ví dụ cho thấy ảnh hƣởng tích cực của phép phân tích. Ví dụ 1: Ngữ liệu No matter what happens , we ' ll be as well prepared as we can be given the enormous potential for crowds . Dù bất kỳ vấn đề nào xảy ra , chúng tôi sẽ chuẩn bị tốt khi chúng tôi có thể đƣợc đƣa ra tiềm năng to lớn cho đám đông . Baseline Không có vấn đề về những gì sẽ xảy ra , chúng tôi sẽ là cũng đƣợc chuẩn bị vì chúng tôi có thể đƣợc đƣa ra các rất lớn tiềm năng cho các crowds . Tách từ tiếng Anh thành nguyên mẫu và phụ tố No matter what happen s , we 'll be as well prepare ed as we can be give en the enormous potential for crowd s . Không có vấn đề những gì xảy ra , chúng tôi sẽ là cũng nhƣ đƣợc chuẩn bị nhƣ chúng tôi có thể đƣợc đƣa ra những lớn tiềm năng cho đám đông . Ví dụ 2: Ngữ liệu The boat cruises down the canal making stops at points of interest along the way . Các chuyến đi tàu xuống kênh dừng tại các điểm thú vị trên đƣờng đi . Baseline Các thuyền cruises xuống kênh làm dừng tại điểm của sự quan tâm dọc theo đƣờng . Tách từ tiếng Anh thành nguyên mẫu và phụ tố The boat cruise s down the canal make ing stop s at point s of interest along the way . Các thuyền đi xuống các kênh làm việc dừng tại điểm quan tâm dọc theo đƣờng . o Tuy nhiên, kết quả dịch tệ hơn so với hệ cơ sở trong các trƣờng hợp sau: Trang 61 Ngữ liệu Tasmania has long been a location for cloud seeding programs , following apparent success with the programs in the 1960 's and 1970 's when significant rainfall increases of more than 30 percent were measured and reported by CSIRO scientists . Tasmania từ lâu đã là nơi cho các chƣơng trình tạo mƣa nhân tạo , sau thành công rực rỡ với các chƣơng trình trong những năm 1960 và 1970 khi lƣợng mƣa tăng lên đáng kể với hơn 30 phần trăm đƣợc đo và báo cáo bởi các nhà khoa học CSIRO . Baseline Tasmania từ lâu đã đƣợc một địa điểm cho các đám mây chƣơng trình tạo mƣa nhân tạo , sau đây rõ ràng thành công với các chƣơng trình trong những năm 1960 của và 1970 của khi quan trọng lƣợng mƣa tăng hơn 30 phần trăm đã đƣợc đo và báo cáo của cây trồng các nhà khoa học . Tách từ tiếng Anh thành nguyên mẫu và phụ tố Tasmanium s have s long be en a location for cloud seed ing program s , follow ing apparent success with the program s in the 1960 ' s and 1970 ' s when significant rainfall increase s of more than 30 percent be ed measure ed and report ed by CSIRO scientist s . Tasmania đã lâu dài đƣợc một địa điểm cho đám mây hạt giống các chƣơng trình , đi theo rõ ràng thành công với các chƣơng trình trong thập niên 1960 của và 1970 của khi quan trọng lƣợng mƣa tăng của hơn 30 phần trăm đã đƣợc đo và báo cáo của CSIRO các nhà khoa học . o Do công cụ phân tích từ về nguyên mẫu dựa trên kết quả gán nhãn từ loại nên nhãn từ loại sai sẽ dẫn đến kết quả phân tích sai. Ngữ liệu Professor Johnson was not involved in the study but wrote an accompanying article in the same issue of Science , outlining its Trang 62 significance . Giáo sƣ Johnson đã không tham gia vào nghiên cứu này , nhƣng đã viết một bài báo đi kèm trong cùng một ấn bản Khoa học , phác thảo ra ý nghĩa của nó . Baseline Giáo sƣ Johnson đã không tham gia vào việc nghiên cứu , nhƣng đã viết một đi kèm bài viết trong cùng một vấn đề về Khoa học , phác thảo của nó có ý nghĩa . Tách từ tiếng Anh thành nguyên mẫu và phụ tố Professor Johnson be ed not involve ed in the study but write ed an accompanying article in the same issue of Science , outline ing its significance . Giáo sƣ Johnson là không liên quan đến việc nghiên cứu , nhƣng đã viết một accompanying bài viết trong cùng một vấn đề của Khoa học , phác thảo của nó có ý nghĩa . Nhƣ vậy, việc tích hợp thông tin từ loại và hình thái của tiếng Anh đã có cải thiện kết quả dịch trong một số trƣờng hợp. Tuy nhiên, kết quả dịch vẫn phụ thuộc rất nhiều vào hiệu quả của các công cụ đánh nhãn từ loại và phân tích hình thái. Do đó, từ trong câu tiếng Anh bị phân tích sai dẫn đến nhiều trƣờng hợp câu dịch tệ hơn hệ cơ sở. Mặc khác, ngữ liệu không bao phủ hết các nhãn từ loại của từ cũng dẫn đến hệ dịch không hiệu quả. 5.3.1.2. Chuyển đổi trật tự từ Bảng 5.3. Kết quả dịch của các hệ chuyển đổi trật tự từ BLEU NIST TER Hệ cơ sở 43,31 9,8269 37,914 Chuyển đổi trật tự 45,88 9,9461 36,429 Trang 63 Bảng 5.3 hiển thị kết quả dịch của hệ dịch áp dụng luật chuyển đổi trật tự. Kết quả cho thấy khi dùng luật chuyển đổi, hiệu quả dịch cao hơn so với hệ cơ sở. Kết quả gióng hàng từ cho thấy, sau khi áp dụng luật chuyển đổi trật tự cho câu nguồn, số lƣợng gióng hàng chéo giảm đáng kể. Do câu tiếng Anh đã đƣợc thay đổi vị trí sao cho gần giống với tiếng Việt nhất. Nhờ vậy, hệ thống dịch hiệu quả hơn. Ngữ liệu Our training time is too long and could limit the doctors ' motivation and waste our medical talent . Thời gian đào tạo của chúng tôi là quá dài và có thể giới hạn động cơ của các bác sĩ và lãng phí tài năng y học của chúng ta . Baseline của chúng tôi đào tạo thời gian là quá lâu dài và có thể giới hạn sự bác sĩ của động lực và chất thải của chúng tôi y tế tài năng . Chuyển đổi trật tự time training Our is too long and could limit the motivation ' doctors and waste talent medical our . thời gian đào tạo của chúng tôi là quá lâu dài và có thể giới hạn sự động lực của các bác sĩ và chất thải tài năng y tế của chúng tôi . Ngữ liệu But his real interest remains in the distant provinces of the empire . Nhƣng sự quan tâm thực sự của ông vẫn còn ở các tỉnh xa xôi của đế quốc . Baseline Nhƣng ông thực sự quan tâm vẫn còn ở xa xôi tỉnh của đế quốc . Chuyển đổi trật tự But interest real his remains in the provinces distant of the empire . Nhƣng sự quan tâm thực sự của ông vẫn còn ở các tỉnh xa xôi Trang 64 của đế quốc . Tuy nhiên, không phải trƣờng hợp áp dụng luật nào cũng cải thiện đƣợc hệ dịch. Vì không phải luật nào cũng bao quát đƣợc mọi trƣờng hợp. Luật đƣợc áp dụng sai dẫn đến lƣợng gióng hàng chéo trong câu lại tăng lên, kéo theo kết quả dịch tệ hơn so với hệ dịch cơ sở. Ngữ liệu In the plan toward the year 2010 , Vietnam National Administration of Tourism declares Van Phong as " the most important region for tourism development " . Trong kế hoạch hƣớng tới năm 2010 , Tổng cục Du lịch Việt Nam công bố Văn Phong là khu phát triển du lịch quan trọng nhất . Baseline Trong các kế hoạch hƣớng đến năm 2010 , Việt Nam Tổng cục Du lịch tuyên bố Vân Phong là " quan trọng nhất của khu vực cho phát triển du lịch " . Chuyển đổi trật tự In the plan toward the year 2010 , Vietnam National Administration of Tourism declares Van Phong as " the most region important for tourism development " . Trong các kế hoạch đến năm 2010 , Việt Nam Tổng cục Du lịch tuyên bố Vân Phong là " hầu hết các khu vực quan trọng cho phát triển du lịch " . 5.1.1.1. Thêm thông tin hình thái từ trong câu tiếng Việt Thông tin hình thái từ của tiếng Việt đƣợc khảo sát bao gồm ranh giới từ và từ loại. i. Phân đoạn từ trong câu tiếng Việt Kết quả dịch của các mô hình tách từ cho tiếng Việt nhƣ sau: Trang 65 Bảng 5.4. Kết quả dịch của các hệ tích hợp thông tin hình thái từ vào câu tiếng Việt BLEU NIST TER Hệ cơ sở 43,31 9,8269 37,914 Tách từ tiếng Việt 44,19 9,9079 37,103 Đổi trật tự từ tiếng Anh 45,88 9,9461 36,429 Đổi trật tự từ tiếng Anh + Tách từ tiếng Việt 46,49 10,0107 35,850 Kết quả cho thấy hệ dịch đƣợc cải thiện nếu khi gán nhãn ranh giới từ cho câu tiếng Việt. Khi kết hợp chuyển đổi trật tự từ ở câu tiếng Anh và phân đoạn từ tiếng Việt, kết quả đƣợc cải tiến đáng kể. Hiệu quả dịch đƣợc nâng cao do số liên kết gióng hàng từ 1− 𝑛 (liên kết giữa 1 token với nhiều token) giảm đáng kể và từ trong các ngữ đƣợc rút ra không bị gián đoạn. Nhờ vậy, hệ dịch có thể thống kê các cặp ngữ chính xác hơn và tìm kiếm câu dịch tốt hơn. Bảng 5.5. Số liên kết gióng hàng từ trong các mô hình Tổng số liên kết Số liên kết trung bình trong câu Cơ sở 771.492 37,74 Tách từ tiếng Việt 616.846 30,18 Đổi trật tự tiếng Anh 770.424 37,69 Đổi trật tự tiếng Anh + Tách từ tiếng Việt 616.589 30,16 Sau đây là một số ví dụ cho kết quả gióng hàng từ của hệ cơ sở và hệ dịch có câu tiếng Việt đƣợc tách từ: Ví dụ 1: Trang 66 All industrial and processing zones must have waste treatment systems . Tất_cả các khu công_nghiệp và khu chế_xuất phải có các hệ_thống xử_lý chất_thải . Kết quả gióng hàng từ hệ baseline: 0-0 0-1 4-2 4-3 1-4 1-5 2-6 3-7 4-7 3-8 3-9 5-10 6-11 9-13 9-14 8-15 8-16 7-17 7-18 10-19 All industrial and processing zones must have waste treatment systems . Tất cả các khu công nghiệp và khu chế xuất phải có các hệ thống xử lý chất thải . Kết quả gióng hàng từ của hệ dịch khi tách từ: 0-0 4-2 1-3 2-4 4-5 3-6 5-7 6-8 9-10 8-11 7-12 10-13 All industrial and processing zones must have waste treatment systems . Tất_cả các khu công_nghiệp và khu chế_xuất phải có các hệ_thống xử_lý chất_thải . Ví dụ 2: On the way to the central provinces of Binh Thuan and Ninh Thuan , tourists can catch a view of deserted sand dunes and peaceful villages. Trên đường đến các tỉnh miền trung của tỉnh Bình Thuận và Ninh Thuận , các du khách có thể bắt gặp cảnh một cồn cát hoang vu và những ngôi làng yên bình . Kết quả gióng hàng từ của hệ cơ sở: 0-0 2-1 3-2 4-3 6-4 5-5 5-6 7-7 6-8 8-9 9-10 10-11 11-12 12-13 13-14 14-15 14-16 14-17 15-18 15-19 16-20 16-21 18-22 17-23 22-24 21-25 20-26 20-27 23-28 22-29 25-30 25-31 24-32 24-33 26-34 Trang 67 On the way to the central provinces of Binh Thuan and Ninh Thuan , tourists Trên đƣờng đến các tỉnh miền trung của tỉnh Bình Thuận và Ninh Thuận , các du khách can catch a view of deserted sand dunes and peaceful villages . có thể bắt gặp cảnh một cồn cát hoang vu và những ngôi làng yên bình . Kết quả gióng hàng từ của hệ có tách từ tiếng Việt: 0-0 2-1 3-2 4-3 6-4 5-5 5-6 7-7 8-8 10-10 11-11 12-11 13-12 14-13 14-14 15- 15 16-16 18-17 17-18 22-19 21-20 20-21 23-22 25-24 25-25 24-26 26-27 On the way to the central provinces of Binh Thuan and Ninh Thuan , tourists Trên đƣờng đến các tỉnh miền trung của tỉnh Bình_Thuận và Ninh_Thuận , các du_khách can catch a view of deserted sand dunes and peaceful villages . có_thể bắt_gặp cảnh một cồn cát hoang_vu và những ngôi làng yên_bình . Sau đây là một số kết quả dịch của hệ dịch cơ sở và hệ dịch có tách từ tiếng Việt: Ngữ liệu Each member of the Management Board shall have a single vote . Mỗi thành viên của Hội đồng quản trị sẽ có một phiếu bầu duy nhất . Cơ sở Mỗi một thành viên của Hội đồng quản trị sẽ có duy nhất có một phiếu biểu quyết . Tách từ Mỗi thành_viên của Hội_đồng_quản_trị sẽ có một phiếu bầu duy_nhất . Trang 68 Ngữ liệu Tasmania has long been a location for cloud seeding programs , following apparent success with the programs in the 1960 's and 1970 's when significant rainfall increases of more than 30 percent were measured and reported by CSIRO scientists . Tasmania từ lâu đã là nơi cho các chƣơng trình tạo mƣa nhân tạo , sau thành công rực rỡ với các chƣơng trình trong những năm 1960 và 1970 khi lƣợng mƣa tăng lên đáng kể với hơn 30 phần trăm đƣợc đo và báo cáo bởi các nhà khoa học CSIRO . Cơ sở Tasmania từ lâu đã đƣợc một địa điểm cho các đám mây chƣơng trình tạo mƣa nhân tạo , sau đây rõ ràng thành công với các chƣơng trình trong những năm 1960 của và 1970 của khi quan trọng lƣợng mƣa tăng hơn 30 phần trăm đã đƣợc đo và báo cáo của cây trồng các nhà khoa học . Tách từ Tasmania từ lâu đã đƣợc một địa_điểm cho chƣơng_trình tạo mƣa nhân_tạo , sau đây rõ_ràng thành_công với các chƣơng_trình trong những năm 1960 của và 1970 của khi đáng_kể lƣợng mƣa tăng hơn 30 phần_trăm đã đƣợc đo và báo_cáo của CSIRO các nhà khoa_học . ii. Tích hợp thông tin từ loại trong câu tiếng Việt Bảng 5.6 Kết quả dịch của hệ dịch tích hợp từ loại tiếng Việt BLEU NIST TER Hệ cơ sở 43,31 9,8269 37,914 Thêm từ loại tiếng Việt 42,58 9,7837 38,072 Đổi trật tự từ tiếng Anh 45,88 9,9461 36,429 Đổi trật tự từ tiếng Anh + Thêm từ loại tiếng Việt 44,99 9,8972 36,864 Trang 69 Kết quả cho thấy hệ dịch khi thêm thông tin từ loại vào phía tiếng Việt làm giảm hiệu quả so với hệ cơ sở. Đối với mô hình này, hệ thống học mô hình dịch từ từ tiếng Anh sang từ tiếng Việt. Sau đó, hệ sẽ phát sinh từ loại cho từ tiếng Việt này. Bộ giải mã chọn câu tiếng Việt đã đƣợc gán nhãn từ loại có xác suất cao nhất dựa vào mô hình dịch, mô hình ngôn ngữ của từ và mô hình ngôn ngữ của từ loại. Nhƣ vậy, hệ dịch này khác với hệ dịch cơ sở ở chỗ là chịu ảnh hƣởng của mô hình ngôn ngữ của từ loại. Khi khảo sát kết quả, chúng tôi nhận thấy kết quả phát sinh từ loại cho câu tiếng Việt không chính xác, dẫn đến kết quả dịch cũng tệ hơn so với hệ cơ sở. Ví dụ: Ngữ liệu From Belgium we got to know that : " it might be interesting for you to know that currently an application for a field trial with GM poplar trees is [ being ] considered . Từ Bỉ , chúng_tôi đã cho_biết rằng : " có_thể rất thú_vị khi bạn biết rằng hiện_nay một ứng_dụng cho thử_nghiệm bên ngoài với GM cây dƣơng là [ đang ] đƣợc xem_xét . Tách từ tiếng Việt Từ Bỉ , chúng_tôi nhận đƣợc biết rằng : " nó có_thể đƣợc thú_vị cho bạn biết rằng hiện đơn xin cho một thử_nghiệm bên ngoài với biến_đổi gen cây dƣơng là [ đƣợc coi là ] . Thêm từ loại tiếng Việt Từ|Cm Bỉ|Nr ,|PU chúng_tôi|Pp đã|R nhận|Vv đƣợc|M biết|Vv rằng|Cp :|PU "|PU nó|Pp có_thể|Aa đƣợc|Vv thú_vị|Aa cho|Cp Tiếng Việt Từ loại Tiếng Anh Từ Từ Trang 70 bạn|Pp biết|Vv rằng|Cp hiện|Vv đơn|Nn xin|Vv cho|Cp một|Nq thử_nghiệm|Nn bên|Nn ngoài|Nn với|Cp biến_đổi|Nn gen|Nn cây|Nn dƣơng|Aa là|Vc [|PU đƣợc|Vv ]|PU xem_xét|Vv .|PU Mặc khác, kết quả dịch bị chi phối rất nhiều bởi mô hình nhãn từ loại. Do xác suất n-gram của từ loại thƣờng lớn hơn xác suất của chuỗi từ. Xét câu dịch sau: Ngữ liệu Earlier , Hung signed a decision to take legal action over the illegal transport and purchase of wild animals and handed over both of the suspects and the evidence to the Lac Duong district police for investigation . Trƣớc đó , Hƣng đã ký một quyết_định để thực_hiện hành_động pháp_lý đối_với việc vận_tải và mua_bán bất_hợp_pháp động_vật hoang_dã và giao_nộp cả hai nghi_phạm và chứng_cứ cho công_an huyện Lạc_Dƣơng để điều_tra . Cơ sở Trƣớc đó , Hƣng đã ký một quyết_định để thực_hiện hành_động pháp_lý trong việc vận_chuyển và mua các động_vật hoang_dã và bàn_giao cả các nghi_phạm và bằng_chứng đến Lạc_Dƣơng huyện cảnh_sát để điều_tra . Thêm từ loại tiếng Việt Trƣớc|Nn đó|Pd ,|PU ông|Nn Hùng|Nr đã|R ký|Vv một|Nq quyết_định|Nn để|Cm thực_hiện|Vv các|Nq hành_động|Nn pháp_lý|Nn trong|Cm việc|Nc vận_chuyển|Vv và|Cp mua|Vv của|Cm các|Nq loài|Nn động_vật|Nn hoang_dã|Aa và|Cp bàn_giao|Vv cả|Pp của|Cm các|Nq nghi_phạm|Nn và|Cp bằng_chứng|Nn đến|Cm Lạc_Dƣơng|Nr huyện|Nu cảnh_sát|Nn cho|Cp điều_tra|Vv .|PU Xác suất chuỗi nhãn từ loại trong mô hình ngôn ngữ: Trang 71 -0.8658289 Vv Nq Nn Nn Aa -0.5041147 Vv Cm Nq Nn Nn Rõ ràng xác suất 5-gram của chuỗi từ loại sau cao hơn, dẫn đến hệ dịch chọn câu dịch tệ hơn. Sau đây là ví dụ khác cho thấy ảnh hƣởng của mô hình ngôn ngữ từ loại. Ngữ liệu Under the monoculture plantation approach , the rubber farmers must obey and follow the instructions given to them . Theo phƣơng_pháp đồn_điền độc_canh , nông_dân trồng cây cao_su phải tuân theo những hƣớng_dẫn đƣợc giao cho họ . Cơ sở Theo các đồn_điền độc_canh tiếp_cận , những ngƣời nông_dân trồng cây cao_su phải tuân theo và làm theo hƣớng_dẫn đƣợc trao cho họ . Thêm từ loại tiếng Việt Theo|Vv các|Nq đồn_điền|Nn độc_canh|Vv tiếp_cận|Vv ,|PU cao_su|Nn nông_dân|Nn phải|Vv tuân|Nn theo|Vv và|Cp làm|Vv theo|Vv hƣớng_dẫn|Nn đƣợc|Vv trao|Vv cho|Cp họ|Pp .|PU 5.1.1.2. Thêm thông tin hình thái từ cho cả tiếng Anh và tiếng Việt Bảng 5.7. Kết quả dịch của các hệ tích hợp thông tin hình thái từ vào câu tiếng Anh và tiếng Việt BLEU NIST TER Hệ cơ sở 43,31 9,8269 37,914 Từ loại tiếng Anh, từ loại tiếng Việt 40,08 9,781 38,728 Từ loại, tách nguyên mẫu tiếng Anh, từ loại tiếng Việt 42,12 9,8169 38,254 Trang 72 Trong mô hình này, hệ thống dịch từ sang từ và từ loại sang từ loại bằng hai mô hình dịch độc lập. Hiệu quả dịch của mô hình này giảm đáng kể so với hệ cơ sở. Nguyên nhân làm giảm hiệu quả dịch là do ảnh hƣởng của mô hình ngôn ngữ từ loại, nếu chuỗi từ loại phát sinh sai dẫn đến kết quả dịch cũng sai. Từ loại của câu đích sai do 2 nguyên nhân: o Từ loại trong câu nguồn sai, dẫn đến hệ thống dịch sang câu đích cũng sai. Ví dụ: Tiếng Anh "|"|NN Even|even|RB with|with|IN a|a|DT strong|strong|JJ monsoon|monsoon|NN system|system|NN ,|,|, if|if|IN circulation|circulation|NN changes|change|NNS enough|enough|RB to|to|TO change|change|VB where|where|WRB and|and|CC when|when|WRB rain|rain|NN is|be|VBZ delivered|deliver|VBN ,|,|, then|then|RB that|that|WDT could|could|MD have|have|VB an|a|DT impact|impact|NN that|that|WDT has|have|VBZ not|not|RB been|be|VBN captured|capture|VBN in|in|IN the|the|DT large|large|JJ -|-|: scale|scale|NN evaluations|evaluation|NNS ,|,|, "|"|NN Ashfaq|Ashfaq|NNP said|say|VBD .|.|. Tiếng Việt "|Nn Ngay_cả|Aa với|Cm một|Nq mạnh_mẽ|Nn gió_mùa|Nn hệ_thống|Nn ,|PU nếu|Cm lƣu_thông|Nn thay_đổi|Nn đủ|Aa để|Cm thay_đổi|Vv nơi|Nt và|Cp khi|Nt mƣa|Nn đƣợc|Vv giao|Vv ,|PU sau|Aa đó|Vc có_thể|R có|Vv một|Nq tác_động|Nn mà|Cp đã|R không|R đƣợc|Vv giữ|Vv trong|Cm quy_mô|Aa lớn|Nn đánh_giá|Nn ,|PU "|Nn Ashfaq|Ashfaq|NNP|UNK nói|Vv .|PU Tiếng Việt Từ loại Tiếng Anh Từ Từ loại Từ Trang 73 o Mô hình dịch từ từ loại tiếng Anh sang từ loại tiếng Việt không chính xác. Do hai ngôn ngữ này khác biệt nhiều về đặc điểm hình thái từ. Tiếng Anh Matthew|matthew|NNP Huber|Huber|NNP ,|,|, assistant|assistant|JJ professor|professor|NN of|of|IN earth|earth|NN and|and|CC atmospheric|atmospheric|JJ sciences|science|NNS at|at|IN Purdue|Purdue|NNP University|university|NNP ,|,|, says|say|VBZ no|no|DT evidence|evidence|NN of|of|IN global|global|JJ cooling|cool|NN during|during|IN the|the|DT period|period|NN had|have|VBD been|be|VBN found|find|VBN .|.|. Tiếng Việt Matthew|matthew|NNP|UNK Huber|Nr ,|PU trợ_lý|Nn giáo_sƣ|Aa của|Cm trái_đất|Nn và|Cp khí_quyển|Nn khoa_học|Nn tại|Cm Đại_học|Nn Purdue|Nr ,|PU nói|Vc không|Nq bằng_chứng|Nn của|Cm toàn_cầu|Aa mát|Nn trong|Cm thời_kỳ|Nn này|Pd đã|R đƣợc|Vv tìm|Vv thấy|Vv .|PU Tiếng Anh Several|several|JJ other|other|JJ areas|area|NNS along|along|IN Phu|Phu|NNP Quoc|Quoc|NNP National|national|NNP Park|park|NNP 's|'s|POS border|border|NN with|with|IN Ham|Ham|NNP Ninh|Ninh|NNP Commune|Commune|NNP were|be|VBD found|find|VBN with|with|IN newly|newly|RB -|-|: cut|cut|NN stumps|stump|NNS and|and|CC cleared|clear|VBD hillsides|hillside|NNS .|.|. Tiếng Việt Một_số|Aa các|Nq khu_vực|Nn khác|Aa dọc|Cm Vƣờn_quốc_gia|Nn Phú_Quốc|Nr của|Cm biên_giới|Nn với|Cm xã|Nn Hàm_Ninh|Nr đƣợc|R tìm|Vv thấy|Vv với|Cm vừa|Aa - |PU cắt_giảm|Nn gốc|Nn và|Cp khai_hoang|Vv sƣờn|Nq đồi|Nn .|PU Trang 74 Tiếng Anh Once|once|RB the|the|DT team|team|NN identified|identify|VBD the|the|DT global|global|JJ cooling|cool|NN ,|,|, the|the|DT next|next|JJ step|step|NN was|be|VBD to|to|TO find|find|VB what|what|WP caused|cause|VBD it|it|PRP .|.|. Tiếng Việt Một_khi|R các|Nq nhóm|Nn xác_định|Vv toàn_cầu|Aa mát|Nn ,|PU tiếp_theo|Aa bƣớc|Vv là|Vv để|Cm tìm|Vv những|Nq gì|Nn đã|R gây|Vv ra|R nó|Pp .|PU 4.4. Tóm tắt kết quả thí nghiệm Nhƣ vậy, kết quả khảo sát ảnh hƣởng của thông tin hình thái từ vào hệ dịch thống kê Anh – Việt có thể tóm tắt lại nhƣ sau: - Thông tin hình thái từ của tiếng Anh: o Tích hợp trực tiếp từ loại và biến đổi hình thái từ: Hệ dịch có thể khử nhập nhằng nhờ thông tin từ loại và giảm số từ chƣa gặp khi biến đổi về dạng nguyên mẫu. Tuy nhiên, do kết quả phụ thuộc vào độ chính xác của công cụ và độ bao phủ của ngữ liệu nên kết quả dịch vẫn chƣa cải tiến đƣợc so với hệ cơ sở. o Chuyển đổi trật tự từ dựa trên từ loại: Kết quả dịch đƣợc cải thiện đáng kể do câu nguồn đƣợc chuyển đổi trật tự nhằm tạo sự tƣơng đƣơng với câu đích. - Thông tin hình thái từ của tiếng Việt: o Gán nhãn ranh giới từ: Chất lƣợng dịch tăng lên so với hệ cơ sở do khi nối các tiếng trong từ của câu tiếng Việt, số liên kết gióng hàng từ 1 – nhiều giảm đáng kể và kết quả thống kê trong mô hình dịch cũng nhƣ mô hình ngôn ngữ chính xác hơn do từ không bị gián đoạn trong quá trình rút trích ngữ. o Gán nhãn từ loại: Kết quả dịch giảm do hệ dịch phụ thuộc vào kết quả gán nhãn và mô hình ngôn ngữ của từ loại tiếng Việt. Trang 75 - Thông tin hình thái từ cho cả tiếng Anh và tiếng Việt: o Chất lƣợng dịch của mô hình factored SMT giảm đáng kể so với hệ cơ sở do quá trình dịch từ từ loại tiếng Anh sang từ loại tiếng Việt thiếu chính xác. Điều này dẫn đến hệ thống chọn ra câu dịch tệ hơn so với hệ cơ sở. Ngoài ra, khảo sát kết quả của các mô hình khi tích hợp các thông tin hình thái từ, mô hình chuyển đổi trật tự cho câu tiếng Anh và gán nhãn từ loại cho tiếng Việt đạt kết quả dịch cao nhất, điểm BLEU tăng từ 43,31 lên 46,49. Trang 76 CHƢƠNG 6: KẾT LUẬN Trong đề tài này chúng tôi đã tích hợp các tri thức ngôn ngữ về hình thái từ vào trong dịch máy thống kê Anh - Việt. Hệ thống đạt chất lƣợng dịch tốt nhất khi áp dụng luật chuyển đổi trật tự dựa trên thông tin từ loại cho câu tiếng Anh và gán nhãn từ loại cho câu tiếng Việt. Điểm BLUE từ 43,31 đến 45,88, điểm NIST tăng từ 9,8269 đến 10,01 và tỉ lệ lỗi TER giảm từ 37,914 xuống 35,850. Tuy nhiên, khi các tri thức về từ loại lại không làm tăng chất lƣợng dịch. Điều này có thể lí giải do chất lƣợng của công cụ gán nhãn từ loại. Một phần nữa là do khi kết hợp với nhãn từ loại, độ phân tán của các từ sẽ tăng, dẫn đến việc hệ thống không dịch đƣợc các từ này. Ngoài ra, việc áp dụng luật chuyển đổi trật tự cho câu nguồn đã có ảnh hƣởng tốt đến chất lƣợng dịch, nhờ cải thiện kết quả gióng hàng từ. Luật chuyển đổi cũng cải tiến hệ dịch khi kết hợp với các thông tin hình thái từ. Nhƣ vậy, không chỉ trong hệ dịch thống kê của các cặp ngôn ngữ khác, đối với cặp tiếng Anh và tiếng Việt, việc biến đổi để tạo sự tƣơng đồng giữa hai ngôn ngữ đã phát huy thế mạnh của hệ dịch máy thống kê, vừa học tự động trên ngữ liệu, vừa xử lý dựa trên những tri thức ngôn ngữ. Tóm lại có hai điểm quan trọng đƣợc rút ra sau khi thực hiện đề tài: - Các tri thức ngôn ngữ khác nhau đóng góp khác nhau vào chất lƣợng hệ dịch. Việc kết hợp các tri thức này hợp lí sẽ làm tăng đáng kể chất lƣợng dịch của hệ thống. - Cách sử dụng khác nhau một tri thức ngôn ngữ để tích hợp vào hệ dịch máy thống kê cũng tạo ra các hiệu quả khác nhau đối với hệ dịch. Trang 77 Trong tƣơng lai, đề tài có thể mở rộng theo các hƣớng sau nâng cao hiệu quả của hệ dịch bằng cách tích hợp thêm một số tri thức khác vào hệ dịch nhƣ thông tin cú pháp để chuyển đổi trật tự từ hoặc thông tin ngữ nghĩa để chọn từ dịch chính xác. Trang 78 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Đinh Điền (2001), So sánh trật tự từ của định ngữ giữa tiếng Anh và tiếng Việt. Tạp chí Khoa học Xã hội và Nhân văn, Trƣờng Đại học Khoa học Xã hội và Nhân văn Tp. Hồ Chí Minh. [2] Hoàng Công Duy Vũ, Văn Chí Nam, Đinh Điền (2006), Dịch máy thống kê Anh – Việt, Việt – Anh kết hợp thông tin ngôn ngữ tiếng Việt. Hội nghị kỷ niệm 30 năm thành lập Viện CNTT, Hà Nội. [3] Vũ Ngọc Tú (1996), Nghiên cứu đối chiếu trật tự từ Anh-Việt trên một số cấu trúc cú pháp cơ bản, Luận án phó tiến sĩ khoa học ngữ văn. Tiếng Anh [4] A. Stolcke, 2002, SRILM - An Extensible Language Modeling Toolkit, In Proceedings of Intl. Conf. Spoken Language Processing, Denver, Colorado, September 2002. [5] Alexandra Birch, Miles Osborne, Philipp Koehn, 2007, CCG supertags in factored statistical machine translation. In Proceedings of the Second Workshop on Statistical Machine Translation (ACL), Prague, Czech Republic, page 9-16. [6] Chao Wang, Michael Collins, and Phillip Koehn, 2007. Chinese Syntactic Reordering for Statistical Machine Translation, in Proceeding of EMNLP, 2007. [7] Collins, M., Koehn, P. and Kucerova, I. (2005), Clause restructuring for statistical machine translation, Proceedings of the 43rd Annual Meeting of the Assoc. for Computational Linguistics (ACL), pp. 531-540. [8] Doddington, G. (2002), Automatic Evaluation of Machine Translation Quality Using N-gram Co-Occurrence Statistics, Proceedings of the second international conference on Human Language Technology Research, pp. 138 – 145. Trang 79 [9] Eugene Charniak, Kevin Knight, and Kenji Yamada, 2003. Syntax-based Language Models for Statistical Machine Translation. In Proceedings of the Ninth Machine Translation Summit of the International Association for Machine Translation, New Orleans, Louisiana, September 2003. [10] F. J. Och and H. Ney, 2000, Improved statistical alignment models, In Proceedings of ACL 2000. [11] F. Xia and M. McCord. 2004. Improving a statistical MT system with automatically learned rewrite pat-terns. In Proceedings of COLING 2004. [12] Habash, Nizar. Syntactic Preprocessing for Statistical Machine Translation, In Proceedings of the Machine Translation Summit (MT-Summit), Copenhagen, Denmark, 2007. [13] J. Giménez and L. Márquez, 2004, SVMTool: A general POS tagger generator based on Support Vector Machines, In Proceedings of the 4th International Conference on Language Resources and Evaluation, Lisbon, Portugal, 2004 [14] J. May and K. Knight, 2007. Syntactic Re-Alignment Models for Machine Translation. In Proceeding EMNLP-CoNLL. [15] K. Rottmann and S. Vogel, 2008, Word reordering in statistical machine translation with a POS-based distortion model, In Proceedings of the 11th International Conference on Theoretical and Methodological Issues in Machine Translation, Skovde (Sweden), pp.171-180, 7-9 September 2007 [16] K. Toutanova, H.T. Ilhan, and C.D. Manning, 2002, Extensions to HMM- based statistical word alignment models, In Proceedings of Conf. on Empirical Methods for Natural Language Processing, pages 87-94, Philadelphia, PA, July 2002 [17] Koehn, P., Och, F. J., and Marcu, D. (2003), Statistical phrase-based translation, Proceedings of the HLT-NAACL 2003 conference, pp. 127–133. [18] Koehn, P. (2003), Lecture of Statistical Machine Translation. [19] Libin Shen, Jinxi Xu, Bing Zhang, Spyros Matsoukas, Ralph Weischedel (2009). Effective Use of Linguistic and Contextual Information for Statistical Trang 80 Machine Translation. In Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing (August 2009), pp. 72-80. [20] M. Popovic, H. Ney, 2006, POS-based Word Reorderings for Statistical Machine Translation, In Proceedings of the LREC 2006, Genova, Italy, May 2006 [21] Maria Holmqvist, Sara Stymne, Lars Ahrenberg (2007). Getting to know Moses: initial experiments on German--English factored translation. In Proceedings of the Second Workshop on Statistical Machine Translation (ACL), Prague, Czech Republic, page 181-184 [22] Minnen, G., J. Carroll and D. Pearce, 2001, Applied morphological processing of English, Natural Language Engineering, 7(3), pages 207-223. [23] N. Ueffing, and H. Ney, 2003, Using POS Information for Statistical Machine Translation into Morphologically Rich Languages, In Conference of the European Chapter of the Association for Computational Linguistics (EACL), pages 347-354, Budapest, Hungary, April 2003 [24] Nhung N., Dien D., 2008. A syntactic-based Word Re-ordering for English- Vietnamese Statistical machine translation system. In Proceeding of PRICAL 2008, LNAI 5351, pp 809 – 818, 2008. [25] P. F. Brown, S. A. D. Pietra, V. J. D. Pietra, and R. L. Mercer, 1993, The mathematics of statistical machine translation, Computational Linguistics. 22(1): 39-69. [26] P. Koehn, F. J. Och, and D. Marcu, 2003, Statistical phrase-based translation, In Proceedings of HLT-NAACL 2003. [27] P. Koehn, H. Hoang, 2007. Factored Translation Models. In Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning (ACL), pp. 868– 876, Prague, June 2007. [28] Papineni K. A., Roukos S., Ward T., and Zhu W.J (2002), Bleu: a method for automatic evaluation of machine translation, Proceedings of the 40th Trang 81 Annual Meeting of the Association for Computational Linguistics, pp. 311– 318. [29] S. NieBen and H. Ney, 2001, Morpho-syntactic analysis for reordering in statistical machine translation, In Proceedings of MT Summit VIII, pages 247- 252, Santiago de Compostela, Galicia, Spain, September 2001. [30] Sonja Nießen, Hermann Ney, 2000, Improving SMT quality with morpho- syntactic analysis. In Proceedings of the 18th conference on Computational linguistics - Volume 2 (ACL), Saarbrücken, Germany, page 1081-1085. [31] Snover M., Dorr B., Schwartz R., Micciulla L. and Makhoul J (2006), A study of translation edit rate with targeted human annotation, Proceedings of Association for Machine Translation in the Americas, pp. 223 – 231. [32] Thai Phuong Nguyen and Akira Shimazu, 2006, Improving Phrase-Based SMT with Morpho-Syntactic Analysis and Transformation, In Proceedings of the 7th Conference of the Association for Machine Translation in the Americas, pages 138-147, Cambridge, 2006 [33] Victoria Fossum, Kevin Knight and Steven Abney, 2008. Using Syntax to Improve Word Alignment Precision for Syntax-Based Machine Translation. In Proceedings of ACL MT Workshop, 2008. [34] Yamada,K. and Knight, K. (2001), A syntax-based statistical machine translation, Proceedings of ACL. [35] Yuqi Zhang, Richard Zens and Hermann Ney. 2007. Chunk-level reordering of source language sentence with automatically learned rules for statistical machine translation. In Proceedings of SSST, NAACL-HLT 2007/AMTA Workshop on Syntax and Structure in Statistical Translation. Trang 82 PHỤ LỤC A. Đối chiếu hình thái từ Anh – Việt (biến cách) Stt Ý nghĩa ngữ pháp Biến cách Nghĩa Từ loại 1 Danh từ số nhiều s những, các NNS 2 Ngôi thứ 3 số ít s VBZ 3 Sở hữu cách „s của POS 4 Hiện phân từ ing đang VBG 5 Quá khứ ed đã VBD 6 Quá phân từ en đã VBN 7 So sánh hơn er hơn JJR,RBR 8 So sánh nhất est nhất JJS,RBS B. Kết quả dịch của một số mô hình Văn bản tiếng Anh In addition , Viet Nam now hosts a great variety of industries and many use dirty technology and waste natural resources . An estimated VND 124 trillion ( US $ 7.4 billion ) is needed to eliminate industrial pollution , a new Industrial Policy and Strategy Institute ( IPSI ) study shows . The quantity of HCFCs , particularly R22 , used in the refrigerating and air - conditioning industries is on the increase , Thanh said , adding that finding an ideal alterative refrigerant is a major challenge facing the industry . It is situated about 20 kilometers from Cao Lanh Town along National Highway 30 . " We still had coffee and food and they organised stuff so we could get out , " she said . Trang 83 Dust in the air is 113 - 230 - times above the permitted level , the content of some metals in waste water ten times thicker than the acceptable level . A project to build Ha Long into a smoke - free tourist city started in Ha Long city , northern coastal Quang Ninh province on Sept . As the driest province in the country with annual rainfall between 700 and 1,100 millimeters , Ninh Thuan is endowed with a coastline , deltas , mountains , rivers , and sand dunes . It , however , warned that rising sea - level would cost the habitats of such rare , endangered and endemic species like the leopard gecko , which lives only in the lowland area of the region . The Minister for Natural Resources and the Environment , Pham Khoi Nguyen , will then chair a workshop on what Vietnam has been doing to cope with the problems brought on by global warming and rising sea levels . Sanctuary established for under threat snub - nosed monkeys in Ha Giang . Heavy rain and strong winds pounded Italy on Monday , claiming the lives of four people , ANSA news agency reported . A hole with the length of two metres is on the blocked road Phainam - the road nearby Chao Anuvong Stadium . Running the club is very difficult for me because we lack money , but with supports from members , we still manage the club effectively . When not working as an architect he dedicates much of his time to running the Viet Nam Amateur Club of Astronomy . Vietnam has begun an initiative to raise its capacity in coping with A / H1N1 flu , a Red Cross official said in Hanoi September 16 . According to him , the country has met almost all of its health care targets set for the 2006 - 2010 period . Vietnam has continued to receive messages of sympathy from leaders of other countries over the losses of human life and poverty caused by typhoon Ketsana . Trang 84 Russian President Dmitri Medvedev on Oct . 2 cabled a message to his Vietnamese counterpart Nguyen Minh Triet , saying , " Russia is willing to help Vietnam overcome the natural disaster ' s consequences " . Kết quả dịch hệ cơ sở In bổ sung , Việt Nam hiện vật chủ rất nhiều loại của các ngành công nghiệp và nhiều sử dụng bẩn công nghệ và chất thải các nguồn tài nguyên thiên nhiên . Ƣớc tính đồng 124 nghìn tỷ đồng ( US $ 7.4 tỷ ) là cần thiết để loại bỏ ô nhiễm công nghiệp , một mới , công nghiệp và chính sách chiến lƣợc Viện ( IPSI ) nghiên cứu cho thấy . Các số lƣợng HCFCs , đặc biệt là R22 , đƣợc sử dụng trong điện lạnh và không khí - điều hoà ngành công nghiệp đang tăng lên , Thành cho biết , nói thêm rằng việc tìm kiếm một lý tƣởng alterative refrigerant là một lớn thách thức đối mặt với ngành công nghiệp . Nó nằm khoảng 20 km từ Cao Lãnh thị trấn theo Quốc lộ 30 . " Chúng tôi vẫn còn có cà phê và thực phẩm và họ đã tổ chức thứ nhƣ vậy , chúng tôi có thể thoát khỏi " , Cô nói . Bụi trong không khí là 113 - 230 - lần trên mức cho phép , nội dung của một số các kim loại trong nƣớc thải mƣời lần dày hơn so với các mức độ chấp nhận đƣợc . Một dự án để xây dựng Hạ Long vào một thuốc tự do thành phố du lịch đã bắt đầu tại thành phố Hạ Long , ven biển phía bắc tỉnh Quảng Ninh vào tháng 9 . Do khô nhất tỉnh ở các quốc gia với hàng năm lƣợng mƣa giữa 700 và số 1.100 mm , Ninh Thuận đƣợc ƣu đãi với một bờ biển , đồng bằng , núi , các con sông , và cồn cát . Trang 85 Nó , tuy nhiên , đã cảnh báo rằng sự gia tăng mực nƣớc biển sẽ chi phí môi trƣờng sống nhƣ vậy quý hiếm , đang bị đe dọa và đặc hữu loài nhƣ lƣợng con báo hoa mai tắc kè , mà còn chỉ tại các khu vực đất thấp của khu vực . Các Bộ trƣởng Bộ Tài nguyên và Môi trƣờng Phạm Khôi Nguyên , sau đó sẽ chủ trì một hội thảo về những gì mà Việt Nam đã đang làm để đối phó với các vấn đề đƣa vào bởi sự nóng lên toàn cầu và mực nƣớc biển tăng lên . Sanctuary thành lập cho bị đe dọa khỉ mũi tẹt trên Hà Giang . Hôm mƣa và gió mạnh pounded Ý vào thứ hai , làm thiệt mạng sống của bốn ngƣời , ANSA Hãng tin . Một lỗ với chiều dài của hai mét trên các chặn đƣờng Phainam - đƣờng gần Sân vận động Chao Anuvong . Hoạt động câu lạc bộ là rất khó khăn cho tôi bởi vì chúng tôi thiếu tiền , nhƣng với sự hỗ trợ từ các thành viên , chúng tôi vẫn quản lý các câu lạc bộ có hiệu quả . Khi không làm việc nhƣ một kiến trúc sƣ ông dedicates nhiều thời gian của mình để chạy Việt Nam Amateur Câu lạc bộ của nền thiên văn học . Việt Nam đã bắt đầu một sáng kiến để nâng cao của nó có khả năng trong việc đối phó với các bệnh cúm A / H1N1 , một Hội chữ thập đỏ chức nói tại Hà Nội ngày 16 tháng 9 . Theo ông , quốc gia đã đáp ứng gần nhƣ tất cả các của nó chăm sóc sức khỏe mục tiêu thiết lập cho năm 2006 - 2010 kỳ . Việt Nam đã tiếp tục nhận đƣợc thông điệp của đồng cảm từ các nhà lãnh đạo của các nƣớc khác trên những thiệt hại của cuộc sống con ngƣời và nghèo gây ra bởi bão Ketsana . Nga , Tổng thống Dmitri Medvedev vào ngày 2 tháng 10 cabled một thông điệp của ông đối tác Việt Nam Nguyễn Minh Triet , nói , " Nga sẵn sàng để giúp Việt Nam khắc phục những thảm họa thiên nhiên của những hậu quả " . Kết quả dịch sau khi thêm từ loại vào tiếng Anh Trang 86 In bổ sung , Việt Nam hiện có rất nhiều loại của các ngành công nghiệp và nhiều sử dụng bẩn công nghệ và chất thải các nguồn tài nguyên thiên nhiên . Ƣớc tính đồng 124 nghìn tỷ đồng ( Hoa Kỳ $ 7.4 tỷ đôla ) là cần thiết để loại bỏ ô nhiễm công nghiệp , một mới , công nghiệp và chính sách chiến lƣợc Viện ( IPSI ) nghiên cứu cho thấy . Các số lƣợng HCFCs , đặc biệt là R22 , đƣợc sử dụng trong các refrigerating và không khí - điều hoà ngành công nghiệp đang gia tăng , Thành cho biết , nói thêm rằng việc tìm kiếm một lý tƣởng alterative refrigerant là một lớn thách thức đối mặt với ngành công nghiệp . Nó nằm khoảng 20 km từ Cao Lãnh thị trấn dọc theo Quốc lộ 30 . " Chúng tôi vẫn còn có cà phê và thực phẩm và họ đã tổ chức thứ để chúng tôi có thể làm ra " , Cô nói . Bụi trong không khí là 113 - 230 - lần trên mức cho phép , nội dung của một số các kim loại trong nƣớc thải mƣời lần dày hơn so với các mức độ chấp nhận đƣợc . Một dự án để xây dựng Hạ Long vào một không khói thuốc thành phố du lịch đã bắt đầu tại thành phố Hạ Long , ven biển phía bắc tỉnh Quảng Ninh vào tháng 9 . Do khô nhất tỉnh ở trong nƣớc với hàng năm lƣợng mƣa giữa 700 và số 1.100 mm , Ninh Thuận đƣợc ƣu đãi với một bờ biển , đồng bằng , núi , các con sông , và cồn cát . Nó , tuy nhiên , đã cảnh báo rằng tăng mực nƣớc biển sẽ có chi phí môi trƣờng sống nhƣ vậy quý hiếm , đang bị đe dọa và đặc hữu loài nhƣ những con báo hoa mai phục kè , mà sống chỉ tại các khu vực đất thấp của khu vực . Các Bộ trƣởng cho Tài nguyên và Môi trƣờng Phạm Khôi Nguyên , sau đó sẽ chủ trì một hội thảo về những gì mà Việt Nam đã đang làm để đối phó với các vấn đề đƣa tiếp tục bởi sự nóng lên toàn cầu và mực nƣớc biển tăng lên . Sanctuary phát hiện cho bị đe dọa khỉ mũi tẹt trên Hà Giang . Trang 87 Hôm mƣa và gió mạnh pounded Ý vào thứ hai , làm thiệt mạng sống của bốn ngƣời , ANSA Hãng tin báo cáo . Một lỗ với chiều dài của hai mét trên các chặn đƣờng Phainam - đƣờng gần Sân vận động Chao Anuvong . Running câu lạc bộ là rất khó khăn cho tôi bởi vì chúng tôi thiếu tiền , nhƣng với sự hỗ trợ từ các thành viên , chúng tôi vẫn quản lý các câu lạc bộ có hiệu quả . Khi không làm việc nhƣ một kiến trúc sƣ ông dedicates nhiều thời gian của ông để chạy Việt Nam Amateur câu lạc bộ của Thiên văn học . Việt Nam đã bắt đầu một sáng kiến để nâng cao của nó có khả năng trong việc đối phó với các bệnh cúm A / H1N1 , một Hội Chữ thập đỏ quan chức nói tại Hà Nội ngày 16 tháng 9 . Theo ông , quốc gia đã đáp ứng gần nhƣ tất cả các của nó chăm sóc sức khỏe mục tiêu thiết lập cho năm 2006 - 2010 kỳ . Việt Nam đã liên tục để nhận thông điệp của đồng cảm từ các nhà lãnh đạo của các nƣớc khác trên những thiệt hại của cuộc sống con ngƣời và nghèo gây ra bởi bão Ketsana . Nga , Tổng thống Dmitri Medvedev vào ngày 2 tháng 10 cabled một thông điệp của ông đối tác Việt Nam Nguyễn Minh Triet , nói , " Nga sẵn sàng để giúp Việt Nam khắc phục những thảm họa thiên nhiên của những hậu quả " . Kết quả dịch sau khi áp dụng luật chuyển đổi trật tự In bổ sung , Việt Nam chủ nhà bây giờ là một loại lớn của các ngành công nghiệp và nhiều sử dụng công nghệ bẩn và chất thải các nguồn tài nguyên thiên nhiên . Ƣớc tính đồng 124 nghìn tỷ đồng ( US $ 7.4 tỷ đôla ) là cần thiết để loại bỏ ô nhiễm công nghiệp , một mới công nghiệp và chính sách chiến lƣợc Viện ( IPSI ) nghiên cứu cho thấy . Trang 88 Các số lƣợng HCFCs , đặc biệt là R22 , đƣợc sử dụng trong điện lạnh và không khí - điều hoà ngành công nghiệp đang gia tăng , Thành cho biết , nói thêm rằng việc tìm kiếm một lý tƣởng refrigerant alterative là một thách thức lớn đối với ngành công nghiệp . Nó nằm khoảng 20 km từ Cao Lãnh Town theo Quốc lộ 30 . " Chúng tôi đã vẫn còn cà phê và thực phẩm và họ đã tổ chức chất liệu để chúng tôi có thể thoát khỏi " , cô nói . Bụi trong không khí là 113 - 230 - lần so với mức cho phép , nội dung của một số các kim loại trong nƣớc thải mƣời lần dày hơn so với các mức độ chấp nhận đƣợc . Một dự án để xây dựng Hạ Long vào một khói - thành phố du lịch không bắt đầu tại thành phố Hạ Long , ven biển phía bắc tỉnh Quảng Ninh vào tháng 9 . Khi các tỉnh khô nhất trong nƣớc với lƣợng mƣa hàng năm khoảng 700 và 1.100 mm , Ninh Thuận đƣợc ƣu đãi với một bờ biển , đồng , núi , các con sông , và cồn cát . Nó , tuy nhiên , đã cảnh báo rằng sự gia tăng mực nƣớc biển sẽ chi phí môi trƣờng sống của quý hiếm , đang bị đe dọa và đặc hữu loài nhƣ vậy nhƣ con tắc kè những con báo hoa mai , mà sống chỉ tại các khu vực đất thấp của khu vực . Các Bộ trƣởng Bộ Tài nguyên và Môi trƣờng Phạm Khôi Nguyên , sẽ sau đó chủ trì một hội thảo về những gì mà Việt Nam đã đang làm để đối phó với các vấn đề đƣa vào bởi sự nóng lên toàn cầu và mực nƣớc biển tăng lên . Sanctuary thành lập cho bị đe dọa khỉ mũi tẹt trong Hà Giang . mƣa Heavy và gió mạnh pounded Ý vào thứ hai , làm thiệt mạng sống của bốn ngƣời , hãng tin ANSA báo cáo . Một lỗ với chiều dài của hai mét trên chặn đƣờng Phainam - đƣờng gần Sân vận động Chao Anuvong . Trang 89 Hoạt động câu lạc bộ là rất khó khăn cho tôi bởi vì chúng tôi thiếu tiền , nhƣng với sự hỗ trợ từ các thành viên , chúng tôi quản lý vẫn còn câu lạc bộ có hiệu quả . Khi làm việc không phải là một kiến trúc ông dedicates nhiều thời gian của ông để chạy Việt Nam Amateur Câu lạc bộ Thiên văn học . Việt Nam đã bắt đầu một sáng kiến để nâng cao năng lực của nó trong việc đối phó với các bệnh cúm A / H1N1 , một đồng bằng của Hội chữ thập đỏ cho biết tại Hà Nội ngày 16 tháng 9 . Theo ông , quốc gia đã đáp ứng gần nhƣ tất cả các chăm sóc sức khỏe mục tiêu của nó đƣợc đặt ra cho năm 2006 - 2010 thời gian . Việt Nam đã liên tục để nhận thông điệp cảm thông từ các nhà lãnh đạo của các quốc gia khác về thiệt hại của cuộc sống con ngƣời và nghèo gây ra bởi bão Ketsana . Nga , Tổng thống Dmitri Medvedev vào ngày 2 tháng 10 cabled một thông điệp đến đối tác Việt Nam của ông Nguyễn Minh Triet , nói , " Nga sẵn sàng để giúp Việt Nam khắc phục những thiên tai tự nhiên của những hậu quả " . Hệ dịch gán nhãn ranh giới từ tiếng Việt In bổ_sung , Việt_Nam hiện chủ_nhà rất nhiều loại của các ngành công_nghiệp và nhiều sử_dụng công_nghệ chất_thải bẩn và các nguồn tài_nguyên thiên_nhiên . Ƣớc_tính 124 nghìn tỷ đồng ( US $ 7.4 tỷ ) là cần_thiết để loại_bỏ ô_nhiễm công_nghiệp , một công_nghiệp mới và chính_sách Viện Chiến_lƣợc ( IPSI ) nghiên_cứu cho_thấy . Các số_lƣợng HCFCs , đặc_biệt là R22 , đƣợc sử_dụng trong refrigerating và điều_hoà không_khí - các ngành công_nghiệp đang gia_tăng , Thành cho_biết , nói thêm rằng việc tìm_kiếm một lý_tƣởng alterative refrigerant là một thách_thức lớn phải đối_mặt với các ngành công_nghiệp . Nó nằm khoảng 20 km từ Cao Lanh Thị_xã dọc theo Quốc_lộ 30 . Trang 90 " Chúng_tôi vẫn còn có cà_phê và thực_phẩm và chúng đƣợc tổ_chức stuff vì_vậy chúng_tôi có_thể nhận ra , cô ấy nói , " . bụi trong không_khí là 113 - 230 - lần trên các mức cho_phép , nội_dung của một_số các kim_loại trong nƣớc_thải mƣời lần dày hơn so với mức_độ chấp_nhận đƣợc . Một dự_án để xây_dựng Hạ_Long thành một không khói thuốc thành_phố du_lịch đã bắt_đầu tại thành_phố Hạ_Long , ven biển phía bắc tỉnh Quảng_Ninh vào tháng 9 . Do khô nhất tỉnh trong nƣớc với lƣợng mƣa hàng năm khoảng 700 và 1.100 mm , Ninh_Thuận đƣợc ƣu_đãi với một bờ biển , đồng_bằng , núi , các con sông , và cồn cát . Nó , tuy_nhiên , đã cảnh_báo rằng việc tăng mực nƣớc biển sẽ tốn môi_trƣờng sống nhƣ vậy quý_hiếm , đang bị đe_doạ và đặc_hữu loài nhƣ leopard tắc_kè , mà chỉ sống trong các khu_vực đất thấp của khu_vực . Các Bộ_trƣởng Bộ Tài_nguyên và Môi_trƣờng Phạm_Khôi_Nguyên , sau đó sẽ chủ_trì một hội_thảo về những gì Việt_Nam đã đƣợc làm để đối_phó với các vấn_đề đƣa vào do sự nóng lên toàn_cầu và mực nƣớc biển dâng cao . Tam_Nông thành_lập cho bị đe_doạ khỉ mũi tẹt trong Hà_Giang . Giao_thông mƣa và gió mạnh pounded Ý vào ngày thứ hai , làm thiệt_mạng cuộc_sống của bốn ngƣời , ANSA tin_tức cơ_quan báo_cáo . Một lỗ với chiều dài của hai mét là trên chặn đƣờng Phainam - đƣờng gần Sân_vận_động Chao_Anuvong . Hoạt_động câu_lạc_bộ là rất khó_khăn cho tôi bởi_vì chúng_tôi thiếu tiền , nhƣng với sự hỗ_trợ từ các thành_viên , chúng_tôi vẫn quản_lý câu_lạc_bộ có hiệu_quả . Khi không làm_việc nhƣ một architect ông dedicates nhiều thời_gian của ông để chạy Việt_Nam Lễ_hội Carlton của nền thiên_văn_học . Trang 91 Việt_Nam đã bắt_đầu một sáng_kiến để nâng_cao năng_lực của nó trong việc đối_phó với các bệnh cúm A / H1N1 , một Hội Chữ_thập_đỏ quan_chức nói tại Hà_Nội ngày 16 tháng 9 . Theo ông , quốc_gia đã đáp_ứng gần nhƣ tất_cả các chăm_sóc y_tế đặt ra mục_tiêu cho năm 2006 - 2010 thời_gian . Việt_Nam đã tiếp_tục nhận đƣợc những thông_điệp cảm_thông từ các nhà lãnh_đạo của các nƣớc khác trên những thiệt_hại của cuộc_sống con_ngƣời và nghèo gây ra bởi bão Ketsana . Nga Tổng_thống Dmitri Medvedev vào ngày 2 tháng 10 cabled một thông_điệp của ông đối_tác Việt_Nam Nguyễn đã Triet , nói rằng : " Nga sẵn_sàng để giúp Việt_Nam khắc_phục những thảm_hoạ thiên_nhiên của những hậu_quả " .

Các file đính kèm theo tài liệu này:

  • pdfĐề Tài- Tích hợp thông tin hình thái từ vào hệ dịch máy thống kê Anh-Việt.pdf