Một dự_án để xây_dựng Hạ_Long thành một không khói thuốc thành_phố
du_lịch đã bắt_đầu tại thành_phố Hạ_Long , ven biển phía bắc tỉnh
Quảng_Ninh vào tháng 9 .
Do khô nhất tỉnh trong nƣớc với lƣợng mƣa hàng năm khoảng 700 và 1.100
mm , Ninh_Thuận đƣợc ƣu_đãi với một bờ biển , đồng_bằng , núi , các con
sông , và cồn cát .
Nó , tuy_nhiên , đã cảnh_báo rằng việc tăng mực nƣớc biển sẽ tốn môi_trƣờng
sống nhƣ vậy quý_hiếm , đang bị đe_doạ và đặc_hữu loài nhƣ leopard tắc_kè ,
mà chỉ sống trong các khu_vực đất thấp của khu_vực .
Các Bộ_trƣởng Bộ Tài_nguyên và Môi_trƣờng Phạm_Khôi_Nguyên , sau đó
sẽ chủ_trì một hội_thảo về những gì Việt_Nam đã đƣợc làm để đối_phó với
các vấn_đề đƣa vào do sự nóng lên toàn_cầu và mực nƣớc biển dâng cao .
Tam_Nông thành_lập cho bị đe_doạ khỉ mũi tẹt trong Hà_Giang .
Giao_thông mƣa và gió mạnh pounded Ý vào ngày thứ hai , làm thiệt_mạng
cuộc_sống của bốn ngƣời , ANSA tin_tức cơ_quan báo_cáo .
Một lỗ với chiều dài của hai mét là trên chặn đƣờng Phainam - đƣờng gần
Sân_vận_động Chao_Anuvong .
Hoạt_động câu_lạc_bộ là rất khó_khăn cho tôi bởi_vì chúng_tôi thiếu tiền ,
nhƣng với sự hỗ_trợ từ các thành_viên , chúng_tôi vẫn quản_lý câu_lạc_bộ có
hiệu_quả .
92 trang |
Chia sẻ: aloso | Lượt xem: 1870 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Luận văn Tích hộp thông tin hình thái từ vào hệ dịch máy thống kê Anh - Việt, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
to|NNP
has|have|VBZ stated|state|VBN that|that|IN he|he|PRP
will|will|MD not|not|RB risk|risk|VB his|his|PRP$
player|player|NN .|.|.
Tuy nhiên , nó không rõ ràng nếu Hoàng sẽ chơi ngày hôm nay vì
Calisto đã tuyên bố rằng ông sẽ không mạo hiểm đối thủ .
Tuy nhiên, thông tin từ loại đã dẫn đến kết quả dịch tệ hơn hệ cơ sở do các lý do
sau:
o Mỗi từ tiếng Anh có thể có nhiều hơn một nhãn từ loại. Nhƣng ngữ liệu
không thể bao quát đƣợc hết mọi trƣờng hợp. Do đó, với cùng một từ đã
xuất hiện trong ngữ liệu huấn luyện nhƣng đƣợc đánh nhãn từ loại chƣa
gặp, hệ dịch xem nhƣ là một từ mới và không dịch đƣợc.
Ví dụ:
Ngữ liệu
The Control Board may use independent consultants to perform
assigned duties .
Ban kiểm soát có thể sử dụng các nhà tƣ vấn tự do để thực hiện
các nhiệm vụ đƣợc giao .
Baseline Ban kiểm soát có thể sử dụng độc lập consultants để thực hiện
Trang 58
các nhiệm vụ đƣợc giao .
Thêm từ loại
tiếng Anh
The|the|DT Control|control|NNP Board|board|NNP may|may|MD
use|use|VB independent|independent|JJ
consultants|consultant|NNS to|to|TO perform|perform|VB
assigned|assign|JJ duties|duty|NNS .|.|.
Ban kiểm soát có thể sử dụng độc lập consultants để thực hiện
assigned nhiệm vụ .
Từ “assigned” trong ngữ liệu huấn luyện đƣợc đánh nhãn VBN, động từ ở dạng quá
khứ phân từ nhƣng chƣa gặp trƣờng hợp từ “assigned” đƣợc đánh nhãn JJ, tính từ.
o Trƣờng hợp công cụ gán nhãn sai cũng tạo nên câu dịch tệ hơn. Vì khi
kết hợp với nhãn sai, từ tiếng Anh cũng tạo nên từ chƣa gặp trong ngữ
liệu. Xét ví dụ sau:
Ngữ liệu
Hitler also has a devastating new weapon to unveil - the magnetic
mine , dropped into the sea from the air to cling to a passing
vessel and explode .
Hitler cũng có một loại vũ khí tàn phá mới để công bố - mỏ từ
trƣờng , bị bỏ vào trong biển từ trên không để bám víu vào một
con tàu đi qua và nổ .
Baseline
Hitler cũng đã tàn phá vũ khí mới để công bố - magnetic mỏ ,
giảm xuống vào biển từ không khí để cling đến một thông qua
các tàu và explode .
Thêm từ loại
tiếng Anh
Hitler|hitler|NNP also|conjurer|RB has|have|VBZ a|a|DT
devastating|devastate|VBG new|new|JJ weapon|weapon|NN
to|to|TO unveil|unveil|VB -|-|: the|the|DT magnetic|magnetic|JJ
mine|mine|NN ,|,|, dropped|drop|VBD into|into|IN the|the|DT
sea|sea|NN from|from|IN the|the|DT air|air|NN to|to|TO
cling|cling|VB to|to|TO a|a|DT passing|pass|NN vessel|vessel|NN
Trang 59
and|and|CC explode|explode|VB .|.|.
Hitler cũng có một tàn phá vũ khí mới để công bố - magnetic mỏ
, giảm xuống vào biển từ không khí để cling đến một passing tàu
và explode .
o Ngoài ra, do hệ dịch chọn lựa ngữ dịch tƣơng ứng dựa trên nhãn từ loại
nên nhãn từ loại sai dẫn đến câu dịch cũng sai. Ví dụ:
Ngữ liệu
When Spring comes , Sa Dec bonsai village also starts its
festival .
Khi mùa xuân đến , làng cây cảnh Sa Đéc cũng bắt đầu lễ hội
của nó .
Baseline
Khi mùa xuân đến , Sa Đéc cây cảnh làng cũng bắt đầu của nó lễ
hội .
Thêm từ loại
tiếng Anh
When|when|WRB Spring|spring|NNP comes|come|VBZ ,|,|,
Sa|Sa|NNP Dec|Dec|NNP bonsai|bonsai|NN village|village|NN
also|conjurer|RB starts|start|VBZ its|its|PRP$ festival|festival|NN
.|.|.
Khi Lƣơng đến , Sa Đéc cây cảnh làng cũng bắt đầu của nó lễ
hội .
Từ đƣợc đánh nhãn sai làm ảnh hƣởng kết quả gióng hàng từ. Nếu từ không đƣợc
gióng hàng sẽ không đƣợc thống kê, do đó khi dịch hệ thống không gặp khi tra
phrase-table dẫn đến từ không đƣợc dịch.
ii. Ảnh hƣởng của biến đổi từ thành nguyên mẫu và phụ tố
Mặc dù việc phân tích từ tiếng Anh sang nguyên mẫu và phụ tố có cải thiện kết quả
dịch so với hệ dịch cơ sở. Nhƣng kết quả phân tích cũng tạo nên từ/ngữ chƣa gặp
trong ngữ liệu huấn luyện nên kết quả dịch nhìn chung bị giảm.
Trang 60
Sau đây là hai ví dụ cho thấy ảnh hƣởng tích cực của phép phân tích.
Ví dụ 1:
Ngữ liệu
No matter what happens , we ' ll be as well prepared as we can be
given the enormous potential for crowds .
Dù bất kỳ vấn đề nào xảy ra , chúng tôi sẽ chuẩn bị tốt khi chúng
tôi có thể đƣợc đƣa ra tiềm năng to lớn cho đám đông .
Baseline
Không có vấn đề về những gì sẽ xảy ra , chúng tôi sẽ là cũng
đƣợc chuẩn bị vì chúng tôi có thể đƣợc đƣa ra các rất lớn tiềm
năng cho các crowds .
Tách từ tiếng
Anh thành
nguyên mẫu
và phụ tố
No matter what happen s , we 'll be as well prepare ed as we can
be give en the enormous potential for crowd s .
Không có vấn đề những gì xảy ra , chúng tôi sẽ là cũng nhƣ đƣợc
chuẩn bị nhƣ chúng tôi có thể đƣợc đƣa ra những lớn tiềm năng
cho đám đông .
Ví dụ 2:
Ngữ liệu
The boat cruises down the canal making stops at points of
interest along the way .
Các chuyến đi tàu xuống kênh dừng tại các điểm thú vị trên
đƣờng đi .
Baseline
Các thuyền cruises xuống kênh làm dừng tại điểm của sự quan
tâm dọc theo đƣờng .
Tách từ tiếng
Anh thành
nguyên mẫu
và phụ tố
The boat cruise s down the canal make ing stop s at point s of
interest along the way .
Các thuyền đi xuống các kênh làm việc dừng tại điểm quan tâm
dọc theo đƣờng .
o Tuy nhiên, kết quả dịch tệ hơn so với hệ cơ sở trong các trƣờng hợp sau:
Trang 61
Ngữ liệu Tasmania has long been a location for cloud seeding programs ,
following apparent success with the programs in the 1960 's and
1970 's when significant rainfall increases of more than 30
percent were measured and reported by CSIRO scientists .
Tasmania từ lâu đã là nơi cho các chƣơng trình tạo mƣa nhân
tạo , sau thành công rực rỡ với các chƣơng trình trong những
năm 1960 và 1970 khi lƣợng mƣa tăng lên đáng kể với hơn 30
phần trăm đƣợc đo và báo cáo bởi các nhà khoa học CSIRO .
Baseline Tasmania từ lâu đã đƣợc một địa điểm cho các đám mây chƣơng
trình tạo mƣa nhân tạo , sau đây rõ ràng thành công với các
chƣơng trình trong những năm 1960 của và 1970 của khi quan
trọng lƣợng mƣa tăng hơn 30 phần trăm đã đƣợc đo và báo cáo
của cây trồng các nhà khoa học .
Tách từ tiếng
Anh thành
nguyên mẫu
và phụ tố
Tasmanium s have s long be en a location for cloud seed ing
program s , follow ing apparent success with the program s in
the 1960 ' s and 1970 ' s when significant rainfall increase s of
more than 30 percent be ed measure ed and report ed by CSIRO
scientist s .
Tasmania đã lâu dài đƣợc một địa điểm cho đám mây hạt giống
các chƣơng trình , đi theo rõ ràng thành công với các chƣơng
trình trong thập niên 1960 của và 1970 của khi quan trọng lƣợng
mƣa tăng của hơn 30 phần trăm đã đƣợc đo và báo cáo của
CSIRO các nhà khoa học .
o Do công cụ phân tích từ về nguyên mẫu dựa trên kết quả gán nhãn từ loại
nên nhãn từ loại sai sẽ dẫn đến kết quả phân tích sai.
Ngữ liệu
Professor Johnson was not involved in the study but wrote an
accompanying article in the same issue of Science , outlining its
Trang 62
significance .
Giáo sƣ Johnson đã không tham gia vào nghiên cứu này , nhƣng
đã viết một bài báo đi kèm trong cùng một ấn bản Khoa học ,
phác thảo ra ý nghĩa của nó .
Baseline
Giáo sƣ Johnson đã không tham gia vào việc nghiên cứu , nhƣng
đã viết một đi kèm bài viết trong cùng một vấn đề về Khoa học ,
phác thảo của nó có ý nghĩa .
Tách từ tiếng
Anh thành
nguyên mẫu
và phụ tố
Professor Johnson be ed not involve ed in the study but write ed
an accompanying article in the same issue of Science , outline
ing its significance .
Giáo sƣ Johnson là không liên quan đến việc nghiên cứu , nhƣng
đã viết một accompanying bài viết trong cùng một vấn đề của
Khoa học , phác thảo của nó có ý nghĩa .
Nhƣ vậy, việc tích hợp thông tin từ loại và hình thái của tiếng Anh đã có cải thiện
kết quả dịch trong một số trƣờng hợp. Tuy nhiên, kết quả dịch vẫn phụ thuộc rất
nhiều vào hiệu quả của các công cụ đánh nhãn từ loại và phân tích hình thái. Do đó,
từ trong câu tiếng Anh bị phân tích sai dẫn đến nhiều trƣờng hợp câu dịch tệ hơn hệ
cơ sở. Mặc khác, ngữ liệu không bao phủ hết các nhãn từ loại của từ cũng dẫn đến
hệ dịch không hiệu quả.
5.3.1.2. Chuyển đổi trật tự từ
Bảng 5.3. Kết quả dịch của các hệ chuyển đổi trật tự từ
BLEU NIST TER
Hệ cơ sở 43,31 9,8269 37,914
Chuyển đổi trật tự 45,88 9,9461 36,429
Trang 63
Bảng 5.3 hiển thị kết quả dịch của hệ dịch áp dụng luật chuyển đổi trật tự. Kết quả
cho thấy khi dùng luật chuyển đổi, hiệu quả dịch cao hơn so với hệ cơ sở.
Kết quả gióng hàng từ cho thấy, sau khi áp dụng luật chuyển đổi trật tự cho câu
nguồn, số lƣợng gióng hàng chéo giảm đáng kể. Do câu tiếng Anh đã đƣợc thay đổi
vị trí sao cho gần giống với tiếng Việt nhất. Nhờ vậy, hệ thống dịch hiệu quả hơn.
Ngữ liệu
Our training time is too long and could limit the doctors '
motivation and waste our medical talent .
Thời gian đào tạo của chúng tôi là quá dài và có thể giới hạn
động cơ của các bác sĩ và lãng phí tài năng y học của chúng ta .
Baseline
của chúng tôi đào tạo thời gian là quá lâu dài và có thể giới hạn
sự bác sĩ của động lực và chất thải của chúng tôi y tế tài năng .
Chuyển đổi
trật tự
time training Our is too long and could limit the motivation '
doctors and waste talent medical our .
thời gian đào tạo của chúng tôi là quá lâu dài và có thể giới hạn
sự động lực của các bác sĩ và chất thải tài năng y tế của chúng
tôi .
Ngữ liệu
But his real interest remains in the distant provinces of the
empire .
Nhƣng sự quan tâm thực sự của ông vẫn còn ở các tỉnh xa xôi
của đế quốc .
Baseline Nhƣng ông thực sự quan tâm vẫn còn ở xa xôi tỉnh của đế quốc .
Chuyển đổi
trật tự
But interest real his remains in the provinces distant of the
empire .
Nhƣng sự quan tâm thực sự của ông vẫn còn ở các tỉnh xa xôi
Trang 64
của đế quốc .
Tuy nhiên, không phải trƣờng hợp áp dụng luật nào cũng cải thiện đƣợc hệ dịch. Vì
không phải luật nào cũng bao quát đƣợc mọi trƣờng hợp. Luật đƣợc áp dụng sai dẫn
đến lƣợng gióng hàng chéo trong câu lại tăng lên, kéo theo kết quả dịch tệ hơn so
với hệ dịch cơ sở.
Ngữ liệu
In the plan toward the year 2010 , Vietnam National
Administration of Tourism declares Van Phong as " the most
important region for tourism development " .
Trong kế hoạch hƣớng tới năm 2010 , Tổng cục Du lịch Việt
Nam công bố Văn Phong là khu phát triển du lịch quan trọng
nhất .
Baseline
Trong các kế hoạch hƣớng đến năm 2010 , Việt Nam Tổng cục
Du lịch tuyên bố Vân Phong là " quan trọng nhất của khu vực
cho phát triển du lịch " .
Chuyển đổi
trật tự
In the plan toward the year 2010 , Vietnam National
Administration of Tourism declares Van Phong as " the most
region important for tourism development " .
Trong các kế hoạch đến năm 2010 , Việt Nam Tổng cục Du lịch
tuyên bố Vân Phong là " hầu hết các khu vực quan trọng cho
phát triển du lịch " .
5.1.1.1. Thêm thông tin hình thái từ trong câu tiếng Việt
Thông tin hình thái từ của tiếng Việt đƣợc khảo sát bao gồm ranh giới từ và từ loại.
i. Phân đoạn từ trong câu tiếng Việt
Kết quả dịch của các mô hình tách từ cho tiếng Việt nhƣ sau:
Trang 65
Bảng 5.4. Kết quả dịch của các hệ tích hợp thông tin hình thái từ vào câu tiếng Việt
BLEU NIST TER
Hệ cơ sở 43,31 9,8269 37,914
Tách từ tiếng Việt 44,19 9,9079 37,103
Đổi trật tự từ tiếng Anh 45,88 9,9461 36,429
Đổi trật tự từ tiếng Anh +
Tách từ tiếng Việt
46,49 10,0107 35,850
Kết quả cho thấy hệ dịch đƣợc cải thiện nếu khi gán nhãn ranh giới từ cho câu tiếng
Việt. Khi kết hợp chuyển đổi trật tự từ ở câu tiếng Anh và phân đoạn từ tiếng Việt,
kết quả đƣợc cải tiến đáng kể.
Hiệu quả dịch đƣợc nâng cao do số liên kết gióng hàng từ 1− 𝑛 (liên kết giữa 1
token với nhiều token) giảm đáng kể và từ trong các ngữ đƣợc rút ra không bị gián
đoạn. Nhờ vậy, hệ dịch có thể thống kê các cặp ngữ chính xác hơn và tìm kiếm câu
dịch tốt hơn.
Bảng 5.5. Số liên kết gióng hàng từ trong các mô hình
Tổng số liên kết
Số liên kết trung
bình trong câu
Cơ sở 771.492 37,74
Tách từ tiếng Việt 616.846 30,18
Đổi trật tự tiếng Anh 770.424 37,69
Đổi trật tự tiếng Anh +
Tách từ tiếng Việt
616.589 30,16
Sau đây là một số ví dụ cho kết quả gióng hàng từ của hệ cơ sở và hệ dịch có câu
tiếng Việt đƣợc tách từ:
Ví dụ 1:
Trang 66
All industrial and processing zones must have waste treatment
systems .
Tất_cả các khu công_nghiệp và khu chế_xuất phải có các
hệ_thống xử_lý chất_thải .
Kết quả gióng hàng từ hệ baseline:
0-0 0-1 4-2 4-3 1-4 1-5 2-6 3-7 4-7 3-8 3-9 5-10 6-11 9-13 9-14 8-15 8-16 7-17
7-18 10-19
All industrial and processing zones must have waste treatment systems .
Tất cả các khu công nghiệp và khu chế xuất phải có các hệ thống xử lý chất thải .
Kết quả gióng hàng từ của hệ dịch khi tách từ:
0-0 4-2 1-3 2-4 4-5 3-6 5-7 6-8 9-10 8-11 7-12 10-13
All industrial and processing zones must have waste treatment systems .
Tất_cả các khu công_nghiệp và khu chế_xuất phải có các hệ_thống xử_lý chất_thải .
Ví dụ 2:
On the way to the central provinces of Binh Thuan and Ninh
Thuan , tourists can catch a view of deserted sand dunes and
peaceful villages.
Trên đường đến các tỉnh miền trung của tỉnh Bình Thuận và
Ninh Thuận , các du khách có thể bắt gặp cảnh một cồn cát
hoang vu và những ngôi làng yên bình .
Kết quả gióng hàng từ của hệ cơ sở:
0-0 2-1 3-2 4-3 6-4 5-5 5-6 7-7 6-8 8-9 9-10 10-11 11-12 12-13 13-14 14-15
14-16 14-17 15-18 15-19 16-20 16-21 18-22 17-23 22-24 21-25 20-26 20-27
23-28 22-29 25-30 25-31 24-32 24-33 26-34
Trang 67
On the way to the central provinces of Binh Thuan and Ninh Thuan , tourists
Trên đƣờng đến các tỉnh miền trung của tỉnh Bình Thuận và Ninh Thuận , các du khách
can catch a view of deserted sand dunes and peaceful villages .
có thể bắt gặp cảnh một cồn cát hoang vu và những ngôi làng yên bình .
Kết quả gióng hàng từ của hệ có tách từ tiếng Việt:
0-0 2-1 3-2 4-3 6-4 5-5 5-6 7-7 8-8 10-10 11-11 12-11 13-12 14-13 14-14 15-
15 16-16 18-17 17-18 22-19 21-20 20-21 23-22 25-24 25-25 24-26 26-27
On the way to the central provinces of Binh Thuan and Ninh Thuan , tourists
Trên đƣờng đến các tỉnh miền trung của tỉnh Bình_Thuận và Ninh_Thuận , các du_khách
can catch a view of deserted sand dunes and peaceful villages .
có_thể bắt_gặp cảnh một cồn cát hoang_vu và những ngôi làng yên_bình .
Sau đây là một số kết quả dịch của hệ dịch cơ sở và hệ dịch có tách từ tiếng Việt:
Ngữ liệu
Each member of the Management Board shall have a single vote .
Mỗi thành viên của Hội đồng quản trị sẽ có một phiếu bầu duy
nhất .
Cơ sở
Mỗi một thành viên của Hội đồng quản trị sẽ có duy nhất có một
phiếu biểu quyết .
Tách từ
Mỗi thành_viên của Hội_đồng_quản_trị sẽ có một phiếu bầu
duy_nhất .
Trang 68
Ngữ liệu
Tasmania has long been a location for cloud seeding programs ,
following apparent success with the programs in the 1960 's and
1970 's when significant rainfall increases of more than 30
percent were measured and reported by CSIRO scientists .
Tasmania từ lâu đã là nơi cho các chƣơng trình tạo mƣa nhân
tạo , sau thành công rực rỡ với các chƣơng trình trong những năm
1960 và 1970 khi lƣợng mƣa tăng lên đáng kể với hơn 30 phần
trăm đƣợc đo và báo cáo bởi các nhà khoa học CSIRO .
Cơ sở
Tasmania từ lâu đã đƣợc một địa điểm cho các đám mây chƣơng
trình tạo mƣa nhân tạo , sau đây rõ ràng thành công với các
chƣơng trình trong những năm 1960 của và 1970 của khi quan
trọng lƣợng mƣa tăng hơn 30 phần trăm đã đƣợc đo và báo cáo
của cây trồng các nhà khoa học .
Tách từ
Tasmania từ lâu đã đƣợc một địa_điểm cho chƣơng_trình tạo
mƣa nhân_tạo , sau đây rõ_ràng thành_công với các
chƣơng_trình trong những năm 1960 của và 1970 của khi
đáng_kể lƣợng mƣa tăng hơn 30 phần_trăm đã đƣợc đo và
báo_cáo của CSIRO các nhà khoa_học .
ii. Tích hợp thông tin từ loại trong câu tiếng Việt
Bảng 5.6 Kết quả dịch của hệ dịch tích hợp từ loại tiếng Việt
BLEU NIST TER
Hệ cơ sở 43,31 9,8269 37,914
Thêm từ loại tiếng Việt 42,58 9,7837 38,072
Đổi trật tự từ tiếng Anh 45,88 9,9461 36,429
Đổi trật tự từ tiếng Anh +
Thêm từ loại tiếng Việt
44,99 9,8972 36,864
Trang 69
Kết quả cho thấy hệ dịch khi thêm thông tin từ loại vào phía tiếng Việt làm giảm
hiệu quả so với hệ cơ sở.
Đối với mô hình này, hệ thống học mô hình dịch từ từ tiếng Anh sang từ tiếng Việt.
Sau đó, hệ sẽ phát sinh từ loại cho từ tiếng Việt này. Bộ giải mã chọn câu tiếng Việt
đã đƣợc gán nhãn từ loại có xác suất cao nhất dựa vào mô hình dịch, mô hình ngôn
ngữ của từ và mô hình ngôn ngữ của từ loại.
Nhƣ vậy, hệ dịch này khác với hệ dịch cơ sở ở chỗ là chịu ảnh hƣởng của mô hình
ngôn ngữ của từ loại.
Khi khảo sát kết quả, chúng tôi nhận thấy kết quả phát sinh từ loại cho câu tiếng
Việt không chính xác, dẫn đến kết quả dịch cũng tệ hơn so với hệ cơ sở.
Ví dụ:
Ngữ liệu
From Belgium we got to know that : " it might be interesting for
you to know that currently an application for a field trial with
GM poplar trees is [ being ] considered .
Từ Bỉ , chúng_tôi đã cho_biết rằng : " có_thể rất thú_vị khi bạn
biết rằng hiện_nay một ứng_dụng cho thử_nghiệm bên ngoài với
GM cây dƣơng là [ đang ] đƣợc xem_xét .
Tách từ tiếng
Việt
Từ Bỉ , chúng_tôi nhận đƣợc biết rằng : " nó có_thể đƣợc thú_vị
cho bạn biết rằng hiện đơn xin cho một thử_nghiệm bên ngoài
với biến_đổi gen cây dƣơng là [ đƣợc coi là ] .
Thêm từ loại
tiếng Việt
Từ|Cm Bỉ|Nr ,|PU chúng_tôi|Pp đã|R nhận|Vv đƣợc|M biết|Vv
rằng|Cp :|PU "|PU nó|Pp có_thể|Aa đƣợc|Vv thú_vị|Aa cho|Cp
Tiếng Việt
Từ loại
Tiếng Anh
Từ Từ
Trang 70
bạn|Pp biết|Vv rằng|Cp hiện|Vv đơn|Nn xin|Vv cho|Cp một|Nq
thử_nghiệm|Nn bên|Nn ngoài|Nn với|Cp biến_đổi|Nn gen|Nn
cây|Nn dƣơng|Aa là|Vc [|PU đƣợc|Vv ]|PU xem_xét|Vv .|PU
Mặc khác, kết quả dịch bị chi phối rất nhiều bởi mô hình nhãn từ loại. Do xác suất
n-gram của từ loại thƣờng lớn hơn xác suất của chuỗi từ.
Xét câu dịch sau:
Ngữ liệu
Earlier , Hung signed a decision to take legal action over the
illegal transport and purchase of wild animals and handed over
both of the suspects and the evidence to the Lac Duong district
police for investigation .
Trƣớc đó , Hƣng đã ký một quyết_định để thực_hiện hành_động
pháp_lý đối_với việc vận_tải và mua_bán bất_hợp_pháp
động_vật hoang_dã và giao_nộp cả hai nghi_phạm và chứng_cứ
cho công_an huyện Lạc_Dƣơng để điều_tra .
Cơ sở
Trƣớc đó , Hƣng đã ký một quyết_định để thực_hiện hành_động
pháp_lý trong việc vận_chuyển và mua các động_vật hoang_dã
và bàn_giao cả các nghi_phạm và bằng_chứng đến Lạc_Dƣơng
huyện cảnh_sát để điều_tra .
Thêm từ loại
tiếng Việt
Trƣớc|Nn đó|Pd ,|PU ông|Nn Hùng|Nr đã|R ký|Vv một|Nq
quyết_định|Nn để|Cm thực_hiện|Vv các|Nq hành_động|Nn
pháp_lý|Nn trong|Cm việc|Nc vận_chuyển|Vv và|Cp mua|Vv
của|Cm các|Nq loài|Nn động_vật|Nn hoang_dã|Aa và|Cp
bàn_giao|Vv cả|Pp của|Cm các|Nq nghi_phạm|Nn và|Cp
bằng_chứng|Nn đến|Cm Lạc_Dƣơng|Nr huyện|Nu cảnh_sát|Nn
cho|Cp điều_tra|Vv .|PU
Xác suất chuỗi nhãn từ loại trong mô hình ngôn ngữ:
Trang 71
-0.8658289 Vv Nq Nn Nn Aa
-0.5041147 Vv Cm Nq Nn Nn
Rõ ràng xác suất 5-gram của chuỗi từ loại sau cao hơn, dẫn đến hệ dịch chọn câu
dịch tệ hơn. Sau đây là ví dụ khác cho thấy ảnh hƣởng của mô hình ngôn ngữ từ
loại.
Ngữ liệu
Under the monoculture plantation approach , the rubber
farmers must obey and follow the instructions given to them .
Theo phƣơng_pháp đồn_điền độc_canh , nông_dân trồng cây
cao_su phải tuân theo những hƣớng_dẫn đƣợc giao cho họ .
Cơ sở
Theo các đồn_điền độc_canh tiếp_cận , những ngƣời nông_dân
trồng cây cao_su phải tuân theo và làm theo hƣớng_dẫn đƣợc
trao cho họ .
Thêm từ loại
tiếng Việt
Theo|Vv các|Nq đồn_điền|Nn độc_canh|Vv tiếp_cận|Vv ,|PU
cao_su|Nn nông_dân|Nn phải|Vv tuân|Nn theo|Vv và|Cp
làm|Vv theo|Vv hƣớng_dẫn|Nn đƣợc|Vv trao|Vv cho|Cp họ|Pp
.|PU
5.1.1.2. Thêm thông tin hình thái từ cho cả tiếng Anh và tiếng Việt
Bảng 5.7. Kết quả dịch của các hệ tích hợp thông tin hình thái từ vào câu tiếng Anh và
tiếng Việt
BLEU NIST TER
Hệ cơ sở 43,31 9,8269 37,914
Từ loại tiếng Anh, từ loại
tiếng Việt
40,08 9,781 38,728
Từ loại, tách nguyên mẫu
tiếng Anh, từ loại tiếng
Việt
42,12 9,8169 38,254
Trang 72
Trong mô hình này, hệ thống dịch từ sang từ và từ loại sang từ loại bằng hai mô
hình dịch độc lập. Hiệu quả dịch của mô hình này giảm đáng kể so với hệ cơ sở.
Nguyên nhân làm giảm hiệu quả dịch là do ảnh hƣởng của mô hình ngôn ngữ từ
loại, nếu chuỗi từ loại phát sinh sai dẫn đến kết quả dịch cũng sai.
Từ loại của câu đích sai do 2 nguyên nhân:
o Từ loại trong câu nguồn sai, dẫn đến hệ thống dịch sang câu đích cũng sai.
Ví dụ:
Tiếng Anh
"|"|NN Even|even|RB with|with|IN a|a|DT strong|strong|JJ
monsoon|monsoon|NN system|system|NN ,|,|, if|if|IN
circulation|circulation|NN changes|change|NNS
enough|enough|RB to|to|TO change|change|VB
where|where|WRB and|and|CC when|when|WRB rain|rain|NN
is|be|VBZ delivered|deliver|VBN ,|,|, then|then|RB that|that|WDT
could|could|MD have|have|VB an|a|DT impact|impact|NN
that|that|WDT has|have|VBZ not|not|RB been|be|VBN
captured|capture|VBN in|in|IN the|the|DT large|large|JJ -|-|:
scale|scale|NN evaluations|evaluation|NNS ,|,|, "|"|NN
Ashfaq|Ashfaq|NNP said|say|VBD .|.|.
Tiếng Việt
"|Nn Ngay_cả|Aa với|Cm một|Nq mạnh_mẽ|Nn gió_mùa|Nn
hệ_thống|Nn ,|PU nếu|Cm lƣu_thông|Nn thay_đổi|Nn đủ|Aa
để|Cm thay_đổi|Vv nơi|Nt và|Cp khi|Nt mƣa|Nn đƣợc|Vv giao|Vv
,|PU sau|Aa đó|Vc có_thể|R có|Vv một|Nq tác_động|Nn mà|Cp
đã|R không|R đƣợc|Vv giữ|Vv trong|Cm quy_mô|Aa lớn|Nn
đánh_giá|Nn ,|PU "|Nn Ashfaq|Ashfaq|NNP|UNK nói|Vv .|PU
Tiếng Việt
Từ loại
Tiếng Anh
Từ
Từ loại
Từ
Trang 73
o Mô hình dịch từ từ loại tiếng Anh sang từ loại tiếng Việt không chính
xác. Do hai ngôn ngữ này khác biệt nhiều về đặc điểm hình thái từ.
Tiếng Anh
Matthew|matthew|NNP Huber|Huber|NNP ,|,|,
assistant|assistant|JJ professor|professor|NN of|of|IN
earth|earth|NN and|and|CC atmospheric|atmospheric|JJ
sciences|science|NNS at|at|IN Purdue|Purdue|NNP
University|university|NNP ,|,|, says|say|VBZ no|no|DT
evidence|evidence|NN of|of|IN global|global|JJ cooling|cool|NN
during|during|IN the|the|DT period|period|NN had|have|VBD
been|be|VBN found|find|VBN .|.|.
Tiếng Việt
Matthew|matthew|NNP|UNK Huber|Nr ,|PU trợ_lý|Nn
giáo_sƣ|Aa của|Cm trái_đất|Nn và|Cp khí_quyển|Nn
khoa_học|Nn tại|Cm Đại_học|Nn Purdue|Nr ,|PU nói|Vc
không|Nq bằng_chứng|Nn của|Cm toàn_cầu|Aa mát|Nn
trong|Cm thời_kỳ|Nn này|Pd đã|R đƣợc|Vv tìm|Vv thấy|Vv .|PU
Tiếng Anh
Several|several|JJ other|other|JJ areas|area|NNS along|along|IN
Phu|Phu|NNP Quoc|Quoc|NNP National|national|NNP
Park|park|NNP 's|'s|POS border|border|NN with|with|IN
Ham|Ham|NNP Ninh|Ninh|NNP Commune|Commune|NNP
were|be|VBD found|find|VBN with|with|IN newly|newly|RB -|-|:
cut|cut|NN stumps|stump|NNS and|and|CC cleared|clear|VBD
hillsides|hillside|NNS .|.|.
Tiếng Việt
Một_số|Aa các|Nq khu_vực|Nn khác|Aa dọc|Cm
Vƣờn_quốc_gia|Nn Phú_Quốc|Nr của|Cm biên_giới|Nn với|Cm
xã|Nn Hàm_Ninh|Nr đƣợc|R tìm|Vv thấy|Vv với|Cm vừa|Aa -
|PU cắt_giảm|Nn gốc|Nn và|Cp khai_hoang|Vv sƣờn|Nq đồi|Nn
.|PU
Trang 74
Tiếng Anh
Once|once|RB the|the|DT team|team|NN identified|identify|VBD
the|the|DT global|global|JJ cooling|cool|NN ,|,|, the|the|DT
next|next|JJ step|step|NN was|be|VBD to|to|TO find|find|VB
what|what|WP caused|cause|VBD it|it|PRP .|.|.
Tiếng Việt
Một_khi|R các|Nq nhóm|Nn xác_định|Vv toàn_cầu|Aa mát|Nn
,|PU tiếp_theo|Aa bƣớc|Vv là|Vv để|Cm tìm|Vv những|Nq gì|Nn
đã|R gây|Vv ra|R nó|Pp .|PU
4.4. Tóm tắt kết quả thí nghiệm
Nhƣ vậy, kết quả khảo sát ảnh hƣởng của thông tin hình thái từ vào hệ dịch thống
kê Anh – Việt có thể tóm tắt lại nhƣ sau:
- Thông tin hình thái từ của tiếng Anh:
o Tích hợp trực tiếp từ loại và biến đổi hình thái từ: Hệ dịch có thể khử
nhập nhằng nhờ thông tin từ loại và giảm số từ chƣa gặp khi biến đổi
về dạng nguyên mẫu. Tuy nhiên, do kết quả phụ thuộc vào độ chính
xác của công cụ và độ bao phủ của ngữ liệu nên kết quả dịch vẫn chƣa
cải tiến đƣợc so với hệ cơ sở.
o Chuyển đổi trật tự từ dựa trên từ loại: Kết quả dịch đƣợc cải thiện
đáng kể do câu nguồn đƣợc chuyển đổi trật tự nhằm tạo sự tƣơng
đƣơng với câu đích.
- Thông tin hình thái từ của tiếng Việt:
o Gán nhãn ranh giới từ: Chất lƣợng dịch tăng lên so với hệ cơ sở do
khi nối các tiếng trong từ của câu tiếng Việt, số liên kết gióng hàng từ
1 – nhiều giảm đáng kể và kết quả thống kê trong mô hình dịch cũng
nhƣ mô hình ngôn ngữ chính xác hơn do từ không bị gián đoạn trong
quá trình rút trích ngữ.
o Gán nhãn từ loại: Kết quả dịch giảm do hệ dịch phụ thuộc vào kết quả
gán nhãn và mô hình ngôn ngữ của từ loại tiếng Việt.
Trang 75
- Thông tin hình thái từ cho cả tiếng Anh và tiếng Việt:
o Chất lƣợng dịch của mô hình factored SMT giảm đáng kể so với hệ cơ
sở do quá trình dịch từ từ loại tiếng Anh sang từ loại tiếng Việt thiếu
chính xác. Điều này dẫn đến hệ thống chọn ra câu dịch tệ hơn so với
hệ cơ sở.
Ngoài ra, khảo sát kết quả của các mô hình khi tích hợp các thông tin hình thái từ,
mô hình chuyển đổi trật tự cho câu tiếng Anh và gán nhãn từ loại cho tiếng Việt đạt
kết quả dịch cao nhất, điểm BLEU tăng từ 43,31 lên 46,49.
Trang 76
CHƢƠNG 6: KẾT LUẬN
Trong đề tài này chúng tôi đã tích hợp các tri thức ngôn ngữ về hình thái từ vào
trong dịch máy thống kê Anh - Việt.
Hệ thống đạt chất lƣợng dịch tốt nhất khi áp dụng luật chuyển đổi trật tự dựa trên
thông tin từ loại cho câu tiếng Anh và gán nhãn từ loại cho câu tiếng Việt. Điểm
BLUE từ 43,31 đến 45,88, điểm NIST tăng từ 9,8269 đến 10,01 và tỉ lệ lỗi TER
giảm từ 37,914 xuống 35,850.
Tuy nhiên, khi các tri thức về từ loại lại không làm tăng chất lƣợng dịch. Điều này
có thể lí giải do chất lƣợng của công cụ gán nhãn từ loại. Một phần nữa là do khi kết
hợp với nhãn từ loại, độ phân tán của các từ sẽ tăng, dẫn đến việc hệ thống không
dịch đƣợc các từ này.
Ngoài ra, việc áp dụng luật chuyển đổi trật tự cho câu nguồn đã có ảnh hƣởng tốt
đến chất lƣợng dịch, nhờ cải thiện kết quả gióng hàng từ. Luật chuyển đổi cũng cải
tiến hệ dịch khi kết hợp với các thông tin hình thái từ. Nhƣ vậy, không chỉ trong hệ
dịch thống kê của các cặp ngôn ngữ khác, đối với cặp tiếng Anh và tiếng Việt, việc
biến đổi để tạo sự tƣơng đồng giữa hai ngôn ngữ đã phát huy thế mạnh của hệ dịch
máy thống kê, vừa học tự động trên ngữ liệu, vừa xử lý dựa trên những tri thức
ngôn ngữ.
Tóm lại có hai điểm quan trọng đƣợc rút ra sau khi thực hiện đề tài:
- Các tri thức ngôn ngữ khác nhau đóng góp khác nhau vào chất lƣợng hệ
dịch. Việc kết hợp các tri thức này hợp lí sẽ làm tăng đáng kể chất lƣợng
dịch của hệ thống.
- Cách sử dụng khác nhau một tri thức ngôn ngữ để tích hợp vào hệ dịch
máy thống kê cũng tạo ra các hiệu quả khác nhau đối với hệ dịch.
Trang 77
Trong tƣơng lai, đề tài có thể mở rộng theo các hƣớng sau nâng cao hiệu quả của hệ
dịch bằng cách tích hợp thêm một số tri thức khác vào hệ dịch nhƣ thông tin cú
pháp để chuyển đổi trật tự từ hoặc thông tin ngữ nghĩa để chọn từ dịch chính xác.
Trang 78
TÀI LIỆU THAM KHẢO
Tiếng Việt
[1] Đinh Điền (2001), So sánh trật tự từ của định ngữ giữa tiếng Anh và tiếng
Việt. Tạp chí Khoa học Xã hội và Nhân văn, Trƣờng Đại học Khoa học Xã
hội và Nhân văn Tp. Hồ Chí Minh.
[2] Hoàng Công Duy Vũ, Văn Chí Nam, Đinh Điền (2006), Dịch máy thống kê
Anh – Việt, Việt – Anh kết hợp thông tin ngôn ngữ tiếng Việt. Hội nghị kỷ
niệm 30 năm thành lập Viện CNTT, Hà Nội.
[3] Vũ Ngọc Tú (1996), Nghiên cứu đối chiếu trật tự từ Anh-Việt trên một số
cấu trúc cú pháp cơ bản, Luận án phó tiến sĩ khoa học ngữ văn.
Tiếng Anh
[4] A. Stolcke, 2002, SRILM - An Extensible Language Modeling Toolkit, In
Proceedings of Intl. Conf. Spoken Language Processing, Denver, Colorado,
September 2002.
[5] Alexandra Birch, Miles Osborne, Philipp Koehn, 2007, CCG supertags in
factored statistical machine translation. In Proceedings of the Second
Workshop on Statistical Machine Translation (ACL), Prague, Czech Republic,
page 9-16.
[6] Chao Wang, Michael Collins, and Phillip Koehn, 2007. Chinese Syntactic
Reordering for Statistical Machine Translation, in Proceeding of EMNLP,
2007.
[7] Collins, M., Koehn, P. and Kucerova, I. (2005), Clause restructuring for
statistical machine translation, Proceedings of the 43rd Annual Meeting of
the Assoc. for Computational Linguistics (ACL), pp. 531-540.
[8] Doddington, G. (2002), Automatic Evaluation of Machine Translation
Quality Using N-gram Co-Occurrence Statistics, Proceedings of the
second international conference on Human Language Technology Research,
pp. 138 – 145.
Trang 79
[9] Eugene Charniak, Kevin Knight, and Kenji Yamada, 2003. Syntax-based
Language Models for Statistical Machine Translation. In Proceedings of the
Ninth Machine Translation Summit of the International Association for
Machine Translation, New Orleans, Louisiana, September 2003.
[10] F. J. Och and H. Ney, 2000, Improved statistical alignment models, In
Proceedings of ACL 2000.
[11] F. Xia and M. McCord. 2004. Improving a statistical MT system with
automatically learned rewrite pat-terns. In Proceedings of COLING 2004.
[12] Habash, Nizar. Syntactic Preprocessing for Statistical Machine Translation, In
Proceedings of the Machine Translation Summit (MT-Summit), Copenhagen,
Denmark, 2007.
[13] J. Giménez and L. Márquez, 2004, SVMTool: A general POS tagger generator
based on Support Vector Machines, In Proceedings of the 4th International
Conference on Language Resources and Evaluation, Lisbon, Portugal, 2004
[14] J. May and K. Knight, 2007. Syntactic Re-Alignment Models for Machine
Translation. In Proceeding EMNLP-CoNLL.
[15] K. Rottmann and S. Vogel, 2008, Word reordering in statistical machine
translation with a POS-based distortion model, In Proceedings of the 11th
International Conference on Theoretical and Methodological Issues in
Machine Translation, Skovde (Sweden), pp.171-180, 7-9 September 2007
[16] K. Toutanova, H.T. Ilhan, and C.D. Manning, 2002, Extensions to HMM-
based statistical word alignment models, In Proceedings of Conf. on Empirical
Methods for Natural Language Processing, pages 87-94, Philadelphia, PA,
July 2002
[17] Koehn, P., Och, F. J., and Marcu, D. (2003), Statistical phrase-based
translation, Proceedings of the HLT-NAACL 2003 conference, pp. 127–133.
[18] Koehn, P. (2003), Lecture of Statistical Machine Translation.
[19] Libin Shen, Jinxi Xu, Bing Zhang, Spyros Matsoukas, Ralph Weischedel
(2009). Effective Use of Linguistic and Contextual Information for Statistical
Trang 80
Machine Translation. In Proceedings of the 2009 Conference on Empirical
Methods in Natural Language Processing (August 2009), pp. 72-80.
[20] M. Popovic, H. Ney, 2006, POS-based Word Reorderings for Statistical
Machine Translation, In Proceedings of the LREC 2006, Genova, Italy, May
2006
[21] Maria Holmqvist, Sara Stymne, Lars Ahrenberg (2007). Getting to know
Moses: initial experiments on German--English factored translation. In
Proceedings of the Second Workshop on Statistical Machine Translation
(ACL), Prague, Czech Republic, page 181-184
[22] Minnen, G., J. Carroll and D. Pearce, 2001, Applied morphological processing
of English, Natural Language Engineering, 7(3), pages 207-223.
[23] N. Ueffing, and H. Ney, 2003, Using POS Information for Statistical Machine
Translation into Morphologically Rich Languages, In Conference of the
European Chapter of the Association for Computational Linguistics (EACL),
pages 347-354, Budapest, Hungary, April 2003
[24] Nhung N., Dien D., 2008. A syntactic-based Word Re-ordering for English-
Vietnamese Statistical machine translation system. In Proceeding of PRICAL
2008, LNAI 5351, pp 809 – 818, 2008.
[25] P. F. Brown, S. A. D. Pietra, V. J. D. Pietra, and R. L. Mercer, 1993, The
mathematics of statistical machine translation, Computational Linguistics.
22(1): 39-69.
[26] P. Koehn, F. J. Och, and D. Marcu, 2003, Statistical phrase-based translation,
In Proceedings of HLT-NAACL 2003.
[27] P. Koehn, H. Hoang, 2007. Factored Translation Models. In Proceedings of
the 2007 Joint Conference on Empirical Methods in Natural Language
Processing and Computational Natural Language Learning (ACL), pp. 868–
876, Prague, June 2007.
[28] Papineni K. A., Roukos S., Ward T., and Zhu W.J (2002), Bleu: a method for
automatic evaluation of machine translation, Proceedings of the 40th
Trang 81
Annual Meeting of the Association for Computational Linguistics, pp. 311–
318.
[29] S. NieBen and H. Ney, 2001, Morpho-syntactic analysis for reordering in
statistical machine translation, In Proceedings of MT Summit VIII, pages 247-
252, Santiago de Compostela, Galicia, Spain, September 2001.
[30] Sonja Nießen, Hermann Ney, 2000, Improving SMT quality with morpho-
syntactic analysis. In Proceedings of the 18th conference on Computational
linguistics - Volume 2 (ACL), Saarbrücken, Germany, page 1081-1085.
[31] Snover M., Dorr B., Schwartz R., Micciulla L. and Makhoul J (2006), A
study of translation edit rate with targeted human annotation,
Proceedings of Association for Machine Translation in the Americas, pp. 223
– 231.
[32] Thai Phuong Nguyen and Akira Shimazu, 2006, Improving Phrase-Based
SMT with Morpho-Syntactic Analysis and Transformation, In Proceedings of
the 7th Conference of the Association for Machine Translation in the
Americas, pages 138-147, Cambridge, 2006
[33] Victoria Fossum, Kevin Knight and Steven Abney, 2008. Using Syntax to
Improve Word Alignment Precision for Syntax-Based Machine Translation. In
Proceedings of ACL MT Workshop, 2008.
[34] Yamada,K. and Knight, K. (2001), A syntax-based statistical machine
translation, Proceedings of ACL.
[35] Yuqi Zhang, Richard Zens and Hermann Ney. 2007. Chunk-level reordering
of source language sentence with automatically learned rules for statistical
machine translation. In Proceedings of SSST, NAACL-HLT 2007/AMTA
Workshop on Syntax and Structure in Statistical Translation.
Trang 82
PHỤ LỤC
A. Đối chiếu hình thái từ Anh – Việt (biến cách)
Stt Ý nghĩa ngữ pháp Biến cách Nghĩa Từ loại
1 Danh từ số nhiều s những, các NNS
2 Ngôi thứ 3 số ít s
VBZ
3 Sở hữu cách „s của POS
4 Hiện phân từ ing đang VBG
5 Quá khứ ed đã VBD
6 Quá phân từ en đã VBN
7 So sánh hơn er hơn JJR,RBR
8 So sánh nhất est nhất JJS,RBS
B. Kết quả dịch của một số mô hình
Văn bản tiếng Anh
In addition , Viet Nam now hosts a great variety of industries and many use
dirty technology and waste natural resources .
An estimated VND 124 trillion ( US $ 7.4 billion ) is needed to eliminate
industrial pollution , a new Industrial Policy and Strategy Institute ( IPSI )
study shows .
The quantity of HCFCs , particularly R22 , used in the refrigerating and air -
conditioning industries is on the increase , Thanh said , adding that finding
an ideal alterative refrigerant is a major challenge facing the industry .
It is situated about 20 kilometers from Cao Lanh Town along National
Highway 30 .
" We still had coffee and food and they organised stuff so we could get out ,
" she said .
Trang 83
Dust in the air is 113 - 230 - times above the permitted level , the content of
some metals in waste water ten times thicker than the acceptable level .
A project to build Ha Long into a smoke - free tourist city started in Ha Long
city , northern coastal Quang Ninh province on Sept .
As the driest province in the country with annual rainfall between 700 and
1,100 millimeters , Ninh Thuan is endowed with a coastline , deltas ,
mountains , rivers , and sand dunes .
It , however , warned that rising sea - level would cost the habitats of such
rare , endangered and endemic species like the leopard gecko , which lives
only in the lowland area of the region .
The Minister for Natural Resources and the Environment , Pham Khoi
Nguyen , will then chair a workshop on what Vietnam has been doing to
cope with the problems brought on by global warming and rising sea levels .
Sanctuary established for under threat snub - nosed monkeys in Ha Giang .
Heavy rain and strong winds pounded Italy on Monday , claiming the lives
of four people , ANSA news agency reported .
A hole with the length of two metres is on the blocked road Phainam - the
road nearby Chao Anuvong Stadium .
Running the club is very difficult for me because we lack money , but with
supports from members , we still manage the club effectively .
When not working as an architect he dedicates much of his time to running
the Viet Nam Amateur Club of Astronomy .
Vietnam has begun an initiative to raise its capacity in coping with A / H1N1
flu , a Red Cross official said in Hanoi September 16 .
According to him , the country has met almost all of its health care targets set
for the 2006 - 2010 period .
Vietnam has continued to receive messages of sympathy from leaders of
other countries over the losses of human life and poverty caused by typhoon
Ketsana .
Trang 84
Russian President Dmitri Medvedev on Oct . 2 cabled a message to his
Vietnamese counterpart Nguyen Minh Triet , saying , " Russia is willing to
help Vietnam overcome the natural disaster ' s consequences " .
Kết quả dịch hệ cơ sở
In bổ sung , Việt Nam hiện vật chủ rất nhiều loại của các ngành công nghiệp
và nhiều sử dụng bẩn công nghệ và chất thải các nguồn tài nguyên thiên
nhiên .
Ƣớc tính đồng 124 nghìn tỷ đồng ( US $ 7.4 tỷ ) là cần thiết để loại bỏ ô
nhiễm công nghiệp , một mới , công nghiệp và chính sách chiến lƣợc Viện (
IPSI ) nghiên cứu cho thấy .
Các số lƣợng HCFCs , đặc biệt là R22 , đƣợc sử dụng trong điện lạnh và
không khí - điều hoà ngành công nghiệp đang tăng lên , Thành cho biết , nói
thêm rằng việc tìm kiếm một lý tƣởng alterative refrigerant là một lớn thách
thức đối mặt với ngành công nghiệp .
Nó nằm khoảng 20 km từ Cao Lãnh thị trấn theo Quốc lộ 30 .
" Chúng tôi vẫn còn có cà phê và thực phẩm và họ đã tổ chức thứ nhƣ vậy ,
chúng tôi có thể thoát khỏi " , Cô nói .
Bụi trong không khí là 113 - 230 - lần trên mức cho phép , nội dung của một
số các kim loại trong nƣớc thải mƣời lần dày hơn so với các mức độ chấp
nhận đƣợc .
Một dự án để xây dựng Hạ Long vào một thuốc tự do thành phố du lịch đã
bắt đầu tại thành phố Hạ Long , ven biển phía bắc tỉnh Quảng Ninh vào
tháng 9 .
Do khô nhất tỉnh ở các quốc gia với hàng năm lƣợng mƣa giữa 700 và số
1.100 mm , Ninh Thuận đƣợc ƣu đãi với một bờ biển , đồng bằng , núi , các
con sông , và cồn cát .
Trang 85
Nó , tuy nhiên , đã cảnh báo rằng sự gia tăng mực nƣớc biển sẽ chi phí môi
trƣờng sống nhƣ vậy quý hiếm , đang bị đe dọa và đặc hữu loài nhƣ lƣợng
con báo hoa mai tắc kè , mà còn chỉ tại các khu vực đất thấp của khu vực .
Các Bộ trƣởng Bộ Tài nguyên và Môi trƣờng Phạm Khôi Nguyên , sau đó sẽ
chủ trì một hội thảo về những gì mà Việt Nam đã đang làm để đối phó với
các vấn đề đƣa vào bởi sự nóng lên toàn cầu và mực nƣớc biển tăng lên .
Sanctuary thành lập cho bị đe dọa khỉ mũi tẹt trên Hà Giang .
Hôm mƣa và gió mạnh pounded Ý vào thứ hai , làm thiệt mạng sống của bốn
ngƣời , ANSA Hãng tin .
Một lỗ với chiều dài của hai mét trên các chặn đƣờng Phainam - đƣờng gần
Sân vận động Chao Anuvong .
Hoạt động câu lạc bộ là rất khó khăn cho tôi bởi vì chúng tôi thiếu tiền ,
nhƣng với sự hỗ trợ từ các thành viên , chúng tôi vẫn quản lý các câu lạc bộ
có hiệu quả .
Khi không làm việc nhƣ một kiến trúc sƣ ông dedicates nhiều thời gian của
mình để chạy Việt Nam Amateur Câu lạc bộ của nền thiên văn học .
Việt Nam đã bắt đầu một sáng kiến để nâng cao của nó có khả năng trong
việc đối phó với các bệnh cúm A / H1N1 , một Hội chữ thập đỏ chức nói tại
Hà Nội ngày 16 tháng 9 .
Theo ông , quốc gia đã đáp ứng gần nhƣ tất cả các của nó chăm sóc sức khỏe
mục tiêu thiết lập cho năm 2006 - 2010 kỳ .
Việt Nam đã tiếp tục nhận đƣợc thông điệp của đồng cảm từ các nhà lãnh
đạo của các nƣớc khác trên những thiệt hại của cuộc sống con ngƣời và
nghèo gây ra bởi bão Ketsana .
Nga , Tổng thống Dmitri Medvedev vào ngày 2 tháng 10 cabled một thông
điệp của ông đối tác Việt Nam Nguyễn Minh Triet , nói , " Nga sẵn sàng để
giúp Việt Nam khắc phục những thảm họa thiên nhiên của những hậu quả " .
Kết quả dịch sau khi thêm từ loại vào tiếng Anh
Trang 86
In bổ sung , Việt Nam hiện có rất nhiều loại của các ngành công nghiệp và
nhiều sử dụng bẩn công nghệ và chất thải các nguồn tài nguyên thiên nhiên .
Ƣớc tính đồng 124 nghìn tỷ đồng ( Hoa Kỳ $ 7.4 tỷ đôla ) là cần thiết để loại
bỏ ô nhiễm công nghiệp , một mới , công nghiệp và chính sách chiến lƣợc
Viện ( IPSI ) nghiên cứu cho thấy .
Các số lƣợng HCFCs , đặc biệt là R22 , đƣợc sử dụng trong các refrigerating
và không khí - điều hoà ngành công nghiệp đang gia tăng , Thành cho biết ,
nói thêm rằng việc tìm kiếm một lý tƣởng alterative refrigerant là một lớn
thách thức đối mặt với ngành công nghiệp .
Nó nằm khoảng 20 km từ Cao Lãnh thị trấn dọc theo Quốc lộ 30 .
" Chúng tôi vẫn còn có cà phê và thực phẩm và họ đã tổ chức thứ để chúng tôi
có thể làm ra " , Cô nói .
Bụi trong không khí là 113 - 230 - lần trên mức cho phép , nội dung của một
số các kim loại trong nƣớc thải mƣời lần dày hơn so với các mức độ chấp nhận
đƣợc .
Một dự án để xây dựng Hạ Long vào một không khói thuốc thành phố du lịch
đã bắt đầu tại thành phố Hạ Long , ven biển phía bắc tỉnh Quảng Ninh vào
tháng 9 .
Do khô nhất tỉnh ở trong nƣớc với hàng năm lƣợng mƣa giữa 700 và số 1.100
mm , Ninh Thuận đƣợc ƣu đãi với một bờ biển , đồng bằng , núi , các con
sông , và cồn cát .
Nó , tuy nhiên , đã cảnh báo rằng tăng mực nƣớc biển sẽ có chi phí môi trƣờng
sống nhƣ vậy quý hiếm , đang bị đe dọa và đặc hữu loài nhƣ những con báo
hoa mai phục kè , mà sống chỉ tại các khu vực đất thấp của khu vực .
Các Bộ trƣởng cho Tài nguyên và Môi trƣờng Phạm Khôi Nguyên , sau đó sẽ
chủ trì một hội thảo về những gì mà Việt Nam đã đang làm để đối phó với các
vấn đề đƣa tiếp tục bởi sự nóng lên toàn cầu và mực nƣớc biển tăng lên .
Sanctuary phát hiện cho bị đe dọa khỉ mũi tẹt trên Hà Giang .
Trang 87
Hôm mƣa và gió mạnh pounded Ý vào thứ hai , làm thiệt mạng sống của bốn
ngƣời , ANSA Hãng tin báo cáo .
Một lỗ với chiều dài của hai mét trên các chặn đƣờng Phainam - đƣờng gần
Sân vận động Chao Anuvong .
Running câu lạc bộ là rất khó khăn cho tôi bởi vì chúng tôi thiếu tiền , nhƣng
với sự hỗ trợ từ các thành viên , chúng tôi vẫn quản lý các câu lạc bộ có hiệu
quả .
Khi không làm việc nhƣ một kiến trúc sƣ ông dedicates nhiều thời gian của
ông để chạy Việt Nam Amateur câu lạc bộ của Thiên văn học .
Việt Nam đã bắt đầu một sáng kiến để nâng cao của nó có khả năng trong việc
đối phó với các bệnh cúm A / H1N1 , một Hội Chữ thập đỏ quan chức nói tại
Hà Nội ngày 16 tháng 9 .
Theo ông , quốc gia đã đáp ứng gần nhƣ tất cả các của nó chăm sóc sức khỏe
mục tiêu thiết lập cho năm 2006 - 2010 kỳ .
Việt Nam đã liên tục để nhận thông điệp của đồng cảm từ các nhà lãnh đạo
của các nƣớc khác trên những thiệt hại của cuộc sống con ngƣời và nghèo gây
ra bởi bão Ketsana .
Nga , Tổng thống Dmitri Medvedev vào ngày 2 tháng 10 cabled một thông
điệp của ông đối tác Việt Nam Nguyễn Minh Triet , nói , " Nga sẵn sàng để
giúp Việt Nam khắc phục những thảm họa thiên nhiên của những hậu quả " .
Kết quả dịch sau khi áp dụng luật chuyển đổi trật tự
In bổ sung , Việt Nam chủ nhà bây giờ là một loại lớn của các ngành công
nghiệp và nhiều sử dụng công nghệ bẩn và chất thải các nguồn tài nguyên
thiên nhiên .
Ƣớc tính đồng 124 nghìn tỷ đồng ( US $ 7.4 tỷ đôla ) là cần thiết để loại bỏ ô
nhiễm công nghiệp , một mới công nghiệp và chính sách chiến lƣợc Viện (
IPSI ) nghiên cứu cho thấy .
Trang 88
Các số lƣợng HCFCs , đặc biệt là R22 , đƣợc sử dụng trong điện lạnh và
không khí - điều hoà ngành công nghiệp đang gia tăng , Thành cho biết , nói
thêm rằng việc tìm kiếm một lý tƣởng refrigerant alterative là một thách thức
lớn đối với ngành công nghiệp .
Nó nằm khoảng 20 km từ Cao Lãnh Town theo Quốc lộ 30 .
" Chúng tôi đã vẫn còn cà phê và thực phẩm và họ đã tổ chức chất liệu để
chúng tôi có thể thoát khỏi " , cô nói .
Bụi trong không khí là 113 - 230 - lần so với mức cho phép , nội dung của một
số các kim loại trong nƣớc thải mƣời lần dày hơn so với các mức độ chấp nhận
đƣợc .
Một dự án để xây dựng Hạ Long vào một khói - thành phố du lịch không bắt
đầu tại thành phố Hạ Long , ven biển phía bắc tỉnh Quảng Ninh vào tháng 9 .
Khi các tỉnh khô nhất trong nƣớc với lƣợng mƣa hàng năm khoảng 700 và
1.100 mm , Ninh Thuận đƣợc ƣu đãi với một bờ biển , đồng , núi , các con
sông , và cồn cát .
Nó , tuy nhiên , đã cảnh báo rằng sự gia tăng mực nƣớc biển sẽ chi phí môi
trƣờng sống của quý hiếm , đang bị đe dọa và đặc hữu loài nhƣ vậy nhƣ con
tắc kè những con báo hoa mai , mà sống chỉ tại các khu vực đất thấp của khu
vực .
Các Bộ trƣởng Bộ Tài nguyên và Môi trƣờng Phạm Khôi Nguyên , sẽ sau đó
chủ trì một hội thảo về những gì mà Việt Nam đã đang làm để đối phó với các
vấn đề đƣa vào bởi sự nóng lên toàn cầu và mực nƣớc biển tăng lên .
Sanctuary thành lập cho bị đe dọa khỉ mũi tẹt trong Hà Giang .
mƣa Heavy và gió mạnh pounded Ý vào thứ hai , làm thiệt mạng sống của bốn
ngƣời , hãng tin ANSA báo cáo .
Một lỗ với chiều dài của hai mét trên chặn đƣờng Phainam - đƣờng gần Sân
vận động Chao Anuvong .
Trang 89
Hoạt động câu lạc bộ là rất khó khăn cho tôi bởi vì chúng tôi thiếu tiền , nhƣng
với sự hỗ trợ từ các thành viên , chúng tôi quản lý vẫn còn câu lạc bộ có hiệu
quả .
Khi làm việc không phải là một kiến trúc ông dedicates nhiều thời gian của
ông để chạy Việt Nam Amateur Câu lạc bộ Thiên văn học .
Việt Nam đã bắt đầu một sáng kiến để nâng cao năng lực của nó trong việc đối
phó với các bệnh cúm A / H1N1 , một đồng bằng của Hội chữ thập đỏ cho biết
tại Hà Nội ngày 16 tháng 9 .
Theo ông , quốc gia đã đáp ứng gần nhƣ tất cả các chăm sóc sức khỏe mục
tiêu của nó đƣợc đặt ra cho năm 2006 - 2010 thời gian .
Việt Nam đã liên tục để nhận thông điệp cảm thông từ các nhà lãnh đạo của
các quốc gia khác về thiệt hại của cuộc sống con ngƣời và nghèo gây ra bởi
bão Ketsana .
Nga , Tổng thống Dmitri Medvedev vào ngày 2 tháng 10 cabled một thông
điệp đến đối tác Việt Nam của ông Nguyễn Minh Triet , nói , " Nga sẵn sàng
để giúp Việt Nam khắc phục những thiên tai tự nhiên của những hậu quả " .
Hệ dịch gán nhãn ranh giới từ tiếng Việt
In bổ_sung , Việt_Nam hiện chủ_nhà rất nhiều loại của các ngành
công_nghiệp và nhiều sử_dụng công_nghệ chất_thải bẩn và các nguồn
tài_nguyên thiên_nhiên .
Ƣớc_tính 124 nghìn tỷ đồng ( US $ 7.4 tỷ ) là cần_thiết để loại_bỏ ô_nhiễm
công_nghiệp , một công_nghiệp mới và chính_sách Viện Chiến_lƣợc ( IPSI )
nghiên_cứu cho_thấy .
Các số_lƣợng HCFCs , đặc_biệt là R22 , đƣợc sử_dụng trong refrigerating và
điều_hoà không_khí - các ngành công_nghiệp đang gia_tăng , Thành cho_biết
, nói thêm rằng việc tìm_kiếm một lý_tƣởng alterative refrigerant là một
thách_thức lớn phải đối_mặt với các ngành công_nghiệp .
Nó nằm khoảng 20 km từ Cao Lanh Thị_xã dọc theo Quốc_lộ 30 .
Trang 90
" Chúng_tôi vẫn còn có cà_phê và thực_phẩm và chúng đƣợc tổ_chức stuff
vì_vậy chúng_tôi có_thể nhận ra , cô ấy nói , " .
bụi trong không_khí là 113 - 230 - lần trên các mức cho_phép , nội_dung của
một_số các kim_loại trong nƣớc_thải mƣời lần dày hơn so với mức_độ
chấp_nhận đƣợc .
Một dự_án để xây_dựng Hạ_Long thành một không khói thuốc thành_phố
du_lịch đã bắt_đầu tại thành_phố Hạ_Long , ven biển phía bắc tỉnh
Quảng_Ninh vào tháng 9 .
Do khô nhất tỉnh trong nƣớc với lƣợng mƣa hàng năm khoảng 700 và 1.100
mm , Ninh_Thuận đƣợc ƣu_đãi với một bờ biển , đồng_bằng , núi , các con
sông , và cồn cát .
Nó , tuy_nhiên , đã cảnh_báo rằng việc tăng mực nƣớc biển sẽ tốn môi_trƣờng
sống nhƣ vậy quý_hiếm , đang bị đe_doạ và đặc_hữu loài nhƣ leopard tắc_kè ,
mà chỉ sống trong các khu_vực đất thấp của khu_vực .
Các Bộ_trƣởng Bộ Tài_nguyên và Môi_trƣờng Phạm_Khôi_Nguyên , sau đó
sẽ chủ_trì một hội_thảo về những gì Việt_Nam đã đƣợc làm để đối_phó với
các vấn_đề đƣa vào do sự nóng lên toàn_cầu và mực nƣớc biển dâng cao .
Tam_Nông thành_lập cho bị đe_doạ khỉ mũi tẹt trong Hà_Giang .
Giao_thông mƣa và gió mạnh pounded Ý vào ngày thứ hai , làm thiệt_mạng
cuộc_sống của bốn ngƣời , ANSA tin_tức cơ_quan báo_cáo .
Một lỗ với chiều dài của hai mét là trên chặn đƣờng Phainam - đƣờng gần
Sân_vận_động Chao_Anuvong .
Hoạt_động câu_lạc_bộ là rất khó_khăn cho tôi bởi_vì chúng_tôi thiếu tiền ,
nhƣng với sự hỗ_trợ từ các thành_viên , chúng_tôi vẫn quản_lý câu_lạc_bộ có
hiệu_quả .
Khi không làm_việc nhƣ một architect ông dedicates nhiều thời_gian của ông
để chạy Việt_Nam Lễ_hội Carlton của nền thiên_văn_học .
Trang 91
Việt_Nam đã bắt_đầu một sáng_kiến để nâng_cao năng_lực của nó trong việc
đối_phó với các bệnh cúm A / H1N1 , một Hội Chữ_thập_đỏ quan_chức nói
tại Hà_Nội ngày 16 tháng 9 .
Theo ông , quốc_gia đã đáp_ứng gần nhƣ tất_cả các chăm_sóc y_tế đặt ra
mục_tiêu cho năm 2006 - 2010 thời_gian .
Việt_Nam đã tiếp_tục nhận đƣợc những thông_điệp cảm_thông từ các nhà
lãnh_đạo của các nƣớc khác trên những thiệt_hại của cuộc_sống con_ngƣời và
nghèo gây ra bởi bão Ketsana .
Nga Tổng_thống Dmitri Medvedev vào ngày 2 tháng 10 cabled một
thông_điệp của ông đối_tác Việt_Nam Nguyễn đã Triet , nói rằng : " Nga
sẵn_sàng để giúp Việt_Nam khắc_phục những thảm_hoạ thiên_nhiên của
những hậu_quả " .
Các file đính kèm theo tài liệu này:
- Đề Tài- Tích hợp thông tin hình thái từ vào hệ dịch máy thống kê Anh-Việt.pdf