256 từ mã đầu tiên theo thứ tự từ 0 255 chứa các số nguyên từ 0 255. Đây là mã
của 256 ký tự cơ bản trong bảng mã ASCII.
- Từ mã 256 chứa một mã đặc biệt là mã xóa (CC – Clear Code). Khi số mẫu lặp lớn
hơn 4096 thí người ta sẽ coi ảnh gồm nhiều mảnh ảnh và từ điển sẽ gồm nhiều từ
điển con. Khi hết một mảnh ảnh sẽ gửi 1 mã xóa CC để báo hiệu kết thúc mảnh ảnh
cũ và bắt đầu mảnh ảnh mới đồng thời sẽ khởi tạo lại từ điển.
- Từ mã thứ 257 chứa mã kết thúc thông tin (EOI – End Of Information). Thông
thường một file ảnh GIF có thể chứa nhiều mảnh ảnh, mỗi mảnh ảnh này sẽ được
mã hóa riêng. Chương trính giải mã sẽ lặp đi lặp lại thao tác giải mã từng ảnh cho
đến khi gặp mã kết thúc thông tin thì dừng lại.
65 trang |
Chia sẻ: nguyenlam99 | Lượt xem: 2852 | Lượt tải: 2
Bạn đang xem trước 20 trang tài liệu Bài giảng Nhập môn đa phương tiện, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
hủ đề này trong các phương tiện lưu trữ khác nhau (các băng video
bài giảng, các tập tài liệu in) liên quan đến chủ đề trên. Giải pháp truy vấn đòi hỏi
khả năng duyệt qua các tư liệu để tím được các phần phù hợp, nó có thể là một
video clip. Ngoài các bài giảng, người sử dụng có khả năng lựa chọn được tài liệu
mà họ cho là phù hợp nhất.
E-learning và công nghệ giáo dục:
Kiến thức trong lĩnh vực e-Learning và công nghệ giáo dục rất nhiều, đa dạng
và có sự thay đổi rất nhanh. Đây là lĩnh vực được nhiều tổ chức, nhiều trường đại
học, nhiều bộ ngành, nhiều đối tượng người khác nhau quan tâm bởi tính hiệu quả
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
35
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
của nó trong thời đại mới. Sau đây sẽ cung cấp cho các bạn các kiến thức mang
tình cơ bản quan trọng nhất và các công cụ trong e-Learning và công nghệ giáo
dục.
1. Định nghĩa
Có nhiều quan điểm, định nghĩa khác nhau về e-Learning, dưới đây sẽ trìch ra một số
định nghĩa e-Learning đặc trưng nhất
- E-Learning là sử dụng các công nghệ Web và Internet trong học tập (William
Horton).
- E-Learning là một thuật ngữ dùng để mô tả việc học tập, đào tạo dựa trên công
nghệ thông tin và truyền thông (Compare Infobase Inc).
- E-Learning nghĩa là việc học tập hay đào tạo được chuẩn bị, truyền tải hoặc quản
lý mà có sử dụng nhiều công cụ của công nghệ thông tin, truyền thông khác nhau
và được thực hiện ở mức cục bộ hay toàn cục ( MASIE Center).
- Việc học tập được truyền tải hoặc hỗ trợ qua công nghệ điện tử. Việc truyền tải
qua nhiều kĩ thuật khác nhau như Internet, TV, video tape, các hệ thống giảng dạy
thông minh, và việc đào tạo dựa trên máy tình (CBT ) (Sun Microsystems, Inc ).
- Việc truyền tải các hoạt động, quá trính, và sự kiện đào tạo và học tập thông qua
các phương tiện điện tử như Internet, intranet, extranet, CD-ROM, video tape,
DVD, TV, các thiết bị cá nhân... ( e-learningsite).
- "Việc sử dụng công nghệ để tạo ra, đưa các dữ liệu có giá trị, thông tin, học tập và
kiến thức với mục đìch nâng cao hoạt động của tổ chức và phát triển khả năng cá
nhân." (Định nghĩa của Lance Dublin, hướng tới e-learning trong doanh nghiệp).
2. Lịch sử và tình hình phát triển
Sau đây xin cung cấp một vài con số về doanh thu từ thị trường e-learning để các bạn
tham khảo:
- Trên phạm vi toàn cầu hiện có nhiều công ty lớn đầu tư vào e-learning.
- Năm 2000 thị trường e-learning đạt doanh số 2.2 tỷ USD.
- Năm 2004 thị trường e-learning tại Mỹ đạt doanh số 11.4 tỷ USD.
- Năm 2005 thị trường e-learning đạt doanh số 18.5 tỷ USD.
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
36
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
- Tại Châu Á thị trường này tăng 25% (xấp xỉ 6.2 tỷ USD) mỗi năm .
Lịch sử phát triển của E-learning:
- Trƣớc năm 1983: Kỷ nguyên giảng viên làm trung tâm.
- Giai đoạn 1984-1993: Kỷ nguyên đa phương tiện.
Cho phép tạo bài giảng tìch hợp hính ảnh và âm thanh
Học trên máy tình qua đĩa CD-ROM.
Có thể thấy ở giai đoạn này: Sự hỗ trợ của giảng viên rất hạn chế.
- Giai đoạn 1994-1999: Làn sóng E-learning thứ nhất
Khi công nghệ Web được phát minh: Người thầy thông thái đã dần lộ qua
phương tiện: E-mail,Intranet với text,ảnh đơn giản,..
Đào tạo nhờ công nghệ WEB với hính ảnh chuyển động tốc độ thấp đã được
triển khai trên diện rộng.
Có thể thấy ở giai đoạn này: Người học đã trở thành trung tâm
- Giai đoạn 2000-2005: Làn sóng E-learning thứ hai.
Thông qua Web giáo viên có thể kết hợp hướng dẫn trực tuyến (hính ảnh,
âm thanh, các công cụ trính diễn) tới mọi người học.
Học viên có thể trao đổi với giáo viên và học viên qua mail, diễn đàn, char,
hội thảo trưc tuyến
....
Với hính thức này thí:
- Nâng cao chất lượng, hiệu quả cao trong dịch vụ đào tạo
- Cho phép đa dạng hoá các môi trường học tập.
- Giá thành rẻ, phù hợp với nền kinh tế tri thức.
Tình hình phát triển:
Đánh giá của thế giới về e –Learning
- E-Learning là lĩnh vực thu hút sự quan tâm của nhiều người, nhiều ngành, nhiều
lĩnh vực.
- Giải pháp học tập số tăng rất nhanh và nâng cao tầm quan trọng của GDĐT trong
hệ thống giáo dục.
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
37
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
- E-Learning là xu hướng tất yếu trong nền kinh tế tri thức.
- E-Learning là giải pháp hữu hiệu nâng cao hiệu quả, chất lượng giáo dục.
- E-Learning là hệ thống thường được tìch hợp vào Portal của các trường học hoặc
doanh nghiệp.
Tình hình về e –Learning ở Việt Nam
- Thuật ngữ e-learning mới được biết đến ở Việt Nam khoảng những năm 2000.
- Thị trường e-Learning mới chỉ được nóng lên từ 2003 nhưng đã được sự quan tâm
của nhiều tổ chức giáo dục, đơn vị nghiên cứu, đặc biệt là các trường đại học.
- E- learning là phương pháp dạy và học mới bổ xung và hỗ trợ cho phương pháp
đào tạo truyền thống.
- E- learning tạo thêm cơ hội học tập cho đông đảo tầng lớp xã hội.
- Hiện nay đã có những sản phẩm được áp dụng.
- E-learning được đánh giá là cuộc cách mạng trong giáo dục!
Ví vậy: việc tím hiểu, nắm bắt, nghiên cứu công nghệ và công cụ phát triển là vấn đề
thiết thực và cấp bách!
3. Kiến trúc của hệ thống E-learning
Quan sát trên hính vẽ, chúng ta thấy:
Học tập sẽ dựa trên mạng Internet là chủ yếu (qua World Wide Web -WWW).
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
38
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
Hệ thống e-Learning sẽ được tìch hợp vào portal của trường học hoặc doanh
nghiệp. Như vậy hệ thống e-Learning sẽ phải tương tác tốt với các hệ thống khác
trong trường học như hệ thống quản lý sinh viên, hệ thống quản lý giáo viên, lịch
giảng dạycũng như các hệ thống của doanh nghiệp như là ERP, HR
Một thành phần rất quan trọng của hệ thống chình là hệ thống quản lý học tập
(Learning Management System), gồm nhiều module khác nhau, giúp cho quá trình
học tập trên mạng đuợc thuận tiện và dễ dàng phát huy hết các điểm mạnh của
mạng Internet vì dụ như:
Diễn đàn để trao đổi ý kiến giữa các thành viên của một lớp.
Module khảo sát lấy ý kiến của mọi người về một vấn đề nào đó.
Module kiểm tra và đánh giá.
Module chat trực tuyến.
Module phát video và audio trực truyến.
Module Flash.
Một phần nữa rất quan trọng là các công cụ tạo nội dung. Hiện nay, chúng ta có 2
cách tạo nội dung là trực tuyến (online), có kết nối với mạng Internet và offline
(ngoại tuyến), không cần kết nối với mạng Internet. Những hệ thống như hệ thống
quản trị nội dung học tập (LCMS – Learning Content Management System) cho
phép tạo và quản lý nội dung trực tuyến. Các công cụ soạn bài giảng (authoring
tools) giáo viên có thể cài đặt ngay trên máy tình cá nhân của mính và soạn bài
giảng. Với những nước và khu vực mà cơ sở hạ tầng mạng chưa tốt thí việc dùng
các công cụ soạn bài giảng là một sự lựa chọn hợp lý. Một hệ thống tạo nội dung
mềm dẻo thường cho phép kết hợp giữa soạn bài giảng online và offline.
Với các trường và cơ sở có quy mô lớn cần phải quản lý kho bài giảng lớn và
muốn chia sẻ cho các trường khác thí phải nghĩ đến giải pháp kho chứa bài giảng.
Kho chứa bài giảng này cho phép lưu trữ, quản lý thông tin về các bài giảng
(thường dùng các chuẩn về metadata của IEEE,IMS, và SCORM). Hơn nữa,
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
39
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
thường có engine tím kiếm đi kèm, tiện cho việc tím kiếm các bài giảng (hoặc tổng
quát hơn là đối tượng học tập).
Các chuẩn/đặc tả là một thành phần kết nối tất cả các thành phần của hệ thống e-
Learning. LMS, LCMS, công cụ soạn bài giảng, và kho chứa bài giảng sẽ hiểu
nhau và tương tác được với nhau thông qua các chuẩn/đặc tả. Chuẩn và đặc tả e-
Learning cũng đang phát triển rất nhanh tạo điều kiện cho các công ty và tổ chức
tạo ra ngày càng nhiều sản phẩm e-Learning, và người dùng có rất nhiều sự lựa
chọn.
4. Ưu và nhược điểm
Phân tích trên quan điểm của cơ sở đào tạo
Cơ sở đào tạo là một tổ chức thiết kế và cung cấp các khóa học trực tuyến E-learning.
Hãy so sánh ưu và nhược điểm đối với cơ sở đào tạo khi chuyển đổi các khoá học truyền
thống sang khoá học E-learning.
Ƣu điểm Nhƣợc điểm
Giảm chi phí đào tạo. Sau khi đã phát
triển xong, một khoá học E-learning có
thể dạy 1000 học viên với chi phì chỉ cao
hơn một chút so với tổ chức đào tạo cho
20 học viên.
Chi phí phát triển một khoá học lớn. Việc
học qua mạng còn mới mẻ và cần có các
chuyên viên kỹ thuật để thiết kế khoá học.
Triển khai một lớp học E-learning có thể tốn
gấp 4-10 lần so với một khoá học thông
thường với nội dung tương đương.
Rút ngắn thời gian đào tạo. Việc học
trên mạng có thể đào tạo cấp tốc cho một
lượng lớn học viên mà không bị giới hạn
bởi số lượng giảng viên hướng dẫn hoặc
lớp học.
Yêu cầu kỹ năng mới. Những người có khả
năng giảng dạy tốt trên lớp chưa chắc đã có
trính độ thiết kế khóa học trên mạng. Phìa cơ
sở đào tạo có thể phải đào tạo lại một số giảng
viên và tím việc mới cho số còn lại.
Cần ít phương tiện hơn. Các máy chủ và
phần mềm cần thiết cho việc học trên
mạng có chi phì rẻ hơn rất nhiều so với
Lợi ích của việc học trên mạng vẫn chưa
được khẳng định. Các học viên đã hiểu được
giá trị của việc học 3 ngày trên lớp có thể vẫn
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
40
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
phòng học, bảng, bàn ghế, và các cơ sở
vật chất khác.
ngần ngại khi bỏ ra một chi phì tương đương
cho một khoá học trên mạng thậm chì còn hiệu
quả hơn.
Giảng viên và học viên không phải đi lại
nhiều.
Đòi hỏi phải thiết kế lại chương trính đào tạo.
Việc các học viên không có các kết nối tốc độ
cao đòi hỏi phìa đào tạo phải luôn xây dựng lại
các khoá học để khắc phục những hạn chế đó.
Tổng hợp được kiến thức. Việc học trên
mạng có thể giúp học viên nắm bắt được
kiến thức của giảng viên, dễ dàng sàng
lọc, và tái sử dụng chúng.
Phân tích trên quan điểm người học
Cá nhân hoặc tổ chức tham gia các khoá học E-learning trên mạng chắc chắn sẽ
thấy việc đào tạo này xứng đáng với thời gian và số tiền họ bỏ ra. Bảng dưới đây sẽ so
sánh thuận lợi và khó khăn đối với học viên khi họ chuyển đổi việc học tập theo phương
pháp truyền thống sang học tập bằng E-learning.
Ƣu điểm Nhƣợc điểm
Có thể học bất cứ lúc nào, tại bất kỳ
nơi đâu
Kỹ thuật phức tạp. Trước khi có thể bắt đầu
khoá học, họ phải thông thạo các kỹ năng
mới.
Không phải đi lại nhiều và không phải
nghỉ việc. Học viên có thể tiết kiệm
chi phì đi lại tới nơi học. Đồng thời,
họ có thể dễ dàng điều chỉnh thời gian
học phù hợp với thời gian làm việc của
mình.
Chi phì kỹ thuật cao: Để tham gia học trên
mạng, học viên phải cài đặt Turbo trên máy
tình của mính, tải và cài đặt các chức năng
Plug-ins, và kết nối vào mạng.
Có thể tự quyết định việc học của Việc học có thể buồn tẻ. Một số học viên sẽ
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
41
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
mính. Học viên chỉ học những gí mà
họ cần.
cảm thấy thiếu quan hệ bạn bè và sự tiếp xúc
trên lớp.
Khả năng truy cập được nâng cao.
Việc tiếp cận những khoá học trên
mạng được thiết kế hợp lý sẽ dễ dàng
hơn đối với những người không có
khả năng nghe, nhín; những người học
ngoại ngữ hai; và những người không
có khả năng học như người bị mắc
chứng khó đọc.
Yêu cầu ý thức cá nhân cao hơn: Việc học
qua mạng yêu cầu bản thân học viên phải có
trách nhiệm hơn đối với việc học của chình
họ. Một số người sẽ cảm thấy khó khăn
trong việc tạo ra cho mính một lịch học cố
định.
5. Công cụ xây dựng và phát triển hệ thống E-learning
Sau đây là tập hợp môt số tài nguyên về công cụ e-Learning để giúp các bạn chọn lựa
giải pháp và công cụ phù hợp với yêu cầu của mính.
- Danh sách các công cụ soạn bài điện tử
- Danh sách các công cụ kiểm tra đánh giá
- Danh sách các công cụ mô phỏng
- Danh sách LMS/LCMS mã nguồn mở
- Danh sách LMS/LCMS thương mại
a. Công cụ soạn bài giảng
1. Crocodille Clips
Website:
Một tập công cụ giúp giáo viên tạo các thì nghiệm mô phỏng các hiện tượng vật lý,
hóa học, cũng như các tình chất trong toán học và tin học. Phần mềm được đánh giá rất
cao trên thế giới. Các bạn có thể tải các bản thử ngiệm tại website của công ty. Hy vọng
phần mềm sẽ giúp các giáo viên thay đổi phương pháp giảng dạy của mính.
2. MS Producer (Miễn phí)
Website:
4F99-94BC-784919468E73&displaylang=en
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
42
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
Công cụ bổ sung vào bộ MS Office và hoàn toàn miễn phì. Công cụ giúp đưa thêm
multimedia (audio và video) vào các bài trính bày PowerPoint, giúp bài trính bày trở nên
sống động gấp nhiều lần. Chúng tôi khuyến cáo mọi trường nên dùng công cụ này.
3. CabriLog
Website:
Phần mềm giúp các giáo viên dạy toán cấp II và III nhanh chóng vẽ và tím hiểu
được các tình chất thú vị của hính học 2 chiều và 3 chiều. Các bạn có thể tải về các bản
dùng thử tại website của công ty.
4. Authorware
Website:
Công cụ tạo nội dung học tập của Macromedia. Đây là công cụ dễ dùng, tạo được
nhiều dạng bài học khác nhau, và mạnh nhất hiện nay.
5. Toolbook
Website:
ToolBook là công cụ soạn bài rất mạnh, gồm hai sản phẩm ToolBook Assistant,
Toolbook Instructor. ToolBook Assistant giúp phát triển các cua học nhanh chóng, không
đòi hỏi phải luyện tập, đào tạo nhiều. Trong khi đóToolBook Instructor là công cụ soạn
bài toàn diện, dành cho nhiều nhà phát triển nội dung khác nhau. Với ToolBook, bạn có
thể các cua học có tình tương tác cao với sự tham gia của nhiều đối tượng thông minh, có
hỗ trợ mô phỏng và đánh giá.
6. CourseGenie
Website:
Đây là công cụ giúp bạn tạo cua học có tình tương tác cao ngay trong MS Word,
rất tiện lợi cho mọi người. Công cụ nổi bật với khả năng hỗ trợ chuẩn: chuẩn SCORM,
IMS QTI, Section 508, SENDA. Ngoài ra công cụ cũng có tình tương tác cao với các hệ
thống khác trên thế giới như BlackBoard, WebCT, LRN Toolkit.
7. Mindflash Web-Training Software
Website:
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
43
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
Công cụ soạn bài cho môi trường Web, dựa trên Word, PowerPoint, và
Dreamweaver. Hỗ trợ hoàn toàn SCORM. Giúp quản lý tương tác với SME. Có thể tạo,
quản lý, và theo dõi được đào tạo phức tạp, chi phì thấp.
8. Reload
Website:
Dự án Reload là dự án mã nguồn mở, giúp bạn đóng gói và chỉnh sửa gói SCORM
và IMS Content Packaging từ các tài nguyên có trước (tạo bằng Dreamweaver,
FrontPage, Flash, etc) .
9. Lersus
Website:
Lersus hỗ trợ Unicode hoàn toàn, dễ sử dụng và có tình sư phạm cao. Phần mềm có thể
xuất ra nhiều định dạng khác nhau tương thìch tốt với các LMS/LCMS.
10. eXe (Mã nguồn mở)
Website:
Công cụ mã nguồn mở này được phát triển bởi đại học New Auckland - New
Zealand. Giáo viên không cần các kiến thức về HTML, XML có thể phát triển các bài
giảng điện tử offline (không cần kết nối vào mạng Internet)sau đó xuất ra dưới dạng các
trang Web hoặc một gói tuân theo chuẩn SCORM hoặc IMS Content Packaging. Hiện tại,
phiên bản mới nhất là 0.15, có thể tải về tại:
b. Công cụ mô phỏng
1. VirtualProfessor
Website:
Virtual Professor™ là phần mềm đã ra đời khá lâu và được thử nghiệm kĩ, cho phép tạo
các mô phỏng nhanh và dễ dàng.
2. ViewletBuilder
Website:
Tạo và xuất bản các phần mềm mô phỏng và trính diễn trong vài phút
3. TurboDemo
Website:
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
44
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
Phiên bản mới nhất là 7.0 . TurboDemo ghi các sự kiện trên deskto của bạn và sau đó có
thể tạo các trính diễn và các hướng dẫn bằng FLASH, JAVA, EXE, Windows Media
Player... Rất dễ sử dụng, tương thìch với SCORM và cùng với phiên bản 6.5 cung cấp khả
năng đồng bộ hóa với audio và video. Chỉ trong vài phút bạn có thể ghi các sự kiện diễn
ra trền màn hính và tạo ra các bản trính diễn và giảng dạy sinh động. Việc bổ sung văn
bản, các chú giải, và tương tác không đòi hỏi bạn phải có các kiến thức về lập trính.
4. SoftSim
Website:
Phiên bản mới nhất là 5.0. Gồm nhiều cải tiến trong phiên bản này: khả năng xem lại
điểm và thời gian học tập, cải thiên giao diện và tình năng soạn nội dung. Các khách
hàng SoftSim 5.0 có thể tận dụng để tạo ra các bài giảng dạy hấp dẫn, giúp học viên
nhanh chóng nắm được bài.
5. RoboDemo
Website:
Macromedia Captivate (có tên trước đây là RoboDemo) tự động ghi các sự kiên trên màn
hính và tạo các mô phỏng Flash tương tác. Chỉ và nhấn chuột để đưa thêm các văn bản
minh họa, các chú thìch, và các tương tác e-Learning không cần các kiến thức về lập
trình.
6. RapidBuilder
Website:
RapidBuilder™ là công cụ tạo mô phỏng mạnh, giúp xây dựng các bài trính diễn và mô
phỏng giàu multimedia trên nền Windows. RapidBuilder™ là công cụ không đòi hỏi lập
trính một chút nào.
7. Camtasia Studio
Website:
Camtasia Studio 2 là một giải pháp hoàn chỉnh để ghi, chỉnh sửa và xuất bản các sự kiện
trên màn hính. Dễ dàng tạo các demo và mô phỏng cho khách hàng toàn cầu của bạn
(Real Networks).
8. DemoBuilder
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
45
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
Website:
Demo Builder là công cụ để tạo các film Flash tương tác giúp thể hiện cách hoạt động
các ứng dụng của bạn một cách sống động. Nó ghi các sự kiên trên màn hính của một ứng
dụng hoặc cửa sổ cụ thể, và tự động kết hợp chúng lại thành đoạn film Flash (có thể có cả
con trỏ).
c. Các LMS/LCMS mã nguồn mở
1. Moodle
Website:
Moodle được đánh giá là một trong các LMS tốt nhất trong hệ thống mã nguồn mở và
được cộng đồng mã nguồn mở hỗ trợ rất mạnh với trên 98.000 thành viên. Hiện tại Việt
Nam đã thành lập cộng đồng Moodle tại:
Địa chỉ demo bằng tiếng Anh:
2. Sakai
Website:
Một CMS/LMS được sự ủng hộ mạnh mẽ của các trường đại học tại Mỹ, và gần đây được
IBM tài trợ. Hứa hẹn sẽ là một hệ thống mạnh trong tương lai.
3. ATutor
Website:
Phần mềm này được đánh giá là một trong các LCMS tốt nhất trong hệ thống mã nguồn
mở.
Địa chỉ demo:
4. Dokeos
Website:
Địa chỉ demo:
5. DotLRN
Website:
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
46
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
Đây là một phần mềm của MIT. Theo như MIT tuyên bố thí đây là một giải pháp rất toàn
diện ứng dụng được trong nhiều môi trường khác nhau như đại học/cao đẳng, phổ thông,
các tổ chức doanh nghiệp, và phần mềm này đã nhận được nhiều giải thưởng trên thế giới.
6. ILIAS
Website:
LMS này được phát triển bởi một trường đại học của Đức, chất lượng rất tốt, đã được
ADL chứng nhận là tuân theo SCORM 1.2.
7. Claroline
Website:
Là ứng dụng Web miễn phì PHP/MySQL cho phép giáo viên hoặc các tổ chức giáo dục
tạo hoặc quản lý các khóa học thông qua Web.
8. ADL Sample RTE
Website:
Đây là một LMS tuân theo hoàn toàn các đặc tả trong SCORM. Tuy các chức năng của
LMS còn tương đối đơn giản nhưng nó sẽ rất hữu ìch cho bạn nếu bạn muốn tự phát triển
một LMS/LCMS tuân theo SCORM. LMS này luôn là một trong các LMS tuân theo đầy
đủ nhất các tiêu chuẩn trong các phiên bản SCORM mới nhất.
9. Avatal Learn Station
Website:
LMS đã tuân theo SCORM (RTE3), có nhiều tình năng tốt, được viết dựa trên Java -
J2EE (MySql, JBoss).
10. KanataLV
Website:
Đây là một trong rất ìt các LCMS mở được viết theo công nghệ của Microsoft
(ASP/ASP.NET, MS SQL Server 2000), có rất nhiều tình năng của LCMS hiện đại.
11. DotNetSCORM
Website:
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
47
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
Mục đìch của dự án DotNetSCORM™ là tạo một Learning Management System (LMS)
mã nguồn mở sử dụng công nghệ .Net. Có một vài hệ thống viết bằng Java và PHP. Và đa
số chúng dựa trên ADL Sample RTE. Tuy nhiên bởi ví các công nghệ đó, chúng khó tìch
hợp với môi trường Windows Server. Do đó mục đìch của dự án này là tạo một LMS
tương thìch với SCORM, hoạt động tốt trên môi trường Windows.
12. LAMS
Website:
Phần mềm LAMS đã được công bố là phần mềm mã nguồn mở (sử dụng giấy phép GPL)
vào cuối tháng 2 năm 2005. LAMS là hệ thống chuyên dụng dùng để thiết kế các hoạt
động học tập dựa trên lý thuyết hiện đại Learning Design.
d. Danh sách các LMS/LCMS thương mại
1. BlackBoard
Website:
LMS thương mại chiếm thị phần lớn nhất trên thế giới hiện nay về LMS thương mại.
BlackBoard vừa mua WebCT(LMS chiến thị phần thứ 2). Blackboard được dùng trong
môi trường học tập và giảng dạy trực tuyến tại hơn 3,300 trường đại học và cao đẳng ,
trong các trường phổ thông trên toàn thế giới.
2. WebCT
Website:
WebCT chiếm thị phần thứ hai và vừa sát nhập với BlackBoard.
3. eCollege
Website:
Tình đến đầu năm 2005, LMS thương mại này chiếm vị trì thứ 3 trên thị trường sau
BlackBoard và WebCT.
4. IBM Learning Space
Website:
Bạn có cần một cách dễ dàng để quản lý các tài nguyên e-learning, tài nguyên học tập, và
các sự kiện? Việc quản lý học viên và các hoạt động học tập khác khiến bạn mệt mỏi?
IBM Lotus Learning Management System giúp bạn giải quyết tốt các vướng mắc trên
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
48
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
5. eDocent
Website:
eDocent là sản phẩm e-Learning product, bao gồm nhiều module khác nhau và các hoạt
động khác nhau giúp bạn tạo nên một giải pháp e-learning thành công. Điều phân biệt
eDocent với các giải pháp khác chình là tình mềm dẻo và mở rộng được.
e. Danh sách công cụ kiểm tra/ đánh giá
1. Quiz Lab
Website:
Tạo các câu hỏi trực tuyến hoặc lựa chọn từ một thư viện lớn các câu hỏi đã có trước.
Phần mềm tiết kiệm thời gian cho bạn bằng cách tự động ghi và tình điểm, theo dõi quá
trính kiểm tra của học viên.
2. QuestionTools
Website:
QuestionTools cho phép mọi người tạo và phân phối các câu hỏi, các bài kiểm tra, dễ
dàng kiểm tra sử dụng máy tình cá nhân , mạng LAN, cũng như Internet.
3. QuestionMark
Website:
Question Mark là một trong các công ty hàng đầu chuyên cung cấp các giải pháp về việc
kiểm tra và đánh giá dựa trên máy tình. Công ty có rất nhiều phần mềm hỗ trợ việc thi cử
và đánh giá.
4. IMS Assesst Designer
Website:
Là công cụ giúp bạn tạo các bài đánh giá, kiểm tra và nổi bật với tình thân thiện người
dùng. Các soạn giả có thể tạo, chỉnh sửa, xóa, và sắp xếp lại các câu hỏi. Phần mềm này
tuân theo các chuẩn thông dụng chẳng hạn như IMS Project Question and Test
Interoperability (QTI).
5. Hot Potatoes
Website:
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
49
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
Phần mềm này miễn phì, hỗ trợ rất nhiều định dạng câu hỏi: điền vào chỗ trống, đa lựa
chọn, kéo/thả....Bạn có thể đưa các bài kiểm tra đã tạo xong lên mạng rất dễ dàng. Tuy
nhiên, phần mềm hỗ trợ chuẩn chưa tốt.
7. Easy Test Maker
Website:
Đây là phần mềm miễn phì giúp bạn tạo các bài kiểm tra của riêng mính. Với Easy Test
Maker bạn có thể tạo các loại câu hỏi như điền vào chỗ trống, đa lựa chọn, ghép
(matching), câu trả lời ngắn, đúng/sai trên cùng một bài thi. Bạn có thể đưa thêm các chỉ
dẫn và chia bài kiểm tra thành nhiều phần.
8. CourseBuilder & LearningSite
Website:
Như là các phần mềm bổ sung cho phần mềm Dreamweaver và miễn phì. Trong khi
CourseBuilder hỗ trợ tạo các câu hỏi, bài kiểm tra nhanh chóng, thuận tiện với nhiều kiểu
câu hỏi thí LearningSite chịu trách nhiệm ghép các bài kiểm tra thành một site kiểm tra
hoàn chỉnh.
9. Castle Toolkit
Website:
Bộ công cụ giúp giáo viên tạo các câu hỏi đa lựa chọn có tình tương tác cao nhanh chóng
và dễ dàng không cần các kiến thức về lập trính. Điều quan trọng là phần mềm miễn phì.
2.2 Thông tin và bán hàng
Tương tự như công nghiệp du lịch, ta có thể sử dụng cùng khái niệm để thương
mại sản phẩm đến khách hàng. Như trong trường hợp của công nghiệp du lịch, khách
hàng có thể gọi hay xâm nhập các nhà cung cấp dịch vụ mà họ cung cấp thông tin trực
tuyến về các sản phẩm đang có và các thông tin thương mại khác.
2.3 Y học
Chẳng hạn một học viên phẫu thuật ở Miami mong muốn thực hành một ca phẫu
thuật trên một bệnh nhân ảo có những triệu chứng sinh lý nào đó. Trên thực tế để tím ra
bệnh nhân với những triệu chứng mong muốn, học viên phẫu thuật phải truy vấn cơ sở dữ
liệu (CSDL) ảnh phân tán và kìch thước lớn chứa ảnh X quang hay MRI (Magnetic
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
50
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
Resonance Imaging) của các bệnh nhân với các triệu chứng tương tự. Đôi khi các triệu
chứng có thể dễ dàng mô tả bằng văn bản. Tuy nhiên trong nhiều trường hợp khác, nó có
thể dễ dàng hơn cho học viên phẫu thuật nếu có thể trính diễn hính ảnh của loại mẫu
(pattern) mà anh ta đang tím kiếm trong các ảnh X quang của bệnh nhân. Trong cả
hai trường hợp này, một CSDL hính ảnh phải được duy trí. Nó có thể được truy vấn trên
cơ sở các tiêu chì rất khác nhau - đầu vào là văn bản hay ảnh phù hợp (matching.
Đây chỉ là một vì dụ đơn giản, các bạn có thể đưa ra đây rất nhiều các ứng dụng
khác trong nhiều tính huống khác nhau. Hãy bắt đầu như: Chuẩn đoán và điều trị từ xa,
Hội chuẩn qua hội thảo trực tuyến, thì nghiệm ảo trên mô hính bệnh thật, ...
2.4 Hội thảo trực tuyến
2.5 Giải trí
Trong một tương lai rất gần, nhu cầu về phim ảnh theo yêu cầu (on demand) sẽ rất
lớn. Người sử dụng có thể dễ dàng chọn các bộ phim tại nhà và xem chúng qua TV tại
nhà.
Ngày nay cách thức chọn phim mà người sử dụng mong muốn là rất phong phú.
Cũng như việc ứng dụng đa phương tiện trong lĩnh vực giáo dục miêu tả ở trên, trong lĩnh
vực điện ảnh người sử dụng có thể lựa chọn phim mong muốn bằng cách trộn cả truy vấn
tím kiếm và duyệt.
Thì dụ, người sử dụng muốn xem một bộ phim Alfred Hitchcock nhưng trong đó
không có sự tham gia diễn xuất của Jimmy Stewart (có lẽ anh ta đã xem một số bộ phim
kiểu này trước đây và đã trở nên nhàm chán với sự diễn xuất của Jimmy Stewart). Một hệ
thống đa phương tiện hỗ trợ tương tác như vậy của người sử dụng thí phải có khả năng
tím kiếm hiệu quả những bộ phim thoả mãn nhu cầu của người sử dụng. Hơn thế nữa,
người sử dụng nên có được khả năng xem trước những mẩu phim giới thiệu mà họ mong
muốn. Ngoài ra, họ nên được quyền xem xét các bài phê bính về bộ phim, với sự cân nhắc
như vậy có thể giúp người sử dụng lựa chọn được những bộ phim mà anh ta thực sự muốn
xem.
Ngoài ra nhiều kỹ xảo trong điện ảnh là nhờ sự góp mặt đáng kể của các phần mềm
multimedia.
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
51
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
2.6 Các ứng dụng khác
Công nghiệp du lịch
Rất nhiều người lập kế hoạch nghỉ hè cho gia đính hàng năm phải đến các đại lý du
lịch hay trong sách quảng cáo du lịch để tím ra địa điểm du lịch phù hợp tài chính
và thoả mãn nhu cầu nghỉ ngơi của họ. Nhưng ta có thể lập kế hoạch toàn bộ
chuyến du lịch tại nhà. Hệ thống đa phương tiện cài đặt đại lý du lịch thông minh
cho người sử dụng khả năng khớp nối các nhu cầu du lịch của họ, sau đó hỏi hệ
thống để tìm ra vị trí thoả mãn. Hệ thống có thể cho lại nhiều điểm đến đều thoả
mãn yêu cầu người sử dụng. Hệ thống sẽ in ra toàn bộ hành trình, chi tiết về khách
sạn, lịch bay...
Điều tra tội phạm
- Hãy xem xét một cuộc điều tra với quy mô lớn của cảnh sát về tính hính buôn bán
ma túy. Thông thường, để thực hiện thành công một cuộc điều tra như vậy lực
lượng cảnh sát sử dụng một số lượng lớn các thiết bị điện tử để thực hiện theo dõi
các đối tượng nghi ngờ dình lìu đến các tổ chức ma tuý. Với một cuộc điều tra như
vậy có thể sử dụng các thiết bị dưới đây để thu thập thông tin:
- Cảnh sát có thể sử dụng camera theo dõi (surveillance camera) để ghi lại các hính
ảnh về hoạt động đang diễn ra tại các địa điểm khác nhau. Vì dụ mỗi camera theo
dõi có thể giám sát các hoạt động đang diễn ra tại một địa điểm trong một khoảng
thời gian tương đối dài (có thể là trong 6 tháng). Tại mỗi địa điểm họ thu được
khoảng vài triệu hính ảnh. Ví chỉ mỗi một cuộc điều tra như vậy đã đòi hỏi từ 50
đến 100 camera theo dõi đặt tại các địa điểm khác nhau, do đó số hính ảnh video
cần được quản lý là nhiều đáng kể. Quan trọng hơn nữa là với thúc ép của pháp
luật, cần thực hiện hàng trăm cuộc điều tra như vậy tại những địa điểm xác định
trong một khoảng thời điểm tại nhiều vùng khác nhau với rất nhiều hính thức tội
phạm tương tự như cuộc điều tra về ma tuy như điều tra về các đường dây lừa đảo,
các tội phạm liên quan đến tài chình, các cuộc điều tra về khủng bố, các cuộc điều
tra về gián điệp Số lượng dữ liệu video thu được theo cách đó phục vụ cho các
cuộc điều tra là lớn khủng khiếp.
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
52
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
- Một tính huống khác, lực lượng cảnh sát được lệnh thực hiện các cuộc nghe trộm
điện thoại (telephone wiretaps) tại một địa điểm sau đó tập hợp lại các dữ liệu âm
thanh là các cuộc đàm thoại cho là đáng ngờ. Mặc dù số lượng các cú điện thoại có
thể khác nhau giữa các tội phạm, nhưng các tổ chức tội phạm (như đường dây ma
tuy) rất hay sử dụng liên lạc điện thoại. Theo chiều hướng đó số lượng các chuỗi
âm thanh thu được trong một khoảng thời gian từ các cuộc điều tra là rất lớn. Do
vậy việc tổ chức và tím kiếm dữ liệu audio này có ý nghĩa vô cùng lớn.
- Ngoài tất cả những gí trính bày ở trên, lực lượng cảnh sát có thể có một số lượng
lớn các bức ảnh chụp (still photographs) từ các điều tra viên (có thể trong quá trính
theo dõi một kẻ tính nghi). Hơn nữa, trong các cuộc điều tra tội phạm quy mô lớn
có thể phát hiện ra số lượng đáng kể các tội phạm với tội danh nhẹ (vì dụ hính ảnh
những kẻ buôn bán ma tuý lẻ bị chụp khi đang tiến hành bán ma tuý hay một hành
vi liên quan đến ma tuý có thể được phát hiện mà bản thân nó có liên quan đến
người trong bức ảnh). Tất cả những hính ảnh này phải được lưu lại dưới dạng kỹ
thuật số, sẵn sàng cho các công việc tím kiếm và khai thác khi cần.
- Cảnh sát cũng có thể phải xem xét một số lượng lớn các tư liệu (document) đã tím
được tại những nơi có liên quan đến những vụ án đang điều tra hay những vụ án
khác. Một lượng lớn tư liệu có thể liên quan trực tiếp đến vụ án nhưng vào thời
điểm ban đầu thí chúng có thể không được rõ ràng. Khi một cuộc điều tra về ma
tuý đang diễn ra, mọi cái trở nên minh bạch khi mà ngày càng có nhiều mối liên hệ
với các chứng cứ đã thu được trong cuộc điều tra này hay các cuộc điều tra trước
đây cũng có thể là những cuộc điều tra đang diễn ra cùng thời điểm.
- Một tính huống khác, cảnh sát có thể xâm nhập đến các dữ liệu có quan hệ cấu trúc
(structured relational data). Dữ liệu dạng này có thể bao gồm, thì dụ như dữ liệu
trong các giao dịch ngân hàng của một vài tội phạm. Điều này là đặc biệt quan
trọng bởi ví một số trùm ma tuý sử dụng rất nhiều hính thức rửa tiền, việc “Lần
theo dấu vết đồng tiền” thường khám phá được rất nhiều điều thú vị. Các dữ liệu
khác thuộc thể loại này có thể bao gồm những thông tin chán ngắt như những cuốn
danh bạ điện thoại để xác định, nhận dạng người bị tính nghi.
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
53
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
- Cảnh sát cũng có thể sử dụng hệ thống thông tin địa lý (GIS) chứa đựng những dữ
liệu địa lý liên quan đến cuộc điều tra ma tuý đang được triển khai. Vì dụ cảnh sát
nghi ngờ rằng một tuyến đường nào đấy đang được sử dụng để vận chuyển ma tuý.
Để kiểm tra giả thuyết trên, họ phong toả một trong những tuyến đường đó (có lẽ
ban đầu là kiểm tra một cách khắt khe trên tuyến đường này), theo cách đó làm tập
trung hướng vận chuyển ma tuý. Mẫu (pattern) của luồng ma tuý sẽ cung cấp cho
cảnh sát các thông tin rất quan trọng về các vị trì đầu mối của ma tuý. Để thực thi
chiến dịch trên, cảnh sát có thể sử dụng các hệ thống GIS để quản lý dữ liệu địa lý.
Các hệ thống GIS này quản lý các thông thông tin bao gồm thông tin về bản đồ
đường đi, cũng có thể là các thông tin thu được về địa hính của những vùng lân cận
của những thủ phủ trên núi (như Medellin, Colombia). Nhận thức về địa hính cũng
như các hính thức sử dụng các phương tiện để vận chuyển ma tuý có thể mang lại
cho cảnh sát những đầu mối có giá trị để xác định được các tuyến đường đi qua các
địa hính có khả năng là vùng hoạt động của tội phạm.
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
54
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
Chƣơng 3: Dữ liệu văn bản
3.1 Văn bản – các định nghĩa cơ bản
Văn bản thuần túy
- Đây là khuôn mẫu cơ sở nhất, văn bản thuần túy chỉ bao gồm các ký tự chữ và số,
hầu hết biểu diễn bằng mã ASCII (American Standard Code for Information
Interchange). Sử dụng ASCII 7 bit và ASCII 8 bit nếu sử dụng thêm 1 bìt parity và
cho văn bản không phải tiếng Anh.
- Ký tự được biểu diễn duy nhất, các mục (item) trong văn bản có thể là ký tự hay từ,
dễ nhận biết. Không gian lưu trữ trung bính.
- Khó khăn khi truy tím tài liệu text: Các tài liệu text không có thuộc tình cố định
như bản ghi trong CSDL truyền thống. Các từ (word) hay các thuật ngữ (term) có
nhiều nghĩa.
Văn bản có cấu trúc
- Phần lớn tài liệu văn bản là có cấu trúc, bao gồm tiêu đề, chương, mục, đoạn
- Có nhiều chuẩn và khuôn mẫu mã hóa thông tin cấu trúc này. Thì dụ, khuôn mẫu
hay được sử dụng trong các chương trính xử lý văn bản là SGML (Standard
General Markup Language), ODA (Office Document Architecture), LaText và
PDF (Portable Document Format).
- Thông thường, file header được sử dụng để chỉ ra khuôn mẫu tài liệu. Khi đã biết
khuôn mẫu tệp, có thể trìch trọn thông tin cấu trúc để truy tím văn bản. Thì dụ, các
từ hay thuật ngữ xuất hiện trong tiêu đề hay tên chương mục sẽ quan trọng hơn từ
trong text. Do vậy, nó có trọng lượng lớn hơn trong tiến trính chỉ mục và tím kiếm.
3.2 Kỹ thuật nén văn bản
Mặc dù dung lượng lưu trữ văn bản tương đối ìt so với loại dữ liệu khác như dữ
liệu âm thanh, video, nhưng vẫn có nhu cầu nén văn bản khi cần lưu trữ nhiều tệp.
Đặc trưng chình của văn bản nén là nén không mất mát thông tin, có nghĩa là có
thể khôi phục chình xác văn bản như trước khi nén.
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
55
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
Có thể nén văn bản ví có nhiều ký tự xuất hiện thường xuyên hơn một số ký tự
khác hay một số ký tự xuất hiện liên tục trong văn bản. Thì dụ các phương pháp
nén văn bản: Huffman, RLE và LZW.
3.2.1. Nén Huffman
Nguyên tắc
Phương pháp mã hóa Huffman là phương pháp dựa trên mô hính thống kê. Dựa vào
dữ liệu gốc, người ta tình tần suất xuất hiện của các ký tự. Việc tình tần suất được thực
hiện bằng cách duyệt tuần tự tệp gốc từ đầu đến cuối. Việc xử lý ở đây tình theo bit.
Trong phương pháp này, người ta gán cho các ký tự có tần suất cao một từ mã ngắn,
các ký tự có tần suất thâp một từ mã dài. Nói cách khác, các ký tự có tần suất càng cao
được gán mã càng ngắn và ngược lại. Rõ ràng với cách thức này, ta đã làm giảm chiều
dài trung bính của từ mã bằng cách dùng chiều dài biến đổi. Tuy nhiên, trong một số
tính huống khi tần suất là rất thấp, ta có thể không thu được lợi một chút nào, thậm chí
còn bị thiệt một ìt bit.
Thuật toán nén
Thuật toán gồm 2 bước chình:
- Bước 1: tính tần suất của các ký tự trong dữ liệu gốc
Duyệt tệp gốc một cách tuần tự từ đầu đến cuối để xây dựng bảng mã. Tiếp sau
đó là sắp xếp lại bảng mã theo thứ tự tần suất giảm dần.
- Bước 2: mã hóa
Duyệt bảng tần suất từ cuối lên đầu để thực hiện ghép 2 phần tử có tần suất thấp
nhất thành một phần tử duy nhất. Phần tử này có tần suất bằng tổng 2 tần suất
thành phần. Tiến hành cập nhật lại bảng và đương nhiên loại bỏ 2 phần tử đã xét.
Quá trính được lặp lại cho đến khi bảng chỉ còn 1 phần tử. Quá trình này gọi là
quá trình tạo cây mã Huffman vì việc tập hợp được tiến hành nhơ một cây nhị
phân với 2 nhánh. Phần tử có tần suất thấp ở bên phải, phần tử kia ở bên trái. Với
cách tạo cây này, tất cả các bit dữ liệu/ ký tự là nút lá, các nút trong là các nút
tổng hợp. Sau khi cây đã tạo xong, người ta tiến hành gán mã cho các nút lá.
Việc mã hóa rất đơn giản: mỗi lần xuống bên phải ta thêm 1 bit “1” vào từ mã,
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
56
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
mỗi lần xuống bên trái ta thêm 1 bit “0”. Tất nhiên có thể làm ngược lại, chỉ có
giá trị mã thay đổi còn tổng chiều dài là không đổi. Cũng chình ví lý do này mà
cây có tên gọi là cây mã Huffman.
Quá trình giải nén tiến hành theo chiều ngược lại khá đơn giản. Người ta cũng
phải dựa vào bảng mã tạo ra trong giai đoạn nén.
Ví dụ
Một tệp dữ liệu mà tần suất các ký tự cho bởi:
Ký tự Tần suất
“1” 152
“2” 323
“3” 412
“4” 226
“5” 385
“6” 602
“7” 92
“8” 112
“9” 87
“0” 1532
“.” 536
“+” 220
“-” 315
“ ” 535
Bảng tần suất sắp xếp theo thứ tự giảm dần:
Ký tự Tần suất Xác suất
“0” 1532 0.2770
“6” 602 0.1088
“.” 536 0.0969
“ ” 535 0.0967
“3” 412 0.0746
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
57
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
“5” 385 0.0696
“2” 323 0.0585
“-” 315 0.0569
“4” 226 0.0409
“+” 220 0.0396
“1” 152 0.0275
“8” 112 0.0203
“7” 92 0.0167
“9” 87 0.0158
Lưu ý rằng, trong phương pháp Huffman, mã của ký tự là duy nhất và không mã nào là
phần bắt đầu của mã khác. Ví vậy, khi đọc tệp nén từng bit từ đầu đến cuối ta có thể duyệt
cây mã cho đến một lá, tức là ký tự đã được giải nén.
Cây mã Huffman
Bảng từ mã gán cho các ký tự bởi mã hóa Huffman:
Ký tự Từ mã
“0” 10
“6” 010
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
58
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
“.” 001
“ ” 000
“3” 1110
“5” 1100
“2” 0111
“-” 0110
“4” 11110
“+” 11011
“1” 111111
“8” 111110
“7” 110101
“9” 110100
Thuật toán giải nén
- Bước 1: Đọc lần lượt từng bit trong tập tin nén và duyệt cây nhị phân đã được xác
định cho đến khi hết một lá. Lấy ký tự ở lá đó ghi ra tệp giải nén.
- Bước 2: Trong khi chưa hết tập tin nén thì thực hiện bước một, ngược lại thì thực
hiện bước 3.
- Kết thúc thuật toán.
Ƣu nhƣợc điểm:
Ưu điểm:
Thuật toán Huffman có ưu điểm là hệ số nén tương đối cao, phương pháp thực hiện
tương đối đơn giản, đòi hỏi ít bộ nhớ, có thể xây dựng dựa trên các mảng bé hơn
64KB.
Nhược điểm:
- Mã Huffman chỉ thực hiện được khi biết tần suất xuất hiện của các ký tự.
- Mã Huffman chỉ giải quyết được độ dư thừa phân bố ký tự.
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
59
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
- Huffman tĩnh đòi hỏi phải xây dựng cây nhị phân sẵn chứa các khả năng. Điều này
đòi hỏi thời gian không ít do ta không biết trước kiểu dữ liệu sẽ được thực hiện
nén.
- Quá trình giải nén phức tạp do chiều dài mã không biết trước cho đến khi ký tự đầu
tiên được tìm ra.
3.2.2. Nén RLE
Mã hóa loạt dài RLE là một phương pháp nén ảnh dựa trên sự cắt bớt các dư thừa về
không gian (một vài hính ảnh có vùng màu lớn không đổi đặc biệt là ảnh nhị phân). Loạt
được định nghĩa là dãy các phần tử điểm ảnh (pixel) liên tiếp có cùng chung một giá trị.
Phương pháp mã hóa loạt dài lúc đầu được phát triển dành cho ảnh nhị phân như các văn
bản trên nền trắng, trang in, các bức vẽ kỹ thuật.
Nguyên tắc
Phát hiện một loạt các bit lặp lại, thì dụ như một loạt các bit 0 nằm giữa 2 bit 1 hay ngược
lại, một loạt bit 1 nằm giữa 2 bit 0. Vì dụ: 110000000000000011. Dãy các bit lặp gọi là
loạt hay mạch (run). Tiếp theo, thay thế chuỗi đó bởi một chuỗi mới gồm 2 thông tin:
chiều dài chuỗi và bit lặp (ký tự lặp). Như vậy, chuỗi thay thế sẽ có chiều dài ngắn hơn
chuỗi cần thay.
- Ví dụ:
Cho một chuỗi nguồn d:
d= 5 5 5 5 5 5 5 5 5 5 19 19 19 19 19 0 0 0 0 0 0 0 23 23 23 23 23 23 23 23
Ta sẽ có chuỗi mới là: (10 5) (5 19) (7 0) (8 23)
Tỷ số nén = 30/8 = 3.75
Đối với ảnh đen trắng chỉ sử dụng 1 bit để biểu diễn 1 điểm ảnh thí phương pháp này tỏ ra
rất hiệu quả.
- Ví dụ:
Cho một chuỗi nguồn:
d= 000000000000000111111111100000000001111111111000000000000000
Ta có chuỗi mới: (15, 10, 10, 10, 15)
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
60
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
Tỷ số nén = 60/(5*4) = 3 (chỉ sử dụng 4 bit để thể hiện độ dài loạt và không thể hiện giá
trị loạt ví ảnh đen trắng chỉ có 2 giá trị bit là 0 hoặc 1).
Chú ý:
- Cần lưu ý rằng, đối với dữ liệu ảnh, chiều dài của chuỗi lặp có thể lớn hơn 255,
nếu ta dùng một byte để lưu trữ chiều dài thí không đủ. Giải pháp được dùng là
tách chuỗi đó thành 2 chuỗi: một chuỗi có chiều dài 255, chuỗi kia là số bit còn
lại.
- Phương pháp này chỉ có hiệu quả khi chiều dài dãy lặp lớn hơn một ngưỡng nào đó
hay nói cách khác trong ảnh cần nén phải có nhiều điểm ảnh kề nhau có cùng giá
trị màu. Do đó, phương pháp này không đem lại cho ta kết quả một cách ổn định
vì nó phụ thuộc hoàn toàn vào ảnh nén, chỉ thích hợp cho ảnh đen trắng hay ảnh
đa cấp xám.
- Ví dụ:
Ta có một chuỗi nguồn:
d = 5 7 9 11 13 18 28 38 48 58 30 35 40 45
Chuỗi kết quả sau khi mã hóa:
1 5 1 7 1 9 1 11 1 3 1 18 1 28 1 38 1 48 1 58 1 30 1 35 1 40 1 45
Tỷ số nén = 14/ 28 = 0.5
Như vậy, chuỗi sau khi mã hóa lớn hơn nhiều chuỗi nguồn ban đầu. Do đó, cần phương
pháp cải tiến để xử lý những trường hợp như trên tránh làm mở rộng chuỗi dữ liệu nguồn
nghĩa là chỉ mã hóa độ dài loạt dữ liệu lặp lại. Người ta đưa ra cách là thêm ký tự tiền tố
vào trước độ dài loạt, việc giải mã được thực hiện nếu gặp ký tự tiền tố với độ dài loạt và
giá trị điểm ảnh theo sau.
- Ví dụ:
Ta có chuỗi nguồn:
d= 5 8 4 8 8 8 8 8 8 8 8 10 10 10 10 10 10 10 10 10
Giả sử ký tự tiền tố là “@” ta có chuỗi sau khi mã hóa: 5 8 4 @ 7 8 @ 9 10
Tỷ số nén = 19/9/ 2.1
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
61
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
Tuy nhiên, trong một số trường hợp các điểm ảnh có độ tương quan với nhau về giá trị
mức xám như trong vì dụ dưới đây ta có thể tiến hành xử lý như sau:
- Ví dụ:
Ta có một chuỗi nguồn:
d= 5 7 9 11 13 18 28 38 48 58 55 60 65 70 75 80 85 90 95 100
Ta dựa vào độ tương quan này để có được hiệu quả nén cao, bằng việc áp dụng e(i) = d(i)
– d(i-1) sẽ thu được:
5 2 2 2 2 5 10 10 10 10 10 -3 5 5 5 5 5 5 5 5 5
Áp dụng phương pháp nén RLE ta thu được:
(1 5)(4 2)(1 5)(5 10)(1 -3)(9 5)
3.2.3. Nén LZW
a. Phương pháp mã hóa LZ78
Mô hình từ điển (Dictionary – based compression):
Có 2 loại:
- Mã hóa từ điển tĩnh ( Static dictionary coding)
- Mã hóa từ điển động ( Dynamic dictionary coding)
Có rất nhiều thuật toán áp dụng kỹ thuật này như: LZ77, LZK, LZSS, LZHnhưng trong
bài này chúng ta chỉ đề cập đến hai thuật toán chình là:
- Thuật toán LZ78
- Thuật toán LZW
Jacob Ziv và Abraham Lempel đã mô tả kỹ thuật dựa trên từ điển bằng mã hóa LZ77 và
LZ78. Ý tưởng dựa trên việc thay thế 1 cụm ký tự bằng một con trỏ, trỏ đến vị trì xuất
hiện trước đó của cụm ký tự.
LZW là mã hóa trong họ LZ, hoàn thiện hơn LZ77 – LZ78 và đang được sử dụng phổ
biến hiện nay.
Nguyên tắc:
Thay ví thông báo vị trì đoạn văn lặp lại trong quá khứ, mã LZ78 đánh số tất cả
các đoạn văn sao cho mỗi đoạn ghi nhận số hiệu đoạn văn lặp lại trong quá khứ cộng
với một ký tự mà nó làm cho đoạn đó khác với đoạn trong quá khứ. Như vậy, mỗi đoạn
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
62
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
mới là một đoạn ký tự trong quá khứ cộng với một ký tự trong quá khứ. Chình ví thế
đoạn mới khác với đoạn cũ trong quá khứ.
Ví dụ:
Giả sử ta có đoạn văn bản sau: “aaabbabaabaaabab”
Theo thuật toán LZ78 thí chúng được phân thành các đoạn như sau:
Input a aa b ba baa baaa bab
Đoạn 1 2 3 4 5 6 7
Output 0 + a 1 + a 0 + b 3 + a 4 + a 5 + a 4 + b
Như vậy, bản nén của chúng ta là: (0, a); (1, a); (0, b); (3, a); (4, a); (5, a); (4, b)
Nói chung thuật toán LZ78 là một thuật toán nén vă bản khá tốt, có thời gian chạy chương
trính tương đối nhanh, tuy nhiên khả năng tiết kiệm chưa được khai thác tối đa.
b. Phương pháp mã hóa LZW
Khái niệm nén từ điển được Jocob Lempe và Abraham Ziv đưa ra lần đầu tiên năm
1977 và lấy tên là LZ77. Năm 1978 cải tiến dựa trên LZ77 và lấy tên là LZ78. Năm 1984,
Welch đã cải tiến giải thuật LZ thành giải thuật mới hiệu quả hơn và được đặt tên là LZW
(Lempe – Ziv - Welch). Phương pháp này xây dựng từ điển lưu các chuỗi ký tự có tần
suất lặp lại cao và thay thế bằng từ mã tương ứng mỗi khi gặp lại chúng, nó hay hơn các
phương pháp trước đó ở kỹ thuật tổ chức từ điển cho phép nâng cao tỷ lệ nén.
Giải thuật LZW được dùng cho tất cả các loại file nhị phân, thường được dùng để nén các
loại dữ liệu như: văn bản, ảnh đen trắng, ảnh màu, ảnh đa cấp xám và là chuẩn nén cho
các dạng ảnh GIF và TIFF. Số bit/pixel không ảnh hưởng đến hiệu quả của LZW.
Nguyên tắc
Giải thuật nén LZW xây dựng một từ điển lưu các mẫu có tần suất xuất hiện cao trong
ảnh. Từ điển là tập hợp những cặp từ vựng và nghĩa của từ vựng. Trong đó, từ vựng sẽ là
các từ mã được sắp xếp theo thứ tự nhất định, nghĩa là một chuỗi con trong dữ liệu ảnh,
từ điển được xây dựng song song với quá trính đọc dữ liệu. Sự xuất hiện của chuỗi con
trong từ điển khẳng định rằng chuỗi đó đã từng xuất hiện trong phần dữ liệu đã được đọc
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
63
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
qua.Thuật toán liên tục tra cứu và sau mỗi lần đọc một ký tự ở dữ liệu đầu vào thí tiến
hành cập nhật lại từ điển.
Do giới hạn của bộ nhớ và để đảm bảo tốc độ tím kiếm nhanh, từ điển chỉ có giới hạn
4096 phần tử dùng để lưu trữ giá trị của các từ mã. Như vậy, độ dài lớn nhất của từ mã là
12 bit (4096 = ). Cấu trúc từ điển như sau:
- 256 từ mã đầu tiên theo thứ tự từ 0255 chứa các số nguyên từ 0255. Đây là mã
của 256 ký tự cơ bản trong bảng mã ASCII.
- Từ mã 256 chứa một mã đặc biệt là mã xóa (CC – Clear Code). Khi số mẫu lặp lớn
hơn 4096 thí người ta sẽ coi ảnh gồm nhiều mảnh ảnh và từ điển sẽ gồm nhiều từ
điển con. Khi hết một mảnh ảnh sẽ gửi 1 mã xóa CC để báo hiệu kết thúc mảnh ảnh
cũ và bắt đầu mảnh ảnh mới đồng thời sẽ khởi tạo lại từ điển.
- Từ mã thứ 257 chứa mã kết thúc thông tin (EOI – End Of Information). Thông
thường một file ảnh GIF có thể chứa nhiều mảnh ảnh, mỗi mảnh ảnh này sẽ được
mã hóa riêng. Chương trính giải mã sẽ lặp đi lặp lại thao tác giải mã từng ảnh cho
đến khi gặp mã kết thúc thông tin thì dừng lại.
- Các từ mã còn lại (từ 258 đến 4095) chứa các mẫu thường lặp lại trong ảnh. 512
phần tử đầu tiên của từ điển biểu diễn bằng 9 bit. Các từ mã từ 512 đến 1023 biểu
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
64
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
diễn bởi 10 bit, từ 1024 đến 2047 biểu diễn bởi 11 bit và từ 2048 đến 4095 biểu diễn
bởi 12 bit.
Ví dụ
Cho chuỗi đầu vào: “HELLOHELLOHELL”
Từ điển ban đầu đã gồm 256 ký tự cơ bản.
Kìch thước đầu vào: 14 x 8 = 112 bit
Đầu vào Đầu ra Thực hiện
H(72) H đã có trong từ điển -> đọc tiếp
E(69) 72 Thêm vào từ điển mã 258 đại diện chuỗi HE
L(76) 69 Thêm vào từ điển mã 259 đại diện chuỗi EL
L 76 Thêm vào từ điển mã 260 đại diện chuỗi LL
O(79) 76 Thêm vào từ điển mã 261 đại diện chuỗi LO
H 79 Thêm vào từ điển mã 262 đại diện chuỗi OH
E HE đã có trong từ điển -> đọc tiếp
L 258 Thêm vào từ điển mã 263 đại diện chuỗi HEL
L LL đã có trong từ điển -> đọc tiếp
O 260 Thêm vào từ điển mã 264 đại diện chuỗi LLO
H OH đã có trong từ điển -> đọc tiếp
E 262 Thêm vào từ điển mã 265 đại diện chuỗi OHE
L EL đã có trong từ điển -> đọc tiếp
L 259 Thêm vào từ điển mã 266 đại diện chuỗi ELL
76 Input = FALSE
EOI
Chuỗi đầu ra là: 72 69 76 76 79 258 260 262 259 76
Kìch thước đầu ra: 6 x 8 + 4 x 9 = 84 bit
Tỷ số nén = 112/ 84 = 1.3
Quá trính giải nén thực hiện như sau:
Code Outbuff() AddToDictionary()
Bài giảng Nhập môn Đa phương tiện – Ngành TTĐPT, CNTRT
65
Bộ môn Truyền thông Đa phương tiện – Đại học Công nghệ thông tin và Truyền thông
CodeWord String
72 H
69 E 258 HE
76 L 259 EL
76 L 260 LL
79 O 261 LO
258 HE 262 OHE
260 LL 263 HEL
262 OH 264 LLO
259 EL 265 OHE
76 L 266 ELL
EOI
Chuỗi thu được sau giải nén: “HELLOHELLOHELL”
Các file đính kèm theo tài liệu này:
- bai_giang_nhap_mon_da_phuong_tien_p1_7877.pdf