Audio Video

156
BÀI GIẢNG XỬ LÝ AUDIO & VIDEO

description

Sách

Transcript of Audio Video

Page 1: Audio Video

BÀI GIẢNG

XỬ LÝ AUDIO & VIDEO

Page 2: Audio Video

LỜI MỞ ĐẦU

Bài giảng Xử lý Audio và Video là tài liệu được biện soạn nhằm phục vụ cho

đối tượng học viên thuộc chuyên ngành Kỹ thuật Điện tử - Viễn thông. Để giúp

học viên tìm hiểu môn học một cách dễ dàng, tài liệu đã được chọn lọc biên soạn

với những nội dung rất căn bản về lý thuyết theo một trình tự logic, được trình bày

qua 5 chương.

Chương 1, đại cương về tín hiệu audio và video, đây là bức tranh toàn cảnh

về tín hiệu audio và video.

Chương 2, số hóa tín hiệu audio và video, trình bày những đặc trưng về

biến đổi của tín hiệu audio và video tương tự-số.

Chương 3, truyền dẫn tín hiệu audio và video, trình bày những nguyên tắc

truyền dẫn tín hiệu audio và video số.

Chương 4, ghi phát tín hiệu audio và video số, trình bày những nguyên tắc

ghi phát (lưu trữ) tín hiệu audio và video số.

Chương 5, nén dữ liệu audio và video, trình bày những phương pháp xử lý

nén audio và video.

Biên soạn tài liệu này, tác giả đã tổng hợp và chọn lọc những nội dung dựa

theo các tài liệu của các tác giả đã được xuất bản, qua đó cũng đã cập nhật những

nội dung mới nhằm làm phong phú cho môn học. Tuy đã có nhiều cố gắng và thận

trọng nhưng tài liệu không sao tránh khỏi những sai sót, mong sự thông cảm và

đóng góp ý kiến của bạn đọc.

Page 3: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Chương 1

ĐẠI CƯƠNG VỀ AUDIO VÀ VIDEO 1.1. QUÁ TRÌNH PHÁT TRIỂN

Khoảng cuối thế kỷ 19 đầu thế kỷ 20, nhiều thiết bị xử lý âm thanh điện tử ra đời, đã mở ra một hướng phát triển mới trong chế tạo các thiết bị điện tử dân dụng. Trong giai đoạn này các nhà khoa học đã thành công trong chế tạo các thiết bị xử lý âm thanh như: hệ thống máy điện thoại, máy cassette, các máy quay đĩa và máy phát thanh…Ngày nay âm thanh điện tử được ứng dụng rộng rãi trong các thiết bị dân dụng, nhiều thiết bị âm thanh số ra đời có tính năng kỹ thuật cao từng bước thay thế cho các thiết bị âm thanh tương tự trước đây. Cho đến nay, hầu như các gia đình đều sở hữu một vài thiết bị điện tử phục vụ đời sống tinh thần.

Khi kỹ thuật truyền thanh ra đời thì truyền hình là tiêu điểm nghiên cứu quan trọng cho các nhàkhoa học. Đến khoảng giữa thế kỷ 20, thời kỳ thế chiến thứ II, kỹ thuật truyền hình ảnh động đấu tiên ra đời, nhưng chỉ nhằm để phục vụ cho mục đích quâ sự. Sau khi kết thúc chiến tranh, truyền hình ở các quốc gia mới thực sự nhằm vào mục đích dân dụng, từ đó kỹ thuật truyền hình không ngừng được cải tiến và phát triển. Cho đến nay, thế giới thực sự đổi thay từ khi mọi gia đình có thể thưởng thức thông tin bằng hình ảnh và âm thanh.

Trong suốt hơn 50 năm qua, truyền hình đóng một vai trò quan trọng trong sự phát triển của nền kinh tế tri thức của thế giới. Cho đến nay cùng với sự phát triển mạnh mẽ của công nghệ điện tử, nhiều công nghệ truyền hình thế hệ mới ra đời với những tính năng kỹ thuật cao dần thay thế cho truyền hình tương tự trước đây, truyền hình số với những công nghệ khác nhau như: truyền hình mặt đất, truyền hình cáp, truyền hình vệ tinh...đã thực sự làm cho thế giới truyền hình ngày càng sóng động hơn.

1.2. ẢNH TỰ NHIÊN

Ảnh tự nhiên là những gì mà chúng ta có thể trông thấy xung quanh thế giới thực, chúng được tạo ra bởi các nguồn ánh sáng mặt trời hoặc ánh sáng nhân tạo phản xạ lên các vật thể mà ta có thể trông thấy. Truyền hình là một hệ thống tín hiệu hình ảnh và tín hiệu âm thanh analog được phát triển rất cao. Cơ sở của hệ thống truyền hình là dựa trên đặc tính của thị giác con người, đặc tính này cũng được áp dụng trong hệ thống truyền hình kỹ thuật số hiện nay.

1

Page 4: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Mục đích hệ thống tái tạo ảnh điện tử (video) là thu ảnh tự nhiên và tái tạo lại với những khoảng cách về không gian, hoặc cả hai (hình 1.1). Ở đây chúng ta quan tâm đến hai thuộc tính nhìn thấy của cảnh quan là màu sắc và độ chói.

Chuyển đổi ảnh-tín hiệu Xử lý tín hiệu

Tạo xung đồng bộ

Lưu trữ hoặc truyền dẫn

Xử lý tín hiệu Chuyển đổi tín hiệu-ảnh

Tách xung đồng bộ

Mắt người xem

Ảnh tái tạo

Ảnh tự nhiên Ống kính

Hình 1.1. Hệ thống tái tạo ảnh điện tử

Nhưng cảnh tự nhiên ít khi được tạo nên từ một nguồn sáng đơn sắc. Ảnh tại mọi điểm trong cảnh quan là tổng của ánh sáng từ các nguồn đồng nhất với ánh sáng phản xạ từ các vật xung quanh. Sự chiếu sáng vừa nêu đã được sửa đổi bởi các thành phần phản chiếu từ các vật xung quanh môi trường tạo ra một sự chiếu sáng mà màu sắc và độ sáng của nó thay đổi theo từng cảnh. Đối với những cảnh phức tạp hơn, mắt người có thể thích nghi với sự thay đổi từng khu vực chiếu sáng cho đến lúc không còn cảm nhận được nữa khi quan sát trực tiếp. Hệ thống tái tạo hình ảnh cũng cần tạo ra một kết quả tương tự .

Quá trình chuyển đổi tín hiệu-ảnh hoàn toàn đồng bộ và đồng pha với quá trình chuyển đổi ảnh-tín hiệu thì mới khôi phục được ảnh quang đã truyền đi. Để thực hiện sự đồng bộ và đồng pha, trong hệ thống truyền hình phải dùng một bộ tạo xung đồng bộ. Xung đồng bộ được đưa đến bộ xử lý tín hiệu để khống chế quá trình phân tích ảnh, đồng thời đưa đến bộ xử lý tín hiệu hình rồi truyền sang phía thu, tín hiệu hình được cộng thêm xung đồng bộ gọi là tín hiệu truyền hình.

1.3. ÂM THANH TỰ NHIÊN

Âm thanh là những biến đổi áp suất nhanh xảy ra trong không khí do nhiều quá trình tự nhiên gây nên. Tiếng gió thổi trên cành cây, tiếng sóng biển vỗ bờ , tiếng chim kêu…tất cả đều là âm thanh tự nhiên. Nhiều hệ thống do con người chế

2

Page 5: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

tạo cũng tạo ra những biến đổi áp suất tương tự, đôi khi còn có ý chủ định, hay đôi khi còn do khách quan. Một dàn nhạc tạo ra những âm thanh có chủ định với mục đích thưởng thức âm nhạc. Trong khi, âm thanh của một động cơ phản lực phát ra khi cất cánh lại được coi là do khách quan gây lên.

Tai con người phản ứng lại những biến đổi áp suất không khí ở phạm vi tần số trong khoảng từ 30Hz đến 15000Hz sau đó đưa đến não và đó chính là âm thanh. Độ lớn hay biên độ dao động của những biến đổi áp suất này tạo nên cảm giác về tiếng ồn.

Âm thanh chuyển động trong không khí theo quy tắc truyền sóng, vì vậy người ta có thể nghe thấy một âm thanh phát ra từ khoảng cách khá xa và những biến đổi áp suất âm thanh thường được gọi là sóng âm. Trong mọi trường hợp, sóng âm thanh là sóng tương tự. Sóng âm chuyển động trong không khí với vận tốc xắp xỉ bằng 345m/s ở nhiệt độ phòng và mực nước biển. Theo lý thuyết về sóng, mối liên hệ giữa tần số f và bước sóng λ là:

λ = v/f (1.1)

Ngoài ra, các tính chất khác của sóng âm thanh cũng có tầm quan trọng đối với việc thiết kế các thiết bị âm thanh. Sóng âm sẽ phản xạ với bề mặt cứng (những bề mặt không hấp thụ sóng âm) tạo nên hiệu ứng về tiếng vọng và vang âm. Sóng âm thanh bị nhiễu xạ, chúng có thể xuyên qua các lỗ hỏng, các khe hở và đến từng ngóc ngách. Sóng âm thanh cũng có thể bị khúc xạ, nó sẽ bị bẻ cong khi vận tốc truyền thay đổi ở những khu vực khác nhau với nhiệt độ và mật độ không khí khác nhau. Tầm quan trọng của những hệ quả này là hàm điều kiện môi trường và bước sóng. Về mặt toán học, việc tạo những đường truyền sóng âm thanh trong một môi trường thực tiễn khá phức tạp.

Âm thanh tự nhiên không chỉ liên quan đến hai yếu tố là nguồn phát và người nghe, bởi vì sóng âm luôn phản xạ với các đồ vật xung quanh môi trường. Người nghe tiếp nhận âm thanh phản xạ ngay sau khi âm thanh đó được phát ra. Người ta gọi các yếu tố có liên quan đến âm thanh này là môi trường âm thanh. Môi trường này rất quan trọng đối với việc tái tạo lại âm thanh bằng hệ thống điện tử.

Một trong những yếu tố chủ yếu của môi trường âm thanh được tạo ra do hiện tượng phản xạ, thường xảy ra ở những không gian kín (như phòng hoà nhạc). Do tốc độ giới hạn của âm thanh, song âm được truyền đi trong một phòng kín mất nhiều thời gian để đến được tai người hơn là âm thanh trực tiếp và được gọi là những âm bị trễ mà có thể nghe thấy sự lặp lại của âm thanh trước. Chúng ta có thể nhận thấy rõ tiếng vọng xẩy ra khi sự trễ âm phản xạ lớn hơn khoảng 50m/s, tương đương với khoảng cách là 17m. Tiếng vọng rõ nhất với những âm thanh có thời gian trễ lớn hơn, ví dụ như tiếng vọng xảy ra trong một thung lũng.

3

Page 6: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Ở những khu vực không gian hẹp hơn, có thể có rất nhiều phản xạ mà không một phản xạ nào có thể bị trễ khác biệt hẳn tới mức là tiếng vọng. Tuy nhiên, âm thanh vẫn tiếp tục truyền đi trong phòng cho đến khi nó biến mất hoàn toàn do có hiện tượng hấp thụ âm, và gọi là hiện tượng tiếng vọng.

Hiện tượng tiếng vang tạo ra cảm giác về không gian, nó rất quan trọng trong quá trình mô phỏng âm thanh. Ví dụ, nếu việc mô phỏng âm thanh không thu được tiếng vang (trường hợp máy thu đặt gần, hoặc thậm chí đặt máy thu ngay tại nguồn âm), âm thanh sẽ trở thành âm “chết”. Điều kiện này có thể khắc phục bằng cách đưa vào những tiếng vang nhân tạo (thường xử lý bằng kỹ thuật số). Các chương trình truyền hình gốc (chưa được biên tập) thường được thực hiện ở những điều kiện âm “chết” này với mục đích là tiếng vang nhân tạo sẽ được đưa vào trong quá trình biên tập, điều này giúp cho biên tập viên có thể kiểm soát được âm thanh.

Tiếng vang được lượng tử hoá trong khoảng thời gian đủ để nó phá huỷ 1/1000 âm gốc. Đối với phòng thiết kế riêng cho phòng hội thảo, thời gian vang của âm thích hợp nhất là 1 giây. Với một phòng hòa nhạc, thời gian dài hơn một chút, lên đến khoảng 2 giây.

Việc đo âm bằng các thiết bị như micro hay loa cần phải được thực hiện trong một môi trường hoàn toàn cách âm để tách các đặc tính của chúng ra khỏi các đặc tính của môi trường. Một loại phòng đặc biệt được gọi là phòng cách âm được thiết kế cho mục đích này. Loại phòng này hấp thụ tất cả các âm thanh nhập vào chu vi của nó, vì vậy hiện tượng phản xạ không xảy ra. Về cơ bản đây là một không gian “chết”. Khi nói trong căn phòng này, người ta hầu như không thể nghe được giọng nói của chính mình .

1.4. TÁI TẠO ÂM THANH ĐIỆN TỬ

Âm thanh điện tử được gọi chung là audio. Hình 1.2 minh họa một hệ thống audio điển hình. Âm được thu từ nguồn nhờ một hoặc nhiều micro và những tín hiệu audio thu được truyền qua hệ thống cho đến khi tới loa phát (bộ phận chuyển các tín hiệu điện thành sóng âm).

Nguồn

âm Thu audio Lưu trữ hay

truyền dẫn Máy thu

Hình 1.2. Hệ thống tái tạo âm thanh điện tử

Mục đích tái tạo âm thanh điện tử là để tải các sóng âm thanh đến những khoảng cách xa cả về không gian và thời gian, để người nghe có thể tiếp nhận như thể họ đang nghe âm trực tiếp từ nguồn. Một mục đích khác nữa là để chau chuốt

4

Page 7: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

âm thanh mới không có trong tự nhiên, làm cho âm thanh điện tử hay hơn âm gốc, hoặc tạo ra những âm thanh mới không có trong tự nhiên.

1.5. THỊ GIÁC CON NGƯỜI

Mắt người là một thiết bị rất đặc biệt bao gồm trên 100.000.000 (108) phần tử cảm biến cùng một hệ thống điều khiển độ sáng cho phép nhìn rõ ở một phạm vi độ sáng hơn 10 triệu tới 1. Hai mắt kết hợp với não tạo ra khả năng nhận biết các vật trong không gian ba chiều. Mặc dù hầu hết các hệ thống tái tạo điện tử không có các tính năng này nhưng bằng cánh thiết kế như các đặc điểm của mắt trong bộ não điện tử, hệ thống có khả năng đáp ứng nhiều mục đích ứng dụng.

1.5.1. Độ phân giải

Thị lực trung bình của mắt là 20/20, vùng trung tâm thị lực là một cung có góc khoảng 1/60 độ. Đây là độ phân giải của mắt, tất nhiên chỉ áp dụng đối với những ảnh của các vật thể trên thang xám. Còn đối với ảnh màu, độ phân giải của mắt sẽ giảm đi (xem phần 1.8.1). Độ phân giải ở đây có nghĩa là mắt người có thể nhìn rõ các vật thể có kích thước khoảng 1cm khi nhìn khoảng cách là 3m, trường nhìn của mắt gần bằng 1800, một người có thể phân biệt được tổng cộng 180×60 =10.800 vật thể ngang qua trường nhìn. Tuy nhiên, độ phân giải của mắt giảm dần từ trung tâm của thị giác, vì vậy tổng số vật thể trong thực tế là ít hơn nhiều .

Hệ thống ảnh điện tử phân biệt được một số lượng lớn các vật thể trong ảnh đơn thực tế là rất hiếm. Vì vậy, nó thường được thiết kế sao cho màn hình hiển thị có kích thước nhỏ hơn tổng trường nhìn của mắt. Do đó, hầu hết hình ảnh đều được quan sát bởi phần có độ phân giải đầy đủ nhất của mắt, và độ phân giải đầy đủ cũng là yếu tố quan trọng cần được sử dụng trong các thao tác tính toán hình ảnh điện tử. Một đặc điểm khác cũng yêu cầu sử dụng độ phân giải đầy đủ nhất là khả năng chuyển động của mắt để mang vật thể cần nhìn vào trung tâm thị giác. Một màn hình hiển thị ở một góc rộng, khi nhìn gần sẽ gặp một số vấn đề đó là người xem sẽ nhìn trực tiếp vào bất cứ phần nào trên màn hình thu hút họ trước nhất. Ở một thời gian đặc biệt nào đó nó có thể là một điểm bất kỳ trên màn hình. Do vậy toàn bộ màn hình đều cần phải có độ phân giải cao.

Ta biết rằng, ảnh trong các hệ thống số được miêu tả là một chuỗi các pixel. Hệ thống hiển thị cần phải thiết kế sao cho các pixel không bị lộ diện nếu như không có sẽ gây ảnh hưởng xấu tới chất lượng ảnh. Người ta thường hạn chế số lượng pixel trong ảnh để đủ cho người xem ở khoảng cách nhìn quy định hoặc lớn hơn, không thể phân tích được. Một thông số quan trọng cần tính đến ở đây là tỉ lệ nhìn, được xác định bằng tỉ lệ giữa khoảng cách người xem (tính từ màn hình) với độ cao nhất của ảnh.

5

Page 8: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

VR= d/PH (1.2)

Trong đó: VR = tỉ lệ nhìn.

d: khoảng cách từ mắt tới màn hình.

PH: độ cao của ảnh (lấy theo cùng đơn vị d)

Khi sử dụng hình ảnh theo độ phân giải trên đây, số lượng tối đa của các điểm ảnh có thể nhìn thấy được ở một tỉ lệ nhất định là:

Số điểm ảnh = 3440/VR (1.3)

Lưu ý, đối với một bức ảnh có số pixel xác định, nếu ở khoảng cách cho trước mà mắt chưa phân biệt được các điểm ảnh thì đây là kích cỡ lớn nhất của ảnh, điều đó tương đương với tỉ lệ nhìn là nhỏ nhất (bảng 1.1). Điều này đúng cho cả hệ thống video số và video tương tự. Hệ thống video tương tự quan tâm đến số dònd quét hơn là số pixel trên một ảnh. Trong khi đó, các dòng quét lại ngây nhiễu cho khả năng nhìn hơn pixel, đây chính là nhược điểm của hệ thống video analog. Các máy tính thường hoạt động với các thông số thấp hơn.

Hệ thống Dòng hoặc pixel/ph Tỉ lệ nhìn

Hệ NTSC 483 7.2

HDTV 1080 3.2

Màn hình máy tính 768 4.5*

Bảng 1.1. Các tỉ lệ nhìn nhỏ nhất

1.5.2. Tạo mức xám

Để tạo ra hình ảnh rõ nét, ánh sáng phát ra ở màn hình phải tỉ lệ với độ sáng phát ra từ cảnh ở một điểm. Điều này có nghĩa là các tín hiệu video phải là một hàm tuyến tính với độ chói của ảnh. Tuy nhiên, thiết bị hiển thị tiêu biểu (CRT) lại có cường độ hàm phi tuyến, ngược với hàm tín hiệu, rất nhiều các tiêu chuẩn của hệ thống đã đưa vào các phần sửa lỗi phi tuyến trong tín hiệu video, bởi vì nếu sửa lỗi phi tuyến tại các máy thu thì giá thành rất cao .

Hầu hết các bộ cảm biến trong camera truyền hình có đặc tuyến ánh sáng tuyến tính, vì vậy camera thường được lắp đặt hệ thống sửa méo gamma để đưa vào tín hiệu có đặc tính biên độ phi tuyến cần thiết. Gamma là một đường đặc tuyến của hàm mũ xấp xỉ bằng biên độ phi tuyến chuyển giao. Ví dụ, gamma của một CRT điển hình là 2,2. Như vậy một camera phải đưa phần sửa lỗi với số mũ là 1/2,2 hoặc 0,45. Đặc tính này được thể hiện bằng đường cong trên hình 1.3.

6

Page 9: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

0.5 1.0 0.0

0.5

1.0

Đầu

ra tư

ơng đố

i

Ү= 45

Hình 1.3. Đường cong sửa lỗi 45.0=γ

Tuy nhiên, đa phần máy tính áp dụng tiêu chuẩn sửa lỗi gamma chứ không phải truyền hình, vì vậy đôi khi việc gây lỗi là cần thiết khi chuyển đổi giữa các tín hiệu truyền hình và tín hiệu trong máy tính.

1.5.3. Rung hình và tỷ lệ phục hồi

Người ta không nhận thấy sự nhấp nháy của màn hình bởi vì mắt có khả năng lưu hình. Có nghĩa là, hệ thống thị giác phản ứng rất chậm với sự thay đổi nhanh của ánh sáng trên màn hình. Tuy nhiên, sự chiếu sáng thay đổi theo chu kỳ với tần số thấp (khi được chiếu sáng bởi đèn điện có tần số thấp), gây ra hiệu ứng mà ta gọi là hiện tượng rung hình. Hiện tượng rung hình phụ thuộc vào số lượng của độ chiếu sáng (rung hình dễ nhận thấy hơn khi hình ảnh có độ chói cao) và cũng dễ nhìn hơn khi nhìn ở ngoại vi tầm nhìn. Hiệu ứng vừa rồi giúp chúng ta nhạy cảm hơn với những vật chuyển động nhanh (có thể là nguy hiểm) xuất hiện đầu tiên ở ngoại vi tầm nhìn. Vấn đề điều khiển rung hình khá quan trọng, bởi vì nếu ánh sáng ở màn hình bị rung kéo dài sẽ gây ra chứng mổi mắt người xem.

Hệ thống Tỷ lệ phục hồi Môi trường VR

NTSC 60 (59,94) Phòng khách 7

PAL 50 Phòng khách 7

Màn hình máy tính 72 Phòng sáng 1-2

Rạp chiếu phim 48 Phòng tối 5-10

Bảng 1.2. Các tỉ lệ phục hồi tiêu biểu

7

Page 10: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Thiết bị điện tử lại có hiệu ứng lưu hình ngược lại, ánh sáng phát ra sẽ bị hủy sau một thời gian ngắn. Vì vậy, ảnh điện tử phải được phục hồi thường xuyên để duy trì hiệu ứng chiếu sáng ổn định. Tỉ lệ phục hồi phải đủ để tránh tình trạng rung hình ở các điều kiện xem mong muốn. Tỉ lệ phục hồi tiêu biểu được trình bày trong bảng 1.2. Ở điện ảnh, tỉ lệ phục hồi có thể thấp bởi vì các rạp chiếu phim thường phải tối và ảnh không được quá sáng. Riêng máy tính lại ở trong tình trạng ngược lại, thường hiển thị trong một phòng sáng, màn hình cũng phải sáng, và như vậy tỉ lệ nhìn thấp có nghĩa là những phần màn hình này xuất hiện ở ngoại vi tầm nhìn.

Hiện tượng rung hình với một số lượng thích nghi nhất định, điều này xảy ra khi cùng một kiểu nhìn đều đặn diễn ra. Ví dụ, tỉ lệ phục hồi 50 Hz được sử dụng ở một số quốc gia được đánh giá là hoàn toàn hợp lí với người bản địa. Song, một số quốc gia khác tỉ lệ 60 Hz cũng được áp dụng.

1.5.4. Tái tạo ảnh chuyển động

Sự chuyển động của ảnh được tạo ra trong hệ thống video nhờ vào cập nhật nội dung trên màn hình với tỉ lệ vừa đủ để người xem có thể nhận biết được một quá trình chuyển động liên tục. Trong một hệ thống truyền hình, nó được thực hiện ở camera và tỉ lệ quét của màn hình.

Trong những trường hợp đơn giản nhất, camera video sẽ tạo ra mành riêng biệt cho mỗi chu kỳ phục hồi của màn hình. Đây chính là cách hoạt động thông thường của tryuền hình số, tỉ lệ mành của camera và màn hình như nhau. Thực chất, tỉ lệ ở hai bộ phận này đã được đồng bộ hoá. Trong phương thức vận hành này, tín hiệu phát ra từ camera không ngừng đi tới màn hình mà không cần sự can thiệp của quá trình xử lý hay lưu trữ nào. Khi đề ra các tiêu chuẩn màn hình, vấn đề xử lý hay lưu trữ vẫn chưa được bàn đến, do vậy hệ thống thiết kế cho màn hình được phục hồi bằng cách liên tục phát ra các tín hiệu mới từ camera, thậm chí ngay cả khi hình ảnh đã dừng.

Hiện nay với công nghệ kỹ thuật số, lưu trữ và xử lý là hai quá trình tồn tại thường xuyên trong hệ thống, và camera cũng như màn hình không cần thiết phải có tỉ lệ mành như nhau thậm chí không cần phải đồng bộ. Camera có thể hoạt động ở một tỉ lệ mành vừa đủ để tạo lại chuyển động, còn màn hình có thể vận hành ở một tỉ lệ cao hơn, đáp ứng chỉ tiêu rung hình cần thiết. Thậm chí có thể ngừng hẳn việc truyền theo chu kỳ của những hình ảnh đã dùng, để giảm yêu cầu mà quá trình truyền dữ liệu đặt ra.

Như đề cập ở trên, để giảm độ rung hình, tần số mành ở 50 Hz hoặc cao hơn nữa và màn hình cũng có thể quét ở tần số này. Nhưng quá trình tái tạo chuyển động thường tốt nhất với tần số mành 30Hz, hoặc thậm chí có thể thấp hơn. Do vậy quá trình quét ảnh của camera càng phải diễn ra nhanh, để đủ hỗ trợ quá trình tạo

8

Page 11: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

chuyển động. Các hệ thống số có thể đáp ứng cả những tiêu chí này. Khi theo dõi một vật chuyển động nhanh, người ta có cảm giác như sự chuyển động này rất rõ nét. Tuy nhiên, thực chất hình ảnh chuyển động lại rất mờ do hiệu ứng lưu hình của mắt đã nêu ở trên. Tuy nhiên, nếu mắt di chuyển theo chuyển động của vật, sự mờ ảo của chính vật đó sẽ giảm xuống nhưng phong hình lại trở lên mờ ảo. Một hệ thống mô phỏng không thể đồng thời giải quyết tình trạng này do camera thu ảnh điện tử đều có lưu hình như nhau. Đây được gọi là sự kéo vết của chuyển động xảy ra do camera có thời gian lộ sáng xác định.

Vấn đề đặt ra không khó khăn lắm với hệ thống truyền hình bình thường hoạt động ở tỉ lệ nhìn thiết kế sẵn vì hình ảnh ở đó không rộng đến mức người xem có thể di chuyển theo chiều chuyển động của vật. Camera thường di chuyển theo chuyển động của vật, người xem không cần thiết phải làm việc này. Tuy nhiên, với màn hình có độ phân giải cao và rộng hơn, người xem có thể phải di chuyển mắt theo những phần khác nhau của cảnh để đáp ứng đầy đủ trường nhìn của mình. Sau nữa, camera cũng không nên di chuyển theo vật và phải có thời gian lộ sáng ngắn để vật chuyển động sắc nét hơn.

1.6. THÍNH GIÁC CỦA CON NGƯỜI

Độ nhạy của tai con người không hề thua kém mắt. Kết hợp với não, tai có thể tiếp nhận sóng âm ở phạm vi biên độ lớn và trong chốc lát nó có thể xác định phương hướng tần số, đặc tính của âm nguồn thông tin (trong trường hợp đây là lời nói). Hiểu được khả năng và hạn chế của hệ thống sinh học tuyệt vời này là một điều quan trọng đối với công việc tái tạo hệ thống âm thanh diện tử. Nghiên cứu quá trình thích giác của con người được gọi là khoa học tâm lý âm thanh.

1.6.1. Tiếng ồn

Tiếng ồn là phản ứng của con người với biên độ sóng âm thanh, nó nằm trong ngưõng có thể nghe được ở mức độ âm thanh thấp đến ngưỡng của sự chói tai của những âm cao nằm trong phạm vi từ 1012 (1000.000.000.000:1) hoặc nhiều hơn ở những âm thanh có cường độ cao. Âm thanh có cường độ cao được biểu thị bằng W/m×m. Do phạm vi rộng, thông thường âm thanh được tính theo dB. Ở mức độ âm chuẩn (0 dB) thường được sử dụng như là ngưỡng nghe và 120dB (ví dụ như mức độ âm ở khoảng cách 457,2m phát ra từ một động cơ máy bay phản lực khi cất cánh) gần như được coi là ngưỡng của âm chói, ở mức độ này tiếng ồn trở nên khó chịu. Nếu như ở mức độ cao hơn thính giác của con người có thể bị tổn thương.

Con người cũng không thể nghe được nhiều âm thanh ở các mức độ khác nhau trên toàn bộ phạm vi ở bất kỳ thời điểm nào, bởi vì các âm thanh lớn có xu hướng lấn áp những âm thanh yếu. Tuy nhiên, khi những âm thanh hữu ích (như lời nói,

9

Page 12: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

âm nhạc) có xu hướng xuất hiện những khoảng lặng và tai con người nhanh chóng phản ứng với sự thay đổi mức độ âm thanh đó. Vì vậy, việc đưa ra tỉ lệ tín hiệu trên tạp âm S/N ở 80 hoặc 90dB, nếu như tiếng ồn hoàn toàn không thể nghe được, là rất quan trọng đối với quá trình tái tạo âm thanh điện tử chất lượng cao. Mặc khác, nếu chỉ tính đến khả năng nghe rõ, tai có thể hiểu được lời nói S/N bằng 30dB hoặc thậm chí còn thấp hơn.

1.6.2. Đặc tuyến tần số

Đặc tuyến tần số của thính giác con người nằm trong phạm vi từ 30 đến 15000Hz. Tuy nhiên, con số này thay đổi một cách đáng kể tùy theo từng người và từng loại tiếng ồn. Các đường cong ở hình 1.4 biểu diễn một số cấp độ âm thanh tạo ra cảm giác tiếng ồn như nhau ở những tần số và các cấp độ âm thanh khác nhau.

120

100

80

60

40

20

0

0

2

0

4

0

6

0

80

1

00

120

20 50 100 500 1000 5000 10000

Tần số (MHz )

Biên

độ

(dB

)

Hình 1.4. Đường cong biên độ tín hiệu duy trì độ ổn định âm lượng

Những đường cong này dựa trên cơ sở nghiên cứu tâm lý do Fletcher và Munson tiến hành. Đường cong thấp hơn biểu thị chệch khỏi phạm vi tần số khoảng 40dB, khi âm thanh lớn hơn có sự thay đổi cảm giác đối với tần số. Ở 120dB, mọi tần số âm thanh đều lớn như nhau.

Do phụ thuộc vào mục đích của hệ thống nên không biết lúc nào phải tái tạo đủ phạm vi tần số. Ví dụ như điện thoại, loại máy được thiết kế dùng cho đàm thoại chỉ có độ rộng band tần từ 300 đến 3000Hz. Mặc khác, đối với các loại máy nghe nhạc HI-FI lại cần toàn bộ band tần từ 30 đến 15000Hz. Rất nhiều hệ thống audio lại yêu cầu độ rộng band tần ở mức cao hơn thế, từ 20 dến 20000Hz.

1.7. QUÉT ẢNH

10

Page 13: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Một cảnh tự nhiên phản chiếu ánh sáng đồng thời từ tất cả các điểm, trong khi mắt người có thể cảm thụ được tất cả các điểm này tương đương 108 bộ cảm biến của mắt. Việc cảm nhận dòng dữ liệu này song song phụ thuộc vào não. Tuy nhiên cấu trúc song song như vậy không thông dụng trong điện tử, vì vậy hệ thống ảnh điện tử gặp phải những vấn đề khó khăn khác, nó phải chuyển dữ liệu song thành một hoặc vài tín hiệu điện tử thay đổi theo thời gian, phương tiện để thực hiện việc này chính là quá trình quét ảnh.

Quét ảnh cũng giống như đọc một quyển sách, bắt đầu ở bên góc trái trên cùng của cuốn sách, mắt người đọc sẽ di chuyển theo chiều ngang từ trái sang phải bắt đầu dòng đầu tiên của văn bản, ở cuối dòng này mắt lại quay ngược trở lại bên trái và di chuyển xuống dòng tiếp theo, đây được coi là quá trình quét dòng.

Hướng quét ngang

Hướ

ng q

uét dọc

Xung quét dòng

Xung quét mành

Hình 1.5. Quét liên dòng: a) mành quét, b) dạng xung quét.

Do vậy, quét ảnh là một quá trình di chuyển các phần tử cảm biến lên mọi điểm của một ảnh đến khi toàn bộ ảnh được quét hết, tất nhiên điều này có thể được thực hiện trong mô hình quét như rada, theo hình soắn ốc hoặc thậm chí là ngẫu nhiên. Trong truyền hình người ta đã lựa chọn kiểu quét hình chữ nhật (được gọi là mành) bao gồm các chuyển động theo hàng dọc hàng ngang tách rời nhau. Điều này đã được chứng tỏ ưu thế ở chỗ toàn bộ cảnh do một phần tử chuyển động đồng bộ với tốc độ đồng nhất quét và thiết bị lắp đặt phần cứng cũng đơn giản.

1.7.1. Quét ảnh điện tử

11

Page 14: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Để có mô hình quét ảnh ổn định, tần số quét ảnh hàng dọc (quét mành) và hàng ngang (quét dòng) phải được đồng bộ hoá trong mối quan hệ thống nhất. Nếu một hệ thống có N dòng, tần số quét dòng phải ở mức cao nhất và tỉ lệ với tần số quét dọc theo công thức:

fh = N × fv

Tần số quét dòng cũng là tần số quét ảnh trong hệ thống. Ví dụ nếu tần số quét ảnh là 60Hz thì tần số quét dọc cũng là 60 Hz. Đối với hệ thống 525 dòng, tần số quét dòng là 525× 60 = 31500Hz.

Các tín hiệu quét phải được thiết kế để tạo ra quá trình quét tuyến tính, có nghĩa là tốc độ quét phải đồng nhất trên mọi vị trí của ảnh. Điều này khá quan trọng đối với camera và máy thu nhằm đảm bảo sự đồng bộ của ảnh trên màn hình máy thu. Bất cứ độ phi tuyến trong quá trình quét ảnh cũng sẽ gây ra sự biến dạng vị trí trên một vài phần ảnh. Mặc dù, trên lí thuyết có thể sử dụng mô hình quét ảnh phi tuyến, nhưng mô hình này rất khó di trì, và tốc độ quét không đồng bộ nên sẽ gây ra một số vấn đề như: sự thay đổi độ phân giải, độ nhạy cảm và độ chói. Chính vì vậy các tiêu chuẩn quét ảnh của video đều sử dụng quét tuyến tính.

1.7.2. Xoá khoảng trống

Vị trí của các phần tử quét phải chuyển động tuyến tính trên một đường thẳng theo thời gian. Điều này được áp dụng trong quá trình quét ảnh từ trái qua phải trên một dòng của màn hình (đây là thời gian quét tích cực), nhưng không cần thiết trong quá trình quét ngược lại. Giai đoạn này thời gian quét càng ngắn càng tốt. Trước đây, quét ngược trong các hệ thống truyền hình bị giới hạn bởi các mạch quét, do vậy thời gian quét ngược chiếm gần 18% tổng thời gian quét một dòng. Điều này gây ra lãng phí, bởi vì trong thời gian này không có một thông tin nào được tuyền. Thực tế trong thời gian này tín hiệu bị xoá do bị đẩy tới điện áp của mức đen. Do vậy, chu kỳ quét ngược thường được gọi là khoảng xoá dòng và quét ảnh tuyến tính phải có dạng hình răng cưa. Hình 1.5(b) quét mành cũng là một quá trình tuyến tính, khoảng xóa mành (VBI) là 8 % đối với truyền hình.

1.7.3. Độ phân giải theo chiều ngang và dải thông tín hiệu

Như trong khi đọc một cuốn sách, mắt phải nhận biết từ kí tự này đến kí tự khác, quá trình quét ảnh ở một camera video di chuyển rất hiệu quả các phần tử cảm biến nên ảnh. Điện áp lấy tại đầu ra thay đổi tỉ lệ với cường độ ánh sáng ở mỗi điểm mà bộ cảm biến quét qua, (trong thực tế không có phần tử chuyển động nào, nhưng kết quả lại giống như chuyển động này vẫn tồn tại).

Một phần tử cảm biến có kích cỡ xác định, bộ cảm biến lấy trung bình ánh sáng mà nó cảm nhận được thông qua góc mở. Lấy trung bình như vậy đã làm mất

12

Page 15: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

các chi tiết nhỏ hoặc gây ra độ dốc của tuyến tính ở tần số cao khi chúng ta quan sát tín hiệu điện này, hiệu ứng gây ra bởi góc mở, gọi là đặc tưyến góc mở, được minh họa trong hình 1.6. Hình này đưa ra một góc mở tròn, tuy nhiên góc mở có thể là bất cứ hình gì và độ nhạy không được phân bổ đồng đều. Điều này đã biến quá trình lấy trung bình thành một quá trình gộp toàn bộ diện tích góc mở. Kết quả như đã chỉ trong hình vẽ, là làm tròn các biên trên các quá trình chuyển tiếp và số biên độ bị mất khi khoảng cách giữa các hình nhỏ hơn kích thước của góc mở.

Góc mở trong quá trình quét

Đầu ra tín hiệu video

Hình 1.6. Đặc tuyến góc mở trong quá trình quét

Về hình thức bên ngoài các tần số video tạo bởi quá trình quét ảnh phụ thuộc vào những chi tiết nhỏ của cảnh và tốc độ quét. Việc quan sát các chi tiết nhỏ để biết hệ thống tạo ra mô hình có dòng đen và trắng cân bằng là rất hữu ích trong các hình theo chiều dọc kiểm tra độ phân giải theo chiều ngang của hệ thống và ngược lại, các hình theo chiều ngang kiểm tra độ phân giải theo chiều dọc.

Đối với độ phân giải theo chiều ngang tần số video fv tạo bởi một hình của các dòng đen và trắng theo chiều đứng ở khoảng cách đồng nhất được cho tính bằng biểu thức:

fV= (fH × Np × AR)/ 2(1-HB) (1.3)

fH: tần số quét dòng

Np: số dòng đen trắng ở khoảng cách cân bằng với độ cao của ảnh

AR: cỡ ảnh là tỷ lệ của chiều rộng và chiều cao của màn hình (NTSC là 1,33).

HB: thời gian xóa dòng (0,18 đối với hệ NTSC)

1.7.4. Quét cách dòng

Phương pháp quét mô tả trong những phần trên được gọi là quá trình quét liên dòng bởi vì tất cả các dòng hoặc mỗi ảnh đều được quét liên tục. Công thức (1.5) chỉ rõ tần số video lớn nhất được tạo bởi quá trình quét ảnh tỉ lệ với tần số quét dòng, và tất nhiên sẽ bằng tần số quét dọc nhân với số dòng quét. Do tần số quét dọc phải đủ lớn để không gây ra hiện tượng rung hình, nên người ta có thể nhận

13

Page 16: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

thấy độ rộng band tần video cần thiết là một hàm số dòng trực tiếp trong ảnh và giá trị của tần số quét theo hàng dọc. Tuy nhiên, tần số video có thể hạ thấp mà không gây ra hiện tượng rung hình bằng phương pháp quét cách dòng.

Quét cách dòng được thực hiện bằng cách chỉ quét từng phần của dòng quét trong mỗi lần quét dọc. Ví dụ, một lần quét dọc thứ nhất có thể quét tất cả các dòng lẻ, và lần quét dọc thứ hai quét tất cả các dòng chẵn. Đây chính là quét cách dòng tỉ lệ 2:1, và tần số video giảm theo hệ số 2:1 so với quá trình quét liên dòng ở cùng tần số quét dọc. Do tần số quét dọc không đổi, nên hiện tượng rung hình hầu như không xảy ra.

Hướng quét ngang

Hướ

ng q

uét dọc

Xung quét

dòng

Xung quét mành

Hình 1.7. Quét cách dòng: a) mành quét b) dạng xung quét

Quá trình quét dòng được hoàn thành khi tổng số dòng quét phải là số lẻ (525 hoặc 625) và tần số quét dòng bằng 1,5 lần tích của số dòng và tần số quét dọc. Từ mối quan hệ tần số này sẽ cho ra kết quả của quá trình quét cách dòng như trong hình 1.7. Trong hình này, điểm cuối của lượt quét dọc thứ nhất nằm ở trung tâm của dòng, vì vậy điểm xuất phát của dòng quét dọc thứ hai cũng nằm ở trung tâm của một dòng (chính xác là diểm giữa của dòng đầu tiên). Phải mất hai lượt quét mới quét hết một ảnh gồm hai mành: mành 1 bao gồm tất cả các dòng lẻ và mành 2 bao gồm tất cả các dòng chẵn.

1.7.5. Độ phân giải đứng

14

Page 17: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Không giống như độ phân giải ngang thường bị giới hạn bởi độ rộng band tần của hệ thống, độ phân giải đứng lại bị giới hạn bởi số lượng các dòng quét trên hình. Các hình ngang hoặc gần kề, ở những chi tiết nhỏ được lấy mẫu bằng tần số không gian của số dòng quét thể hiện qua số dòng quét tích cực. Tiêu chuẩn Nyquist đã chỉ ra rằng các tần số vượt quá 1,5 chu kỳ lấy mẫu sẽ không lấy được mẫu chính xác nên người ta có thể kết luận giới hạn độ phân giải theo hàng dọc đo ở TVL là 1.5 số dòng tích cực. Tuy nhiên, trong thực tế giớn hạn này có thể cao hơn bởi vì hiện tượng méo do chồng phổ, không hoàn toàn che khuất tín hiệu. Trước đây, trong hệ thống truyền hình, người ta đã đặt tên cho tỷ lệ giữa độ phân giải giới hạn biểu kiến và số dòng tích cực là hệ số Kell. Nó nằm trong phạm vi từ 0.5 đến 0.9 và thường lấy ở 0.7.

Kết hợp quét cách dòng và chồng phổ theo chiều dọc ở các biên ngang sẽ gây ra hiệu ứng giả trong quá trình tái tạo lại ảnh tự nhiên, đó chính là hiện tượng rung hình ở các biên ngang gần kề và hiện tượng rung hình theo hình chữ chi ở một phần của ảnh có hướng tập trung theo chiều ngang.

Hiệu ứng lấy mẫu theo chiều dọc xảy ra ở bất cứ hệ thống nào có sử dụng quét dòng, vì vậy nó tồn tại trong các hệ thống video số cũng như truyền hình. Để loại trừ hoàn toàn hiện ứng này, tần số đầu vào trên giới hạn Nyquist phải được lọc ra trước quá trình lấy mẫu. Điều này có nghĩa là, quá trình lọc phải được thực hiện ở phần quang học của camera trước khi quá trình quét xảy ra ở bộ cảm biến ảnh.

1.8. BIỂU DIỄN MÀU SẮC

1.8.1. Đặc trưng màu sắc của ánh sáng

Ánh sáng tự nhiên là một nguồn sáng tổng hợp các sóng điện từ nằm trong giải phổ có bước sóng từ 400 đến 700nm (10-9m) mà mắt người có thể quan sát được. Sự phân bố phổ biến của ánh sáng trắng tương đối đồng đều trên toàn bộ dải ánh sáng quan sát được mặc dù có rất nhiều loại ánh sáng trắng. Ngược lại, sự phân bố của ánh sáng màu không đồng đều, thường có từ hai vùng phổ trở lên. Quá trình phản chiếu ánh sáng trắng từ bề mặt của những vật tự nhiên có thể có sự chọn lọc bước sóng, điều này tạo ra đặc tính màu sắc của vật. Sóng của ánh sáng ở bước sóng của màu sắc được phản chiếu, bước sóng khác ít nhiều bị hấp thụ thay bằng bị phản chiếu

Mắt người nhận biết được màu sắc bằng ba loại tế bào hình nón khác nhau trong bộ thụ cảm của võng mạc. Chúng phản ứng khác nhau với những màu sắc khác nhau và phát tín hiệu ba chiều tới não, tại đây màu sắc sẽ được nhận biết. Chính vì quá trình nhận biết này mà mắt người cảm nhận màu sắc không giống với màu sắc vật lý. Một hệ thống tái tạo màu sắc thường quan tâm tới các thông tin về

15

Page 18: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

màu sắc vật lý (phân bố phổ), tuy nhiên nó vẫn phải tái tạo lại được cảm giác màu sắc mà người xem cảm nhận được.

Từ thế kỷ thứ 17, Isaac Newton đã chỉ ra rằng tất cả các màu sắc đều có thể cảm nhận chỉ bởi từ ba màu tương đương với ba thành phần cảm thụ màu sắc trong mắt và điều này được trình bày thông qua thuyết ba màu. Đây là cơ sở cho ảnh màu, in màu, sơn màu và các hệ thống truyền hình màu.

1.8.2. Các màu cơ bản

Thuyết ba màu cho rằng bất kỳ màu sắc nào cũng được tạo ra bởi sự kết hợp của ba màu, được gọi là các màu cơ bản (hình 1.10). Ba màu cơ bản sử dụng trong hệ thống truyền hình này: đỏ, lục, lam. (gọi tắt là RGB). Khi trộn ba màu theo tỷ lệ bằng nhau thì sẽ thu được màu trắng .

Mỗi màu cơ bản có một màu phụ tương ứng, mà khi trộn với màu cơ bản của nó sẽ tạo ra nàu trắng. Màu phụ của màu đỏ là màu lơ, của màu lục là màu mận chín và của màu lam là màu vàng như biễu diễn ở hình 1.8. Như vậy trong sử lý ảnh màu cũng như trong kỹ thuật truyền hình màu người ta chỉ dùng ba màu cơ bản để biểu diễn cho vô số các màu sắc của ảnh bằng cách pha trộn những màu sắc cơ bản này theo những tỷ lệ màu nhất định.

Đỏ tươi Đỏ

Vàng

Lục Lơ

Lam Các màu cơ bản

Phụ của màu lục

Phụ của màu lam

Phụ của màu đỏ

Hình 1.8. Các màu cộng và trừ cơ bản

1.8.3. Hệ thống truyền hình thành phần

Trong hệ thống truyền hình màu, camera phải phát đi ba thành phần màu sắc điều khiển các nguồn ánh sáng đỏ, lục, lam của màn hình. Camera video chuyên nghiệp thực hiện việc này bằng cách sử dụng ba bộ thụ cảm hình ảnh được quét đồng thời và ba bộ này có bộ phận lọc màu sắc phù hợp để đạt được đặc tuyến phổ tương ứng. Đầu ra của bộ thụ cảm sẽ truyền tín hiệu để điều khiển ba súng điện tử

16

Page 19: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

của máy thu. Các camera giá thấp hơn chỉ sử dụng một bộ thụ cảm có bộ lọc màu sửa sai để thu ba màu từ khu vực lân cận trên bề mặt thụ cảm. Quá trình xử lý điện tử của các tín hiệu ở camera này cho phép lấy ra các thành phần màu sắc RGB.

Khi hệ thống lớn, việc xử lý các tín hiệu thành phần màu sắc trên ba mạch song song trở nên phức tạp, có nhiều tín hiệu video mắc nối tiếp và không thể thực hiện được khi các tín hiệu màu analog được truyền hoặc phát quảng bá trên một kênh đơn. Vì vậy, cần thiết phải có một hệ thống màu tổng hợp kết hợp ba thành phần màu sắc thành một tín hiệu đơn .

Chú ý rằng, trong hệ thống số mà các thành phần RGB được số hoá, việc kết hợp các kênh số cho một trong ba thành phần, một kênh đơn giản chỉ là quá trình chuyển đổi song song-nối tiếp. Tuy nhiên, tạo ra một tín hiệu tổng hợp ở một hệ thống analog không phải là một công việc đơn giản và thường có liên quan đến các quy ước về chỉ tiêu kỹ thuật. Do đó, bất cứ một hệ thống nào được thiết kế theo tiêu chuẩn kỹ thuật số đều không nên sử dụng các tín hiệu tổng hợp analog. Dù vậy, rất nhiều hệ thống sẽ đổi từ analog sang số và việc số hoá các tín hiệu tổng hợp analog được miêu tả dưới đây là rất có ích trong giai đoạn chuyển tiếp .

Một số thao tác kĩ thuật giúp hệ thống màu tổng hợp analog có thể sử dụng vào hệ thống số cũng rất hữu ích với các hệ thống số. Phần bàn luận dưới đây sẽ chỉ ra điều đó. Tuy nhiên, phần bàn luận hệ thống tổng hợp này mới chỉ dừng lại ở việc khái quát.

1.8.4. Hệ thống màu tổng hợp

Mắt người còn có một đặc tính nữa góp một phần khá quan trọng cho hệ thống truyền hình màu. Từ cách thu thập thông tin trong não, có thể nhận thấy là mắt có độ phân giải kém với các vật thể có màu sắc hơn là với các vật đen trắng. Vì vậy, một hệ thống video cũng phải giảm độ phân giải, để khai thác đặc tính này của mắt, các tín hiệu màu cơ bản của một hệ thống video tạo bởi camera cần phải được cấu trúc lại thành các màu sắc riêng biệt và đơn sắc giống như cách mà mắt thực hiện.

Thuyết ba màu cho rằng, bất cứ một tín hiệu ba màu nào xuất hiện, đều có thể thực hiện phép chuyển đổi ma trận tuyến tính của các tín hiệu thành phần R,G,B thành một tín hiệu đơn sắc (độ chói) và hai tín hiệu hiệu màu. Các tín hiệu màu là các khác nhau về màu sắc, có nghĩa là khi không có màu ta có kết quả bằng 0. Đây là kết quả của phép trừ tín hiệu chói cho các tín hiệu màu thành phần.

1.8.4.1. Độ chói và các thành phần tín hiệu màu

Tín hiệu chói có đặc tuyến phổ tương ứng với đường chói (hình 1.9), nó thể hiện độ chói tương đối mà mắt người thu được ở những phổ màu khác nhau. Tín hiệu chói Y được tổng hợp bằng cách kết hợp các tín hiệu R, G, B theo công thức:

17

Page 20: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Y = 0,59G + 0.30R + 0,11B (1.6)

Chú ý là trọng số của màu sắc ở công thức chói là thích hợp với sự cảm nhận của thị giác về độ chói của màu sắc. Màu lục xuất hiện chói nhất, màu đỏ tối hơn và màu lam là tối nhất. Các tín hiệu màu nhận được bằng cách trừ Y với R và B để tạo ra tín hiệu R-Y và B-Y. Những tín hiệu này có thể truyền đi với dải band tần có độ rộng một nữa do sự phân giải của mắt kém hơn. Độ chói các tín hiệu màu được sử dụng rộng rãi trong hệ thống tương tự và số.

210 x fH211 x fH212 x fH

0 1.0 2.0 3.0 4.0

Biê

nđộ

Tần số MHz

1.0

0.5

400 440 480 520 560 600 640 680

Hình 1.9. Đường cong độ chói 1.8.4.2. Tần số quét cách dòng

Một đặc tính khác của tín hiệu video là có thể kết hợp các thành phần tín hiệu chói và các thành phần tín hiệu màu thành một kênh đơn. Điều này được lý giải là các thành phần tần số tạo bởi tín hiệu video được quét hầu hết đều tập trung xung quanh hài của tần số quét dòng.

Hình 1.10. Phổ của tín hiệu video đơn sắc

18

Page 21: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Về mặt toán học, điều này có thể được chứng minh bằng phép phân tích Fourier các tín hiệu video tiêu biểu, song nó có thể được chứng minh theo trực giác bằng cách quan sát và thấy rằng, các thành phần có ý nghĩa nhất của sóng video là tín hiệu xoá dòng, đó là một chuỗi xung của tần số quét dòng. Tất nhiên, phổ của xung này có thể bao gồm tần số quét dòng và hài của nó, như hình 1.10.

Bản chất này là phổ năng lượng tín hiệu tập trung vào gần hài của tần số dòng. Có nghĩa là, có thể quét các dòng với tín hiệu mà các thành phần tần số của nó hầu hết có thể bị giảm ở giữa các hài của dòng. Nếu điều này được thực hiện một cách chính xác sẽ giảm thiếu được nhiễu giữa hai tín hiệu.

1.8.4.3. Hệ thống truyền hình màu tổng hợp NTSC

Hệ thống truyền dẫn màu tổng hợp đầu tiên là công nghệ truyền hình màu NTSC xuất hiện tại Mỹ vào những năm 50. Hệ thống này kết hợp các tín hiệu thành phần ba màu thành một tín hiệu tổng hợp phù hợp với kênh 6MHz, kênh này sử dụng cho truyền hình quảng bá đen trắng. Hơn nữa, tín hiệu này có thể đáp ứng được tính tương hợp giữa truyền hình màu và truyền hình đen trắng, tức là tín hiệu màu đen trắng có thể thu được tín hiệu màu và cả đen trắng nữa. Hệ NTSC hiện nay vẫn được sử dụng hơn 50 năm sau khi ra đời.

210 x fH211 x fH212 x fH

0 1.0 2.0 3.0 4.0

Biên

độ

Tần số MHz

Sóng mang màu Dải tín

hiệu sắc

Dải biên tín hiệu chói

Phổ tín hiệu chói

Phổ tín sắc được chèn

Hình 1.11. Phổ của tín hiệu video màu tổng hợp minh họa quá trình chèn tần số

Ở hệ truyền hình màu NTSC hoặc PAL, hai tín hiệu màu được điều biên nén vuông góc đặc điểm của phương pháp điều chế này là sóng mang phụ sẽ bằng 0 khi không có tín hiệu, nó xảy ra khi truyền ảnh đen trắng. Vì vậy, tín hiệu sóng mang màu sẽ biến mất ở ảnh đen trắng hoặc các vùng đơn sắc của ảnh màu. Bởi vì các tín

19

Page 22: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Sóng mang màu được chọn ở miền tần số cao của phổ tín hiệu chói, bởi vì đặc tính của tín hiệu video là các thành phần tần số cao thường nhỏ và sự nhiễu tần số cao thì khó nhìn thấy hơn tần số thấp. Cả hai vấn đề này điều làm giảm khả năng nhìn các sự xuyên âm giữa các thành phần quét dòng.

Một đặc điểm cuối cùng góp phần làm giảm thiểu sự xuyên âm giữa các thành phần của tín hiệu NTSC là độ phân giải của mắt tuỳ theo màu. Vì vậy, bằng cách chọn các thành phần màu phù hợp, nó sẽ giảm dải tần số tín hiệu màu R-Y và B-Y có thể đến hơn một nữa, điều này yêu cầu thay đổi tín hiệu màu R-Y và B-Y thành hai tín hiệu Y (cùng pha) và Q (cầu phương). Biểu thức ma trận của tín hiệu này là:

I = 0.6R - 0.28G - 0.32B

Q = 0.21R - 0.51R + 0.30B

Trong tiêu chẩn NTSC, tín hiệu I được truyền với dải thông là 1,3MHz, tín hiệu Q có dải thông là 0,5MHz, và tín hiệu Y được sử dụng toàn bộ dải thông 4,2MHz. Bảng 1.3 đưa ra các thông số thực tế cho ba hệ truyền hình.

Danh mục NTSC PAL SECAM

Tần số quét dòng 525 625 625

Tỷ lệ quét cách dòng 2:1 2:1 2:1

Tần số quét mành (Hz) 59,94 50,0 50,0

fH (Hz) 15.734.26 15.625 15.625

Dải thông tín hiệu chói (Mhz) 4,2 5,0 hoặc 5,5 50 hặc 5,5

fSC (Hz) 3.579.545 4.433.619 4.250.000

4.406.250

Dải thông tín hiệu sắc (Mhz) I = 1,3 Q=0,5

U = 1,3 V = 1,3

DR = 1,3 DB = 1,3

Bảng 1.3. Các thông số hệ thống của các hệ thống màu tổng hợp

Tần số mành 59,94 Hz của hệ NTSC có sự khác biệt rất nhỏ so với tần số 60Hz vì một lý do rất quan trọng. Nhằm giảm thiểu hiện tượng nhiễu điều biến xuyên có thể xảy ra giữa tần số mang âm thanh 4,5MHz và tần số mang này thì tần số quét

20

Page 23: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

dòng phải là ước số nguyên của 4,5MHz. Tần số gần nhất tần số dòng 15.725Hz của tiêu chuẩn màn hình trắng đen là ước số thứ 286 của 4,5MHz là 15.7345,26Hz con số này chia cho 525 và nhân với 2 sẽ cho tần số mành 59,94 Hz.

1.8.4.4. Hệ thống truyền hình màu tổng hợp PAL

Vài năm khi hệ NTSC đưa vào sử dụng, hệ truyền hình màu PAL của châu Âu cũng được phát triển và đã thừa hưởng thành quả của hệ thống NTSC, nó có dải thông lớn hơn hệ NTSC và nó được dùng quảng bá châu Âu. Cũng giống như NTSC hệ PAL cũng đáp ứng được tính tương hợp đối với hệ thống truyền hình đen trắng ở châu lục này.

ưHầu hết các n ớc châu Âu có hệ thống đen trắng 625 dòng và có tầng số quét mành là 50Hz. Với độ rộng band tần là 5,5MHz, hệ PAL sử dụng tần số quét màu cao hơn hệ NTSC và có dải thông của 2 tín hiệu màu là như nhau cho mỗi kênh. Từ đó hệ PAL dùng trực tiếp các thành phần B-Y và G-Y. Các thành phần này được gọi là U và V. Các biểu thức của nó là:

U = 0.493(B-Y)

V = ± 0.877(R-Y)

Tuy nhiên có sự khác biệt quan trọng ở hệ PAL chính là tên gọi của hệ này “đảo pha theo từng dòng” được đánh dấu bằng kí hiệu ± trong biểu thức. Pha của sóng mang màu tín hiệu V sẽ bị đảo ngược từ dòng này đến dòng khác. Mục đích của nó là sửa méo pha, méo này có thể gây nên sự méo sắc độ của màu, đây chính là nhược điểm của hệ NTSC, mặc dù nó có thể giảm bớt khi các hệ thống và thành phần được thiết kế một cách cẩn thận. Các thông số của hệ PAL cũng được cho trong bảng 1.3.

1.8.4.5 Hệ thống truyền hình màu SECAM

Một hệ thống truyền hình màu khác được phát triển tại Pháp có tên là SECAM và nó được sử dụng hai sóng mang điều tần để mang hai tín hiệu hiệu màu B-Y và R-Y. Hệ thống này đã loại bỏ các thông số biên độ và pha bởi vì các thông số này không quan trọng với điều tần. Tuy nhiên nó chỉ được sử dụng ở Pháp và Liên Xô cũ. Các thông số của SECAM cũng được cho trong bảng 1.3

1.8.4.6 Các vấn đề nảy sinh với màu tổng hợp

Mặc dù hiện nay có khoảng 10.000 trạm phát hình tới hàng trăm triệu máy thu trên toàn thế giới, tất cả đều sử dụng màu tổng hợp, song những hệ thống này vẫn còn rất nhiều vấn đề cần giải quyết. Kết quả của quá trình điều chế màu và quét cách dòng không hoàn hảo, độ phân giải tín hiệu đen trắng bị tiêu hao, độ phân giải màu bị giảm quá nhiều không thể tái tạo được truyền đi từ máy tính. Quét cách

21

Page 24: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

dòng tạo ra một hiệu ứng giả và các tín hiệu lại không chấp nhận hiện tượng nhiễu hoặc méo do việc truyền hay ghi hình gây nên. Nhìn chung, người xem truyền hình đều hài lòng với hệ thống hiện có, song đó là do chưa có hệ thống nào để họ chọn lựa.

Tuy nhiên, cần nói thêm là các tiêu chuẩn truyền hình hiện nay còn nhiều hạn chế. Đây là mục tiêu của những người đang nghiên cứu phát triển tiêu chuẩn HDTV mới. Sử dụng kỹ thuật số, những hạn chế của truyền hình tổng hợp sẽ được loại bỏ và bằng cách áp dụng công nghệ nén hình số, các tín hiệu có độ phân giải cao hơn nhiều sẽ được truyền đi trên cùng các kênh có tần số 6MHz đang được sử dụng cho hệ thống NTSC.

Tất nhiên, mỗi hệ thống đều có hạn chế riêng, song các tiêu chuẩn HDTV có sự cải thiện chất lượng đáng kể hơn cả so với các hệ thống khác. Tuy nhiên quá trình chuyển đổi từ tương tự sang số sẽ rất khó khăn đối với hệ thống này. Trong thế giới của kỹ thuật số không có không gian giành riêng cho màu tổng hợp

1.9. CÁC TÍN HIỆU VIDEO TƯƠNG TỰ

ưCác tín hiệu do quá trình quét ảnh tạo nên đ ợc xử lý trong camera và định dạng theo tiêu chuẩn của camera. Cùng với việc xác định các tần số quát ảnh tiêu chuẩn video tương tự cũng xác định rõ dạng sóng của tín hiệu video.

1.9.1 Dạng sóng tín hiệu video

Các dạng sóng video tương tự có thể nhìn thấy trên màn hiển thị dạng sóng hoặc trên OSC, nó được đồng bộ hoá với tín hiệu của cả ảnh, mành và tỉ lệ dòng. Ở bất cứ các tỉ lệ này thông tin video thường là ngẫu nhiên và tất nhiên nó sẽ thay đổi khi ảnh thay đổi. Tuy nhiên phần xoá dòng và đồng bộ hoá tín hiệu video không thay đổi và lặp đi lặp lại vì vậy chúng xuất hiện rất nét. Hình 1.12 biểu diễn các dạng sóng video của tiêu chuẩn truyển hình NTSC.

Như biểu diễn ở hình 1.12a. là dạng tín hiệu video trong một chu kì quét dòng, nó minh họa chi tiết dữ liệu trong khoảng xoá dòng bao gồm xung đồng bộ dòng và burst đồng bộ màu. Burst đồng bộ màu bao gồm ít nhất 8 chu kì tần tần số sóng mang màu. Hìmh 1.12b minh hoạ chi tiết không xoá mành. Trong khoảng xoá mành có chứa một xung lớn để đồng bộ quá trình quét mành, tuy nhiên trong khoảng rộng xung này, các xung hẹp lại bị biến thành hình răng cưa để đồng bộ hoá quá trình quét dòng. Bởi vì mối quan hệ giữa sự dịch các xung dòng và xung mành giữa mành chẵn và mành lẻ do tỉ lệ tần số cần cần để quét các dòng nên các xung hình răng cưa trong khoảng đồng bộ mành và các xung cân bằng ở xung quanh có tần số gấp đôi. Nhờ đó xung mành và các xung quanh nó giống nhau cả ở mành chẵn và mành lẻ.

22

Page 25: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Đỉnh mức

trắng

Mức đen

Xung đồng bộ dòng

Tín hiệu hình trên dòng

Bust màu

Khoảng xóa dòng

VBI

Xung đồng bộ mành

Xung đồng bộ mành và cân bằng

Hình 1.12. Dạng sóng tín hiệu video NTSC

Hầu hết các hệ thống truyền hình đều có một vài bộ phận và tín hiệu video phải được truyền giữa các bộ phận đó, vì vậy phải đề ra các tiêu chuẩn kết nối video để xác định cáp, bộ kết nối, mức điện áp. Điều này giúp cho các bộ phận của các nhà sản xuất khác nhau có thể kết nối cùng một hệ thống.

1.9.2. Các đặc điểm của truyền hình tương tự

Tín hiệu ở đầu vào và đầu ra của một hệ thống video luôn là tín hiệu tương tự ngay cả khi hệ thống đó đã được số hoá toàn bộ, người ta vẫn sử dụng các thông số video tương tự để đánh giá hệ thống số.

1.9.2.1. Thang xám

Đặc tuyến thang xám được kiểm tra bằng một ảnh có dạng bậc thang hoặc bằng một tín hiệu có dạng bậc thang xám được biểu diễn trên hình 1.13. Hình (hoặc tín hiệu) bao gồm các bậc thang xám cân bằng các bậc này có thể được tạo lại tuyến tính bởi hệ thống. Bằng cách đưa ra 2 ảnh: 1đi lên và 1 đi xuống, chúng ta có thể so sánh đặc tuyến của điểm giữa. Với hệ thống tuyến tính thật sự, điểm giữa sẽ gặp nhau chính xác ở 50% thang xám. Nếu hệ thống kiểm tra có lỗi gamma thì các bậc này sẽ gặp nhau ở điểm khác nhau như hình đã miêu tả.

23

Page 26: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Đồ thị thang xám Dạng sóng tuyến tính Dạng sóng phi tuyến

Hình 1.13. Ảnh kiểm tra thang xám minh hoạ dạng sóng tuyến tính và phi tuyến

1.9.2.2. Tỉ lệ tín hiệu trên tạp nhiễu

Tỉ lệ tín hiệu trên tạp nhiễu (SNR) được đo bằng cách đo tách riêng tín hiệu và tạp nhiễu. Tuy nhiên ở một hệ thống tương tự, tín hiệu đồng bộ và tín hiệu xoá phải cùng xuất hiện thì mới có tín hiệu. Phép đo SNR, vì vậy được thực hiện bằng cách cung cấp tín hiệu hiện mành dạng phẳng, tín hiệu này thường phải là 50% độ chói đồng đều của thang xám. Cổng do tạp nhiễu dùng để đo sự thay đổi (sự thay đổi này chính là tạp nhiễu) của mành xám. Đồng thời, mành phẳng có thể được quan sát trên bộ kiểm tra dạng sóng và chúng ta có thể đánh giá được độ dày của dòng thuộc mành phẳng. Công thức SNR là:

SNR = (mức tín hiệu đen tới trắng)/(độ dày của dòng thuộc mành phẳng)

Phương pháp này có thể được dùng khi đánh giá tạp nhiễu ở mỗi bậc thuộc thang xám để kiểm tra tạp nhiễu độ chói của hệ thống. Việc kiểm tra tạp nhiễu ở mành phẳng khó hơn khi dùng camera bởi vì camera có thể gây ra sự thay đổi về phông (gọi là bóng) trên mành phẳng khiến người ta nhầm với tạp nhiễu.

1.9.2.3. Các thông số màu sắc

Việc kiểm tra màu sắc phụ thuộc vào bảng chất hệ thống đó là tổng hợp hay thành phần. Ở hệ thống thành phần, chỉ tiêu màu sắc được xác định bởi sự kết hợp các mức độ tín hiệu. Đối với việc kiểm tra các tín hiệu dạng này cần phải đưa vào hệ thống một tín hiệu màu RGB dạng thang. Một hệ thống được điều chỉnh đúng sẽ tạo ra các tín hiệu màu RGB dạng thanh ở đầu ra của nó. Hình 1.14 mô tả một ảnh màu dạng thanh và các dạng sóng RGB của nó.

Một hệ thống tổng hợp sẽ tạo ra các dạng sóng đặc trưng với định dạng của nó. Ví dụ dạng sóng NTSC cho ảnh màu dạng thanh như mô tả trong hình thứ 3 của hình 1.14. Hình màu dạng thanh ở một hệ thống NTSC hay PAL cũng có thể được quan sát trên một màn hình đặc biệt là màn hình dao động tạo sóng hiển thị các

24

Page 27: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

thành phần chói, màn hình này chỉ rõ tọa độ cực màn hình của pha và biên độ sóng mang.

B

R

G

Ảnh

Dạng sóng NTSC (75 biên độ)

Dạng sóng RGB

Hình 1.14. Các tín hiệu thanh màu RGB và ảnh

1.10. TÍN HIỆU AUDIO TƯƠNG TỰ

Hầu hết các âm thanh tự nhiên là sự kết hợp phức tạp các sóng âm thanh có tần số và dạng sóng khác nhau. Vì vậy, phổ của tín hiệu âm tiêu biểu đều phức tạp như nhau, gồm một hoặc nhiều tần số cơ bản, song hài của những tần số đó và các sản phẩm của sự biến điệu xuyên. Vì đa số tần số cơ bản của âm thanh đều dưới 500Hz nên phổ trên mức tần số này chỉ bao gồm các sóng hài. Điều này có nghĩa là mật độ năng lượng của quang phổ âm thanh sẽ giảm ở tần số cao. Đây là một đặc tính cần được khai thác trong quá trình nén tín hiệu hoặc trong các hệ thống giảm tạp âm.

Tín hiệu âm thanh là lưỡng cực, vì vậy chúng dao động trên hoặc dưới giá trị zero. Khi ở đặc tuyến tần số có hiện tượng bị cắt ở thành phần tần số thấp, sẽ không có thành phần một chiều trong bất kỳ một tín hiệu nào.

Không giống như tín hiệu video vốn có cấu trúc dựa vào quá trình quét ảnh, tín hiệu audio tương tự hoàn toàn không có cấu trúc. Không có bất cứ khoảng cách nào trong tín hiệu audio mà ta có thể đoán được giá trị của nó, hoặc có thể chèn thêm thông tin vào được. Một khi tín hiệu audio được số hóa chúng ta có thể xây dựng cấu trúc của nó ở dạng số. Điều này là cần thiết như việc lấy lại thời gian chuẩn cho đồng hồ và chống lỗi trong hệ thống số.

Kỹ thuật audio tương tự rất phát triển, các đặc tính của tín hiệu được hiểu rất cặn kẻ. Các phương pháp đo được sử dụng rông rãi. Phần bàn luận dưới đây là những đặc tính quan trọng nhất và ý nghĩa của chúng trong môi trường số.

25

Page 28: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Nguyên lý cơ bản để xây dựng dạng phổ rất quan trọng trong việc nghiên cứu các đặc tính của tín hiệu audio. Đây là nhược điểm cố hữu của hệ thống tương tự, tuy nhiên sang hệ thống số nó đã được khắc phục. Sự suy yếu cơ bản của hệ thống số chỉ xảy ra ở bộ phận A/D và D/A. Theo đó, ứng dụng duy nhất của các đặc tính tương tự trong hệ thống số là ở bộ phận chuyển đổi A/D và D/A. Các thành phần còn lại của hệ thống số được đánh giá chỉ cần dựa vào các chỉ tiêu của lỗi.

Tuy nhiên, hệ thống số có một vài quá trình có thể ảnh hưởng đến chỉ tiêu kỹ thuật của hệ thống tương tự. Một trong những quá trình đó là nén dữ liệu; nếu quá trình nén dữ liệu xảy ra trong hệ thống thì chúng ta phải đánh giá tác động của nó lên chỉ tiêu kỹ thuật của hệ thống. Hơn nữa, nếu quá trình nén và giải nén diễn ra liên tục trong hệ thống, sẽ gây ra nguy cơ méo tín hiệu trong tường hợp đó, quá trình nén và giải nén sẽ xảy ra ở bất cứ thời điểm nào mà tín hiệu truyền qua máy ghi âm.

1.10.1. Đặc tuyến tần số

Khoảng tần số từ 20Hz đến 20kHz ±0.1dB nhằm dự phòng các tầng analog đã tạo nên đặc thù của đặc tuyến tần số. Trong khi điều này thể hiện độ trong suốt cho một đường truyền thì còn lâu nó mới đạt độ bền vững như toàn bộ hệ thống. Như đã đề cập ở trên, hầu hết con người không thể nghe được ngoài phạm vi 30 đến 15.000 Hz, và không ai có thể phát hiện được sự thay đổi đặc tuyến ở phạm vi 0,1dB. Tuy nhiên, một vài máy CD những đặc tính như vậy đơn giản chỉ là ưu thế của kỹ thuật số.

Đặc tuyến tần số của hệ thống số tương ứng với đặc tuyến tần số của hệ thống tương tự được xác định trước tiên bằng việc chọn tần số lấy mẫu, sau đó là quá trình lọc tần số tại các điểm của bộ A/D và D/A. Khi sử dụng kỹ thuật lấy mẫu tần cao được đề cặp trong phần 1.12 và trong chương 2, thì các chỉ tiêu mô tả trên đây là tương đối dễ chấp nhận ở một hệ thống audio số. Tuy các chỉ tiêu trên khá cao, nhưng nếu hạ thấp giá thành thiết bị cũng không giảm đáng kể.

Đặc tuyến tần số tương tự được đo nhờ một loạt các tín hiệu hình sin ở đầu vào có tần số khác so với tần số của bộ phận đang kiểm tra, và quan sát biên độ của tín hiệu đầu ra. Việc này có thể thao tác đơn giản bằng tay với những tần số riêng lẻ hoặc có thể thao tác bằng những thiết bị tự động quét tần số quá phạm vi và vẽ sơ đồ tín hiệu đầu ra. Vì có những tần số thấp, nên quá trình xác định đặc tuyến tần số có thể mất một vài giây (nếu là tự động) đến vài phút (nếu bằng tay). Đặc tuyến thường được trình bày dưới dạng biểu đồ biên độ như hình 1.15.

Do phạm vi tần số rộng, thang đo tần số được chia theo logarit và tung độ được tính theo dB tương đương với đặc tuyến ở một tần số “trung tâm”, thường là 1.000Hz. Phần lớn các đơn vị đều thể hiện đặc tuyến dạng “phẳng” trên toàn bộ

26

Page 29: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

phạm vi tần số trung tâm và dốc xuống ở mỗi đầu. Đặc tuyến tần số được xác định rỏ bằng cách đưa ra một giá trị dung sai, trong khoảng đó đặc tuyến phải thực sự có ảnh hưởng đến phạm vi tần số được xác định. Hình 1.15 là một ví dụ về dạng đặc tuyến phẳng trong khoảng ±20 dB trên phạm vi từ 20÷ 20.0000Hz.

-6

-4

-2

0

2

4

6

20 50 100 200 500 1000 2000 5000 10000 20000

Tần số (Hz )

Biên

độ

(dB

)

Hình 1.15. Đồ thị đặc tuyến tần số audio điển hình

1.10.2. Tỉ lệ tín hiệu trên tạp âm (SNR)

Mọi hệ thống điện tử đều có tạp âm, vấn đề chỉ là ở chổ giữ cho tạp âm vừa đủ nhỏ so với các tín hiệu yêu cầu để toàn bộ chỉ tiêu hoạt động của hệ thống có thể chấp nhận được. Trong một hệ thống audio tương tự, SNR được xác định bằng dB tương đương với mức độ tín hiệu “bình thường”. Đối với hệ thống audio, cả tiếng ồn và tín hiệu đều được tính theo giá trị quân phương (rms). Hệ thống này được thiết lập cho mức độ tín hiệu bình thường ở 0dB, tín hiệu bị khử và tín hiệu thu được ở đầu ra (được xác định là tạp âm) được đo xấp xỉ là 0dB. Đây là một phương pháp đo đơn giản cho kết quả là một số đơn.

Quang phổ của tín hiệu tạp âm cũng là vấn đề cần quan tâm. Điều này cũng quan trọng đối với các hệ thống audio vì độ nhạy của tai với tạp âm giảm xuống ở vị trí cuối tạp âm. Nó sẽ đánh giá đặc tuyến tần số của tai (hình 1.14). Một vài chuẩn mực được cung cấp với mục đích này, vì vậy khi thực hiện quá trình đo tạp âm có trọng số, người ta phải xác định rõ kỹ thuật trọng số. Trọng số được sử dụng rộng rải nhất là A và CCIR.

Trong hệ thống audio số, tỉ lệ tín hiệu trên tạp âm (SNR) của analog tương ứng không bị ảnh hưởng bởi phần số của hệ thống. Nó chỉ bị ảnh hưởng bởi quá trình chuyển đổi A/D và D/A. Việc đo SNR các phần số của một hệ thống mà không có

27

Page 30: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

tín hiệu hiện thời sẽ là vô nghĩa. Phần số tương ứng của SNR analog thường được coi như là tỉ lệ lỗi bit.

1.10.3. Méo tín hiệu

Tính phi tuyến của các đặc tính chuyển đổi ở hệ thống analog gây ra hiện tượng méo (biến dạng). Ở miền tần số, người ta có thể coi sự méo là những thành phần tần số tạp do sự xuất hiện của một tín hiệu gây ra. Các đặc tính đưa ra đều là biến dạng hài toàn phần (THD), và khi sự biến dạng hài vượt quá khoảng 1% thì ta có thể nghe thấy sự biến dạng này. Các thành phần màu của hệ thống analog thường đưa ra những giá trị nhỏ hơn rất nhiều để dự phòng trong hệ thống lớn.

Quá trình xác định biến dạng analog được thực hiện nhờ sử dụng một tín hiệu âm thuần hình sin (đối với toàn hệ thống) và ở điểm đo, quá rình lọc ra tín hiệu âm thuần sẽ do một thiết bị lọc khấc nhọn thực hiện. Cái còn lại sau bộ lọc này chính là THD. Tuy nhiên, nó cũng chứa cả tạp âm của hệ thống, điều này có lẽ sẽ hạn chế đến quá trình đo, những biến dạng nhỏ trong các hệ thống ồn. THD được xác định là số phần trăm của mức độ tín hiệu bình thường, tất cả được phân định bằng phép đo sự sai lệch bình phương trung bình (rms).

Biến dạng có thể là một hàm tần số tín hiệu và điều này có ý nghĩa trong việc thiết kế hệ thống. Song hầu như chỉ tiêu kỹ thuật đưa ra đều bỏ qua vấn đề này và xác định biến dạng cho một tần số tín hiệu là 1000Hz. Méo tương ứng ở phần tương tự trong hệ thống audio số chỉ bị ảnh hưởng bởi quá trình chuyển đổi A/D và D/A. Việc xác định biến dạng ở hệ thống những phần số là hoàn toàn vô nghĩa.

1.10.4. Dịch chuyển pha

Nếu thời gian trễ ở hệ thống analog thay đổi theo tần số tín hiệu, hệ thống sẽ báo lỗi dịch chuyển pha. Ban đầu, tai có vẻ như không nghe thấy những lỗi này. Tuy nhiên, dịch pha có thể xác định được và đôi khi được xác định rõ trong các thành phần của hệ thống chất lượng cao. Lưu ý thông số này rất quan trọng đối với một hệ thống video, ở hệ thống này nó được gọi là méo thời gian truyền nhóm.

Người ta đo sự dịch chuyển pha nhờ sử dụng một tín hiệu hình sin ở đầu vào và so sánh pha tín hiệu ở đầu ra với đầu vào. Nếu dịch chuyển pha là một hàm tần số tuyến tính của tín hiệu đầu vào, khi đó sự trễ là ổn định và không có biến dạng.

Đối với các hệ thống số, dịch chuyển pha hầu như chỉ xảy ra ở các thành phần ở quá trình chuyển đổi A/D và D/A. Phần đa các bộ lọc số đều không có lỗi dịch chuyển mặc dù bộ lọc số IIR có thể đưa vào những sai số của pha. Vì những đặc tính này bộ lọc IIR rất ít được sử dụng trong hệ thống audio số.

1.10.5. Méo sai tốc âm tần

28

Page 31: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Các tín hiệu audio tương tự truyền qua một số thiết bị như máy ghi băng từ tính hoặc máy ghi đĩa có thể phải chịu sự biến điệu tần số do có sự chuyển động không đồng nhất về chuyển động cơ học của băng và đĩa. Nó được xác định bởi những thông số của sự méo sai tốc âm tần và phách động (W&F). Người ta đo W&F bằng cách đặt một tín hiệu kiểm tra (thường 3,15kHz) lên hệ thống và đo đầu ra thông qua bộ tách sóng biến điệu tần số FM được điều chỉnh đến tần số kiểm tra. W&F được xác định là biến điệu tần số toàn phần rms biểu thị số phần trăm của tần số kiểm tra. Một hệ thống sẽ phải đọc dưới 0,1%, mức này chúng ta không thể nghe thấy.

Một số tiêu chuẩn đáp ứng được quá trình đo này, chúng sẽ thay đổi các đơn vị đo được sử dụng (rms, đỉnh v.v…) và quá trình lọc ở kênh cần đo tuy nhiên vẫn phải tôn trọng đúng tần số kiểm tra. Hầu hết quá trình đo đều hạn chế độ rộng band tần của W&F ở phạm vi từ 0,5 đến 200Hz. Song vẫn có những chuẩn mực đo độ rộng band tần cao hơn nhiều để thu sóng FM nhờ các hoạt động tạo âm ở cơ cấu băng.

Trong hệ thống số, W&F phụ thuộc vào sự ổn định của đồng hồ lấy mẫu sử dụng trong bộ chuyển đổi A/D và D/A. Từ khi những đồng hồ này được sản xuất bởi bộ dao động máy tạo sóng điện tử cho mức ổn định cao, các tính năng W&F của hệ thống số thường thấp dưới 0,001%.

1.11. CHUYỂN ĐỔI TÍN HIỆU AUDIO TƯƠNG TỰ SANG SỐ

Những tham số của quá trình chuyển đổi A/D là tần số lấy mẫu và số bit/ mẫu. Theo chương 2 quá trình sử dụng hệ thống sẽ quyết định độ rộng band tần như mong muốn các chỉ tiêu của SNR. Điều này tạo ra các đặc tính của tần số lấy mẫu và số bit/mẫu. Các hệ thống audio số bao gồm từ CD các hệ thống audio số Hi-Fi đến một vài hệ thống được thiết kế cho điện thoại truyền âm thanh chất lượng cao. Trong số đó có những tiêu chuẩn audio sử dụng cho máy tính cá nhân, ở đây tỉ lệ lấy mẫu thấp hơn do yêu cầu lưu trữ dữ liệu và phải sử dụng nén dữ liệu. Bảng 1.4 đưa ra một vài tiêu chuẩn lấy mẫu tiêu biểu.

Tiêu chuẩn Fs (KHz) Bit/mẫu Dải thông

(kHz) Tốc độ dữ

liệu (byte/s)

CD-DA stereo 44.1 16 20 176.400

WAV mono (speech) 11,05 8 5 11.050

WAV stereo (music) 22.1 16 10 88.400

Telephone (μ-low) 8,0 8 3,5 64.000

29

Page 32: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Bảng 1.4. Các tiêu chuẩn lấy mẩu audio điển hình

Do tín hiệu âm tương tự là lưỡng cực, nên tất cả các hệ thống đều phải dựa vào sự mã hoá bù của cả hai cực mặc dù những hệ thống nén có thể sẽ không truyền mẫu trực tiếp trong định dạng này.

Hầu hết các hệ thống đều sử dụng quá trình lượng tử hoá tuyến tính, trừ một số thiết bị như điện thoại sử dụng lượng tử hoá phi tuyến theo luật μ. Nó tối ưu hoá việc sử dụng một lượng bit nhỏ/ mẫu ở hệ thống này.

Sử dụng bộ lọc ở đầu vào bộ chuyển đổi A/D nhằm loại bỏ những tần số của

tín hiệu đầu vào cao hơn 211 tần số lấy mẫu là hết sức quan trọng bởi vì khi lấy mẫu,

những tần số này sẽ tạo ra những thành phần tần số tạp do sự khác nhau giữa tần số audio và tần số lấy mẫu. Nhưng tần số này được gọi là tần số chồng phổ và bộ lọc này được gọi là bộ lọc tránh chồng phổ. Vì những tần số này không liên quan đến bất cứ tần số nào của âm nên nó rất dễ bị nghe thấy. Với mục đích như vậy, một bộ lọc analog cần phải có độ dốc cao, tuy nhiên để thiết kế được bộ lọc này là rất khó và giá thành cũng tương đối cao.

Một công nghệ có thể tạo điều kiện thuận lợi cho các yêu cầu của quá trình lọc được gọi là lấy mẫu tần số cao (oversampling). Ở phương pháp này, âm analog được lấy mẫu cao hơn chu kỳ lấy mẫu thông thường, nếu không một bộ lọc đầu vào sẽ được sử dụng. Sau khi lấy mẫu, người ta sẽ sử dụng bộ lọc số để đẩy bất cứ thành phần chồng phổ nào “tụ tập” xung quanh tần số lấy mẫu cao và do đây là tần số lấy mẫu cao ta không nên chồng ghép dải thông âm. Một dạng khác của kỹ thuật này lại sử dụng hệ số lấy mẫu tần cao lớn nhưng chỉ số hoá ở 1 bit/mẫu. Kỹ thuật lấy mẫu tần cao sẽ được nói rõ thêm ở phần 2.3.1

Lưu ý là kỹ thuật lấy mẫu tần cao chỉ có thể áp dụng cho các tín hiệu âm tần có độ rộng band tần thấp mà hiếm khi được sử dụng cho video vì tần số lấy mẫu cần thiết sẽ trở nên quá cao so với các mạch thông dụng.

1.12. GIẢM TẠP ÂM

Tạp âm trong khi thu hoặc ghi âm có thể nhận biết được khi nguồn âm tĩnh hoặc ngưng lại. Trong suốt thời gian này người nghe có thể nghe được tạp âm như một âm suýt. Rất nhiều hệ thống đã được thiết lập để thụ cảm tiếng ồn của âm thanh và sữa đổi nó trong những khoảng lặng để tiếng ồn không đến được tai người nghe. Hệ thống này được sử dụng rộng rải đặc biệt là ở máy ghi âm.

30

Page 33: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

Biện pháp cơ bản được gọi là ép giãn hình 1.16. Ở đầu vào của hệ thống mức độ âm thanh được thụ cảm và hệ số khuếch đại của hệ thống được điều chỉnh sao cho những âm thấp hơn sẽ có hệ số khuếch đại cao hơn còn những âm cao hệ số khuếch đại giảm do đó kênh sẽ không bị quá tải ở đầu ra của hệ thống. Có thể xảy ra hoạt động ngược lại để lưu trữ dải động của hệ thống. Kết quả là tạp âm của kênh sẽ bị loại đi đối với tín hiệu mức thấp bằng với số lượng mà bộ ép giãn tăng hệ số khuếch đại của những tín hiệu này. Thông thường tiếng ồn giảm 10dB hoặc hơn nữa.

Độ tăng ích

thay đổi Hệ thống Độ tăng ích thay đổi

Điều khiển Điều khiển

Ngỏ vào Ngỏ ra

Hình 1.16. Sơ đồ khối ép giãn

Quá trình ép giãn đặt ra rất nhiều vấn đề, bao gồm vấn đề thích ứng hoặc xác định quá trình xử lý đầu vào. Đó là sản phẩm của một vài công ty phục vụ cho cả những cơ sở thu băng chuyên nghiệp và người tiêu dùng, cho một vài kênh truyền hình, bao gồm âm thanh đa kênh trong truyền hình và tuyền quảng bá truyền hình số độ phân giải cao (HDTV).

1.13. HỆ THỐNG VIDEO SỐ

Những hệ thống video số cũng yêu cầu các tiêu chuẩn cùng loại. Một vài hệ thống video số thường xác định rõ việc lấy mẫu trực tiếp của dạng sóng analog tổng hợp, đây là hệ thống số tổng hợp. Những hệ thống khác thao tác trực tiếp với các tính hiệu RGB và tránh được quá trình xử lý màu tổng hợp. Đây được gọi là các hệ thống số thành phần. Việc xử lý một hệ thống tương tự tổng hợp có liên quan đế sự dung hòa về chất lượng của tính hiệu, điều này cũng không thể thiếu được đối với quá trình số hoá, trong khi các hệ thống thành phần lại tránh được sự dung hòa này ngay từ đầu cho nên chất lượng hình ảnh cao hơn. Dưới đây là một vài nét khái quát về hệ thống video số.

1.13.1. Hệ thống số tổng hợp

Trong một hệ thống số tổng hợp, tín hiệu NTSC hay PAL được tạo ra bình thường như trong một thiết bị tương tự, và quá trình chuyển đổi A/D được thực hiện trên tín hiệu đơn này. Do ở các tín hiệu này, sóng mang màu là một thành phần có năng lượng cao và biên độ cũng như pha của nó phải được tái tạo một cách chính

31

Page 34: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

xác nên thường phải sử dụng tần số lấy mẫu đồng bộ với sóng mang màu. Hầu hết các hệ thống đều đồng bộ với clock lấy mẫu 3× hoặc 4× sóng mang, với 8 bit trên mẫu. Nó đưa ra tốc độ dữ liệu như trong bảng 1.5.

Tiêu chuẩn fs (KHz) Bit/mẫu Tốc độ dữ liệu Mb/s

NTSC 3fSC 8 85.9

NTSC 4 fSC 8 114.5

PAL 3 fSC 8 106.3

PAL 4 fSC 8 141.8

Bảng 1.5. Các thông số lấy mẫu của các hệ thống số tổng hợp

Một vài hệ thống số tổng hợp xử lý các tín hiệu nhằm thay đổi bộ mã hóa, di chuyển khoảng xóa dòng-mành, hoặc tạo ra một số thay đổi khác tận dụng triệt để các thế mạnh của kỹ thuật số.

1.13.2. Hệ thống số thành phần

Trong hệ thống số thành phần, ba thành phần màu độc lập sẽ được số hóa ở tần số lấy mẫu, gần bằng như tần số lấy mẫu ở hệ thống tổng hợp. Vì vậy, tốc độ dòng số ở hệ thống số thành phần sẽ cao hơn tốc độ dòng số ở hệ thống tổng hợp.

Ngay từ khi hệ thống truyền hình số ra đời, ủy ban tư vấn quốc tế về thông tin vô tuyến (CCIR) và ngày nay là liên đoàn viễn thông quốc tế (ITU) đảm nhận trách nhiệm thiết lập các tiêu chuẩn định dạng lấy mẫu tín hiệu video số thành phần. Để thuận tiện trong quá trình trao đổi quốc tế, các tín hiệu truyền hình số, tần số lấy mẫu được quy ước là không có mối quan hệ nào với tần số sóng mang trong các hệ thống tương tự. Đây là sự lựa chọn hợp lý từ thực tế là các hệ thống thành phần không có sóng mang màu. Tần số được lựa chọn là 13,5Mhz, những biến thể của nó sẽ được giải thích trong phần 2.3.3.

Tiêu chuẩn ITU, còn gọi là ITU-R BT cũng hướng dẫn cách sử dụng các thành phần màu khác nhau ở hệ PAL hay NTSC để có thể giảm độ rộng band tần và được lấy mẫu là ước số của tần số lấy mẫu cơ bản. Đây được gọi là lấy mẫu con màu và có thể xảy ra với hệ số chia 2:1 hoặc 4:1 dưới tần số cơ bản (13,5Mhz). Tất nhiên, lấy mẫu con cũng có nghĩa là phải giảm độ rộng band tần của màu sắc, điều này lại trái với yêu cầu quá trình xử lý thành phần. Song, lấy mẫu con với tỉ lệ 2:1 vẫn được sử dụng rộng rãi. Một thiết kế đơn giản của ITU-601 đã xác định:

4:4:4 lấy mẫu toàn bộ các thành phần R,G,B

32

Page 35: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

4:2:2 lấy mẫu con theo dòng với tỉ lệ 2:1 R-Y, B-Y

4:1:1 lấy mẫu con theo dòng với tỉ lệ 4:1 R-Y, B-Y

4:2:0 lấy mẫu con theo dòng và theo cột với tỉ lệ 2:1 R-Y, B-Y

Lưu ý rằng các thành phần màu sắc khác nhau là R-Y và B-Y. Để đơn giản, định dạng này thường được viết dưới dạng YUV hoặc YCrCb, bảng 1.6 đưa ra tốc độ dữ liệu của những sự lựa chọn mẫu này.

1.13.3. Các tiêu chuẩn đĩa số

Tín hiệu hình ảnh được ghi trên CD-ROM bằng cách sử dụng một số phương pháp nén dữ liệu lớn. Vì vậy, chất lượng hình ảnh giảm rất nghiêm trọng và không thể chấp nhận được đối với một hệ thống chuyên nghiệp. Tuy nhiên, cùng với sự phát triển của định dạng DVD dựa vào công nghệ ghi đĩa quang tương tự như CD-ROM, chất lượng hình ảnh đang được cải thiện dần.

Các DVD làm tăng mật độ ghi từ 650 MB như dung lượng một mặt của CD-ROM lên 4,7GB. Điều này, kết hợp với định dạng hai mặt, hai lớp, cho phép ghi tới 17GB trên một đĩa đơn 12cm. Sử dụng kỹ thuật nén MPEG-2, các chỉ tiêu kỹ thuật của video tương ứng với chỉ tiêu ghi hình của hệ NTSC và PAL sẽ nhận được với thời gian đọc là 1 giờ/một mặt hoặc lớp. Nó tương đương với tốc đọ nén dữ liệu là 10Mb/s. Giống như đĩa CD-ROM, DVD là đĩa chỉ đọc, hoặc tối đa chỉ để ghi một lần. Vì vậy, nó rất hữu ích cho việc phân phối chương trình nhưng lại không thể thay thế được định dạng băng từ để phục vụ cho việc ghi và đọc thông thường.

1.14. AUDIO SỐ

Đĩa CD là một trong những ứng dụng đầu tiên của công nghệ audio số. Nó đã chiếm lĩnh thị trường băng đĩa thu âm và tạo ra bước đột phá của máy tính cá nhân thông qua ổ đĩa CD-ROM và một vài ứng dụng khác.

1.14.1. Đĩa compact (CD)

Công nghệ ghi đĩa quang được phát triển vào những năm 70 và xuất hiện lần đầu tiên ở dạng analog là đĩa hình laser (LVD). Sản phẩm này chưa bao giờ xuất hiện trên thị trường tiêu dùng nhưng lại đóng một vai trò rất quan trọng trong lĩnh vực giáo dục và đào tạo. Vì trong lĩnh vực này khả năng truy cập ngẫu nhiên của đĩa ghi phù hợp hơn băng ghi.

Đĩa CD, được Sony và Philip phát triển và giới thiệu vào đầu những năm 80, vẫn áp dụng công nghệ LVD để ghi số trên đĩa nhựa có kích thước 12cm. Ở đây chúng ta chỉ đề cập đến các thông số lấy mẫu. Sự lựa chọn các tiêu chuẩn của CD cho audio số (CD-DA) phải đảm bảo yêu cầu về chất lượng, độ rộng band tần ít nhất

33

Page 36: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

là 18KHz và SNR phải lớn hơn 90 đồng bộ, chuyển sang tần số lấy mẫu là 44,1KHz và 16 bit/mẫu, mã hóa sử dụng điều chế xung mã (PCM) và không có nén. Mã hóa kênh để chống lỗi bao gồm mã khối Reed-Solomon và chèn mã.

Tiêu chuẩn CD-DA đã cho ra đời một hệ thống tương đối mạnh nhưng chỉ dùng để đọc. Nhờ sự tiến bộ của kỹ thuật số, giá thành mọi thiết bị với đầy đủ các tính năng kỹ thuật đã giảm đáng kể.

1.14.2. Băng âm thanh số

Tiếp theo những thành công của đĩa chuyển đổi, một hệ thống băng từ đã được phát triển và tạo ra một hệ thống có khả năng ghi đọc phối hợp các chỉ tiêu của đĩa CD. Đây chính là băng âm thanh số. DAT được sử dụng trước tiên trong lĩnh vực thu âm chuyên nghiệp hoặc được sử dụng để lưu trữ dữ liệu trong máy vi tính cá nhân, nó có khả năng lưu trữ với dung lượng trên 4 GB.

1.14.3. Âm thanh trong PC

Máy tính cá nhân có khả năng lưu trữ và xử lý bất cứ tín hiệu thuộc về kỹ thuật số. Do vậy, xử lý âm thanh số với các PC là một điều hoàn toàn tự nhiên. Những PC trước đây không có phần cứng (A/D và D/A) để xử lý các âm thanh analog chất lượng cao tại card âm thanh. Ngày nay, mọi PC đều có card âm thanh.

Tuy nhiên, dữ liệu được tạo ra theo tiêu chuẩn CD-DA (9MB/phút) là quá nhiều cho khả năng lưu trữ của hầu hết các PC, do vậy các tiêu chuẩn âm thanh đặc biệt của PC đã được xây dựng để cho phép điều chỉnh chất lượng âm thanh phù hợp với kích cỡ của dữ liệu ở một vài cấp độ. Tiêu chuẩn thấp nhất đưa ra có tần số lấy mẫu là 11,05 KHz ở 8bit/mẫu, nó chỉ phù hợp với lời nói sử dụng tốc độ dữ liệu ở 0,66 MB/phút. Tần số lấy mẫu và số bit/mẫu được nhân đôi khi áp dụng cho âm nhạc. Tiêu chuẩn này cũng có thể dùng cho âm thanh nổi (stereo) với tốc độ dữ liệu lên tới 4,5 MB/phút.

Các tiêu chuẩn audio cho PC cũng bao gồm phần nén, dựa trên thuật toán AD-PCM. Thuật toán AD-PCM có thể giảm tốc độ dữ liệu đi 4 lần trong khi chất lượng giảm không đáng kể. Cần lưu ý là, đặc điểm phi cấu trúc của một tín hiệu audio sẽ đưa ra khả năng nén dữ liệu ít hơn nhiều so với tín hiệu video.

1.14.4. Tổng hợp nhạc

Có hai yêu cầu khác nhau cho các bộ tổng hợp. Mục đích thứ nhất là tái tạo các dụng cụ phát âm ở mức chuẩn nhất có thể, hai là tạo ra những âm thanh mới và kỳ lạ không có trong tự nhiên. Cả hai mục đích này đều quan trọng như nhau.

Phương pháp tốt nhất để tổng hợp âm thanh tự nhiên như là âm thanh của các bộ khí cụ nhạc được gọi là bộ tổng hợp sóng âm. Ở phương pháp này, các nhạc cụ

34

Page 37: Audio Video

Chương 1: Đại cương về tín hiệu audio và video

được lấy mẫu theo kỹ thuật số, đọc mỗi lần một nốt, thường chỉ ở một vài điểm trên phạm vi tần số của nhạc cụ đó. Những mẫu này được lưu trữ trong bộ nhớ của bộ tổng hợp và khi một nốt nhạc được đọc, mẫu gần nhất được chọn từ bộ nhớ sẽ dịch chuyển tần số nhờ quá trình xử lý số, ở một hệ thống được thiết kế hoàn chỉnh, âm tổng hợp sẽ rất trung thực.

Có rất nhiều loại hình tổng hợp khác nhau, tuy nhiên loại hình được sử dụng nhiều nhất là tổng hợp FM, ở loại hình này FM sẽ là biến điệu tần số. Nguyên lý của phương pháp này là một hoặc nhiều bộ dao động có tần số bị biến điệu bởi tần số khác để tạo ra phổ của dải band tần. Phổ này sẽ được lọc để tạo nên âm thanh ở đầu ra. Âm thanh được tổng hợp theo loại hình này rất mềm dẻo. Tuy nhiên, việc lập chương trình cho âm thanh là rất phức tạp và không thuộc về lĩnh vực trực giác ngay cả đối với nhạc sĩ. Song, nó vẫn phổ biến nhờ khả năng truyền tải nhiều tính năng ở mức giá thấp. Dù vậy, nó cũng không tốt bằng quá trình lấy mẫu để tổng hợp âm thanh thực của nhạc cụ.

1.15. AUDIO ĐA KÊNH

Hai hoặc nhiều kênh mô phỏng những âm thanh từ cùng một nguồn với cùng sự phân bổ không gian tạo ra những âm thanh gần với thực tiễn hơn vì người nghe có thể thụ cảm được tính có hướng của âm thanh. Mặc dù nhiều thiết bị đa hợp các kênh audio để phù hợp cho ghi hoặc phân bổ nhưng mục đích thường vẫn là giữ cho các kênh độc lập với nhau chỉ với việc trộn kênh xảy ra trong không gian, nơi âm thanh được thu. Với cách này, cảm giác như ở trong một khoảng không gian thật sẽ tăng lên rõ rệt. Audio hai kênh được gọi là âm thanh nổi. Nó được sử dụng rộng rãi trong quá trình ghi và quảng bá cả phát thanh lẫn truyền hình. Các kênh được gọi là trái (L) và phải (R) tương ứng với vị trí của loa.

Cảm giác âm thanh như trong không gian thực có thể tăng lên khi cho thêm một hoặc vài kênh mô phỏng phát âm ở phía sau người nghe. Đây là nguyên lý của âm vòm, được sử dụng rộng rãi trong khi chiếu phim và đã nhanh chóng được áp dụng ở HDTV số. Hệ thống này cung cấp “5.1” kênh, với 5 kênh có độ rộng band tần lớn nhất và một kênh dùng loa lợi trầm phụ. Một vài máy thu TV cung cấp âm vòng mô phỏng rất hiệu quả ngay cả khi truyền hình chỉ phát bằng âm nổi.

35

Page 38: Audio Video

Chương 2: Số hoá tín hiệu audio và video

Chương 2

SỐ HÓA TÍN HIỆU AUDIO VÀ VIDEO 2.1 GIỚI THIỆU

Hầu hết các tín hiệu audio và video tự nhiên là ở dạng tương tự, nhưng hầu hết các thiết bị lưu trữ và truyền tải tín hiệu hiện nay được thực hiện dựa trên phương thức số, cho nên chuyển đổi tín hiệu tương tự sang số là một một yêu cầu cần thiết. Chất lượng tín hiệu tối đa của một hệ thống audio và video số hầu như được quyết định toàn bộ ở bộ chuyển đổi tương tự sang số ADC. Còn các phần tử khác trong hệ thống số có thể có khả năng tái tạo lại một hoàn hảo tín hiệu nhưng không thể cải thiện được chất lượng hình ảnh và âm thanh tốt hơn tín hiệu số hóa sau bộ ADC. Hiểu được đầy đủ những hạn chế của bộ ADC là rất quan trọng trong việc thiết kế và sử dụng các hệ thống số và đây cũng là mục đích của chương này.

2.2. CÁC BƯỚC CỦA ADC

Các bước chuyển đổi bao gồm quá trìn lọc trước để loại bỏ những tần số quá cao không thể số hóa được tại đầu vào, quá trình lấy mẫu dùng để rời rạc hóa tín hiệu theo thời gian, quá trình lượng tử hóa để chuyển biên độ tín hiệu tương tự sang dạng số, và cuối cùng là quá trình mã hóa để chỉ rõ cách thức biểu diễn của các giá trị số. Mỗi một quá trình này được đề cập trong các phần dưới đây. Ở phần cuối của một hệ thống số, tín hiệu anolog ban đầu sẽ được phục hồi từ chuỗi các mẫu nhờ bộ chuyển đổi số sang tương tự, bộ ADC có nhiệm vụ chuyển các mẫu thành các xung điều chế biên độ, sau đó bộ lọc thông thấp loại bỏ các thành phần ở tần số lấy mẫu cao hơn.

Tiền lọc Lấy mẫuLượng tử hóa Mã hóa

Tín hiệu analog

Tín hiệu digital

01110110010101000011001000010000

Hình 2.1. Sơ đồ khối ADC

36

Page 39: Audio Video

Chương 2: Số hoá tín hiệu audio và video

Như trên hình 2.1, trình bày một sơ đồ khối khái quát của khối ADC, quá trình lấy mẫu và lượng tử hóa làm việc dựa trên các đặc tính trực giao của tín hiệu (thời gian và biên độ), điều này có nghĩa là chúng độc lập với nhau. Vì vậy, cả hai bước này có thể được thực hiện theo cả hai trật tự, tức là có thể lượng tử hóa trước thay bằng cách lấy mẫu trước như trong hình.

2.2.1. Tiền lọc và lấy mẫu

Lấy mẫu là quá trình đọc các giá trị của tín hiệu tương tự theo chu kỳ xác định. Thông thường các mẫu có xu hướng nhất thời, có nghĩa là mẫu được lấy trong khoảng thời gian ngắn hơn chu kỳ của tần số lấy mẫu. Độ rộng của một mẫu là số phần trăm của chu kỳ tần số lấy mẫu, trên chu kỳ này mẫu được lấy trung bình.

Đầu ra của quá trình lấy mẫu là một chuỗi các giá trị tương tự (các mẫu) tương ứng với các điểm ở dạng sóng, nơi diễn ra quá trình lấy mẫu. Nó thường là các dạng xung ở tần số lấy mẫu, và biên độ của tần số lấy mẫu biểu thị các giá trị của mẫu.

Tần số lấy mẫu cao

Tần số lấy mẫu theo Nyquist

Tần số lấy mẫu thấp

Hình 2.2. Giới hạn tần số lấy mẫu

Quá trình lấy mẫu được thực hiện ở một tần số ổn định, fS là tần số lấy mẫu. Theo lý thuyết lấy mẫu, tần số lấy mẫu phải cao, đủ để tạo được các thành phần tần số cần thiết cao nhất của sóng đầu vào. Theo tiêu chuẩn Nyquist thì tần số lấy mẫu được xác định bởi:

fS ≥ 2 fMAX

Trong đó: fMAX là tần số cao nhất phải được tạo ra.

Việc lọc đầu vào được sử dụng để đảm bảo sẽ không có các thành phần tần số nào cao hơn fMAX. Bởi vì các bộ lọc dốc nhọn thực tế thường mắc phải một số khó

37

Page 40: Audio Video

Chương 2: Số hoá tín hiệu audio và video

khăn nên fS được thiết lập phần nào cao hơn tiêu chuẩn Nyquist. Lấy mẫu ở 2,2 đến 2,5fH là thông dụng nhất. Một vài hệ thống lấy mẫu với tần số cao hơn nhiều được gọi là lấy mẫu tần cao sẽ bàn đến trong phần 2.3.1

fs 2fs

fs 2fs

2fsfs

Dải tần cơ bản của video

Chồng phổ

Tần số lấy mẫu cao

Tần số lấy mẫu thấp

Tần số lấy mẫu theo Nyquist

Hình 2.3. Phổ lấy mẫu

Ví dụ trên hình 2.2, trình bày quá trình lấy mẫu dưới, trên và tại tần số của tiêu chuẩn Nyquist. Nội dung của một chuỗi mẫu có thể được xác định bằng cách nối các đỉnh mẫu theo một đường thẳng. Hình 2.2 cũng chỉ ra rằng các mẫu tạo ra tần số tín hiệu chính xác cho đến khi tần số tín hiệu vượt quá 1,5 tần số lấy mẫu. Ở điểm này, tần số đầu ra sẽ tạo nên sự khác nhau giữa tần số lấy mẫu và tần số tín hiệu. Đây là một kết quả sai và ngoài mong muốn được gọi là hiện tượng chồng phổ. Mức độ thiệt hại của nó phụ thuộc vào ứng dụng. Ví dụ trong các hệ thống audio, tần số chồng phổ được coi như là những tần số không liên quan và vì vậy có thể loại bỏ. Còn đối với video, chồng phổ gây ra các hình trên ảnh được tạo có thể thiệt hại hoặc không.

Tiêu chuẩn Nyquist cũng có thể được quan sát trên miền tần số. Một chuỗi các mẫu có thể được coi như là một hàm xung định kỳ ở tần số lấy mẫu mà biên độ của nó được điều chế bởi các giá trị lấy mẫu. Phổ của một xung định kỳ bao gồm một thành phần tần số lấy mẫu cộng với các thành phần cân bằng biên độ ở tần số lặp lại và các sóng hài của nó. Mỗi một thành phần có dải band tần biểu thị sự điều chế bằng các tần số tín hiệu biểu diễn trên hình 2.3 với ba điều kiện ứng với hình 2.2. Chồng phổ xảy ra khi dải band tần của thành phần tần số lấy mẫu chồng lên dải band tần của thành phần tần số lấy mẫu bằng 0. Nếu hiện tượng chồng xảy ra sẽ

38

Page 41: Audio Video

Chương 2: Số hoá tín hiệu audio và video

không có cách nào để loại bỏ nó sau khi lấy mẫu, phải ngăn chặn ngay từ quá trình tiền lọc đầu vào. Từ hình vẽ ta nhận thấy, có thể xảy ra hiện tượng chồng lắp bất cứ khi nào tần số tín hiệu tối đa cao hơn 1,5 lần tần số lấy mẫu, vì vậy đây chỉ là một cách biểu thị khác của tiêu chuẩn Nyquist.

Khi cần thiết phải xử lý các tần số tín hiệu ở gần giới hạn Nyquist, yêu cầu đặt ra cho bộ lọc đầu vào trở nên khó khăn. Như trên hình 2.3b, độ dốc của bộ lọc phải nhọn để tránh xảy ra hiện tượng méo tín hiệu cần thiết trong quá trình khử các tần số gây chồng phổ.

2.2.1.1 Quá trình lấy mẫu trong mảng hai chiều

Sóng video analog thu được từ quá trình quét sẽ được lấy mẫu theo từng dòng quét. Quá trình lấy mẫu này trong bộ ADC biển diễn một mảng hai chiều (chi tiết dòng). Nó có thể được quan sát trong giới hạn của ảnh như chỉ ra trong hình 2.4. Để tránh nhiễu, tần số lấy mẫu thường được đồng bộ với tần số quét dòng. Nếu đây là một mối quan hệ có tính chính xác thì quá trình lấy mẫu sẽ xảy ra tại các điểm giống nhau trong mỗi dòng (còn gọi là lấy mẫu trực giao) như hình 2.4a.

Hình 2.4a minh họa quá trình lấy mẫu quincunx, quá trình này được thực hiện bằng cách lấy tần số lấy mẫu là một bội số lẽ của hai lần tần số quét dòng. Các ảnh trong quá trình lấy mẫu khác nhau có thể xảy ra với những mối quan hệ phức tạp hơn, và trên ảnh sẽ xuất hiện hiện tượng nhiễu nhiều hơn.

Trực giao quincunx

Hình 2.4. Mô hình lấy mẫu không gian

Quá trình lấy mẫu quincunx có nhiều ưu điểm do tạo ra độ phân giải cao ở mọi hướng, nhưng lại không được sử dụng nhiều bởi ví nó làm cho quá trình xử lý số của các tín hiệu trở nên khó khăn hơn.

2.2.1.2 Hiện tượng chồng phổ trong mảng hai chiều

39

Page 42: Audio Video

Chương 2: Số hoá tín hiệu audio và video

Hình 2.5 biểu diễn dạng của chồng phổ trên một đường chéo đen với nền màu trắng. Hình 2.5a biểu diễn một đường ảnh bị che bởi một hình lấy mẫu trực giao, và Hình 2.5b biểu diễn kết quả lấy mẫu khi đầu ra chỉ dựa vào màu sắc (đen hay trắng) tại thời điểm lấy mẫu. Đây là dòng nhọn quen thuộc thường xuất hiện trên màn hình máy tính khi hiển thị các dòng kề ngang, kề dọc hoặc các biên.

Hình 2.5. Hiện tượng chồng phổ

Hình 2.5c biểu diễn hiệu ứng của hiện tượng tránh chồng phổ, tại đó các giá trị của đầu ra được dựa vào số lượng của các vùng lấy mẫu chứa dòng (một hình chữ nhật biểu thị ở chu kỳ lấy mẫu sẽ cộng ra trong mỗi mảng và đưa về trung tâm của điểm lấy mẫu). Nếu hình ảnh được quan sát từ khoảng cách xa thì người ta có thể nhận thấy dòng được tránh chồng phổ dễ chịu hơn các các dòng nhọn.

Khi sử dụng một bộ lọc đặt trước bộ lấy mẫu, thì kết quả cho như hình 2.5c. Từ khi bộ lọc loại bỏ các thành phần tần số trên giới hạn Nyquist, thì các biên của dạng sóng tín hiệu sẽ bị dốc tại điểm thời gian tăng lên xấp xỉ bằng một chu kỳ lấy mẫu. Quá trình lấy mẫu tức thời của biên dốc này sẽ tự động tạo ra các biên độ trung gian chính xác cho các điểm ảnh tại các biên của ảnh.

2.2.1.3 Độ rộng lấy mẫu

Việc lấy trung bình giá trị các mẫu trên phần trăm có nghĩa của chu kỳ lấy mẫu gây ra sự giảm sút biên độ mẫu ở những tần số cao, như đã chỉ ra trong hình 2.6. Phạm vi lấy mẫu được biểu thị bằng vùng bóng trên hình, việc lấy trung bình trên độ rộng này cho ra các giá trị được biểu diễn bằng dòng chấm, giá trị này nhỏ hơn các giá trị được đọc bởi mẫu tức thì lấy tại đỉnh của sóng tín hiệu. Đây được gọi là hiệu ứng góc mở, nó xảy ra trong nhiều quá trình xử lý video.

40

Page 43: Audio Video

Chương 2: Số hoá tín hiệu audio và video

Giá trị trung bình

Độ rộng mẫu

Hình 2.6. Độ rộng mẫu

Trên thực tế, độ giảm có dạng sin(x)/x và được biểu thị trên hình 2.7. Tham số độ rộng W là số phần trăm của chu kỳ lấy mẫu.

Độ giảm này có ý nghĩa đối với độ rộng mẫu cực đại (W=100), tại giới hạn Nyquist, đặc tuyến giảm xuống còn 63,6%. Tuy nhiên, hình 2.7 chỉ ra rằng độ rộng của mẫu ít hơn 20% có thể được bỏ qua.

0 10 20 30 40 50

0.6

0.7

0.8

0.9

1.0

Đặc

tuyế

n tươn

g đố

i

Tần số (phần trăm của fs)

W=20

W=50

W=100

Hình 2.7. Lấy mẫu hiệu ứng góc mở

2.2.1.4. Mẫu và lưu trữ

Khi thực hiện quá trình lấy mẫu trước khi lượng tử hóa, người ta thường sử dụng một mạch lấy mẫu và lưu trữ các giá trị mẫu trong một thời gian đủ để bộ lượng tử hóa thực hiện chức năng của mình. Mạch này, như trên hình 2.8, thu mẫu bằng cách đóng mạch trong một thời gian ngắn để nạp các giá trị cả mẫu cho tụ. Khi mạch hở, tụ sẽ lưu giá trị của mẫu cho đến khi có xung lấy mẫu tiếp theo. Vì vậy, các mạch của bộ lượng tử gần như có được toàn bộ chu kỳ của tần số lấy mẫu để hoạt động đúng logic của mình.

41

Page 44: Audio Video

Chương 2: Số hoá tín hiệu audio và video

Tín hiệu tương tự Mẫu và giữ

đầu ra

Xung lấy mẫu

Hình 2.8. Mạch lấy mẫu và lưu trữ

2.2.2 Lượng tử hóa

Lượng tử hóa là quá trình chuyển đổi một vùng liên tục của các giá trị tương tự thành một bộ giới hạn các giá trị rời rạc. Với định nghĩa này, quá trình lấy mẫu có thể được coi như là lượng tử hóa theo trục thời gian bởi vì các mẫu biểu thị các giá trị tín hiệu chỉ ở các thời điểm thời gian rời rạc nơi diễn ra quá trình lấy mẫu. Tất cả các giá trị tín đầu vào giữa các điểm lấy mẫu đều bị loại bỏ trong quá trình lấy mẫu. Như mô tả trong hình 2.5, quá trình lượng tử hóa theo thời gian này sẽ gây ra hiện tượng nhiễu, biểu thị bằng các đường răng cưa. Dù vậy, thuật ngữ lượng tử hóa vẫn được sử dụng rộng rãi với ý nghĩa tạo ra tín hiệu rời rạc chỉ với trục biên độ. Đây cũng là cách hiểu về lượng tử hóa trong cuốn sách này.

Tín hiệu thoải

Mức luợng tử

Hình 2.9. Lượng tử hóa: a) phạm vi biên độ chia thành lượng tử, b) tín hiệu đã được lượng tử hóa, c) lỗi lượng tử hóa

Đầu ra của bộ lấy mẫu là một chuỗi xung rời rạc theo thời gian, nhưng biên độ vẫn liên tục. Các giá trị biên độ phải được lượng tử hóa để nó có thể biểu thị dưới dạng số trong một số bit xác định. Hình 2.9 biểu diễn hiệu ứng lượng tử hóa, không lấy mẫu. Hình 2.9a chỉ rõ, dải biên độ được chia ra thành từng vùng và bộ lượng tử áp dụng cùng giá trị với bất kỳ biên độ nào trong phạm vi mỗi vùng. Do vậy, với một đầu vào tuyến tính, đầu ra của bộ lượng tử sẽ thực hiện từng bước tuần tự từ

42

Page 45: Audio Video

Chương 2: Số hoá tín hiệu audio và video

một giá trị lượng tử tới giá trị tiếp theo. Tất cả các giá trị trung gian của tín hiệu đầu vào bị mất. Ví dụ này là lượng tử hoá tuyến tính bởi vì tất cả các giá trị lượng tử có cùng kích thước.

Đối với lượng tử hóa, số lượng N bit trên một mẫu thì số mức lượng tử hoặc giá trị lượng tử sẽ là (2N), được chọn đủ lớn để không nhận thấy hay nghe thấy tính rời rạc của các mức. Giá trị cơ bản là 8bit/mẫu cho tín hiệu video và 16 bit/mẫu cho audio, mặc dù các giá trị khác có thể được sử dụng trong những trường hợp đặc biệt.

Bản chất sai số lượng tử có thể được quan sát trên hình 2.9c. Lỗi này là sự khác nhau giữa tín hiệu dốc thoải trong hình 2.9a và dạng bậc thang trong hình 2.9b, nó có dạng răng cưa mà biên độ đỉnh-đỉnh của nó chính là độ rộng Q của một mức lượng tử. Chú ý rằng, sai số này sẽ giảm tuyến tính khi tăng số mức lượng tử.

2.2.2.1 Các mạch của bộ lượng tử

Các bộ lượng tử được thiết kế dựa vào mạch bộ so, bộ này so sánh giá trị tín hiệu của đầu vào với mức điện áp chuẩn. Nó phát ra tín hiệu số bằng 0 khi giá trị tín hiệu nhỏ hơn giá trị chuẩn, và bằng 1 khi giá trị tín hiệu trên mức chuẩn. Giá trị chuẩn này đôi khi còn được gọi là ngưỡng của bộ so. Các bộ so phải rất ổn định, chính xác (ở phía đầu vào, đây là các bộ so sánh tương tự) và phải ngắt từ 0 đến 1 đối với sự thay đổi rất nhỏ của các giá trị đầu vào

Hình 2.10 chỉ ra cách nối bộ so được sử dụng cho lượng tử hoá. Trên mỗi mức giá trị lượng tử của một bộ so, tín hiệu đầu vào được sử dụng cho tất cả các bộ so, một thang điện trở sẽ thiết lập các giá trị chuẩn của mỗi bộ so tới một mức cao hơn. Bởi vì phương pháp này lấy 2N bộ so, nó chỉ thực hiện với khoảng N= 8 đến 10 bit (tất nhiên tất cả các bộ so đều được tích hợp trong IC).

Có 2N đầu ra từ thang bộ so như trong hình 2.10, toàn bộ đầu ra là 1 cho đến tận mức giá trị lượng tử của tín hiệu đầu vào và sẽ bằng 0 khi mức giá trị lượng tử cao hơn. Cần thêm vào một bộ logic nhằm giảm số đầu ra từ các bộ so còn N đầu ra. Bộ logic này gọi là bộ mã hóa ưu tiên và nó được tích hợp trong IC ADC.

Kiến trúc của bộ so trên hình 2.10 thực hiện lượng tử hoá trước quá trình lấy mẫu, quá trình lấy mẫu xảy ra trong bộ mã hóa ưu tiên. Đây được gọi là một ADC tốc độ cao, một trong những loại ADC nhanh nhất.

Những kiến trúc khác được sử dụng trong các bộ lượng tử khoảng hơn 10 bit do số bộ so cho một ADC tốc độ cao không hoạt động được. Một phương pháp phổ biến hơn là sử dụng bộ lượng tử xấp xỉ liên tục, nó chỉ có một bộ so dùng để so sánh điện áp đầu ra với điện áp đầu vào của bộ DAC. Tín hiệu số vào bộ DAC được điều chỉnh bởi vòng hồi tiếp cho đến khi đầu ra của bộ so có giá trị bằng 0. Vì vậy, tín hiệu tại đầu ra bộ DAC trở thành tín hiệu đầu vào bộ ADC. Phương pháp này rất

43

Page 46: Audio Video

Chương 2: Số hoá tín hiệu audio và video

chính xác với số bit cao (ví dụ, N= 16) nhưng lại rất chậm do vòng hồi tiếp phải đi qua N phép lặp để đạt tới giá trị đầu ra cho mỗi mẫu. Nó vẫn có thể đủ độ áp dụng cho audio nhưng không dùng được cho video.

255

255

255

255

255

255 + _

Ngắt 8 bitBộ

mã hoá chẳn lẽ

fs

VREF

Đầu vào analog

Bộ chia biên độ

Bộ so sánh

D7

D6

D5

D4

D3

D2

D1

D0

. . . . . . . . . . .

Hình 2.10. ADC tốc độ cao

2.2.2.2. Thiết lập phạm vi biên độ

Một bộ lượng tử không thể cung cấp đầu ra cao hơn (hoặc thấp hơn) đầu ra được xác định bởi giới hạn của phạm vi mức lượng tử. Nếu như tín hiệu đầu vào vượt quá phạm vi này, thì các giá trị đầu ra phải bão hòa tại giá trị tối đa (hoặc tối thiểu). Trong thuật ngữ của hệ thống analog, được gọi là xén, nó biểu thị hiện tượng méo nghiêm trọng cần phải tránh. Sẽ có thể phải tạo ra mạch vào phụ bởi vì hầu hết các thiết bị số chỉ đơn giản là chuyển đổi chu kỳ đến giá trị bằng không khi vượt quá giá trị số tối đa, điều này thậm chí còn tệ hại hơn cả hiện tượng bão hòa.

Do sự điều khiển tín hiệu không bao giờ chính xác tuyệt đối nên hầu hết các tiêu chuẩn số hóa đều cho rằng các mức tín hiệu phải được thiết lập để không phải sử dụng hết phạm vi lượng tử. Điều này cho phép bỏ qua lượng giảm nhỏ này. Ví dụ hình 2.11 đưa ra các tiêu chuẩn mức cho số hóa tổng hợp là SMPTE 224M và số hóa thành phần SMPTE 253M. Cần lưu ý rằng trong hầu hết các mạch video, mức

44

Page 47: Audio Video

Chương 2: Số hoá tín hiệu audio và video

chích xác của đỉnh đồng bộ hoặc mức đen của ảnh sẽ xê dịch xung quanh độ chói trung bình của ảnh bởi vì thành phần DC của tín hiệu không xuất hiện trong mạch. Để duy trì đỉnh đồng bộ hoặc mức đen của tín hiệu ở một mức số xác định, thành phần DC phải được lưu trữ ở trong ADC, điều này được thực hiện nhờ ghim mức tín hiệu. Đây đơn giản chỉ là một mạch điều khiển mức đỉnh đồng bộ hoặc mức đen của ảnh và điều chỉnh hệ thống giữ được mức ổn định này.

Đỉnh mức trắng

Mức đen

Xung đồng bộ

Tín hiệu hình trên dòng

Bust màu

Khoảng xóa dòng

255

200

60

0

Hình 2.11. Các mức lượng tử tín hiệu video SMPTE 244M NTSC tổng hợp

Trong trường hợp số hóa tín hiệu audio, hiệu ứng thụ cảm do quá trình xén thậm chí còn kém hơn ở tín hiệu video, và các mức audio khó điều khiển hơn. Kết quả là, các hệ thống audio số thường sử dụng các mức điều khiển tự động hoặc các phương tiện hạn chế để tránh xảy ra hiện tượng tràn, và chúng vẫn có thể hoạt động được khi sử dụng biên bảo vệ là 3dB hoặc hơn nữa. Khi các tín hiệu audio không có thành phần DC thì không cần thiết phải sử dụng quá trình ghim.

2.2.2.3. Tỷ lệ SNR

Khi tín hiệu chiếm hết dải lượng tử, sai số lượng tử có thể được coi như tạp âm lẫn vào tín hiệu ở đó tạp âm là ngẫu nhiên với giá trị đỉnh-đỉnh (p-p) của một bước lượng tử và là một hàm mật độ xác suất đồng nhất (pdf). Tỉ lệ tín hiệu trên tạp âm (SNR) có thể xác định một cách đơn giản đối với trường hợp tín hiệu là sóng sin nhờ phép phân tích sau đây:

Giả sử một tín hiệu hình sin chiếm hết dải lượng tử có L mức (L=2N, trong đó N là số bit/mẫu). Khi sai số lượng tử có giá trị p-p của một mức lượng tử hoặc 1/L, SNR dựa trên các giá trị p-p bằng L. Nếu sử dụng cho audio, SNR được xác định là tỷ số rms của tín hiệu trên rms của tập âm, và phân tích trên sẽ đúng chỉ khi tỷ số p-p trên rms của tín hiệu và tạp âm là như nhau, nhưng điều này lại không xảy ra. Đối với một tín hiệu sóng sin, giá trị rms là 0,354sp-p, nhưng đối với tạp âm lượng tử (giả

45

Page 48: Audio Video

Chương 2: Số hoá tín hiệu audio và video

thiết là pdf đồng nhất) sẽ là 0,29Sp-p. Vì vậy, SNR cao hơn L 1,22:1 (1,76 dB) chuyển tất cả sang dB ta có

SNR(dB) = 6,02N+1,76 (2.2)

Đây là đối với audio, đối với video SNR là tỉ số của p-p của tín hiệu trên rms của tạp âm, vì vậy hệ số 0,354 có thể được loại bỏ. Kết quả đối với video là:

SNR(dB) = 6,02N+10,8 (2.3)

Biểu thức (2.2) và (2.3) chỉ áp dụng cho trường hợp tín hiệu lớn, chiếm toàn bộ phạm vi lượng tử. Khi tín hiệu nhỏ hơn, hiệu ứng tạp âm lượng tử sẽ tăng lên do tín hiệu chiếm mức lượng tử ít hơn. “Tạp âm” này trở nên phụ thuộc vào tín hiệu, nó chính là méo chứ không phải tạp âm nữa. Đối với audio và cả video, hiện tượng méo tín hiệu thấp với một bộ lượng tử đồng nhất được mô tả trên đây trở nên rất nghiêm trọng và không thể chấp nhận được. Rất may vấn đề này có thể được loại bỏ nhờ sử dụng tín hiệu dither.

2.2.2.4. Lượng tử nhân tạo

Ở audio, tạp âm lượng tử hiện rõ trong đoạn mức thấp của rãnh âm, ở đó tạp âm giống như một loại méo “hạt” chứ hoàn toàn không giống như tạp âm ngẫu nhiên. Việc sử dụng dither chuyển hiện tượng méo hạt này thành âm tạp ngẫu nhiên có thể dễ dàng được chấp nhận hơn.

Ở video, tạp âm lượng tử có thể được quan sát trên các vùng của ảnh có bóng mờ từ màu này, hoặc độ chói này sang màu khác, hoặc độ chói khác. Chúng ta có thể quan sát được sát các dòng trên ảnh, tại đó giá trị tín hiệu truyền qua từ mức lượng tử này sang mức lượng tử khác. Điều này không rõ rệt nếu sử dụng 8bit/pixel, nhưng rất rõ ràng ở 6 bit hoặc ít hơn trên pixel. Khi có mối tương quan giữa các dòng kề nhau trong ảnh, các bước chuyển lượng tử xuất hiện giống như những đường sóng ở các vùng bị bóng mờ, rất giống như các đường cao ở trên bản đồ địa hình. Từ phép so sánh này, hiện tượng méo như vậy có thể được gọi là méo đường viền.

2.2.2.5. Dither

Méo đường viền không đến nỗi quá tồi so với bản chất của nó, bởi vì ảnh gốc cũng đã chứa một vài tạp âm. Hiệu ứng của tạp âm làm gẫy phần ảnh biên, vì rất khó nhìn. Thực tế, hầu hết các ADC đều được đưa vào, một cách có chủ định, một số lượng xác định tạp âm ngẫu nhiên trước khi lượng tử gọi là quá trình dithering và gây ra lỗi lượng tử xuất hiện giống như tạp âm ngẫu nhiên thay bằng các hiệu ứng tín hiệu có liên quan như tạp âm hạt và tạp âm đường viền.

Hình 2.12a trình bày một bộ lượng tử không có dither. Hình 2.12b trình bày

46

Page 49: Audio Video

Chương 2: Số hoá tín hiệu audio và video

cách dither điều chế các mức giá trị lượng tử và hình 2.12c trình bày cách tính trung bình dither làm cho các đặc tính truyền đạt trở nên tuyến tính. Tín hiệu dither phải có biên độ chính xác, và để đạt được kết quả tốt nhất nó phải có một pdf hình tam giác hoặc Gauxơ. Một pdf đồng nhất cũng có thể được sử dụng nhưng như vậy sẽ gây ra tạp âm ở trong tín hiệu điều chế khi mức tín hiệu thay đổi, điều này là ngoài ý muốn. Các pdf hình tam giác hoặc Gauxơ, không gây ra hiện tượng điều chế tạp âm với mức tín hiệu. Hình 2.12d chứng minh điều này.

Q

Q

2Q

Q/2 (rms) P P P

Biên độ pdf đồng nhất

Biên độ pdf tam giác

Biên độ pdf gausesian

Output Output Output

Hình 2.12. Lượng tử hóa với dither: a) lượng tử, b) lượng tử với dither, c) trung bình của dither, d) các hành phân bố xác suất dither.

Dither gây ra tổn hao nhẹ cho SNR, nhưng động thái lượng tử tạp âm được cải thiện là xứng đáng. Ví dụ, dither của pdf hình tam giác yêu cầu một biên độ p-p của hai mức lượng tử, và SNR dựa trên p-p/p-p là:

SNR(dB) = 6,02N – 3 (2.4)

Tín hiệu đầu vào audio hoặc video có thể có sẵn mức tạp âm cho cùng một kết quả như dither. Tuy nhiên, những tín hiệu này sẽ không tạo ra biên độ tạp âm và pdf tối ưu dưới mọi điều kiện, vì vậy thông thường người ta thêm dither tối ưu hóa riêng cho bộ ADC.

2.2.2.6. Tái lượng tử

Đôi khi cần thiết phải giảm số lượng bit/mẫu. Điều này thường xảy ra khi xử lý tín hiệu có liên quan đến pháp nhân bởi quá trình này làm cho số bit/mẫu tăng lên. Cuối quá trình, các mẫu phải được giảm tới số bit/mẫu ban đầu. Nếu điều đó được thực hiện bằng cách bỏ bớt các bit có giá trị nhỏ nhất thì hiệu ứng của dither trong

47

Page 50: Audio Video

Chương 2: Số hoá tín hiệu audio và video

lượng tử hóa ban đầu bị mất và một lỗi lượng tử mới sẽ được đưa vào. Có thể sửa lỗi này trước tiên bằng cách thực hiện dither số, sau đó làm tròn tới số lượng tử bit cần thiết. Quá trình dithering số đơn giản chỉ là quá trình cộng thêm các bit ngẫu nhiên phù hợp với các bit cần khử. Sau đó quá trình làm tròn diễn ra dựa vào bit có giá trị lớn nhất trong số các bit cần khử. Nếu bit này bằng 0, thì các bit ngoài đã được loại bỏ nhưng nếu nó bằng 1 thì việc làm tròn được thực hiện bằng cách cộng thêm 1 vào các bit còn lại.

2.2.2.7. Lượng tử hoá phi tuyến

Như đã đề cập ở trên, méo lượng tử tăng ở mức tín hiệu thấp không chiếm hết phạm vi của bộ lượng tử. Đặc điểm này có thể được khai thác bằng việc tạo ra bộ lượng tử phi tuyến, có nghĩa là sử dụng quá trình lượng tử tinh hơn ở các mức thấp và thô hơn ở gần mức tối đa. Điều này cũng được áp dụng rộng rãi trong hệ thống điện thoại số. Nó giống như quá trình ép giãn tương tự với phạm vi biên độ của tín hiệu được nén trước kênh truyền và giãn sau kênh truyền. Do có sự đồng nhất, lượng tử hóa phi tuyến cũng được gọi là quá trình ép giãn nhằm giữ cho mức tín hiệu trung bình ở kênh cao hơn và vì vậy khả năng chống nhiễu kênh truyền tốt hơn.

μ = 255

0 0.2 0.4 0.6 0.8 1.0

0

0.2

0

.4

0.6

0

.8

1.0

Input

Out

put

Hình 2.13. Lượng tử phi tuyến hàm luật μ

Lượng tử hoá phi tuyến sử dụng cho lời thoại trong audio với sối bit /mẫu nhỏ, ví dụ như 8bit/mẫu, được thực hiện trước tiên bằng cách lượng tử số bit/mẫu cao hơn, chẳng hạn như 12bit/mẫu, sau đó sử dụng bảng tra cứu để giảm xuống còn 8 bit phi tuyến. Hình 2.13 trình bày kết quả này. Tất nhiên, phải xác định dạng đường cong phi tuyến một cách cẩn thận bởi vì nó sẽ được tạo lại trong cả bộ ADC và DAC. Hàm thông dụng nhất là hàm theo luật μ:

Y= log(1+μx)/log(1+μ)

48

Page 51: Audio Video

Chương 2: Số hoá tín hiệu audio và video

Trong đó: X là đầu ra tới thiết bị theo luật μ, Y là đầu ra, M là một tham số thường được thiết lập bằng 255.

Phương pháp này làm giảm tỉ lệ SNR đối với các tín hiệu lớn, nhưng lại tăng lên với các tín hiệu nhỏ hơn. Có ý kiến cho rằng sự xuất hiện của tín hiệu lớn sẽ lấn áp tạp âm cao, nhưng một SNR ở những tín hiệu nhỏ sẽ tốt hơn.

2.2.3. Tiền nhấn

Một kỹ thuật khác thường sử dụng trong các hệ thống audio được gọi là tiền nhấn. Kỹ thuật này khai thác triệt để tính chất: các tần số tín hiệu cao hơn thường có biên độ thấp hơn. Vì vậy, biên độ của chúng có thể được tăng lên mà không làm hệ thống quá tải. Một bộ lọc tương tự được chèn tại đầu vào của hệ thống để nhấn các tần số cao, và một bộ lọc bổ xung được sử dụng sau bộ ADC ở cuối của hệ thống.

10 50 100 500 1k 5k 10k 20k

0+2

+4+6

+8+1

0

Đặc

tuyế

n (d

B)

Tần số (Hz)

Hình 2.14. Đường cong tiền nhấn cho audio

Hình 2.14 minh họa chức năng tiền nhấn tiêu biểu. Vì sự tiền nhấn giảm biên quá tải của hệ thống, nên phải rất cẩn thận khi sử dụng. Tiền nhấn không được sử dụng cho video số.

2.2.4. Mã hóa.

Quá trình gán các bit cho các mức lượng tử được gọi là mã hoá. Đây có thể là một quá trình đơn giản, ví dụ như hệ nhị phân hay phần bù của 2, một quá trình phi tuyến như luật μ, hoặc có thể là một quá trình rất phức tạp với mục đích thực hiện nén dữ liệu.

2.3. CHỌN TẦN SỐ LẤY MẪU

Tần số lấy mẫu quyết định độ rộng band tần của hệ thống đạt được mà không gây ra chồng phổ, nó cũng quyết định tốc độ bit cơ bản của hệ thống theo biểu thức:

Tốc độ bit = (tần số lấy mẫu) * (số bit/mẫu)

49

Page 52: Audio Video

Chương 2: Số hoá tín hiệu audio và video

Để giảm thiểu tốc độ dòng bit và giá thành, hầu hết các hệ thống đều sử dụng kỹ thuật nén và sự thỏa hiệp giữa tốc độ dòng bit và giá thành. Tần số lấy mẫu đóng một vai trò quan trọng trong thỏa hiệp này. Ví dụ, nếu chọn tần số lấy mẫu gần với giới hạn Nyquist nhất nhằm đạt được tốc độ dòng bit thấp nhất sẽ hoàn toàn thỏa mãn, nhưng phải cần đến một bộ lọc tránh chồng phổ khá đắt đỏ do phải chi phí cho việc sử dụng tần số lấy mẫu cao hơn nhằm đạt được các tính năng hợp lý cho bộ lọc.

Ở các hệ thống video, vấn đề đặt ra là quá trình lấy mẫu phải được đồng bộ với tốc độ quét dòng theo một cách nào đấy để đạt được ảnh lấy mẫu mong muốn (xem phần 2.2.1.1) và số mẫu cần thiết trong chu kỳ dòng tích cực. Như vậy sẽ giảm khả năng lựa chọn tần số tới những giá trị xác định. Còn nếu có một tần số có thể sử dụng cho cả quá trình lấy mẫu của hệ NTSC và PAL, khả năng lựa chọn sẽ nhỏ hơn

2.3.1. Lấy mẫu tần số cao

Một sự lựa chọn tần số lấy mẫu rất gần giới hạn Nyquist nhưng thực tế lại ở rất xa giới hạn này. Đây là phương pháp lấy mẫu tần cao, rất hữu hiệu trong trường hợp thiết bị phần cứng cần thiết cho quá trình lấy mẫu tần số cao hơn đã có sẵn. Phương pháp này được áp dụng rộng rãi cho audio có tần số tín hiệu thấp, đôi khi áp dụng cho cả video. Cách thực hiện là lấy mẫu với bội số của tỉ lệ yêu cầu, như 2×, 3×, 8×, hoặc thậm chí lên đến 64× (chỉ dùng cho tín hiệu audio). Bộ tiền lọc analog cần thiết để loại bỏ sự chồng phổ trở nên dễ lắp đặt hơn bởi vì tần số lấy mẫu và dải thông nằm cách xa nhau hơn. Sau quá trình lấy mẫu và lượng tử hoá, tín hiệu số được lọc tới dải thông cuối cùng bằng một bộ lọc số và tốc độ lấy mẫu, sau đó giảm xuống tới giá trị cuối cùng nhờ quá trình thập phân hóa, là quá trình loại bỏ những mẫu không mong muốn. Đôi khi hai bước này được phối hợp trong một bộ lọc thập phân hoá.

Một bộ lọc số, với các thao tác nhân, sẽ làm tăng số bit/mẫu. Hoạt động này của bộ lọc là sự đánh đổi dải thông, để tăng độ phân dải biên độ, và số bit tăng lên có hiệu lực, đồng thời có thể được giữ lại. Các bit mở rộng còn lại này phải được quá trình lượng tử hóa lại loại bỏ.

Bộ lọc analog

Lấy mẫu

Lượng tử hóa

Bộ lọc digiatal

Bỏ đi 1/10

Lượng tử hóa

chia n

nfs

fs

Ngỏ ra digital

Ngỏ vào analog

Hình 2.15. ADC lấy mẫu tần cao

50

Page 53: Audio Video

Chương 2: Số hoá tín hiệu audio và video

Hình 2.15 là sơ đồ khối của một bộ ADC lấy mẫu tần cao, với các ưu điểm:

1. Bộ tiền lọc analog chỉ phải loại bỏ thành phần tần cao, hơn một nửa tần số lấy mẫu tần cao. Đặc tuyến phẳng trong dải band tần yêu cầu sẽ đạt được dễ dàng hơn và giảm xuống tới tận 1,5 tần số lấy mẫu tần cao.

2. Do quá trình lọc số thực sự là làm tăng số bit /mẫu, cho nên bộ lượng tử ban đầu không cần phải có số mức nhiều như yêu cầu ở kết quả cuối cùng.

3. Đặc tuyến tần số cuối cùng (và sự khử chồng phổ) được xác định bởi một bộ lọc số lắp đặt trong IC cho hầu hết bất kì đặc tính nào của đặc tuyến. Đặc tuyến của bộ lọc số có thể được tái tạo một cách chính xác và ổn định.

2.3.2. Các tần số lấy mẫu audio

Bởi vì tín hiệu audio không có cấu trúc, cho nên ở các điểm khác nhau trong hệ thống phải có sự đồng bộ. Các tần số lấy mẫu audio được lựa chọn trên cơ sở xem xét độ rộng band tần. Việc này tạo ra sự đa dạng của tốc độ lấy mẫu audio, sẽ được giải quyết nhờ các tiêu chuẩn. Tuy nhiên các hãng khác nhau chấp nhận những tiêu chuẩn khác nhau, vì vậy hiện đang tồn tại một số lượng tiêu chuẩn khá phong phú. Bảng 2.1 đưa ra danh sách các tiêu chuẩn audio cho đĩa CD, các máy ghi trong sản xuất chương trình audio, máy tính cá nhân và điện thoại.

Tần số bit/mẫu (Hz)

Bit/mẫu Dải thông audio

Tốc độ dữ liệu

ứng dụng

48.000 16 16 20.000 192.000 Sản xuất audio(stereo)

44.100 16 16 20.000 176.000 Đĩa compact(stereo)

22.100 16 16 9.000 88.400 PC WAV stereo-music

10.500 8 8 4.000 10.500 PC WAV stereo-speech

8.000 8 3.500 8.000 Điện thoại

Bảng 2.1. Các tần số lấy mẫu audio

2.3.3. Lấy mẫu video thành phần

ITU-R rec.BT.601 xác định tần số lấy mẫu cho các hệ thống số thành phần sử dụng tiêu chuẩn quét 525/59.94 hoặc 625/50. Một tần số đơn được sử dụng ở đây, nó cũng cung cấp cho quá trình lấy mẫu con theo tỷ lệ 2:1 hoặc 4:1 đối với các thành phần hiệu màu. Việc chọn tần số 13,5 MHz rất thích hợp vì tần số này có thể sử dụng cho cả hai hệ thống quét 525 và 625 dòng. Do các dải band tần khác nhau,

51

Page 54: Audio Video

Chương 2: Số hoá tín hiệu audio và video

một tần số thấp hơn có thể phù hợp cho hệ thống 525 dòng hơn là cho hệ thống 625 dòng, tuy nhiên ưu điểm của tần số đơn khá quan trọng với việc lựa chọn một tần số.

Yêu cầu chủ yếu là quá trình lấy mẫu phải trực giao trên cả hai hệ thống (xem phần 2.2.1.1), bởi vì các hệ thống số thành phần được sử dụng rộng rãi cho việc xử lý ảnh và các hiệu ứng đặc biệt, với điều kiện các mẫu này được đặt tại cùng điểm trên các dòng kề, một yêu cầu nữa là phải trực giao khi tỉ lệ lấy mẫu được chia theo tỉ lệ 2:1 hoặc 4:1.

Lấy mẫu trực giao yêu cầu tần số lấy mẫu phải là bội số chính xác của tần số quét dòng. Nếu điều kiện này được duy trì trong khi quá trình lấy mẫu con 2 hoặc 4, thì bội số của tần số dòng cũng là bội của 4, hai tần số dòng là 15,625 Hz cho hệ thống 625/50 và 15.734,26 Hz cho hệ thống 525/59,94, điều này làm giảm sự lựa chọn tần số, thực tế là không thể lựa chọn được, không có một tần số đơn nào có thể đáp ứng được tất cả những tiêu chí này.

525/59.94 625/50

n Tần số n Tần số

Khác nhau

842 844* 846 848* 850 852* 854 856* 858 860* 862 864* 866 868* 870

13.248.250 13.279.719 13.311.187 13.342.656 13.374.124 13.405.593 13.437.061 13.468.530 13.499.999 13.531.467 13.562.936 13.594.404 13.625.873 13.657.341 13.688.810

848* 850 852* 854 856* 858 860* 862 864* 866 868* 870 872* 874 876*

13.250.000 13.281.250 13.312.500 13.343.750 13.375.000 13.406.250 13.437.500 13.468.750 13.500.000 13.531.250 13.562.500 13.593.750 13.625.000 13.656.250 13.687.500

1.750 1.531 1.313 1.094 876 657 439 220 1

217 436 654 873

1.091 1.310

Bảng 2.2. các tần số lấy mẫu video

52

Page 55: Audio Video

Chương 2: Số hoá tín hiệu audio và video

Giả sử hệ thống 625/50 yêu cầu dải band tần 5 MHz, khi đó tần số lấy mẫu phải cao hơn 10MHz, có thể từ 12 tới 13 MHz, mới thỏa mãn được một vài biên lọc. Bảng 2.2 liệt kê các tần số là bội số nguyên chẵn của tần số quét dòng xung quanh tần số 13MHz. Các số có đánh dấu hoa thị (*) là các số có thể chia hết cho 4. Lưu ý, các giá trị tần số phải khớp với bội 858 đối với hệ 525 dòng và 864 đối với hệ 625 dòng, và tần số lý tưởng là 13,5MHz. Nhưng 858 lại không chia hết cho 4, điều này tương đương với việc lấy mẫu con 4 sẽ không tạo ra một mô hình lấy mẫu trực giao đối với hệ thống 525 dòng. Tuy nhiên, không có tần số nào phù hợp hơn tần số này. Do vậy 13,5MHz được chọn làm tần số lấy mẫu đơn .

Như đã đề cập ở trên, Rec.BT.601 không chỉ chuẩn bị các thành phần RGB cho quá trình lấy mẫu đầy đủ, mà còn cả các thành phần tín hiệu hiệu màu phù hợp cho quá trình lấy mẫu con 2:1 hoặc 4:1, với dải band tần thấp hơn. Sự lựa chọn tần số lấy mẫu trong các hệ thống khác nhau được miêu tả nhờ cách đánh dấu: “4” chỉ ra tần số lấy mẫu cơ bản, “2” chỉ ra bộ lấy mẫu con 2:1 và “1” chỉ bộ lấy mẫu con 4:1. Vì vậy, lấy mẫu RGB được gọi là 4:4:4, lấy mẫu con 2:1 các thành phần hiệu màu là 4:2:2 và 4:1 là 4:1:1. Một sự lựa chọn khác ở đây cho lấy mẫu con 2:1 các thành phần hiệu màu cả ngang và dọc là 4:2:0. Nó không được chỉ ra trong Rec.BT.601 nhưng được sử dụng trong hệ thống nén video.

2.3.4. Lấy mẫu video tổng hợp

Mặc dù không tránh được hiện tượng méo tín hiệu tổng hợp analog, việc số hóa các tín hiệu NTSC và PAL vẫn được sử dụng rộng rãi trong hệ thống video (chủ yếu là tương tự). Kỹ thuật số là cách tốt nhất để thực hiện các nhiệm vụ như sửa lỗi thời gian gốc, lưu trữ khung hình, xử lý ảnh trong hệ thống analog tổng hợp. Do vậy, những thiết bị này phải kết hợp chặt chẽ bộ ADC và DAC để thích ứng trong hệ thống.

Nhiều ứng dụng xử lý ảnh yêu cầu tín hiệu số phải nằm trong một định dạng thành phần, điều này cũng đồng nhất với việc các tín hiệu số thành phần phải được giả hóa tới định dạng thành phần trước bất kỳ quá trình nào. Đây là một bước rất khó khăn, có thể gây ra hiện tượng méo tín hiệu và là một nhược điểm lớn nhất của tất cả các hệ thống thành phần. Tuy nhiên, các hệ thống số thành phần sẽ rất tuyệt nếu chức năng duy nhất của nó chỉ là lưu trữ hoặc ghi tín hiệu.

Đồng bộ hóa ADC với sóng mang các tín hiệu thành phần thường là hoàn toàn thỏa mãn. Bởi vì sóng mang thành phần nào đó phải dưới giới hạn Nyquist, nên sự lựa chọn hợp lý là 3× và 4× thường được lựa chọn nhiều hơn. Vì vậy, đối với quá trình chuyển đổi của hệ NTSC tần số là 14,318MHz và đối với hệ PAL là 17,72MHz. Quá trình đồng bộ được thực hiện nhờ việc lấy các bust từ tín hiệu tổng hợp và sử dụng một vòng phá khoa để tạo ra khung đồng hồ lấy mẫu.

53

Page 56: Audio Video

Chương 2: Số hoá tín hiệu audio và video

2.4. CHUYỂN ĐỔI DẠNG SỐ SANG TƯƠNG TỰ

Tín hiệu audio hay video số sau khi truyền dẫn hay lưu trữ sẽ được tái tạo lại tín hiệu tương tự như nguyên mẫu. Việc biến đổi tín hiệu số ra tương tự được thực hiện nhờ bộ DAC, mạch này đơn giản hơn ADC, tuy nhiên vẫn còn một vài vấn đề cần xem xét. Hình 2.18 giới thiệu sơ đồ khối của bộ DAC tiêu biểu, thiết kế phù hợp cho video. Cấu trúc này được coi như kiến trúc R-2R sử dụng cho hai giá trị điện trở.

Đầu vào số nối tiếp được chuyển đổi sang một định dạng song song, và một đồng hồ dữ liệu được thiết lập để khóa các dữ liệu nhằm loại bỏ bất cứ một thành phần tạp nào có thể xuất hiện ở đầu vào. Quá trình xử lý đầu vào cũng bao gồm một mạch lấy mẫu (xem phần 2.2.1.5) cho mỗi bit. Mỗi bit chuyển một nút của mạng từ giá trị bằng zero tới mức điện áp chuẩn. Khi chuyển mạch lên phía trên (bit 1), một dòng điện được chia theo tỉ lệ 2:1 cho số lần xuất hiện khi chảy qua các nút giữa chuyển mạch và đầu vào của bộ khuếch đại thuật toán. Ví dụ dòng điện của chuyển mạch LSB truyền qua 7 nút để đến bộ khuếch đại thuật toán, vì vậy nó được chia theo 128 (27). Mặt khác dòng điện của chuyển mạch MSB chảy trực tiếp vào bộ khuếch đại thuật toán, vì vậy nó không được chia. Vì trở kháng đầu vào của bộ khuếch đại rất thấp do sự hồi tiếp chậm nên các dòng điện từ các chuyển mạch bội chuyển lên phía trên sẽ tổng hợp tuyến tính, vì vậy dòng điện đầu ra sẽ là:

⎟⎠⎞

⎜⎝⎛ +++++++= 7

26

45

84

163

322

641

1280

20 bitbitbitbitbitbitbitbitR

Vi REF

Điện áp đầu ra của bộ khuếch đại thuật toán là ioR. Các giá trị điện trở R và 2R phải rất chính xác để sự chuyển đổi là tuyến tính, một mức giá trị lượng tử là 256 hay 0,4% và nếu mức giá trị lượng tử yêu cầu chính xác là 1/10, khi đó độ chính xác của các điện trở yêu cầu phải là 0,04%. Điều này rõ ràng thực hiện được, nhưng các bộ DAC cho số bit cao hơn lại đòi hỏi một phương pháp khác nhằm đạt được các yêu cầu về độ chính xác.

Các việc chuyển mạch trong kiểu DAC này đều có thể gây ra lỗi nếu như có sự hoạt động không đồng đều tại sóng đầu ra của bộ khuếch đại thuật toán do hoạt động chuyển mạch. Nhiều bộ DAC thực hiện quá trình lấy mẫu lại sau khi chuyển đổi để loại bỏ lỗi này. Quá trình lấy mẫu được tính thời gian bắt đầu muộn hơn trong bộ chuyển đổi, nhưng kết thúc trước giai đoạn chuyển mạch tiếp theo, vì vậy nó xảy ra trong khoảng thời gian khi đầu ra của bộ chuyển đổi ở giá trị ổn định.

Bộ lọc đầu ra của DAC chạy ở fs cũng phải đáp ứng những yêu cầu tương tự như bộ lọc đầu của ADC. Nếu độ rỗng band tần yêu cầu gần với giới hạn Nyquist, việc thiết kế bộ lọc sẽ trở nên rất khó khăn và giá thành cao.

54

Page 57: Audio Video

Chương 2: Số hoá tín hiệu audio và video

Xử lý

đầu vào digital

Khôi phục clock

Bộ lọc thấp

Đầu vào digital

-

+

Đầu ra analog

Hình 2.16. Bộ chuyển đổi số-tương tự R-2R

Một công nghệ đồng thời có thể giúp ADC và DAC có số bit cao là lấy mẫu tần cao. Trong bộ DAC lấy mẫu tần cao, quá trình lọc được đáp ứng tốt hơn và dự chính xác về số bit cũng đạt được dễ dàng hơn.

55

Page 58: Audio Video

Chương 3: Truyền dẫn audio và video

Chương 3

TRUYỀN DẪN AUDIO VÀ VIDEO SỐ 3.1. GIỚI THIỆU

Tín hiệu audio-video sau khi được số hoá sẽ được đưa đến kênh truyền để truyền đi hoặc có thể lưu trữ trên các thiết bị ghi phát số. Truyền dẫn audio video là chuyển dữ liệu từ nơi này đến nơi khác với những phương thức truyền khác nhau. Từ một camcorder nhỏ nhất cho đến một mạng lớn như mạng toàn cầu internet, tất cả những hệ thống số đó đều phải đối mặt với rất nhiều khó khăn trong vấn đề truyền dẫn tức là chuyển dữ liệu từ nơi này đến nơi khác. Ghi và lưu trữ là hai loại ứng dụng truyền dẫn khác, chuyển dữ liệu từ thời điểm này tới thời điểm khác. Chương này sẽ bàn đến một số công nghệ cũng như một số hệ thống truyền dẫn dữ liệu số.

3.2 CÔNG NGHỆ TRUYỀN DẪN SỐ

Toàn bộ môi trường truyền dẫn (được gọi là kênh), đối với tín hiệu analog đều có những hạn chế nhất định, thông thường về dải thông, tạp âm, không ổn định về thời gian gốc và đặc tuyến biên độ phi tuyến. Sự suy giảm analog này có thể gây ra lỗi trong truyền dẫn số vì vậy nó phá vỡ ưu điểm cơ bản của kĩ thuật số, một công nghệ khá hoàn hảo. Phần này bàn đến một vài công nghệ dùng để xử lý các vấn đề gặp phải của môi trường analog trong truyền dẫn số.

Hình 3.1. là sơ đồ khối một hệ thống truyền dẫn số tiêu biểu bao gồm tất cả các phần tử có thể có trong hệ thống, mặc dù không phải tất cả mọi hệ thống đều có.

3.2.1. Mã hóa

Trong hầu hết các truờng hợp dữ liệu nhị phân gốc tạo bởi ADC không phù hợp cho truyền dẫn, vì vậy nó phải được định dạng trước khi truyền dẫn. Quá trình này được gọi là mã hóa (encoding hay coding), đây là quá trình biến đổi hoặc bổ sung vào dữ liệu mà không làm tổn hao bất cứ nội dung thông tin nào của dữ liệu. Mã hóa có thể được thực hiện và phá bỏ (giải mã) bằng một vài cách khác nhau để tín hiệu số truyền qua hệ thống. Kỹ thuật mã hóa trình bày ở đây chỉ sử dụng cho truyền dẫn, quá trình mã hóa bổ sung có thể được áp dụng. Ví dụ, để thực hiện nén dữ liệu có thể làm mất lượng thông tin không quan trọng để quá trình nén đạt hiệu quả tốt hơn.

Trong ngành công nghiệp viễn thông, người ta có thể quan sát các bước của quá trình xử lý thông tin như một chuỗi các lớp của giao thức. Năm 1984 tổ chức

56

Page 59: Audio Video

Chương 3: Truyền dẫn audio và video

tiêu chuẩn quốc tế ISO phát triển mô hình liên kết các hệ thống mở (OSI) thành tiêu chuẩn IS7498. Mô hình trên xác định có bảy lớp giữa người dùng và mạch vật lí. Đây là tiêu chuẩn được sử dụng rất rộng rãi ở Châu Âu để kết nối máy tính trên các kênh thông tin ở Mỹ, mô hình OSI cũng được sử dụng nhưng tiêu chuẩn TCP/IP lại thông dụng hơn (là cơ sở cho mạng Internet). Các lớp OSI được minh họa trong hình 3.2. Các lớp được trình bày ngắn gọn dưới đây:

Mã hóa

Mã hóa

Mã hóa

Mã sửa lỗi

Mã sửa lỗi

Mã sửa lỗi

Đóng gói Điều chế Kênh truyền

Khôi phục clock

Giải điều chế

Phân tích gói

EADC Giải mã

EADC

EADC

Giải mã

Giải mã

Ngỏ ra dữ liệu A

Ngỏ ra dữ liệu B

Ngỏ ra dữ liệu C

Ngỏ vào dữ liệu A

ỏ vào dữ liệu B

ỏ vào dữ liệu C

Ng

Ng

Hình 3.1. Sơ đồ khối hệ thống truyền dẫn số

1. Lớp vật lí: lớp này bao gồm phần cứng vật lí thực, phần mềm liên lạc và mọi thứ cần thiết để thiết lập một kết nối vật lí và truyền dòng bit trên nó.

2. Lớp liên kết dữ liệu: lớp này điều khiển mối liên kết vật lí thực và có thể cung cấp các chức năng xử lí lỗi.

3. Lớp mạng: lớp này xử lí phân tuyến liên lạc thông qua một mạng.

4. Lớp giao vận: lớp này là cầu nối giữa các chức năng ứng dụng và thông tin. Nó cũng thực hiện việc sửa lỗi, điều khiển luồng và chức năng ghép kênh.

5. Lớp phiên: lớp này thiết lập, xử lí và giải phóng sự kết nối thông tin.

6. Lớp trình diễn: lớp này định rõ cách thức thiết lập và kết thúc của lớp phiên.

57

Page 60: Audio Video

Chương 3: Truyền dẫn audio và video

7. Lớp ứng dụng: lớp cao nhất này là một giao diện với người sử dụng giữa dịch vụ thông tin dữ liệu và người dùng.

Các hệ thống đơn giản không dùng tất cả các lớp này. Mô hình OSI sẽ được sử dụng trong phần dưới đây.

Lớp ứng dụng

Lớp trình diễn

Lớp phiên

Lớp giao vận

Lớp mạng

Lớp liên kết dữ liệu

Lớp vật lý

Người sử dụng

Phần cứng

Hình 3.2. Các giao thức của mô hình ISO tiêu chuẩn

Đầu ra của quá trình mã hóa vẫn là dòng bit nhị phân. Mặc dù một dòng bit như thế này đôi khi có thể được truyền trực tiếp tới kênh truyền analog, song việc thực hiện thêm quá trình xử lý tương tự hoặc số nhằm tạo ra tín hiệu phù hợp hơn cho kênh truyền là hoàn toàn thỏa mãn. Đầu ra của những quá trình này không còn là tín hiệu số nhị phân nữa, nó có thể có các đặc tính analog. Trong chương này, quá trình xử lý đặc trưng của kênh như trên được gọi là điều chế hoặc mã hóa kênh. Cần chú ý rằng, một vài bước mã hóa như định nghĩa ở đây trong công nghiệp thường có ý nghĩa như điều chế.

3.2.2. Dạng nối tiếp và song song

Dữ liệu số cho audio và video thường có cấu trúc dạng nhóm bit, các nhóm này trình bày một đoạn thông tin, ví dụ như pixel cho video hoặc một mẫu cho audio. Nhiều khi phần cứng tạo thông tin cung cấp dữ liệu trên một số mạch song song, trên cơ sở cấu trúc dữ liệu một mạch trên mẫu. Vì vậy, 1 bộ ADC 8 bit có thể có 8 dây đầu ra. Cấu trúc song song như vậy rất phù hợp cho việc truyền dữ liệu ở những

58

Page 61: Audio Video

Chương 3: Truyền dẫn audio và video

khoảng cách ngắn, với ưu thế tốc độ dữ liệu trên dây thấp hơn tổng tốc độ dữ liệu là số n tương ứng với số dây song song.

Tuy nhiên, việc xử lý các dây tín hiệu song sẽ gặp khó khăn nếu dữ liệu truyền dẫn nằm ngoài một box đơn, và sẽ hoàn toàn không thực hiện được nếu khoảng cách quá xa hay khi cần thiết phải sử dụng truyền dẫn vô tuyến. Trong trường hợp này dữ liệu phải được kết thành dạng chuỗi để có thể truyền được trên một kênh đơn.

3.2.3. Đồng bộ hóa

Có hai phần cần phải đồng bộ hóa dữ liệu: (1) trích một đồng hồ giúp cho việc đọc cũng như chốt dòng dữ liệu trở nên đáng tin cậy hơn, (2) đồng bộ hóa định dạng dữ liệu để nội dung có thể được nhận dạng và giải mã.

3.2.3.1. Trích đồng hồ

Trong một hệ thống dữ liệu song song, một dây riêng biệt được dành riêng cho đồng hồ tạo xung đồng bộ, vì vậy không có khó khăn gì khi trích đồng hồ. Tuy nhiên, các hệ thống nối tiếp phải chứa sẵn tín hiệu đồng hồ trong dữ liệu để thiết bị thu có thể xác định được số bit dữ liệu một cách đáng tin cậy. Đây được gọi là tự tạo xung đồng bộ.

Một dòng dữ liệu nối tiếp có các đặc tính như một chuỗi ngẫu nhiên của các số “1” và “0”. Điển hình là sẽ có các thành phần tín hiệu có giá trị cao ở tần số dữ liệu lập lại, thành phần này có thể được trích bởi một vòng khóa pha (PLL) hoạt động tại tần số đó. Mục đích của việc mã hóa và điều chế là đảm bảo việc trích đồng hồ có thể được hoàn tất với bất cứ mô hình bit dữ liệu nào.

Bộ lọc thông thấp

VCO ở tần số clock

Dạng sóng dốc thoải

Dữ liệu

Ngỏ ra xung clock

Dạng sóng VCO dốc thoải

Xung lấy mẫu

Dạng sóng dữ liệu

Hình 3.3. Sơ đồ khối của một vòng khóa pha

59

Page 62: Audio Video

Chương 3: Truyền dẫn audio và video

Hình 3.3 là sơ đồ khối của một vòng khóa pha. Một bộ tạo sóng điều khiển điện áp (VCO) hoạt động với tần số xấp xỉ bằng tần số đồng hồ. Nó được điều khiển bởi đầu ra của bộ tách sóng pha tạo bởi quá trình lấy mẫu và lưu trữ dạng sóng thoải ở VCO với các xung nhận được từ các biên chính của tín hiệu dữ liệu. Đầu ra của bộ phận trích mẫu và lưu trữ có điện áp có thể làm thay đổi tần số của VCO theo hướng đồng hồ. Tại đồng hồ, bộ phân tích sẽ kết thúc quá trình lấy mẫu tín hiệu VCO ở gần trung tâm của mỗi bước chuyển tích cực. Do có thể có sự trượt về thời gian của tín hiệu đầu vào và đối với một vài định dạng có thể sẽ không có bước chuyển tích cực ở mọi chu kỳ đồng hồ cho nên bộ lọc thông thấp ở PLL sẽ làm chậm hoạt động lại, vì vậy đồng hồ được trích vẫn ổn định.

Đầu ra ở VCO của PLL trở thành đồng hồ dữ liệu. Tuy nhiên, dữ liệu được tạo ra không đáng tin cậy bởi vì có những đoạn được mở rộng của tất cả các số “1” hoặc tất cả các số “0”, trong giai đoạn này không có thành phần tần số đồng hồ, và PLL sẽ trượt khỏi đồng hồ.

Để quá trình trích đồng hồ hoạt động một cách đáng tin cậy, phải đặt ra những điều kiện cho dữ liệu trong quá trình mã hóa để đảm bảo là các đoạn có cùng giá trị không quá dài. Đặc tính của dòng dữ liệu được gọi là độ dài thay đổi và kỹ thuật điều khiển nó là giới hạn độ dài thay đổi (RLL). RLL được lượng tử hóa bằng cách xác định thời gian tối thiểu (Tmin) và tối đa (Tmax) giữa các bước chuyển của trạng thái dữ liệu trong kênh truyền. Giá trị Tmin tương ứng với thành phần tần số tối đa của dòng dữ liệu (xấp xỉ bằng 1,5 chu kỳ của tần số tối đa) và giá trị Tmax tương ứng với thời gian dài nhất mà mạch khôi phục đồng hồ phải giữ mà không có bất cứ đầu vào nào.

Một thông số nữa là tỉ lệ mật độ của dữ liệu (DR), là tỉ lệ Tmin trên T, trong đó T là thời gian tối thiểu giữa các bước chuyển của dòng dữ liệu đầu vào trước khi mã hóa. DR càng lớn, thông tin được truyền bởi kênh xác định càng nhiều.

3.2.3.2. Thành phần DC

Một đặc điểm quan trọng khác của dòng dữ liệu là thành phần dc, là số trung bình dài hạn của các giá trị bit trong dòng bit. Nó quan trọng bởi vì hầu hết các phương tiện truyền dẫn không thể truyền được giá trị dc. Mất thành phần dc của dòng dữ liệu sẽ gây ra lỗi hoặc ít nhất cũng sẽ làm giảm biên của hệ thống. Một sơ đồ mã hóa tốt phải loại bỏ hoặc giảm thiểu thành phần dc.

Bảng 3.1 đưa ra danh sách một vài quá trình mã hóa và các đặc tính của nó. Đầu vào thứ nhất trong bảng, dạng xung không trở về 0 (NRZ) là khi các số “1” và “0” của tín hiệu được truyền trực tiếp lần lượt. Đây chính là cách thức mà chúng ta thường gán cho dòng bit. Trong NRZ, bước chuyển đi tới cực dương được ấn định là “1” và bước chuyển đi tới âm được ấn định là “0”. Các chuỗi của các số “1” và

60

Page 63: Audio Video

Chương 3: Truyền dẫn audio và video

“0” lặp lại sẽ không tạo ra các bước chuyển tiếp. NRZ đơn giản nhưng không sử dụng được bởi vì Tmax không xác định và thành phần dc lớn làm cho quá trình trích đồng hồ không thể thực hiện được.

Tên ký hiệu

Tmin Tmax DR Thành phần DC

Tự đồng bộ

NRZI T ∞ 1 lớn không

FM T/2 T 0,5 không có

PE T/2 T 0,5 không có

MFM T 2T 1 không có

EFM 1,41T 5,18T 1,41 không có

Dạng sóng

1 0 0 1 1 0 1 1 1 0

Bảng 3.1. Thông số của một vài quá trình mã hóa

Một biến thể của NRZ là NRZI (NRZ- inverted). Ở xung NRZI có một bước chuyển tiếp (ở cả hai hướng) cho mọi bit “1” nhưng lại không có bước chuyển cho số “0”. Mã này vô cực nhưng lại giống với NRZ là Tmin = T và Tmax = ∞.

Sơ đồ mã hóa FM (còn được gọi là mã đánh dấu lưỡng pha) truyền hai bước chuyển kênh cho “1” và một bước chuyển cho “0”. Nó loại bỏ thành phần dc nhưng lại giảm Tmin đi một nữa, vì vậy DR chỉ còn 0,5. Nó tự tạo xung đồng hồ.

Mã PE hoặc Manchester có bước chuyển tiếp cho mọi bit, đặt ở trung tâm của ô bit. Bit “0” có bước chuyển dương và “1” có bước chuyển âm. Khi các giá trị liên tiếp là như nhau, các bước chuyển phụ có hướng đối lập được thêm vào giữa các ô bit, nó sẽ cho ra cùng một kết quả như mã hóa FM: không có DC và DR = 0,5.

Ở mã MFM, hay còn gọi là điều chế trễ hoặc mã Miller, “1” được mã hóa bởi bước chuyển của cả hai hướng trị trung tâm của khoảng bit, trong khi không có bước chuyển nào ở vị trí này cho số “0”. Một chuỗi các số “0” sẽ có bước chuyển đơn cuối mỗi khoảng bit. Nó cho DR=1 với thành phần DC nhỏ.

3.2.3.3. Mã hóa nhóm

Có thể thực hiện được nhiều mã trên các nhóm bit dữ liệu, cách này được sử dụng rất rộng rãi. Nó thường có dạng cộng thêm một số bit phụ nào đó với dữ liệu để cho phép kiểm soát được các đặc tính của dòng dữ liệu độc lập với dữ liệu vào bộ mã hóa. Ví dụ, một phương pháp thông dụng điều chế 8 thành 14 (EFM) chia các bit dữ liệu thành các nhóm 8 bit và cộng thêm 6 bit bổ sung cho mỗi nhóm có nghĩa là sẽ có 14 bit thực sự được truyền cho 8 bit dữ liệu.

61

Page 64: Audio Video

Chương 3: Truyền dẫn audio và video

Việc chèn các bit phụ trong EFM được thực hiện bằng cách sử dụng bảng tra cứu cung cấp 14 bit cho mỗi giá trị 8 bit đầu vào (nội dung của bảng mã hóa như thế này được gọi là bảng mã) bảng có 256 đầu vào 14 bit. Do một từ 14 bit có thể biểu thị tới 16384 giá trị và chỉ có 256 là cần thiết, cho nên giá trị 14 bit thực sự cần sử dụng phải được chọn lọc cẩn thận để kiểm soát Tmin, Tmax và thành phần DC. Các cách lựa chọn khác nhau này dẫn đến các hệ thống điều chế khác nhau. Tất nhiên phương pháp phải được tiêu chuẫn hóa, bởi vì bộ giải mã phải biết nội dung chính xác của bảng mã được sử dụng.

Để EFM chọn các giá trị 14 bit, sẽ có khả năng hai hay nhiều bit được chọn cặp với nhau. Khi hai bit đầu ra ứng với (2x8)/14 = 1,14 bit đầu vào, Tmin = 1,14 (Tmin được tính theo số bit đầu vào). DR có cùng giá trị, do vậy bằng cách cộng 6 bit vào 8 bit chúng ta có thể truyền được hơn 14% dữ liệu. Điều này xảy ra bởi vì sự lựa chọn các giá trị EFM 14 bit tránh được tất cả cách bước chuyển tiếp bit đơn bằng cách giảm một nửa độ rộng của kênh truyền như yêu cầu. Quá trình mã hóa EFM giới hạn số bit đầu ra theo đoạn tối đa là 7, vì vậy tính theo số bit đầu vào Tmax=(7x8)/14=4.

Trên thực tế, quá trình EFM phức tạp hơn quá trình được miêu tả trên đây rất nhiều do không đủ các giá trị 14 bit tương ứng đầy đủ mọi điều kiện khi xem xét một chuỗi mã 14 bit kề nhau. Để đảm bảo các mô hình bit được tạo ra tại quá trình ghép các đoạn mã 14 bit không vi phạm các điều kiện của hệ thống đặc ra cho Tmin, Tmax và thành phần DC, bộ mã hóa EFM cũng phải kiểm tra tình trạng này và chọn 1 trong 4 giá trị 14 bit xen kẽ phù hợp. Vì vậy, bảng tra cứu sự thực phải lưu trữ được 1024 giá trị bit. Danh sách trong bảng 3.1 cũng đưa ra các thông số cho mã EFM đặc biệt sử dụng cho máy ghi hình từ tính D-3.

3.2.3.4. Mô hình dạng mắt

Tín hiệu số tiêu biểu trong một kênh truyền dẫn sẽ bị lẫn tạp âm như mô tả trong hình 3.4(a). Một đồng hồ được trích từ tính hiệu này cũng có thể có sự dịch chuyển thời gian tương đối so với tín hiệu. Để kiểm tra hệ thống, hai trong những đặc tính này có thể quan sát thấy trên máy hiện sóng bằng cách hiển thị tín hiệu với các xung răng cưa quét dòng đồng bộ với xung đồng hồ được trích. Đây gọi là mô hình dạng mắt và được mô tả trên hình 3.4(b). Mô hình này chỉ ra tín hiệu dịch chuyển xung quanh một vùng mở (dạng mắt), trung tâm của nó có thể biểu thị điểm lấy mẫu lý tưởng của tín hiệu, tức là tại đó có thể nhận được sự phân tách dữ liệu đáng tin cậy nhất. Khi chỉ tiêu truyền dẫn không đặt lên hàng đầu, mắt sẽ nhỏ hơn và việc xác định điểm lấy mẫu càng phải được giới hạn để duy trì tỉ lệ lỗi thấp. Như đã minh họa trên hình, độ cao và độ rộng của mắt theo thứ tự biểu thị biên của biên độ và biên của pha.

62

Page 65: Audio Video

Chương 3: Truyền dẫn audio và video

3.2.3.5. Nhận dạng định dạng dữ liệu

Khả năng phát hiện các số “1” và “0” của dữ liệu được mã hóa chỉ là một phần của quá trình đồng bộ hóa. Người ta cũng phải xác định vị trí các đặc điểm duy nhất của định dạng dữ liệu để thông tin thực có thể được hồi lại. Ví dụ, giải mã định dạng EFM được miêu tả trong phần 3.2.3.3 yêu cầu phải xác định vị trí của bit chính xác tại điểm mỗi mô hình 4 bit bắt đầu. Việc này thường được thực hiện bằng cách xác định một đoạn bit duy nhất (từ đồng bộ) được chèn vào dữ liệu mã hóa. Khi hồi phục, tìm từ đồng bộ có nghĩa là (ví dụ ở EFM) bit dữ liệu tiếp theo đó chính là điểm xuất phát của một từ được mã hóa 14 bit. Trong những trường hợp khác, các bit tiếp sau từ đồng bộ có thể là điểm xuất phát của một đầu xác định mức đầu tiên của định dạng dữ liệu. Tất nhiên, mã hóa phải được thiết kế để từ đồng bộ là duy nhất, tức là dữ liệu ngẫu nhiên không thể tạo ra từ đồng bộ. Một vài sơ đồ mã hóa tiến bộ hơn như EFM tự động cung cấp các định dạng các từ đồng bộ duy nhất.

Clock lấy mẫu

Mức ngưỡng tối

Vị trí lấy mẫu tối ưu

Biên biên độ

Biên pha

Hình 3.4. Mô hình mắt: a) dạng sóng dữ liệu, b) mô hình mắt

Phần cứng có chức năng tìm từ đồng bộ rất đơn giản, người ta sử dụng cấu hình của thanh ghi dịch nối tiếp-song song. Dữ liệu mã hóa có chứa các từ đồng bộ tại các vị trí chưa biết truyền liên tục tới đầu vào nối tiếp của thanh ghi dịch. Các mức song song được chốt trong mọi chu kỳ đồng hồ nối tiếp và tất cả các bit nối tiếp của đầu ra song song được so sánh với từ đồng bộ mong muốn. Nếu tất cả các bit so sánh, từ đồng bộ được tìm thấy. Quá trình này có thể được thực hiện bằng phần mềm mặc dù đối với tín hiệu video, như vậy sẽ đòi hỏi tốc độ xử lý nhanh và vẫn phải cần đến sự hỗ trợ của phần cứng.

3.2.4 Điều chế

63

Page 66: Audio Video

Chương 3: Truyền dẫn audio và video

Như đã giải thích ở phần 3.2.1, quá trình xây dựng cấu hình một dòng dữ liệu đã được mã hóa cho truyền dẫn tối ưu trên kênh truyền analog xác định gọi là điều chế.

3.2.4.1. Đặc tính kênh truyền

Một kênh truyền có thể được đặc tả bởi các đạt tính truyền đạt analog bao gồm các đặc tính của đặc tuyến số, SNR, độ ổn định thời gian gốc và độ tuyến tính của biên độ. Ví dụ các kênh truyền như đường điện thoại, cáp sợi quang, cáp đồng trục, máy ghi từ tính, các kênh quảng bá vệ tinh, và các kênh quảng bá mặt đất. Mỗi loại này điều có đặc tính riêng, cần đến các phương tiện điều chế khác nhau để đạt được khả năng truyền dẫn số tốt nhất.

3.2.4.2 Biểu trưng (Symbol)

Như đã đề cập ở phần trước, tín hiệu của kênh bao gồm những dòng các bit có giá trị “1” hoặc “0”, hoặc một dòng chuyển tiếp giữa các giá trị nhị phân. Để hỗ trợ phần bàn luận về các phương pháp điều chế tiến bộ hơn, việc đưa ra định nghĩa về khái niệm Symbol là rất cần thiết. Symbol là đơn vị cơ bản của dữ liệu được mang đi tại một thời điểm bởi tín hiệu kênh truyền. Mỗi symbol có thể mang một số bit được xác định thông qua phương pháp điều chế mà kênh sử dụng.

Điều chế có thể được coi như một quá trình chuyển đổi các bit dữ liệu sang symbol. Giải điều chế là quá trình chuyển đổi các symbol ngược trở lại dạng bit. Phương pháp điều chế tốt nhất cho một kênh truyền chuyên biệt sẽ truyền số bit nhiều nhất/symbol, các giá trị thông dụng của bit/symbol trong khoảng từ ½ đến 4. Những giá trị lớn hơn có thể sử dụng nhưng không thông dụng bởi vì khi đó phải cần đến các chỉ tiêu về SNR và tuyến tính của kênh quá cao.

Cần phải có một chu kỳ thời gian nhỏ cho tín hiệu của kênh truyền một symbol độc lập với các symbol gần kề. Chu kỳ này xác định tỉ lệ symbol khác nhau cho kênh (việc xác định này phụ thuộc vào dải thông của kênh). Tốc độ truyền dữ liệu được xác định bằng các bit/symbol nhân với tỉ lệ symbol.

Hầu hết bản chất các kênh là analog và gần như tuyến tính. Chính vì vậy, chúng có khả năng xử lý nhiều hơn hai giá trị. Phụ thuộc vào SNR và các đặc tính khác của kênh, việc truyền dữ liệu số với chỉ hai giá trị có thể gây lãng phí dung lượng kênh truyền. Khi các symbol có giá trị lớn hơn hai, khả năng truyền số bit/mẫu lớn hơn là hoàn toàn có thể.

3.2.4.3 Symbol đa mức

Tại đầu thu cuối của kênh truyền, tín hiệu chứa lẫn tạp âm tham nhập trong quá trình truyền. Một đồng hồ symbol được khôi phục, sử dụng lấy mẫu tín hiệu với mục đích khôi phục các giá trị symbol. Tuy nhiên, các giá trị này phải được lượng

64

Page 67: Audio Video

Chương 3: Truyền dẫn audio và video

tử hóa để chuyển đổi chúng sang các giá trị số thực sự. Trong trường hợp một hệ thống chỉ có hai mức symbol, mỗi symbol sẽ lượng tử thành một bit. Tất nhiên, nhiều mức symbol sẽ lượng tử thành nhiều bit hơn. Ví dụ, nếu hệ thống được thiết kế cho 4 mức, mỗi symbol sau đó sẽ lượng tử thành hai bit.

Số mức symbol nhiều hơn sẽ đòi hỏi SNR của kênh truyền cao hơn để lượng tử hóa thành công. Tuy nhiên, tốc độ dữ liệu của hệ thống cho một dải thông xác định sẽ tăng lên theo năng lượng của hai trong số các mức. Hoạt động đa mức dựa trên biên độ tín hiệu tất nhiên sẽ yêu cầu độ tuyến tính biên độ của kênh rất cao. Ví dụ, các máy ghi từ có kênh có độ phi tuyến cao, không thể sử dụng các symbol đa mức.

Các symbol đa mức tạo sự đánh đổi có hiệu quả giữa SNR và dải thông. Ví dụ điển hình của các symbol đa mức là hệ thống truyền dẫn HDTV Grand Alliance (xem phần 3.4.3) truyền tốc độ dữ liệu thực là 19,3 MB/s trên kênh TV 6 MHz.

3.2.4.4. Các phương pháp điều chế

Các giá trị symbol có thể được truyền trên các kênh analog bằng cách điều chế biên độ, điều chế pha, hay điều chế tín hiệu kênh hoặc bằng cách kết hợp những thông số này. Thông thường, một tần số sóng mang được điều chế với dữ liệu mã hóa, nó cho kết quả là phổ dữ liệu bị dịch chuyển tới các vùng lân cận của tần số sóng mang.

Sử dụng các phương pháp kết hợp (như điều chế biên độ và pha) là cách thức để tăng các mức symbol. Đối với các hệ thống sử dụng sóng mang, có thể quan sát rõ symbol tăng lên bằng cách nhìn vào đồ thị vector của nó. Những đồ thị này có tên là đồ thị trạng thái tín hiệu nhưng do hình dạng bên ngoài nên đôi khi nó được gọi là đồ thị chòm sao.

2-AM 16-PSK 8-PSK 4-PSK

Hình 3.5. Đồ thị thiết lập của các phương pháp điều chế

Như minh họa ở hình 3.5 với bốn loại điều chế. AM được hiểu là điều chế biên độ và 2-AM là điều chế biên độ bằng tín hiệu nhị phân. PSK biểu thị khóa dịch pha hoặc điều chế pha, 4-PSK biểu thị điều chế đa mức 2 bit còn 8-PSK là điều chế đa mức 3 bit. QASK chính là khóa dịch biên độ cầu phương hoặc điều chế biên độ cầu phương, là sự kết hợp của điều chế pha và điều chế biên độ 4bit/mẫu.

65

Page 68: Audio Video

Chương 3: Truyền dẫn audio và video

3.2.5. Phát hiện và sửa lỗi

Tất cả các kênh truyền số thực thỉnh thoảng gây ra các lỗi bit. Đều này được đặc tả bằng cách xác định tỉ lệ lỗi bit cho kênh (BER), có nghĩa là khả năng gây ra lỗi bit đơn. BER thường được xác định bằng lũy thừa của 10. Ví dụ, một kênh trung bình tạo ra một lỗi bit trong số 1.000.000 bit có BER là 10-6.

Phụ thuộc vào loại dữ liệu tham gia, các lỗi bit có thể có giá trị lớn hoặc nhỏ. Những hệ thống thông dụng được thiết kế để bỏ qua một mức lỗi nào đó của kênh bằng cách sử dụng kỹ thuật bảo vệ chống lỗi. Khả năng phát hiện và sữa lỗi này của các hệ thống số là một ưu điểm lớn so với các hệ thống analog. Đây chính là lý do tại sao lỗi truyền dẫn không gây ra lỗi dữ liệu nghiêm trọng, và các lỗi này không tích tụ lại khi hệ thống được mở rộng.

Vấn đề lỗi được quan tâm ở mọi điểm trong hệ thống số, và việc phát hiện và sửa lỗi là một yếu tố quan trọng trong mọi quá trình xử lý, không chỉ riêng quá trình truyền dẫn. Trong hệ thống truyền dẫn, các đặc điểm phát hiện-sửa lổi được thiết lập ở mọi khâu của quá trình mã hóa và cùng với sự kế hợp của một vài công nghệ, có thể sẽ có các hệ thống mạnh mẽ thực sự (BER thấp) hoạt động thành công trên kênh truyền nhiều lỗi (BER cao).

3.2.5.1. Thống kê lỗi

Thống kê lỗi rất quan trọng trong việc thiết kế các hệ thống bảo vệ chống lỗi. Các lỗi có thể xảy ra như là các lỗi bit đơn riêng lẻ hay các lỗi burst có độ dài bất kỳ. Việc phát hiện-sửa các lỗi đơn dễ hơn xử lý các lỗi burst dài rất nhiều. Khi cần sữa các lỗi burst, cách hiệu quả nhất là chèn dữ liệu trước khi áp dụng các phương pháp phát hiện-sửa lỗi khác. Chèn dữ liệu mở rộng các lỗi burst một cách có hiệu quả thành một số lượng các lỗi bit đơn riêng rẽ, sau đó sẽ rất dễ sửa.

3.2.5.2. Nguyên tắc phát hiện-sửa lỗi

Ý tưởng cơ bản của quá trình phát hiện-sửa lỗi là tạo ra sự dư thừa trong dòng bit dữ liệu. Sự dư thừa này có hình dạng các bit phụ, được cấu hình đặc biệt tạo điều kiện thuận lợi cho quá trình phát hiện và sửa lỗi ở đầu thu cuối của hệ thống truyền. Hình 3.6 đưa ra một sơ đồ khối xây dựng theo quan niệm này. Ở đầu ra của hệ thống truyền dẫn, các bit thừa được kiểm tra để xác định số lỗi và các hoạt động phù hợp. Trong một vài trường hợp, lỗi có thể phát hiện nhưng không được sửa, nó có thể vẫn có khả năng che lỗi. Điều này sẽ trình bày trong phần 3.2.5.8.

Việc so sánh các chỉ tiêu kỹ thuật của kênh truyền số và tương tự khá thú vị. Trong hầu hết các kênh analog, sự suy giảm của kênh sẽ ảnh hưởng trực tiếp đến tín hiệu và khi kênh bị suy giảm, chỉ tiêu tín hiệu cũng suy giảm tương tự, nhưng tín hiệu không bao giờ bị mất hoàn toàn. Trong hệ thống số có khả năng phát hiện-sửa

66

Page 69: Audio Video

Chương 3: Truyền dẫn audio và video

lỗi, sự suy giảm của kênh không ảnh hưởng đến tín hiệu cho đến khi các chỉ tiêu của kênh trở nên quá kém và hệ thống phát hiện-sửa lỗi bị quá tải. Điều này có nghĩa là một hệ thống số sẽ duy trì chỉ tiêu của nó cho đến tận điểm giới hạn của chỉ tiêu, hoặc sẽ mất hoàn toàn. Đây được gọi là hiệu ứng vách đá (hiệu ứng này xảy ra giống như trong điều chế FM ở hệ thống analog khi mức sóng mang FM ở dưới mức giới hạn).

Dữ liệu dư thừa được thêm vào

Kênh truyền

Phát hiện và sửa lỗi

Che lỗi

Ngỏ vào dữ liệu

Ngỏ ra dữ liệu

Báo hiệu lỗi không được sữa

Hình 3.6 Sơ đồ khối tổng quát quá trình phát hiện và sửa lỗi

3.2.5.3. Tính chẵn lẻ

Dạng phát hiện lỗi đơn giản nhất sử dụng một bit đơn phụ cộng vào dòng bit theo chu kỳ. Ví dụ, một bit phụ có thể được chèn vào bit nhớ thứ 8 trong dòng bit . Bit này có một giá trị khiến các số “1” trong số tám bit cộng với một bit phụ luôn là giá trị chẵn. Đây được gọi tính chẵn và bit phụ gọi là bit chẵn lẻ.

Để kiểm tra lỗi của dòng bit, người ta cộng tất cả các giá trị của bit “1” trong nhóm bit 9, nếu kết quả là một số lẻ sẽ xuất hiện một hoặc nhiều lỗi. Về hình thức, có vẽ như sơ đồ này chỉ phát hiện số lẻ của các lỗi trong nhóm, các số chẵn của lỗi sẽ không bị ảnh hưởng tới quá trình kiểm tra chẵn lẻ, sẽ xuất hiện một hoặc nhiều lỗi. Bởi vì tính chẵn lẻ chỉ thật sự hoạt động đối với các lỗi đơn trong nhóm và chỉ phát hiện ra sự có mặt của lỗi chứ không thể chỉ ra chính xác bit nào bị lỗi, nên nó chỉ được sử dụng trong những trường hợp đặc biệt như các bộ nhớ truy cập ngẫu nhiên hoặc các hệ thống liên lạc đơn giản như RS-232.

3.2.5.4. Các mã sản phẩm

Khái niệm nề tính chẵn lẻ có thể được cũng cố bằng cách áp dụng vào một khối dữ liệu. Ví dụ, 64 bit dữ liệu có thể được đưa vào một mảng hai chiều có kích thước 8×8 bit. Nếu bit chẵn lẻ được đánh dấu cho mỗi hàng và mỗi cột của mảng, khi đó có thể xác định lỗi và vị trí của nó trong mảng. Sau đó, lỗi có thể sửa bằng cách đổi dấu bit đơn giản tại vị trí được ấn định. Đây là trường hợp đơn giản nhất của mã sản phẩm. Hình 3.7 chỉ ra cách thức hoạt động của nó. Tính chẵn lẻ được chỉ ra ở mỗi hàng và mỗi cột, khi lỗi được phát hiện ở hàng hoặc ở cột, bit ở điểm giao nhau giữa hàng và cột là bit bị lỗi. Sơ đồ này chỉ có thể phát hiện ra một lỗi trên

67

Page 70: Audio Video

Chương 3: Truyền dẫn audio và video

khối, nhưng khái niệm có thể được mở rộng để thực hiện sửa lỗi nhiều hơn như giải thích dưới đây.

Trong ví dụ về mã sản phẩm trên hình 3.7, 16 bit chẵn lẻ được tạo ra cho mỗi khối dữ liệu 64 bit. Cách xử lý thông thường để truyền dẫn là truyền khối dữ liệu không thay đổi và gán các bit chẵn lẻ vào dòng bit. Đây được gọi là ghi mã có hệ thống. Hầu hết ứng dụng phát hiện và sửa lỗi đều sử dụng các mã hệ thống.

1 0 1 1 0 0 1 0

0 1 1 0 0 1 1 1

1 0 1 0 0 1 0 1

1 1 1 1 1 1 1 0

0 0 0 1 1 1 0 0

1 1 0 0 0 1 1 0

0 1 0 0 1 1 0 1

0 0 1 0 1 0 1 1

1 0 1 1 0 0 1 0

0 1 1 0 0 1 1 1

1 0 1 0 0 1 0 1

1 1 1 1 1 1 1 0

0 0 0 1 1 1 0 0

1 1 0 1 0 1 1 0

0 1 0 0 1 1 0 1

0 0 1 0 1 0 1 1

0

1

0

1

1

1

0

0

0 0 1 1 0 0 1 0 0 0 1 1 0 0 1 0

0

1

0

1

1

0

0

0

Hai lỗi chẵn lẻ xác định một lỗi bit

8 byte dữ liệu

Trước khi truyền Sau khi truyền

Cột chẵn lẻ Hàng chẵn lẻ

Hình 3.7. Tính chẵn lẻ hai chiều cho sửa lỗi bit đơn

3.2.5.5. Các mã tiến bộ hơn

Thuyết về các mã phát hiện và sửa lỗi trở nên cực kỳ phức tạp và thiên về toán học nhiều hơn, sẽ không được giới thiệu ở đây. Tuy nhiên, một vài khái niệm then chốt sẽ được trình bày giúp đọc giả có những hiểu biết về một số phương pháp không thông dụng khác.

Ví dụ, khối 8×8 đã nêu ở trên với tính chẵn lẻ hai chiều có thể được quan sát như là tám từ dữ liệu 8 bit cộng với hai từ 8 bit dư thừa, tại đây, các từ dư thừa được tính toán như độ chẵn lẻ của hàng và cột. Nhưng vẫn có những cách tính toán dư thừa khác, và các từ bổ xung cũng có thể được cộng thêm. Phương pháp này tạo ra rất nhiều cơ hội lựa chọn chỉ tiêu lỗi để phù hợp với các ứng dụng khác nhau.

3.2.5.6. Mã Reed-Solomon

Một mã phát hiện và sửa lỗi được sử dụng rộng rãi là mã Reed-Solomon. Mã này được sử dụng trong các máy ghi video và audio, đĩa chuyển đổi, hệ thống HDTV Grand Alliance, và nhiều hệ thống khác. Đây là hệ thống mã khối có thể sửa rất nhiều lỗi trên một khối. Ví dụ, một khối có chứa 20 byte biên phát hiện và sửa

68

Page 71: Audio Video

Chương 3: Truyền dẫn audio và video

lỗi R-S có khả năng sửa tới 10 byte lỗi trên một khối. Sự lựa chọn khả năng sửa lỗi được thực hiện trong quá trình thiết kế hệ thống. Quá trình xử lý hết sức phức tạp, tuy nhiên với các mạch tích hợp có sẵn, việc lắp đặt trở nên dể dàng.

Các mã R-S được xác định bằng cách đưa ra số byte trong khối tổng và số byte trong phạm vi dữ liệu. Ví dụ, mã được sử dụng trong hệ thống truyền dẫn Grand Alliance, được gọi là mã (207, 187) bởi vì kích cỡ của khối tổng là 207 byte và có 20 byte của mã chẵn lẻ R-S, còn lại 187 byte cho dữ liệu.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18…

1 9 17 X X X 49 57 2 10 18 26 34 42 50 58 3 11 19 27 35 43 51 59 4 12 20 28 36 44 52 60 5 13 21 29 37 45 53 61 6 14 22 30 38 46 54 62 7 15 23 31 39 47 55 63 8 16 24 32 40 48 56 64

1 9 17 25 33 41 49 57 2 10 18 26 34 42 50 58…

1 9 17 X X X 49 57 2 10 18 26 34 42 50 58…

…23 24 X 26 27 28 29 30 31 32 X 34 35 36 37 38 39 40 X 42 43… Burst lỗi được chuyển thành các bit đơn

Đọccột

Đọccột

Ghi hàng

Ghi hàng

Mã hoá

Giải mã

Hình 3.8. Chèn các bit lỗi khôi phục thành các bit lỗi độc lập

Một khối dữ liệu được đọc cho các hàng của bộ nhớ cấu trúc theo mảng hai chiều. Dữ liệu sau đó sẽ được đọc ra từ bộ nhớ theo cột. Quá trình ngược lại được thực hiện khi khôi phục. Nếu burst lỗi (chữ × trong hình) xảy ra khi tín hiệu ở trong định dạng được chèn nó sẽ được chuyển thành các lỗi bit đơn khi dữ liệu không được chèn cho đến khi hồi phục. Kỹ thuật này được sử dụng rộng rãi cho các hệ thống như các máy ghi từ nhạy cảm với burst lỗi.

3.2.5.7. Mã chèn chéo

69

Page 72: Audio Video

Chương 3: Truyền dẫn audio và video

Hiện tại, người ta vẫn tiếp tục cải tiến bằng cách đưa quá trình quét lớp vào giữa hai khoảng của mã phát hiện và sửa lỗi Reed-solomon. Đây được gọi là chèn chéo và minh họa như hình 3.9.

Mã R-S ngoài

Chèn dữ liệu

Mã R-S trong Điều chế

Kênh truyền

Giải điều chế

Sửa lỗi R-S trong

Sửa lỗi R-S trong

Rút trích

Ngỏ vào dữ liệu

Ngỏ ra dữ liệu

Hình 3.9. Chèn chéo

Dữ liệu đầu vào được chia thành các khối R-S với mã thừa (mã ngoài), sau đó đọc cho bộ nhớ chèn. Bộ nhớ các một hàng trên một khối R-S. Đầu ra được chèn từ bộ nhớ sau đó sẽ đưa tới một mã R-S khác (mã trong). Khi khôi phục, quá trình này sẽ được đảo ngược lại.

Mã trong có thể sửa các lỗi bit đơn xảy ra ở kênh, tuy nhiên nó không thể sửa được các bit lỗi, các burst lỗi này phải được sửa bởi các mã ngoài. Chèn chéo được sử dụng gần như trong tất cả các hệ thống ghi từ và quang.

3.2.5.8. Che lỗi

Trong một vài trường hợp, hệ thống phát hiện sửa lỗi có thể phát hiện nhưng không sửa được lỗi. Nếu sự tồn tại của lỗi ở những khối dữ liệu là rõ rệt có thể có các kỹ thuật khiến nó trở nên khó nhận biết hơn hoặc khó nghe được trong quá trình tái tạo. Điều này phụ thuộc vào sự xuất hiện của lỗi cũng như các yếu tố tâm vật lý ảnh hưởng đến cách mà con người có thể nhận biết được sự bất bình thường.

Tại điểm phát hiện lỗi, bộ xử lý phát hiện lỗi hiện sửa lỗi có thể tạo ra một cờ. Bộ xử lý này cũng cũng sẽ chỉ ra khối dữ liệu đặc biệt có chứa lỗi chưa được sửa. Ý nghĩa của lỗi đối với việc tái tạo sẽ phụ thuộc vào quá trình mã hóa số audio hoặc video ở điểm xảy ra lỗi. Ví dụ, nếu chúng ta xử lý với audio ở PCM tuyến tính, một lỗi bit đơn sẽ là một lỗi ở giá trị mẫu đơn. Mẫu này có thể được nghe thấy như một click trong quá trình tạo. Độ cao của tiếng click sẽ phụ thuộc vào ý nghĩa từ mẫu của bit bị lỗi. Tuy nhiên, nếu tính hiệu audio được mã hóa trong định dạng nén, một lỗi bit đơn sẽ gây thiệt hại nhiều hơn và có thể phải cần đến một kỹ thuật che khác.

70

Page 73: Audio Video

Chương 3: Truyền dẫn audio và video

Tiếp tục với trường hợp tín hiệu audio được mã hóa PCM, có một số khả năng che mẫu đơn được phát hiện có lỗi. Hình 3.10 minh họa một dạng sóng đầu vào được lấy mẫu và ba trường hợp dạng sóng đầu ra với một lỗi mẫu đơn lẻ. Trường hợp thứ nhất (b) là với lỗi chưa được sửa. Tiếp theo (c) là để thay thế mẫu bị lỗi với giá trị của mẫu trước, và cuối cùng (d) được đặt xen vào giữa các mẫu trước và mẫu tiếp theo để tạo ra một giá trị che. Tất cả đều hoạt động dựa trên cơ sở là tín hiệu audio được lấy mẫu thường không thay đổi từ mẫu này sang từ mẫu khác.

Hình 3.10. Che lỗi a) dạng sóng ban đầu được lấy mẫu, b) một mẫu lỗi,

c) mẫu lặp lại, d) nội suy.

Burst lỗi lấy ra một số mẫu audio liên tiếp là một trường hợp khác, khó hơn. Như vậy sẽ có sự thay đổi nhỏ trong tín hiệu khi lỗi không còn hiệu lực. Trong trường hợp này phải có một kỹ thuật che dấu tốt hơn thay thế cho các mẫu bị phá hủy bởi các burst có các giá trị bằng không. Nó có thể đưa ra một đứt đoạn ngắn cho âm thanh nhưng vẫn tốt hơn một burst của tạp âm ngẫu nhiên (nếu không sử dụng kỹ thuật che) và thậm chí có thể nó còn tốt hơn cả kỹ thuật bit đơn.

Kỹ thuật che ở video tạo ra nhiều cơ hội lựa chọn bởi vì sự dư thừa là cố hữu trong tín hiệu video được quét. Một lần nữa, coi như quá trình mã hóa PCM tính hiệu video là tuyến tính. Một lỗi mẫu đơn lẻ sẽ xuất hiện như là một chấm ở độ sáng hoặc màu sai trên ảnh. Các kỹ thuật được sử dụng cho audio sẽ hoạt động rất tốt để che lỗi này của video, tuy nhiên các kỹ thuật này không đáp ứng được cho các bit lỗi.

Các burst lỗi có thể được che bằng cách thay thế các vùng lỗi bằng thông tin từ dòng trước hoặc khung hình trước của ảnh. Các kỹ thuật này dựa trên quan điểm cơ sở là ảnh video thường không thay đổi nhiều từ dòng nọ sang dòng kia hoặc từ

71

Page 74: Audio Video

Chương 3: Truyền dẫn audio và video

khung hình này tới khung hình kia. Tuy nhiên, với mục đích che lỗi, tất cả những phương pháp này đều yêu cầu hệ thống phải có bộ nhớ để lưu trữ các dòng hoặc khung hình trước. Vì những lý do khác, hầu hết các hệ thống đều đã có các bộ nhớ này, vì vậy việc thêm khả năng che lỗi có thể được thực hiện mà không quá tốn kém.

Phần trên chỉ dành cho quá trình mã hóa PCM. Khi các quá trình mã hóa khác được sử dụng, đặc biệt là khi có sự tham gia của quá trình nén, che lỗi trở thành quá trình mã hóa đặc thù và phải được quan tâm đến trong quá trình thiết kế phần mã hóa.

3.2.6. Đóng gói

Phần bàn luận trước về quá trình phát hiện và sửa lỗi đã giới thiệu rất nhiều kỹ thuật hoạt động dựa vào quá trình phân chia một dòng bit thành các khối. Còn có những ưu điểm khác của các khối dữ liệu trên kênh thông tin được gọi là gói. Các gói này được sử dụng rộng rãi trong các hệ thống viễn thông, mạng máy tính.

Ý tưởng của gói là dòng dữ liệu được chia thành một chuỗi các khối, tại đó mỗi khối chứa một header để nhận dạng gói và dữ liệu xác định. Các gói có thể có kích thước giống nhau hoặc khác nhau với các header xác định kích thước của mỗi gói. Ở đầu thu cuối, các gói được giải mã ngược trở lại định dạng video có nén sau đó sẽ được giải mã thành tín hiệu video để hiển thị.

3.2.6.1. Ưu điểm của quá trình đóng gói

1. Truyền dẫn gói tạo ra một đường linh hoạt để xác định vị trí của kênh truyền động cho nhiều dòng bit.

2. Nhiều dòng bit của các loại dữ liệu khác nhau có thể được truyền cùng nhau trên cùng một kênh. Việc xác định vị trí trước cho một dòng bit là cần thiết, các gói của dòng bit có thể đơn giản là “trượt vào” dòng gói mỗi khi chúng xảy ra. Điều này sẽ dừng lại khi vượt quá dung lượng tổng cộng của kênh.

3. Cùng với khả năng phát hiện sửa lỗi có thể đã có ở đầu vào của các dòng bit, các gói có thể chứa mã phát hiện và sửa lỗi riêng của mình.

4. Cùng với nhận dạng, các header của gói chứa các thông tin đích đến, do vậy hệ thống có thể được thiết kế với khả năng phân tuyến các gói độc lập tới các đích khác nhau. Đây là cơ sở của các mạng điện thoại chuyển mạch gói đang dùng hiện nay và cho cả Internet.

Quá trình đóng gói có sự tham gia của các overhead bổ sung dưới dạng cấu trúc của các header gói chỉ phù hợp trong các trường hợp các ưu điểm được liệt kê trên đây là quan trọng.

72

Page 75: Audio Video

Chương 3: Truyền dẫn audio và video

Hình 3.11. Đóng gói video

3.3.6.2. Mode truyền dị bội (ATM)

Kích cỡ gói là một đặc tính quan trọng của các hệ thống đóng gói và phải được xác định ngay tại thời điểm thiết kế hệ thống. Kích cỡ có thể thay đổi được hoặc cố định. Do có một số overhead cần đến trong header của gói không quan tâm đến kích cỡ của nó, nên nếu overhead giảm, gói sẽ được thiết kế lớn hơn. Tuy nhiên, các gói nhỏ hơn sẽ tạo ra độ linh hoạt tốt hơn cho chỉ tiêu hệ thống. Chính vì độ linh hoạt và cũng do nó lấy cùng số lượng xử lý để tiến hành đóng gói mà không quan tâm đến kích cở của gói nên hầu hết các thiết kế hệ thống có các kích cỡ gói nhỏ, trong phạm vi từ 50 đến vài trăm byte.

Các khung video

Người gởi

Các khung video

Người nhận

Bộ mã hóa Bộ giải mã

Mạng chuyển mạch gói

Các gói

Dữ liệu gởi Dữ liệu nhận

Chỉ đường dẫn ảo (VPI)

5 byte header

Chỉ kênh truyền ảo (VCI)

Điều khiển lỗi header

48 byte dữ liệu

Điều khiển luồng

Header thích ứng

Kiểu dữ liệu

Dự trữ

Hình 3.12. Cấu trúc gói ở chế độ truyền dị bội

73

Page 76: Audio Video

Chương 3: Truyền dẫn audio và video

Các gói của nó gọi là các tế bào có kích thước 53 byte như ở hình 3.12. Mỗi tế bào có sức chứa dữ liệu là 48 byte và một header 5 byte. Header của tế bào ATM có năm phần cộng với 8 bit của mã phát hiện sửa lỗi vào header.

1. Điều khiển dòng 4 bit có thể được sử dụng để điều khiển dòng thông tin từ phần cứng giao diện mạng của người sử dụng.

2. Bộ nhận dạng đường dẫn ảo (VPI) -12 bit dùng để nhận dạng điểm đến cho tế bào. Nhiều dạng tế bào khác nhau có thể có cùng VPI.

3. Bộ nhận dạng kênh ảo (VCI) -12 bit dùng để nhận dạng kênh cho một dòng riêng.

4. Kiểu trọng tải (PT)-3 bit có thể sử dụng để nhận dạng kiểu thông tin, phần cứng và phần mềm trong mạng không nhận biết được những bit này.

5. Một bit dự phòng.

3.3. PHƯƠNG TIỆN TRUYỀN DẪN

Quá trình truyền dẫn phải cần đến một vài loại hình kết nối giữa nguồn dữ liệu và nguồn sử dụng. Đây vừa là sự kết nối vật lý vừa là sóng radio như trong truyền hình quảng bá mặt đất hoặc truyền dẫn qua vệ tinh.

3.3.1. Cáp đồng trục

Truyền bằng cáp đồng trục bao gồm từ các cáp video mềm, loại nhỏ sử dụng trong truyền hình quảng bá hoặc hệ thống video gia đình đến cáp nửa cứng nửa mềm dùng cho các đường trung kế của TV cáp. Tất cả những loại cáp này đều có đặc tính là tín hiệu bị giảm đi theo khoảng cách và càng giảm nhanh hơn ở những tần số cao. Đối với các dịch vụ analog, thường cần đến bộ cân bằng cáp trên dải thông được sử dụng nhờ các mạch lọc đặt tại một hoặc cả hai đầu của cáp. Khi sử dụng thêm quá trình cân bằng, SNR của cáp suy giảm và trở thành giới hạn độ dài của mạch cáp được sử dụng. Điều này có thể được khắc phục nhờ bộ lặp, đây là bộ khuếch đại tín hiệu theo chu kỳ được sử dụng rộng rải trong các hệ thống TV cáp.

Tất cả các thông số trên rất hữu hiệu trong các hệ thống số, tuy nhiên vẫn còn nhiều cơ hội lựa chọn điều chế và mã hóa kỹ thuật phù hợp với các đặc tính của cáp. Truyền dẫn số có thể thực hiện trên mọi loại cáp với bất cứ kiểu mã hóa nào nhưng độ dài hoạt động thực tế sẽ bị giới hạn. Giới hạn này có thể được mở rộng nhờ việc lựa chọn quá trình mã hóa thích hợp và sử dụng các kỹ thuật analog cho quá trình cân bằng.

74

Page 77: Audio Video

Chương 3: Truyền dẫn audio và video

Loại cáp Tốc độ dữ liệu (Mb/s)

Khoảng cách (km)

Tốc độ × khoảng cách (Gb-km/s)

Cáp xoán đôi 1 2 0,002

Cáp đồng trục (nhỏ) 10 1 0,01

Cáp đồng trục (TV cap) 2000 1 2

Sợi đa mode 600 2 1,2

Sợi đơn mode 2000 100 200

Bảng 3.2. Chỉ tiêu của các loại cáp khác nhau

Các hệ thống cáp TV

Dải tần analog cân bằng của các hệ thống cáp TV nằm trong khoảng từ 300 đến 500MHz, được chia thành các kênh TV khoảng từ 50 đến 80 kênh 6MKz. Truyền hình quảng bá mặt đất có thể thực hiện tổng hợp các dịch vụ analog và digital trên cùng một cáp bằng cách định rõ các kênh phù hợp cho chương trình analog và số. Sử dụng điều chế dạng HDTV Grand Alliance, mỗi kênh cáp 6MKz có khả năng chứa tốc độ bit là 38Mb/s. Nếu 50 kênh cáp là số thì tốc độ trung bình của nó sẽ là 1.9GB/s. Tuy khả năng lớn nhưng vấn đề là ở chỗ là cách sử dụng như thế nào. Không phải mọi hệ thống đều truyền được 1000 chương trình khác nhau ở mọi lúc, tuy nhiên các ứng dụng như video hai chiều vẫn có thể sử dụng khả năng này.

3.3.2. Cáp sợi quang

Cáp sợi quang có dải thông và các đặc tính độ dài lớn hơn nhiều so với cáp đồng. Nó cần đến bộ chuyển đổi điện tử-quang ở mỗi đoạn nối trên đường truyền, điều này có nghĩa là sự kết nối phân nhánh sẽ trở nên khó hơn. Tuy nhiên, cáp sợi quang tạo ra tính kháng thể gần như hoàn toàn với nhiễu từ hoặc điện.

3.3.3. Đường điện thoại

Mạng điện thoại toàn cầu khởi đầu được xây dựng cho truyền thoại analog ở dải thông khoảng 3,5KHz. Nó tạo ra đường liên lạc 2 chiều thông qua một mạng quay số chuyển mạch. Các kết nối được thực hiện thông qua việc quay số và khi đã thực hiện xong, kết nối sẽ dành riêng cho hai người đối thoại và kết nối bị phá vỡ khi một trong hai người cúp máy.

3.3.3.1. Modem điện thoại

Trong thực tế người sử dụng phải tương thích các kết nối analog hiện đang sử dụng với truyền dẫn số nhờ sử dụng các modem. Modem được sử dụng rộng rãi ở

75

Page 78: Audio Video

Chương 3: Truyền dẫn audio và video

máy tính và là cơ sở để ứng dụng internet trên toàn cầu. Các modem điện thoại hiện nay sử dụng điều chế đa mức tới tận 4bit/symbol.

Với thiết bị này dải thông hẹp, chỉ tiêu SNR của kết nối tín hiệu thoại analog hạn chế, tất cả điều này hạn chế tốc độ dữ liệu của các modem điện thoại, chỉ khoảng 33.000 bit/s. Tốc độ như vậy phù hợp với việc truyền văn bản, tuy nhiên không thể đáp ứng cho tín hiệu video, audio hoặc ảnh với chất lượng cao được. Tại thời điểm này đã có các modem 56.000bit/s có khả năng thực hiện đầy đủ bằng cách kết nối số trực tiếp với mạng điện thoại của máy chủ.

3.3.3.2. Cáp điện thoại

Cáp sử dụng cho thông tin loại analog là cáp sợi đồng, xoắn đôi, có khả năng truyền dẫn số tốt, một số phần của mạng diện thoại số cũng sử dụng loại này.

3.3.4. Truyền dẫn bằng tần số vô tuyến

Thông tin số vô tuyến có thể là điểm-điểm, hoặc một điểm tới nhiều điểm (quảng bá). Đường truyền dành cho điểm-điểm rất đắt và số lượng các đường truyền như vậy bị giới hạn bởi khoảng cách phổ tần số cho phép.

3.3.4.1. Thông tin tế bào

Hầu hết thông tin điểm-điểm ngày nay đều thực hiện trên các mạng tần số vô tuyến ví dụ như các mạng DT tế bào. Các hệ thống này có giá thành tương đối cao và sử dụng chung khoảng cách phổ cho nhiều người sử dụng. Mạng tế bào, ban đầu là analog dùng cho điện thoại, nhưng hiện nay nó đã được số hóa. Mặc dù các mạng điện thoại tế bào có thể được sử dụng modem nhưng sự chuyển mạch tế bào khiến nó không đáng tin cậy, từ khi mạng tế bào trở thành số và quá trình mã hóa phù hợp để xử lý các đặc tính của nó được đáp ứng, việc sử dụng truyền dẫn dữ liệu trên mạng tế bào sẽ tăng lên.

3.3.4.2. Quảng bá

Truyền quảng bá audio và video là một phương pháp phổ biến trên toàn thế giới, về bản chất toàn bộ các dịch vụ này là analog, tuy nhiên các dịch vụ kỹ thuật số đang được phát triển và sẽ được triển khai trong tương lai gần. Một trong những phát triển mới quan trọng là hệ thống Grand Alliance, hệ thống này được phát triển ở Mỹ.

3.3.4.3. Quảng bá qua vệ tinh

Vệ tinh được sử dụng cả trong thông tin quảng bá và thông tin điểm-điểm. Một bộ thu phát được gọi là transponder trong vệ tinh dùng để thu nguồn tín hiệu từ mặt đất (tuyến lên) và phát lại nó ở một tần số khác và thông qua anten khác (tuyến xuống) tới một hoặc nhiều trạm thu trên mặt đất. Do năng lượng vệ tinh lấy từ mặt

76

Page 79: Audio Video

Chương 3: Truyền dẫn audio và video

trời nên năng lượng truyền dẫn của nó bị hạn chế và các tần số sóng vi ba cũng như các búp hẹp của anten đĩa phải được sử dụng nhằm đạt được chỉ tiêu mong muốn. Các transponder vệ tinh trước đây sử dụng điều chế FM analog nhưng các thiết kế mới hơn đã sử dụng điều chế số.

3.4 CÁC HỆ THỐNG TRUYỀN DẪN

Việc định nghĩa một hệ thống truyền dẫn phải bao hàm cả quá trình mã hóa và điều chế của nó. Trong một môi trường cụ thể, định nghĩa phải xác định rõ môi trường vật lý, kết nối… Một vài hệ thống đã được triển khai rộng rãi sẽ được trình bày trong phần này.

1.4.1 Thành phần 4:2:2 bit song song

Nhóm SMPTE đã đưa ra một vài tiêu chuẩn giao diện số cho các tín hiệu của hệ NTSC, PAL và HDTV trong cả hai định dạng song song và nối tiếp. SMPTE 125M là một giao diện song song 10 bit cho hệ thống 525/60 hoạt động theo tiêu chuẩn ITU-R Rec.BT.601 số hóa, trong định dạng 4:2:2. Một cáp đặc biệt được sử dụng, gồm 12 mạch xoắn đôi với các bộ nối DB-25, 10 cặp sử dụng cho dữ liệu, cặp 11 dùng để truyền xung clock, cặp còn lại dùng để tiếp đất. Độ dài của cáp có thể là 50m không có sự cân bằng, độ dài cũng có thể lên tới 300m nhưng phải được sự cân bằng. Lưu ý là những giao diện song song này phải khớp với các mạch cá nhân trong cáp nhiều dây một cách chính xác để việc đo thời gian của mỗi đường dẫn bit nằm trong khoảng dung sai của đồng hồ. Nó giới hạn chỉ tiêu các giao diện song song.

Quá trình mã hóa tín hiệu trên mỗi đường dữ liệu là NRZ và 10 đường dữ liệu sẽ truyền song song các mẫu PCM. Không có phần dự trữ để phát hiện và sữa lỗi của dữ liệu video, tiêu chuẩn này chỉ thích hợp cho kết nối bằng cáp dây cứng.

Định dạng của tiêu chuẩn Rec.601 không yêu cầu phải lấy mẫu khoảng xóa dòng và xóa mành, tuy nhiên thời gian này vẫn dành cho truyền các tín hiệu ID và thông tin khác. VD có tổng 858 mẫu trong một chu kỳ của dòng, tuy nhiên chỉ có 720 mẫu tích cực được xác định. Hình 3.13 minh hoạ cách thức xác định phần còn lại của khoảng xóa dòng.

Hai khối đồng bộ 4 từ được đặt ở điểm xuất phát video tích cực (SAV) và điểm cuối của video tích cực (EAV). Khối đồng bộ này gồm một từ là tất cả các số “1”, hai từ là tất cả các số “0” và từ thứ tư nhận dạng xóa dòng và số thứ tự của mành. Với tần số đồng bộ giao diện 27MHz sẽ có 276 chu kỳ đồng hồ trong khoảng xóa dòng số và tám chu kỳ dùng cho đồng bộ, còn lại 268 chu kỳ clock được sử dụng để truyền dẫn dữ liệu phụ.

77

Page 80: Audio Video

Chương 3: Truyền dẫn audio và video

Khoảng xóa số

Khoảng lấy mẫu tín

hiệu chói

Dòng tích cực video

16T 122T 720T

720T 736T 0

Y71

9

CB

Y 7

20

Y72

1

CR

CB

CR

CB

CR

Y85

5

Y85

6

Y85

7

Y0

Y1

Tín hiệu chuẩn thời gian EAV

Tín hiệu chuẩn thời gian SAV

Hình 3.13. Gán các mẫu trong khoảng xóa dòng ở SMPTE 125 (NTSC)

Nếu tất cả các khoảng xóa dòng của tiêu chuẩn số tổng hợp được sử dụng cho dòng dữ liệu phụ đơn lẻ, sẽ có thể có tối đa 262 từ 10 bit ở mỗi HBI, với tốc dộ dữ liệu đưa ra là 41,2 Mb/s. Như vậy sẽ có đầy đủ dung lượng cho một vài kênh audio với rất nhiều khả năng dự phòng.

Thiết kế cơ bản của một giao diện song song này cũng có thể được mở rộng thành một dịnh dạng cho phiên bản số của định dạng SMPTE 240M để sản xuất HDTV analog. Giao diện số này được đề cập trong tiêu chuẩn 260M SMPTE. Với định dạng yêu cầu tần số lấy mẫu cao hơn là 74,25MHz, việc ghép các thành phần màu với độ chói như được thực hiện ở 125M là không thể. Vì vậy, các cặp dữ liệu bổ sung được thêm vào giải quyết vấn đề này. Đối với việc truyền dẫn các thành phần R,G,B cần tới 31 cặp. Tuy nhiên tần số clock cao sẽ giới hạn của cáp còn tối đa là 20m mà không có sự cân bằng.

3.4.2. Hệ thống 10 bit nối tiếp

Mặc dù phần cứng cho các giao diện song song khá đơn giản nhưng các cáp nhiều dây lại có giá thành cao, không linh hoạt và còn bị giới hạn về độ dài. Hơn nữa chúng lại quá mới mẻ đối với các trang thiết bị hầu hết là analog đang tồn tại có nghĩa là không có một loại cáp hiện hành nào có thể sử dụng với giao diện số song song. Điều này có thể thực hiện được nếu có một giao diện số sử dụng tiêu chuẩn đồng trục RG-59 sẵn có trong các hệ thống video analog. SMPTE 259M là giao diện

78

Page 81: Audio Video

Chương 3: Truyền dẫn audio và video

nối tiếp cho truyền dẫn 10 bit các tín hiệu số tổng hợp hoặc thành phần chuẩn 625/50 hoặc 525/60. Tiêu chuẩn này là cho giao diện số nối tiếp (SDI).

Cáp đồng trục được sử dụng với các bộ kết nối BNC (ICE 169-8). Các bit của mỗi mẫu được xếp theo dạng chuỗi với LSB được truyền trước tiên và quá trình mã hóa bị xáo trộn NRZL.

Trong trường hợp mã hóa tổng hợp việc đồng bộ định dạng sẽ được cung cấp nhờ việc sử dụng tín hiệu nhận dạng và chuẩn thời gian (TRS-ID) đặt trong khoảng xóa dòng ngay sau vị trí thông thường của biên độ dòng. Tín hiệu này bao gồm một từ là tất cả các số “1”, ba từ là tất cả các số “0”, từ thứ 5 có chứa các bit cờ để nhận dạng mành và 5 bit để nhận dạng số dòng.

3.4.3 ATV Grand Alliance

Sự phát triển của tiêu chuẩn truyền hình số đầu tiên trên TG được bắt đầu ở Mỹ bởi một liên hiệp các tổ chức thương mại và nghiên cứu có tên là Grand Alliance (GA) được hình thành vào năm 1993. Hoạt động cơ bản của nó là phát triển mạng tiêu chuẩn truyền hình số trên toàn TG từ hơn chục năm trước đây, khởi đầu với cái tên HDTV. Tuy nhiên tiêu chuẩn GA không chỉ dừng lại ở đó, nó còn được sử dụng để quảng bá các tín hiệu TV với độ phân giải tiêu chuẩn (525 hoặc 625 dòng). Vì vậy ngày nay tiêu chuẩn này còn được gọi là tiêu chuẩn TV cao cấp (ATV).

3.4.3.1. Mục đích đề ra của ATV

Rất nhiều nghiên cứu trước đây của HDTV chủ yếu dựa vào công nghệ analog. Nhưng vào thời điểm thành lập GA, tất cả đều nhất trí rằng các tiêu chuẩn đều phải là số. Mục đích của hệ thống số là:

Âm thanh và hình ảnh HDTV số có chất lượng cao.

Một hệ thống có thể cùng tồn tại với truyền hình quảng bá analog mà không gây nhiễu cho nhau.

Thiết bị lắp có giá cả hợp lý với người tiêu dùng và các nhà sản xuất, và tất cả người sử dụng vào thời điểm áp dụng tiêu chuẩn.

Có khả năng hoạt động phối hợp các phương tiện truyền dẫn và các ứng dụng khác.

Tiềm năng ứng dụng toàn cầu của tiêu chuẩn.

Mục tiêu cuối cùng được thực hiện dưới con mắt của các nhà thiết kế nhưng chúng ta phải xem xét tác động của nó lên các tiêu chuẩn quốc tế, các mục tiêu khác đều đã được đáp ứng.

79

Page 82: Audio Video

Chương 3: Truyền dẫn audio và video

3.4.3.2. Kiến trúc theo lớp

Kiến trúc của hệ thống GA được minh họa trong hình 3.14 chỉ rõ mối tương quan với các lớp của mô hình OSI đã được mô tả trong phần 3.2.1. Các công nghệ và tiêu chuẩn khác áp dụng trong mỗi lớp được trình bày dưới đây. GA xác định bốn lớp:

1. Lớp ảnh - hệ thống GA cung cấp nhiều định dạng và nhiều tốc độ khung hình tất cả đều có thể được giải mã và trình bày bằng thiết bị thu ATV của GA. Phương pháp này cho phép các dịch vụ khác nhau có các tiêu chuẩn quét khác nhau phù hợp với mục đích của mình.

ớ2. L p nén - việc nén video của hệ thống GA dựa trên tiêu chuẩn ISO-MPEG-2, và hệ thống audio sử dụng nén Dolby AC-3 cung cấp 5.1 kênh âm vòm với tốc độ dữ liệu 384kb/s. Tốc độ dữ liệu video có các định dạng ảnh của HDTV xấp xỉ bằng 18,9 Mb/s và cho các định dạng ảnh có độ phân giải tiêu chuẩn là từ 3 đến 5 Mb/s.

3. Lớp truyền tải - hệ thống GA sử dụng gói truyền tải dựa trên cấu trúc gói MPEG-2. Bất cứ số lượng dòng audio, video hoặc dữ liệu nào cũng có thể được ghép thành dòng bit truyền dẫn.

4. Lớp truyền dẫn - lớp này thực hiện quá trình xử lý phát hiện và sửa lỗi trước và điều chế bằng cách sử dụng các symbol đa mức.

Lớp ảnh

Lớp nén

Lớp truyền tải

Lớp truyền dẫn

Lớp GA Công nghệ được sử dụng

Các lớp OSI

Định dạng ảnh thay đổi

MPEG-2

MPEG-2

Điều chế VSB 1. Vật lý

5. Phiên

4. Truyền tải

3. Mạng

2. Liên kết dữ liệu

6. Trình diễn

Hình 3.14. So sánh giữa kiến trúc phân lớp GA và các lớp OSI

80

Page 83: Audio Video

Chương 3: Truyền dẫn audio và video

3.4.3.3. Lớp truyền tải GA .

Lớp truyền tải nhận các dòng bit audio và video riêng rẽ sau đó ghép chúng lại thông qua việc đóng gói. Bất cứ số lượng dòng bit nào cũng có thể được xử lý, rất nhiều dòng audio, video hay các kiểu dữ liệu khác có thể được truyền trên cùng một kênh, chỉ bị giới hạn bởi khả năng tốc độ dữ liệu tổng của hệ thống.

Gói GA là một khối có độ dài cố định 188 byte như minh hoạ trên hình 3.15. Mỗi một gói có thể chứa một header 4 byte với một trường dữ lệu 184 byte, ở trường này cũng có thể chứa một header thích ứng tùy chọn có độ dài thay đổi. Thiết kế của gói như vậy tạo ra khả năng hoạt động phối hợp cùng cấu trúc gói của ATM. Cùng với trường đồng bộ một byte, header của một gói cung cấp:

1. Một trường 13 bit cho nhận dạng gói sử dụng để tách dòng bit gói. Với mục đích này giá trị bằng “0” của gói ID (PID) được dành cho một gói đặc biệt có chứa 1 chỉ số cho cấu trúc ghép kênh. Chỉ số này có dạng một bảng thống kê chương trình xác định rõ một hoặc nhiều chương trình hoàn chỉnh và số PID của bảng đồ chương trình cho mỗi chương trình. Bảng bản đồ chương trình chỉ rõ PID và dạng của nó cho mỗi dòng dữ liệu trong chương trình. Bằng cách đọc những bảng này, một máy thu có thể chọn được các gói có chứa dữ liệu mà nó cần.

2. Một trường bộ đếm thứ tự 4 bit đếm các chu kỳ từ 0 tới 15 cho mỗi gói với cùng một PID. Nó cho phép máy thu nhận biết được khi nào thì các gói hoàn chỉnh bị mất trong quá trình truyền.

Gói 188 byte

Header gói 4 byte

Header thích ứng (tùy chọn)

Tải dữ liệu

Header đồng bộ (47H) PID 13bit Đếm thứ tự 4 bit

Chi tiết header

Ưu tiên truyền tải 1 bit

Bộ chỉ bắt đầu tải 1 bit

Bộ chỉ lỗi gói truyền tải 1 bit

Điều khiển mành thích ứng 2 bit

Điều khiển xáo trộn truyền tải 2 bit

Hình 3.15. Cấu trúc gói truyền tải GA

81

Page 84: Audio Video

Chương 3: Truyền dẫn audio và video

3. Phần còn lại của các bit trong header của gói là các cờ bit với các mục đích riêng cung cấp các chức năng quản lý gói, ấn định việc sử dụng của quá trình xáo trộn không bắt buộc để điều khiển sự truy cập của người sử dụng, và ấn định xem header thích ứng có mặt ở tải trọng của dữ liệu hay không. Điều này được minh họa trên hình 3.15.

3.4.3.4. Lớp truyền dẫn GA

Đầu ra của lớp truyền tải là một dòng bit đơn bao gồm các gói đã được ghép cho tất cả các loại dữ liệu để truyền trên kênh. Lớp truyền dẫn thực hiện điều chế, cho phép dòng bit này được truyền trên kênh analog 6MHz tuyến tính hoàn toàn ở đây sử dụng phép điều chế dải band cụt (VSB) các symbol đa mức và gọi là điều chế 8-VSB hoặc 16-VSB, tại đó các số 8 hoặc 16 ấn định số mức symbol được truyền. Hệ thống phát quảng bá sử dụng định dạng 8-VSB có khả năng phát hiện và sửa lỗi tốt hơn, trong khi các hệ thống truyền hình cáp có thể sử dụng định dạng 16-VSB cho tốc độ dữ liệu cao hơn nhưng cần đến SNR vượt quá mức mà cáp có thể cung cấp, quá trình xử lý truyền dẫn được minh hoạ trên hình 3.16.

Quá trình xử lý lớp truyền dẫn sẽ đảo mỗi gói thành một đoạn (segment), mã sửa lỗi Reed-Solomon được sử dụng cho mỗi đoạn này. Một segment bao gồm nội dung của một gói trừ đi byte đồng bộ (sẽ được thay thế sau này trong quá trình xử lý). Đầu tiên, dữ iệu được lấy ngẫu nhiên bằng cách xử lý theo mạch XOR với chuỗi giả ngẫu nhiên (trong máy thu, dữ liệu được xử lý lại bằng mạch XOR với chuỗi giả ngẫu nhiên tương tự khôi phục dữ liệu). Sau đó, quá trình xử lý R-S được bổ xung vào mỗi gói, vì vậy gói 188 byte sẽ trở thành một segment 207 byte 9 không có byte đồng bộ).

Tạo đoạn Ngẫu nhiên hóa dữ liệu

Mã hoá R-S

Chèn dữ liệu

Mã hóa trellis

+ Chèn pilotLọc tiền

cân bằngĐiều chế

VSB

Đồng bộ mành

Đồng bộ đoạn

Tới bộ phát

Gói

Dữ liệu đa mức

Hình 3.16. Quá trình xử lý trong lớp truyền dẫn GA

Các segment sau đó được nhóm lại thành các trường dữ liệu có 313 đoạn. Đoạn thứ nhất của mỗi trường dữ liệu là mô hình đồng bộ trường dữ liệu được sử

82

Page 85: Audio Video

Chương 3: Truyền dẫn audio và video

dụng ở máy thu với mục đích cân bằng tự động, giúp máy thu lựa chọn sử dụng quá trình lọc phù hợp cho chuẩn đoán hệ thống, và để máy thu xây dựng cấu hình vòng tự hiệu chỉnh của nó. Vì vậy, máy thu có thể điều chỉnh lại theo định kỳ cơ cấu của nó để bù lại cho những thay đổi động trên đường truyền.

Bước tiếp theo của quá trình xử lý truyền dẫn là chèn dữ liệu bằng bộ chèn xoắn, quá trình này mở rộng dữ liệu trên vùng 52 đoạn, cho phép mã phát hiện và sửa lỗi sửa các lỗi burst tới tận 193μs. Chu kỳ thời gian này có chứa xấp xỉ 360 lỗi bit dữ liệu và chúng điều có thể được sửa. Việc chèn chỉ được thực hiện trên các byte dữ liệu của segment, các tín hiệu đồng bộ segment và đồng bộ mành không được chèn bởi vì chúng sẽ được thêm vào sau này trong quá trình xử lý, như đã minh hoạ ở trên hình .

Bước tiếp theo bắt đầu từ quá trình mã hoá nhị phân và tạo ra các symbol đa mức vì vậy đây là bước khởi đầu của quá trình điều chế. Truyền hình quảng bá sử dụng các symbol 3 bit và truyền hình cáp sử dụng symbol 4 bit. Trong trường hợp truyền hình quảng bá, mỗi trong số 2 bit của dữ liệu đã mã hoá được chuyển thành một symbol 3 bit (8 mức) bằng cách sử dụng mã trellis, đây là một kỹ thuật phát hiện và sửa lỗi có thể cải tiến chỉ tiêu của hệ thống mà không làm tăng độ rộng band tần.

Lược đồ symbol

DD +

Đầu ra analog

Z1

Z2

Z3X2

X1

Bộ mã hóa trellis

Z3 Z2 Z1 Đầu ra Z3,Z2,Z1 100 001 010 000 110 0

0

0

0

1

1

1

1

0

0

1

1

0

0

1

1

0

1

0

1

0

1

0

1

-7

-5

-3

-1

+1

+3

+5

+7

-7-5-3-1+1+3+5+7

Hình 3.17. Mã hóa trellis

83

Page 86: Audio Video

Chương 3: Truyền dẫn audio và video

Ý tưởng của mã trellis là tạo ra một môi trường bao quanh hỗ trợ cho n giá trị symbol nhưng chỉ n/2 giá trị có hiệu quả (vì 1 bit kém), các lỗi symbol sẽ tăng chuỗi có các giá trị không hiệu quả. Tuy nhiên, một bộ dò tìm thích hợp có thể sửa một dòng sai bằng cách tìm kiếm một chuỗi có khả năng sửa lỗi cao nhất cho chuỗi bị lỗi. Đây được gọi là bộ dò tìm viterbi. Phương pháp trên hiệu quả nhất khi hệ thống điều chế được thiết kế để thiết lập khoảng cách lớn nhất (trong sơ đồ điều chế chòm sao người ta thường gọi là khoảng cách Euclidean) giữa các trạng thái của symbol có giá trị. Sơ đồ cho thấy những khoảng cách này xuất hiện tương tự như dạng trellis và chính điều đó là ý tưởng để đặt tên cho phương pháp này.

Do phải quan tâm đến các bộ lọc được đưa vào trong hệ thống để loại bỏ sự can thiệp của các tín hiệu NTSC có thể xảy ra ở cùng kênh hoặc các kênh cận kề, kênh thực sự chỉ có bộ mã 12 trellis được chèn vào chuỗi 12 symbol. Nó ngăn cản bộ lọc khỏi sự can thiệp vào mã trellis.

Sau khi mã hoá trellis, tín hiệu bây giờ là một định dạng analog 8 mức. Tuy nhiên, tín hiệu đồng bộ segment và các mô hình đồng bộ trường dữ liệu không được ghi mã trellis nhưng lại được chèn như các tính hiệu hai mức giữa các mức điều chế +5 và -5. Tín hiệu đầy đủ thu được chèn như các tín hiệu đồng bộ được điều chế biên độ trên sóng mang của kênh bằng cách sử dụng điều chế dải biên cụt triệt sóng mang. Triệt sóng mang có nghĩa là đối với đầu vào ở mức 0, sóng mang đầu ra cũng bằng 0 và pha sóng mang sẽ dịch chuyển 180 độ giữa mức vào dương và âm. Dải biên cụt có nghĩa là dải biên (thấp hơn) của phổ điều chế biên độ bị huỷ bỏ một phần như minh hoạ trên hình 3.18.

Kênh 6 Mhz

Sóng mang VSB

Hinh 3.18. Phổ tần số của tín hiệu truyền dẫn GA trong dải thông 6Mhz

Như đề cập ở trên, để hoạt động trong môi trường TV cáp ít nhiễu SNR tốt hơn, điều chế phải là 16-VSB và không sử dụng mã trellis. Như vậy sẽ cho phép truyền đi tốc độ dữ liệu gấp 2 lần ở mỗi kênh cáp 6 MHz. Các thông số chỉ tiêu của một vài sự lựa chọn trong các hệ thống truyền ATV được trình bày trong bảng 3.3.

0.31Mhz

Miền dải band thấp

Miền dải band cao

84

Page 87: Audio Video

Chương 3: Truyền dẫn audio và video

Thông số HDTV-1 HDTV-2 SDTV

Pixel tích cự 1920×1080 1280×720 720×480

Tổng mẫu 2200×1125 1600×750 858×525

Tốc độ hình

60Hz quét cách dòng

30Hz quét liên dòng

24Hz quét liên dòng

60Hz quét cách dòng

30Hz quét liên dòng

24Hz quét liên dòng

59,94Hz quét cách dòng

29,97Hz quét liên dòng

23,97Hz quét liên dòng

Lấy mẫu tín hiệu sắc

4:2:2 4:2:2 4:1:1

Tỷ lệ khung hình 16:9 16:9 4:3

Nén video MPEG-2 MPEG-2 MPEG-2

Tốc độ dữ liệu 19,3Mb/s 19,3Mb/s 6,0Mb/s

Kênh audio 5,1 5,1 2

Dải thông audio 20Hz-20Khz 20Hz-20Khz 20Hz-20Khz

Tần số lấy mẫu audio

48KHz 48KHz 48KHz

Tốc độ dữ liệu 384kb/s 384kb/s 128kb/s

Bảng 3.3 Các thông số chỉ tiêu kỹ thuật của hệ thống truyền ATV ATSC

ở một số mức độ phân giải

3.4.4. Giao diện audio AES3

Rất nhiều định dạng video như MPEG hoặc Grand Alliance đưa ra khả năng truyền dữ liệu audio kèm theo video. Tuy nhiên, trong thiết bị chỉ dùng cho sản xuất và sản xuất hậu kỳ audio, cần phải truyền audio riêng. Định dạng AES3 được sử dụng rộng rãi trong audio chuyên nghiệp và một số tổ chức khác cũng đã chấp nhận những định dạng tương tự như vậy.

AES3 là giao diện số dạng chuỗi hỗ trợ cho kênh audio và một vài loại dữ liệu khác không phải mạch audio. AES3 sử dụng một cáp đôi xoắn đơn có thể trải dài tới 100m mà không cần cân bằng. Nó cũng có thể sử dụng với cáp đồng trục với độ dài cho phép tới 1km.

Định dạng này tự tạo xung đồng bộ, tự đồng bộ và có thể được sử dụng với bất cứ tần số lấy mẫu nào, 64 bit được truyền cho mỗi chu kỳ lấy mẫu, trong một khung

85

Page 88: Audio Video

Chương 3: Truyền dẫn audio và video

hình phụ và định dạng khối như minh họa trên hình 3.19. Ví dụ với tần số lấy mẫu audio là 44,1KHz tốc độ dữ liệu của AES3 là 2,822Mb/s. Tốc độ dữ liệu có thể lên tới 24 bit trên mẫu và được lượng tử hóa tuyến tính và mã hóa trong định dạng bù hai. Việc điều chế kênh là mã đánh dấu lưỡng cực (3.2.3.2).

Một kung hình tương ứng chính xác với một chu kỳ lấy mẫu ở tỉ lệ nguồn nó chứa 64 bit và một mẫu audio cho mỗi kênh, cộng thêm các header. Một khối là 192 khung hình và một mẫu audio cho mỗi kênh của khung hình trong khối được tích tụ lại để trở thành trường dữ liệu 192 bit (24 byte) cung cấp cho đặc tính của kênh, mã thời gian và nhiều đặc điểm khác.

X Y Z Y YX Y XKênh A Kênh B Kênh A Kênh B Kênh A Kênh B Kênh A

Mở đầu Dữ liệu phụ LSB dữ liệu audio MSB V U C P

Khung 32 bit

4 bit 4 bit 20 bit Giá trị

Dữ liệu người dùng

Dữ liệu trạng thái kênh

Chẵn lẻ

Hình 3.19. Cấu trúc khung 64 bit AES3

Tiêu chuẩn AES3 hai kênh được mở rộng thành nhiều kênh ở tiêu chuẩn AES10 tới tận 56 kênh audio. Tiêu chuẩn này đã ấn định tốc độ dữ liệu là 125 Mb/s.

3.4.5. Dây chịu nhiệt chuẩn IEE 1394

Tiêu chuẩn IEEE 1390 đáp ứng cho một mạng có tốc độ cao, thời gian thực, giá thành rẻ sử dụng trong quá trình kết nối các thiết bị audio và video cũng như máy tính. Có thể có nhiều sự lựa chọn, tuy nhiên trong phần này chỉ giới thiệu một vài loại. Việc sử dụng một cặp cáp xoắn đôi (4 dây tín hiệu với 2 dây phụ trợ 1394 có thể đạt tốc độ dữ liệu lên đến 200Mb/s trên khoảng cách các thiết bị là 4,5m. Các hệ thống 1390 trong tương lai sẽ còn đạt được tốc độ dữ liệu cao hơn nữa.

Giao thức được dựa vào các gói, và hai cặp dây xoắn được sử dụng như là hai kênh, có thể đẳng thời dị bội hoặc đồng thời cả hai tại cùng thời điểm. Chế độ đẳng thời được quan tâm nhiều nhất trong các ứng dụng của audio bởi vì nó cho phép thực hiện kết nối với tốc độ dữ liệu rất tốt, do các bus hoạt động ở chu kỳ ổn định và một lượng gói được truyền đi trong mỗi chu kỳ. Mỗi một kết nối tích cực dự trữ một

86

Page 89: Audio Video

Chương 3: Truyền dẫn audio và video

gói trong mỗi chu kỳ. Các liên kết có thể có 2 loại điểm tới điểm, nó không bị thay đổi bởi người sử dụng khác hoặc quảng bá có thể được xác định bởi người sử dụng.

Chế độ truyền dị bội hoạt động giống mạng máy tính hơn. Ở chế độ này tất cả những người sử dụng đều tranh chấp khả năng của bus trong thời gian thực và việc dự trữ là không thể. Tuy nhiên, hoạt động dị bội mặt khác cũng có thể diễn ra trên một bus đẳng thời bằng cách chiếm dụng không gian của các gói không được sử dụng đến trong mỗi chu kỳ bus. Bus 1390 do người sử dụng quản lý truyền đi các gói điều khiển dị bội để thiết lập các thanh ghi ở mỗi thiết bị kết nối với bus. Việc này phải được thực hiện để thiết lập bất cứ một loại kết nối nào.

Tiêu chuẩn 1390 tương đối mới song đã được yêu cầu sử dụng để nối giữa các camera video số, VCR số, các bộ xử lý hiệu ứng video và máy tính có chức năng video. Đây có thể là một đặc điểm quan trọng trong nhiều hệ thống video tương lai.

87

Page 90: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Chương 4

GHI PHÁT TÍN HIỆU AUDIO & VIDEO SỐ 4.1. GIỚI THIỆU

Truyền dẫn và lưu trữ (ghi phát) tín hiệu là hai yêu cầu quan trọng trong xử lý tín hiệu audio và video số, nó đóng một vai trò tất yếu trong công nghệ thông tin viễn thông hiện nay. Tín hiệu audio và video sau khi số hóa thì sẽ được lưu trữ và truyền dẫn giống như những loại dữ liệu số khác. Tuy nhiên, do đặc thù của tín hiệu audio và video mà có những phương pháp xử lý theo những nét đặc trưng của nó.

4.2. THIẾT BỊ LƯU TRỮ AUDIO-VIDEO SỐ

4.2.1. Đĩa compact

Đĩa compact (CD) là thiết bị dùng để lưu trữ tín hiệu được điều biến dạng số. Các thông tin này được tạo ra từ các tín hiệu tương tự và được lưu trữ trên CD bởi các cấu trúc vật lý là các pit (lồi) và các flat (lõm). Để ghi phát các thông tin trên CD người ta dùng đầu đọc phát chùm tia laser tạo ra từ diode laser đi qua hệ thống thấu kính hay còn gọi là khối đầu quang. Khi ghi, tín hiệu được điều biến dạng số được đưa vào khối đầu quang để biến đổi thành tín hiệu quang, chùm tia có cường độ biến đổi tùy theo tín hiệu điều biến sẽ định dạng trên CD thành các vệt lồi, lõm đặc trưng cho tín hiệu được điều biến dạng số. Khi phát lại chùm tia laser chiếu lên bề mặt CD khi gặp các pit, flat sẽ phản xạ ánh sáng trở về, sau đó tín hiệu quang này sẽ được chuyển đổi thành tín hiệu điện và giải điều chế thành tín hiệu tương tự.

120mm

15mm

Lớp nhựa trong suốt

Lớp nhựa bảo vệ

Lớp phản quang

Hình 4. 1. Cấu tạo đĩa Compact

Đĩa compact là một tấm nhựa phẳng tròn có đường kính ngoài 120mm, đường kính lỗ tâm 15mm và bề dày 1,2mm. Cấu tạo gồm 3 lớp như hình 4.1, lớp plastic trong suốt chứa thông tin dưới dạng các vệt lồi và lõm, lớp phản quang là có thể là

88

Page 91: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

bạc hoặc nhôm được phủ lên trên lớp nhựa plastic, lớp nhựa acrylic được phủ lên trên làm lớp bảo vệ đĩa. Nhãn đĩa ghi các thông tin về đĩa được dán trên lớp nhựa bảo vệ này.

4.2.2. Định dạng các vùng dữ liệu trên CD

- Vùng có đường kính từ 26 → 33mm gọi là vùng kẹp đĩa (clamping area) dùng để giữ cố định đĩa trên bàn xoay nhờ vào bộ phận kẹp đĩa.

- Vùng có đường kính từ 46 → 50mm gọi là vùng dẫn nhập (lead in) hay vùng TOC (Table of content) đây là vùng ghi các thông tin mở đầu như số bài hát, địa chỉ bài hát, thời gian mỗi bài hát…

- Vùng có đường kính từ 50 → 116mm gọi là vùng chương trình (program area) là vùng lưu trữ các thông tin điều biến dạng số của tín hiệu âm thanh, hình ảnh…và thời gian đã phát.

- Vùng có đường kính từ 116 → 117mm gọi là vùng dẫn xuất (lead out) dùng để ghi các thông tin kết thúc chương trình.

4.2.3. Đĩa CD audio

Đĩa CD audio là thiết bị dùng để lưu trữ tín hiệu audio dạng số, có thời gian lưu trữ dữ liệu cho phát tới 74 phút, audio được số hoá ở 44,1kHz với 16 bit trên mẫu, mã hóa PCM tuyến tính loại bỏ nén và có hai kênh cho âm stereo. Việc này sẽ cân bằng tốc độ dữ liệu 1,41Mb/s hoặc 172kB/s. Vì vậy, đối với 74 phút audio, dung lượng dữ liệu là 750 Mb. Mã hóa cho CD audio sử dụng cấu trúc khung hình 588 bít bao gồm mã phát hiện và sửa lỗi Reed-solomon, chèn và dự phòng cho đồng bộ và các mã con. Tất cả các quá trình này được ghi trên đĩa với điều chế EFM cho kết quả tốc độ dữ liệu trên kênh truyền là 4,32Mbit/s.

Trong cấu trúc ban đầu, CD audio chỉ là đĩa sao lại bằng cách nén từ đĩa mẹ trong một quá trình rất tốn kém. Đây chính là định dạng CD cho audio số (CD-DA) và tiêu chuẩn của nó được gọi là “Red book’’.Tiêu chuẩn này sử dụng hoạt động CLV với vận tốc vệt ghi không đổi bằng 51,2 inch/s. Kết quả là tốc độ quay đĩa thay đổi trong khoảng từ 500 tới 200 vòng/m khi đầu đọc di chuyển từ trong ra ngoài vùng ghi đĩa (quá trình ghi luôn bắi đầu từ bên trong đĩa).

4.2.4. CD-ROM

Tiềm năng của công nghệ đĩa CD để phân phối dữ liệu máy tính đã rõ ràng, một tiêu chuẩn đã được phát triển cho dịch vụ này. Bởi vì dữ liệu máy tính yêu cầu phần phát hiện sửa lỗi tốt hơn so với audio (dưới 10-13) cho nên phải cần đến một overhead bổ xung, như vậy sức chứa dữ liệu sẽ ít hơn 680Mb, nhưng vẫn là khá lớn đối với gói nhỏ. Tiêu chuẩn này được gọi là “yellow book” và sản phẩm thường là

89

Page 92: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

CD-ROM (bộ nhớ chỉ đọc CD). Định dạng khối 588 bit của CD-DA được sửa đổi để tạo ra hai chế độ hoạt động cho CD-ROM, chế độ một cung cấp phần phát hiện sửa lỗi mở rộng như nêu ở trên còn chế độ hai cung cấp phần phát hiện sửa lỗi cũng như sức chứa dữ liệu giống như CD-AD, hầu hết các ứng dụng cho máy tính cá nhân đều sử dụng chế độ thứ nhất.

Hình 4.2 trình bày cấu trúc của khối CD-ROM cho chế độ 1 và 2. Mỗi khối CD-ROM có chứa 2352 byte, số lượng này phù hợp với dung lượng chứa là 98 của khối CD-DA (mỗi khối 588 bit) mang 6 mẫu audio stereo 32 bit hoặc là 24 byte, 24×98 =2352 byte). Vì vậy, cấu trúc của khối CD-ROM nằm ở đỉnh của khối CD-DA và phần phát hiện sửa lỗi của cả hai mức đầu là tích cực, cả hai chế độ đều đưa ra mã đồng bộ 12 byte cộng với một header 4 byte, header này có chứa một chế độ riêng và mã ghi địa chỉ khối 3 byte. Chế độ một dành cho 288 byte của không gian còn lại cho phần ghi mã phát hiện sửa lỗi để lại 2048 byte dữ liệu trên khối. Do một CD-ROM có thể lưu trữ tới 33000 khối, chế độ một có dung lượng dữ liệu là 675.840.000 byte. Chế độ 2 loại bỏ phần ghi mã sửa lỗi thêm, đưa ra 22.336 byte trên khối hoặc 770.880.000 byte trên đĩa.

Bởi vì sẽ rất có lợi nếu sử dụng chung thiết kế dữ liệu ổ đĩa với thiết bị CD-DA dân dụng, tiêu chuẩn CD-ROM chấp nhận hoạt động của CLV, cùng vệt từ xiên và cùng tốc độ vệt từ như hệ thống audio. CLV không phải là thích hợp nhất đối với máy tính yêu cầu tốc độ truy cập dữ liệu ngẫu nhiên nhanh. Do việc sử dụng CLV, thời gian truy cập của CD-ROM phải tính đến thời gian thiết lập tốc độ cho đĩa và các hạn chế của cơ cấu trợ động cho vệt từ. Thời gian truy cập của CD-ROM dài hơn thời gian truy cập của ổ cứng máy tính từ 10 đến 20 lần.

2048 byte dữ liệu sử dụng 288 byte dữ liệu phụ

2336 byte dữ liệu sử dụng

Đồn

g bộ

(1

2)

Hea

der

(4)

Chế độ 2

Chế độ 1

2352 byte

Hình 4.2. cấu trúc khối dữ liệu của chuyển đổi-ROM chế độ 1 và 2

Yellow book chỉ xác định môi trường và định dạng của vệt từ trên đĩa, nó không mô tả nội dung được của các vệt từ này. Để hữu ích cho máy tính, phải có một tiêu chuẩn nữa xác định giao diện dữ liệu và một hệ thống file vì vậy máy tính

90

Page 93: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

có thể truy cập dữ liệu một cách ngẫu nhiên tiêu chuẩn cho các hệ thống file của CD-ROM là ISO-9660, tiêu chuẩn này đưa ra cấu trúc thư mục và thư mục còn để tổ chức và gọi ra các file từ một môi trường lưu trữ. ISO-9660 có thể sử dụng được cho hầu hết các máy tính cá nhân có phần mền phù hợp.

Khi thị trường CD-ROM ngày càng phát triển, các nhà sản xuất luôn không ngừng cải tiến để cho ra những sản phẩm có tính năng cao hơn. Sự thay đổi quan trọng nhất là tăng tốc độ quay của đĩa do vậy tăng thời gian truy cập và tốc độ dữ liệu điều này nhìn chung đã được thực hiện bằng cách lấy bội số của tốc độ CD cơ bản (150 kB/s) như 2 x (300 kB/s), 4x (600 kB/s), 6x (900kB/s)…

4.2.5. CD ghi

Mặc dù CD-ROM cực kỳ thành công đối với máy tính, song đối với người sử dụng hiển nhiên vẫn tốt hơn nếu người ta có thể ghi trên CD-ROM ngay tại máy tính của mình. Những ổ đĩa CD có khả năng ghi đã bắt đầu xuất hiện trên thị trường. Hệ thống này được goị là CD-R sử dụng đĩa trắng chứa một lớp nhuộm hữu cơ, độ phản xạ của chất này thay đổi khi nó bị “phát hoả’’ bởi nguồn ánh sáng laser trong máy ghi. Để khớp vệt từ và cơ cấu trợ động hội tụ trong khi ghi, đĩa trắng CD-R có cấu trúc vệt từ dưới dạng vệt từ vật lý được nén vào bề mặt ghi. Những vệt từ này có sẵn phần điều chế được sử dụng với cơ cấu trợ động ghi. Một đĩa CD-R đã ghi có thể chạy trên hầu hết các ổ CD-ROM hoặc CD của thiết bị phát audio. Đĩa trắng có giá tương đối thấp so với khả năng dự trữ tới 680Mb. Đĩa CD-R chỉ có khả năng ghi một lần.Tuy nhiên, đây là một thiết bị ghi phổ biến do khá phù hợp cho sử dụng và lưu trữ.

Ghi trên CD-R cần một máy tính cá nhân với ổ cứng lưu trữ nhanh có phần mềm đặc biệt chạy trên CD-R. Phần mềm cho phép người sử dụng xác định rõ sẽ dùng file nào ổ cứng cho CD và có thể chạy một đĩa kiểm tra đã ghi trước để quyết định thực hiện phần ghi cụ thể. Điều này cần thiết bởi vì quá trình ghi phải hoạt động liên tục một khi đã bắt đầu nếu một vài dữ liệu không truy cập nhanh khi cần, phần ghi sẽ bị phá huỷ.

Thiết bị ghi CD-R có tốc độ điển hình là 2x hoặc 4x…, vì vậy thời gian yêu cầu cho quá trình ghi rất ý nghĩa. Nếu cần nhiều bản sẽ mất rất nhiều thời gian. Tuy nhiên, sự phù hợp và giá cả hợp lý của CD-R rất thông dụng để sao chép các loại CD với số lượng nhỏ.

4.2.6. Các phiên bản khác của CD

Có thể kết hợp audio củaa CD-DA và dữ liệu của CD-ROM trên cùng một đĩa, đây được gọi là đĩa có chế độ hỗn hợp. Vệt từ đầu tiên bao giờ cũng phải là vệt từ của CD-ROM, còn các vệt từ khác trên đĩa có thể định dạng CD-DA. Loại đĩa như

91

Page 94: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

thế này không thể chạy trên một thiết bị phát audio CD bởi vì nó luôn luôn bắt đầu ở vệt từ đầu tiên và tìm dữ liệu mà thiết bị không thể hiểu được. Nhưng một ổ CD-ROM trong máy tính sẽ có khả năng đọc được từ đầu tiên và hiểu được sự có mặt của audio số cùng với dữ liệu máy tính ở trên đĩa. Ổ đĩa CD của máy tính có thể chạy audio chất lượng cao không liên quan đến các hoạt động khác của máy tính có nghĩa là khi audio đang chạy, máy tính có thể làm bất cứ điều gì nó muốn trừ việc truy cập vào ổ CD.

Các phiên bản khác của CD-ROM là CD-I,CD-V và CD-ROM XA. Các phiên bản này tăng cường khả năng trong định dạng dữ liệu để hỗ trợ video hoặc audio cùng với các cấu trúc khác của dữ liệu máy tính.Tuy nhiên, không có phiên bản nào trong số này được sử dụng rộng rãi như CD-ROM, hầu hết các ứng dụng CD-ROM cho video và audio đều sử dụng định dạng chung.

Hiện nay, CD-ROM có rất nhiều chuẩn khác nhau tùy thuộc vào từng nhà sản xuất, tốc độ truyền dữ liệu cũng đạt khá cao đến 8400kB/s và thậm chí còn cao hơn rất nhiều.

4.2.7. DVD

Tốc độ dữ liệu ban đầu của CD-ROM 154 kB/s đã trở thành mục tiêu cho các nhà nghiên cứu và phát triển công nghệ nén audio nhằm tạo ra video có chất lượng tốt, có thể hoạt động từ CD-ROM tiêu chuẩn. Đây có thể là phương tiện để phân phối video như một phần của các game trên máy tính hoặc các ứng dụng khác và nó có thể thay thế băng video làm phương tiện phân phối ảnh động. Hệ thống video ban đầu là công nghệ DVI của intel, công nghệ này đưa ra phần cứng và phần mềm giúp việc thực hiện playback có chuyển động và màn hình video máy tính trở nên khả thi. Năm 1988 sản phẩm này bắt đầu xuất hiện và sử dụng rộng rãi trong các buồng điện thoại và ứng dụng giảng dạy qua máy tính. Tuy nhiên, nó vẫn chưa được sử dụng trên thị trường đại chúng.

Tiếp cận thị trường video của CD, phần mềm video chỉ để sử dụng cho playback. Phần mềm này có thể chạy trên bất cứ máy tính cá nhân nào với bộ xử lý nhanh và phát video với chất lượng thấp thường trong một cửa sổ có kích cỡ bằng một phần tư màn hình hoặc nhỏ hơn. Các hệ thống này là Indeo của intel, Cinepark của SuperMac, Quick time của Apple và một số ứng dụng khác, thường hoạt động với 1x CD-ROM nhưng có thể chạy tốt hơn với 2x hoặc 4x. Chúng được sử dụng rộng rãi trong trò chơi ở CD-ROM và bách khoa toàn thư nhưng không phù hợp với điện ảnh bởi vì thời gian chạy ngắn (74 phút ở 1x và ít hơn ở những tốc độ cao hơn, và chất lượng ảnh tồi. Máy tính kiểu mới nhất đều có bộ tăng tốc độ xử lý của phần mềm chỉ với video và cho phép hiển thị đầy đủ màn hình.

92

Page 95: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Cơ hội đã mở ra cho một hệ thống đĩa quang với chỉ tiêu kỹ thuật tốt hơn. Nhiều quá trình nghiên cứu và phát triển đã được thực hiện, và ngành công nghiệp hiện nay đã đạt được một tiêu chuẩn mới là đĩa video số DVD.

Hệ thống DVD sử dụng đường kính nền 12cm nhưng với bước sóng ngắn hơn và phương pháp khớp vệt ghi tiến bộ, mật độ được tăng từ 680Mb/mặt tới 4,7Gb/mặt, tăng gấp 7 lần. Tuy nhiên, đấy chưa phải là tất cả, bởi vì DVD cung cấp hai lớp trên một mặt nền và cả hai mặt đều có thể được sử dụng. Các lớp này được truy cập bằng độ hội tụ của tia laser còn các mặt được truy cập bằng hai đầu đọc trong ổ đĩa. Điều này tạo ra 8,5Gb/mặt hai lớp (mật độ trên lớp được giảm nhẹ để tạo ra khả năng giao thoa giữa các lớp) hoặc tổng là 17Gb khi cả hai mặt đĩa được sử dụng.

DVD cung cấp các đặc điểm kỹ thuật cho DVD-ROM đa mục đích, một phiên bản của video. DVD-A, DVD-R, và DVD-E. Video DVD sử dụng video MPEG-2 với tốc độ dữ liệu trong phạm vi 5Mbit/s, nó tạo ra chất lượng video cao hơn truyền hình quảng bá. Hệ thống audio là audio kênh 5.1 của AC-3 tương tự như được xác định cho tiêu chuẩn ATV của ATSC.

4.3. KHỐI ĐẦU QUANG

Là thiết bị phát tia laser dùng để ghi phát tín hiệu trên CD, đầu quang là sự kết hợp của tia laser và hệ thống thấu kính chính xác. Tùy theo cấu trúc từng loại máy mà khối đầu quang có thể là loại một tia hoặc loại ba tia.

4.3.1. Khối đầu quang 3 tia

Đầu quang loại ba tia thườmg dùng trong các máy CD để bàn thông dụng, loại đầu quang này có một tia chính và hai tia phụ, tia chính cấp tín hiệu cho mạch focus servo và mạch xử lý tín hiệu khi phát lại còn tia phụ thì cấp tín hiệu cho mạch tracking servo. Về cấu tạo khối đầu quang ba tia gồm có các bộ phận cơ bản như hình 4.3.

Đối với đầu quang dùng cơ cấu trượt thì khi ghi phát tín hiệu khối đầu quang di chuyển trên thanh trượt từ phía vùng tâm đĩa ra bên ngoài từ phía vùng tâm đĩa ra bên ngoài với vận tốc không đổi nhờ một motor điều khiển gọi là sled motor hay slide motor. Nhiều máy sử dụng khối đầu quang có cần đưa ra (swing-out- arm) như máy CD Magnavog FD1040 và Sylvania FDD104….

4.3.1.1. Khối laser diode

Gồm có hai diode bên trong diode LD và MD, hai diode này thường đặt nằm chung trong một khối gồm có ba chân trong đó có một chân dùng chung, một chân dành cho diode LD, một chân dành cho diode MD.

93

Page 96: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

- LD (laser diode): là diode phát tia laser có bước sóng λ = 780nm cấp cho cụm quang học để tạo chùm tia hội tụ đọc tín hiệu trên CD và cấp cho MD.

- MD (monitor diode): là diode giám sát là diode nhận ánh sáng laser từ LD phát ra để cấp cho mạch APC tự động điều chỉnh công suất phát tia laser của LD.

4.3.1.2. Lưới nhiễu xạ

Ánh sáng laser từ LD phát ra khi đi qua kính nhiễu xạ (diffraction grating lens) sẽ được phân thành một tia chính và hai tia phụ dựa trên hiện tượng nhiễu xạ của ánh sáng.

Laser diode

Diffraction grating lens

Collimation lens

λ/4 wave plate lens

Object lens

Concave lens

Cylinder lens

Photo diode

Half prism Beam spliter

Compact Dics

Hình 4. 3. Cấu tạo khối đầu quang 3 tia

4.3.1.3. Bán lăng kính và bộ phân tia

Bán lăng kính (half prism): dùng để phân cực thẳng ánh sáng laser khi truyền đi. Bán lăng kính cho phép truyền ánh sáng theo tỷ lệ 50% theo hướng truyền thẳng và 50% theo hướng vuông gốc.

Bộ phân tia (beam splitter) dùng để phân cực vòng ánh sáng laser khi truyền đi. Thấu kính phân tia có nhiệm vụ truyền toàn bộ 100% ánh sáng phụ thuộc vào gốc phân cực của ánh sáng.

4.3.1.4. Thấu kính chuẩn trực

94

Page 97: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Thấu kính chuẩn trực (collimator lens) có tác dụng tạo chùm sáng song song khi truyền đi nghĩa là khi ánh sáng laser qua bán lăng kính hoặc bộ phân tia sẽ được sửa dạng thành một chùm sáng song song bởi thấu kính chuẩn trực.

4.3.1.5. Phím đổi hướng

Phím đổi hướng λ/4 (λ/4 wave len plate) cấu tạo bằng tinh thể có tính dị hướng, chiết suất của chúng thay đổi theo hướng ánh sáng. Ánh sáng khi qua phím này sẽ lệch pha đi 900, do đó ánh sáng của phân cực thẳng được đổi thành phân cực vòng và phân cực vòng được đổi thành phân cực thẳng.

4.3.1.6. Vật kính

Vật kính (object lens), thấu kính này có tác dụng làm hội tụ chùm tia laser trên CD, thấu kính này sẽ thay đổi vị trí của nó cho phù hợp nhờ vào sự điều khiển của hai cuộn dây.

Cuộn focus: điều khiển vị trí của vật kính theo phương thẳng đứng để giữ khoảng cách giữa vật kính luôn đúng với bề mặt CD để chùm tia hội tụ đúng trên bề mặt CD.

Cuộn tracking: điều khiển vị trí của vật kính theo phương ngang để chùm tia laser luôn đọc đúng các track để tín hiệu phát lại là trung thực nhất.

4.3.1.7. Thấu kính lõm

Thấu kính lõm (concave lens), thấu kính này nhằm làm giảm đi ảnh hưởng của sự biến đổi theo chiều dài của đường dẫn ánh sáng trên các diode cảm quang do sự thay đổi khoảng cách giữa vật kính và CD, đồng thời nó cũng có tác dụng rút ngắn khoảng cách ánh sáng khi phản xạ trở lại.

4.3.1.8. Thấu kính hình trụ

quá gần quá đúng xa

Hình 4.4. Cấu tạo kính hình trụ

Thấu kính hình trụ (cylinder lens), thấu kính này được sử dụng trong khối nhận diện focus. Tia sáng xuyên qua thấu kính này sẽ tạo ra hình dạng chùm sáng khác

95

Page 98: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

nhau rọi lên các diode cảm quang tùy thuộc vào khảng cách giữa vật kính và CD mà chùm sáng tạo ra trên các diode cảm quang có thể là hình tròn, elip đứng hoặc elip nằm ngang.

Khi vật kính đúng với CD thì chùm sáng phản xạ lên các diode cảm quang có dạng hình tròn. Khi vật kính quá gần với CD thì chùm sáng phản xạ lên các diode cảm quang có dạng hình elip đứng. Khi vật kính quá xa với CD thì chùm sáng phản xạ lên các diode cảm quang có dạng hình elip ngang như hình 4.5.

A B

D C

+

_ 0 V+ A B

D C

+

_ A B

D C

+

_ V-

Hình 4.5. Hình dạng các chùm sáng phản xạ khi vị trí vật kính thay đổi

4.3.1.9. Ma trận diode cảm quang

Trong khối đầu quang loại ba tia, ma trận diode cảm quang (photo diode array) có 6 diode cảm quang gồm ABCDEF, các diode cảm quang này làm nhiệm điều chỉnh focus servo, tracking servo và cấp tín hiệu phát lại từ khối đầu quang cho mạch xử lý tín hiệu.

A B

C D

E

F

Tracking servo

Focus servo và Khuếch đại RF

Hình 4.6. Cấu trúc của ma trận diode cảm quang

Bốn diode cảm quang ABCD nhận ánh sáng phản xạ từ chùm tia chính để cấp tín hiệu cho mạch RF để tái tại tín hiệu audio và cấp cho mạch focus servo để điều chỉnh hội tụ của chùm tia trên CD. Hai diode cảm quang EF nhận ánh sáng phản xạ từ hai tia phụ để cấp tín hiệu cho mạch tracking servo.

4.3.2. Khối đầu quang một tia

Về cấu tạo cụm quang học loại một tia cũng tương tự như cụm quang học loại ba tia. Tuy nhiên, do yêu cầu trong sử dụng đòi hỏi tính năng đơn giản, gọn nhẹ sử

96

Page 99: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

dụng trong các máy CD xách tay, các máy CD phone, các ổ CD ROM… người ta chế tạo cụm quang học loại một tia.

Cụm quang học loại một tia thì không có sử dụng lưới nhiễu xạ. Do đó khi ánh sáng laser đi qua không bị tách thành ba tia mà chỉ tạo thành một tia hội tụ trên CD, tia sáng phản xạ được đi vào lăng kính hình trụ và tập trung trên ma trận diode. Trên ma trận diode cảm quang người ta không sử dụng hai diode EF để nhận dạng sai lệch track mà chỉ sử dụng bốn diode ABCD để nhận chùm tia sáng trung tâm.

4.4. GHI PHÁT TÍN HIỆU TRÊN CD

4.4.1. Ghi tín hiệu trên CD

Diode laser

Vật kính Tia laser

Lớp cảm quang

Trong suốt

Pit

Hình 4.7. Ghi tín hiệu trên CD

Khi ghi, chùm tia laser do tín hiệu được điều biến dạng số được đưa vào khối đầu quang để biến đổi thành tín hiệu quang (chùm tia laser). Chùm tia laser này có cường độ thay đổi khác nhau chiếu lên lớp cảm quang của CD tạo thành các vệt lồi (pit) và các vệt lõm (flat). Khi ghi chùm tia laser di chuyển từ phía vùng tâm đĩa ra ngoài nên các pit và các flat được sắp xếp trên những đường track là những đường xoắn ốc từ trong ra ngoài.

4.4.2. Phát lại tín hiệu trên CD

Khi phát lại, chùm tia laser từ đầu đọc chiếu lên bề mặt CD khi gặp các pit và flat thì phản xạ trở về qua hệ thống thấu kính trong khối đầu quang đến bán lăng kính chùm tia đổi phương 900 và chiếu lên bốn diode cảm quang ABCD sau đó cấp tín hiệu cho mạch xử lý tín hiệu để biến đổi tín hiệu quang trở thành tín hiệu điện, giải điều chế, biến đổi tín hiệu từ dạng số trở về tín hiệu dạng tương tự để phục hồi lại tín hiệu như nguyên mẫu.

97

Page 100: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Diode laser

Vật kính Tia laser

Lớp cảm quang

Trong suốt

Pit

Diode cảm quang

Hình 4.8. Phát tín hiệu trên CD

4.4.3. Cấu trúc của tín hiệu ghi trên CD

Tín hiệu lưu trữ trên CD bởi các pit và flat, các cấu trúc vật lý này đặc trưng cho tín hiệu đựơc điều biến dạng số đó là các bit 0 và bit 1, chúng được sắp xếp lên những đường track là đường tròn hình xoắn ốc theo chiều kim đồng hồ khoảng cách giữa các track là 1,6μm. Các pit và flat có kích thước rất nhỏ bề rộng 0,5μm, độ sâu các pit được xác định trong quá trình tạo đĩa gốc là 0,1μm tức xấp xỉ bằng 1/4 độ dài bước sóng laser, độ dài các pit thay đổi từ 0,833→3,054μm (tức từ 3T đến 11T) độ dài các pit cũng là một đại lượng phản ánh thông tin trong tín hiệu audio tương tự. Độ biến thiên ít nhất từ độ dài của pit này đến pit kế tiếp không nhỏ hơn 0,278μm. Chất lượng của tín hiệu đọc từ đĩa quang phụ thuộc vào cấu trúc hình học của các pit trên CD.

1,6μm

0,5μm

Tia laser ≅ 2μm 0,833-

3,054μm

Hình dạng các track trên CD

Hình 4.9. Cấu trúc dữ liệu trên các track CD

98

Page 101: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Các thông số tiêu chuẩn của đĩa CD-DA và máy CD:

- Hệ thống ghi âm dùng kỹ thuật số

- Đường kính ngoài của đĩa là 120mm, đường kính trong là 15mm

- Thời gian phát từ 60 phút đến 75 phút

- Đầu đọc dùng tia laser không tiếp xúc có bước sóng 780nm

- Vận tốc quay đĩa theo hệ thống CLV tức vận tốc dài không đổi 1,2 đến 1,4 m/s và vận tốc gốc thay đổi từ 500 vòng/phút giảm dần xuống 200 vòng/phút khi đầu đọc di chuyển từ vùng tâm ra ngoài biên đĩa.

- Đáp ứng tần số 5Hz – 20 Hz

- Tần số lấy mẫu là 44,1KHz, số bit lượng tử:16 bit, tốc độ truyền 4,3218 MHz, hệ thống điều chế: EFM

4.5. XỬ LÝ TÍN HIỆU AUDIO KHI GHI VÀ PHÁT

4.5.1. Xử lý tín hiệu audio khi ghi

Tín hiệu audio tương tự

Lch Rch

Tạo khung

Mã hóa qui tắc Reed solomon Sắp xếp lại trật tự dữ liệu

Mã hóa qui tắc điều khiển và hiển thị

Điều biến EFM và mã hoá các pit ghép

Mã hoá các qui tắc đồng bộ

Tín hiệu ghi

Biến đổi D/A

Đan xen dữ liệu

Biến đổi EFM

Lấy mẫu

Lượng tử hóa

Mã hóa

Lấy mẫu

Lượng tử hóa

Mã hóa

Hình 4.10. Sơ đồ khối xử lý tín hiệu khi ghi

99

Page 102: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

4.5.1.1. Mạch biến đổi A/D

Mạch này làm nhiệm vụ biến đổi tín hiệu audio nguyên mẫu dạng tương tự thành tín hiệu dạng số thực hiện gồm các công đoạn như sau:

Lấy mẫu tín hiệu

Là công đoạn quan trọng đầu tiên trong việc chuyển đổi tín hiệu audio từ dạng tương tự sang tín hiệu dạng số. Lấy mẫu tín hiệu là rời rạc các mức tín hiệu theo từng mức thời gian nhỏ t1, t2, t3, t4…tức là chia nhỏ các mức tín hiệu theo trục thời gian (trục hoành), các mẫu tín hiệu được tạo ra là cơ sở để biểu diễn thành tín hiệu số. Việc lựa chọn tần số lấy mẫu phải phù hợp với tín hiệu cần chuyển đổi để sau cho từ các mẫu ta có thể dễ dàng tái tạo lại tín hiệu tương tự. Do đó, khi lấy mẫu tín hiệu ta cần dựa theo định lý lấy mẫu.

t 0 t1 t2 t3 t4 . . . .

Mứ

c tín

hiệ

u

Hình 4.11. Biểu diễn mẫu tín hiệu

Định lý lấy mẫu (sampling theorem): giả định rằng đại lượng x của một tín hiệu là một hàm liên tục x(t) theo thời gian t và tín hiệu này không chứa các thành phần tần số lớn hơn W(Hz). Phương trình sau đây được xác lập theo định lý lấy mẫu của Someya-Shannon:

x(t) = ∑∞

−∞= −−

n )nWt2()nWt2(sin)W2/n(x

ππ (4.1)

Trong đó, x(n/2W) là độ lớn của đại lượng x và được chọn trước, sau thời điểm t = 0, theo chu kỳ 1/2W (s) và được gọi là mẫu chọn 1/2W. Đây chính là biểu thị công việc lấy mẫu của hàm liên tục x (t). Vế thứ hai của phương trình trên được gọi là hàm lấy mẫu. Theo đó, phương trình này ám chỉ rằng, một hàm liên tục x(t) được xem là tổng các giá trị mẫu được chọn theo chu kỳ 1/2W và theo hàm lấy mẫu. Tuy nhiên, sự khai triển x(t) theo cách này có một giới hạn là các thành phần tần số lớn hơn W(Hz) không hiện diện.

Khi tần số cao nhất W(Hz) chứa trong x(t) được tìm thấy theo định lý này, người ta thấy rằng khoảng lấy mẫu 1/2W (s) là thích hợp, việc chọn khoảng lấy mẫu nhỏ hơn (chọn tần số lấy mẫu cao hơn) là không cần thiết. Phổ tần lấy mẫu, tần số

100

Page 103: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

lấy mẫu là yếu tố quan trọng trong phương pháp lấy mẫu. Phổ tín hiệu khi lấy mẫu được biểu diễn như hình 4.12.

Hình 4.12. Biểu diễn phổ tín hiệu khi lấy mẫu

Biểu đồ biểu diễn phổ tín hiệu cho thấy hai trường hợp xảy ra. Khi fs > 2fc, không có sự xuyên lẫn nào giữa hai phổ. Trong trường hợp này, dùng một mạch lọc thấp qua (LPF) là có thể tái tạo được tín hiệu gốc. Khi fs > 2fc, sẽ có hiện tượng xuyên lẫn giữa phổ của tín hiệu gốc và phổ của tần số lấy mẫu. Như vậy, khi dùng mạch lọc thấp qua, một loại nhiễu sinh ra có tên gọi là aliasing noise sẽ can thiệp vào việc tái tạo tín hiệu gốc mà hệ quả là không thể chấp nhận được.

Như đã được đề cập trước đây, liên quan đến mối quan hệ fs > 2fc, thì sự khác biệt giữa fs và fc, dù lớn bao nhiêu đều được phép. Tuy nhiên, khi khối lượng thông tin gia tăng thì đặc tính mật độ ghi lại bị ảnh hưởng theo chiều ngược lại. Hơn nữa, cần phải cân nhắc việc chọn tần số fc. Tín hiệu audio tương tự có tần số fc cao nhất là 20KHz nên khi xử lý tần số lấy mẫu được chọn là 44,1KHz, tần số này đảm bảo lớn hơn hai lần tần số cao nhất của tín hiệu tương tự.

Lượng tử hoá

Khi công việc lấy mẫu đã hoàn tất bước kế tiếp là lượng tử hoá. Lấy mẫu được thực hiện theo trục thời gian và sau đó một giá trị đã được lấy mẫu từ tín hiệu gốc analog được đổi thành một số có giá trị gián đoạn theo trục tung (chiều biểu diễn biên độ) là công việc của lượng tử hoá. Sau khi lượng tử hóa thì mỗi mức tín hiệu sẽ tại các mốc thời gian t1, t2, t3 … sẽ được lượng tử bằng một mức tín hiệu có giá trị xác định.

Biên độ càng được chia mịn bao nhiêu, độ chính xác của quá trình lượng tử hoá càng cao bấy nhiêu. Vì một giá trị mẫu được làm tròn bằng một con số hữu dụng gồm nhiều số mã nên đã xảy ra sai số làm tròn. Trong trường hợp tín hiệu âm thanh đã được số hoá, sai số làm tròn tạo méo dạng tương ứng hay gọi là nhiễu. Nhiễu này có đặc tính hoàn toàn khác với nhiễu ở tín hiệu analog và được gọi là méo lượng tử hoá. Nhiễu lượng tử hoá là điều không thể tránh được trong công việc lượng tử hoá. Chỉ có thể làm giảm đi bằng cách tăng số bit lượng tử lên đến mức mà không gây hệ quả nghịch lên thực tế sử dụng.

Mã hoá

fC fSfC

fS > 2fC

MHz MHz

fS < 2fC

fC fS MHz

101

Page 104: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Đây là qui tắc biến trị lấy mẫu đã qua giai đoạn lượng tử hoá thành số nhị phân bao gồm các chuỗi 0 và 1. Các chuổi số nhị phân này được gọi là một từ. Trình bày sau đây cho thấy cách sắp xếp của mỗi bit kiến tạo thành một từ.

1 MSB

1 2SB

1 3SB

14SB

15SB

16SB

07SB

1 LSB

Ở hệ thống xử lý tín hiệu khi ghi lên CD, người ta lượng tử hóa mỗi từ gồm 16 bit, như vậy để biểu diễn tín hiệu biến thiên từ thấp đến cao của tín hiệu tương tự thì có tất cả 216 từ được tạo ra. Với số lượng 216 từ đủ để phản ánh sự biến thiên nhỏ nhất của tín hiệu tương tự. Theo trật tự quan trọng, bit MSB (most significant bit) là bit có nghĩa lớn nhất, đứng ở vị trí đầu tiên, bit 2SB (second significant bit) là bit có nghĩa thứ nhì, chiếm vị trí thứ hai…và cuối cùng là bit LSB (least significant bit) là bit có nghĩa nhỏ nhất xếp cuối.

4.5.1.2. Định dạng khung dữ liệu

Các tín hiệu kênh trái (Lch) và kênh phải (Rch) đều là tín hiệu đã được biến đổi từ analog sang digital để trở thành tín hiệu số 16 bit. Các tín hiệu này chưa được ghi trực tiếp lên đĩa ngay. Chúng được sắp xếp lại thành các đơn vị gọi là khung. Mỗi khung chứa 12 từ mẫu (sample) gồm 6 từ mẫu kênh trái và 6 từ mẫu kênh phải, sau đó chúng được xử lý biến điệu cùng với mã sửa sai trước khi được ghi lên đĩa. Các khung dữ liệu sắp xếp nằm nối tiếp nhau trên các track hình xoắn ốc. Việc định dạng khung được biểu diễn ở hình 4.12.

0 1 0 0 0 01 0 0 0 0 0 0 1 0 0

1 symbol word = 8bit

1 sample data word = 16bit

1 Frame

t

L0

R0

t0 t5

Mức tín hiệu

Rch Lch

L0

Hình 4.13. Định dạng khung dữ liệu trên CD

Một mức tín hiệu được mã hoá với từ 16 bit được gọi là “từ dữ liệu mẫu” (sample data word). Từ dữ liệu mẫu này được phân làm hai thành phần gồm 8 bit trên và thành phần 8 bit dưới, cả hai đều được gọi là ký tự biểu tượng (symbol

102

Page 105: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

word). Một khung bao gồm 6 từ dữ liệu mẫu cho kênh trái và 6 từ dữ liệu mẫu cho kênh phải, nghĩa là gồm tổng cộng 24 ký tự biểu tượng. Vì tần số lấy mẫu ở hệ thống CD là 44,1 KHz, nên thời gian cho một khung là 1/44,100×6(s) =136,05 (μs).

4.5.1.3. Đan xen dữ liệu theo qui tắc Reed-solomon

Sau công đoạn tạo khung, dữ liệu ghi sẽ được thực hiện đan xen với nhau theo một trật tự nhất định gọi là đan xen dữ liệu theo qui tắc Reed-solomon. Việc đan xen dữ liệu như vậy là nhằm để phân tán các lỗi kép thành các lỗi đơn để tiến hành sửa sai tín hiệu khi phát lại. Bởi vì bình thường khi có một lỗi xuất hiện trên CD ví dụ như một đường trầy xướt trên đĩa thì cũng làm cho vô số các từ dữ liệu bị sai đi, lúc đó các lổi kép sẽ xuất hiện, mà các lỗi kép sẽ không sửa được. Để sửa các lỗi như vậy thì cần phải phân tán chúng thành các lỗi đơn, và tiến hành sửa lỗi theo nguyên tắc tương quan dữ liệu. Đó chính là quy tắc đan xen Reed-solomon.

Trong hệ thống xử lý tín hiệu ở CD, khi ghi được thực hiện đan xen chéo (cross interleve), và khi phát lại dữ liệu được sắp lại theo đúng trình tự ban đầu trong hệ thống phát lại được gọi là giải đan xen (de-interleave) tức là quá trình ngược lại đan xen để tái tạo lại dữ liệu. Ví dụ sau đây trình bày nguyên lý đan dữ liệu gồm các bước như sau:

Chuỗi dữ liệu được chia thành từng khối nối tiếp nhau và một loại mã sửa lỗi phần tử có một ký tự cân bằng P và Q được đưa vào.

* * * * * * * * * *

* * * * * * * * * *

. . . A B C D E F G H I K L M N O P Q R S T U V W X Y Z 0 1 2 3 4 5 6 7 8

9 a b c d e f g h I k l m n o p q r s t u v w x y z . . .

Dữ liệu ở mỗi khối được sắp lại thành 6 hàng trên cùng một cột thẳng đứng.

B H O U 0 6 b h o u C I P V 1 7 c k p v

D K Q W 2 8 d l q w E L R X 3 9 f m r x F M S Y 4 a g n s y G N T Z 5 b h o t z

Dữ liệu ở hàng thứ hai được dịch sang phải một cột dữ liệu hàng thứ ba dịch đi hai cột,…, và hàng thứ sáu dịch đi là 5 cột.

. . . . . B H O U 0 6 b h o u C I P V 1 7 c k p v

D K Q W 2 8 d l q w E L R X 3 9 f m r x F M S Y 4 a g n s y G N T Z 5 b h o t z

103

Page 106: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Sau đó, các hàng dữ liệu theo chiều đứng trên cùng một cột được sắp lại thành các khối mới theo chiều ngang của chuỗi dữ liệu mới.

. . . . 6 1 W R M G b 7 2 X S N h c 8 3 Y t o k d 9 4 Z u p l f a 5 . . .

Dữ liệu được sắp trả lại đúng trình tự ban đầu bởi mạch giải đan xen. Vào giai đoạn này, lỗi kép xảy ra liên tục trên nhiều bit trở thành những lỗi đơn phân tán trên các khối khác nhau.

. . . . 6 1 W R M G b 7 2 X S N h c 8 3 Y t o k d 9 4 Z u p

l f a 5 . . .

Nguyên lý đan xen dữ liệu trên đã phân tán các lỗi kép xuất hiện trên các ký tự thành các lỗi đơn, các lỗi đơn này sẽ được tiến hành sửa sai theo nguyên tắc tương quan dữ liệu. Tuy nhiên, đây chỉ là ví dụ áp dụng đối với lỗi kép có độ dài giới hạn, để sửa những lỗi dài hơn, cần phải thêm các kiểu sửa lỗi khác.

* * * * *

*

Như vậy khi đưa mã cân bằng P và Q vào trong khung dữ liệu, thì trong mỗi khung dữ liệu có 4 ký tự P và 4 ký tự Q như vậy tổng số ký tự trong khung là 32 ký tự, mỗi ký tự vẫn là 8 bit .

4.5.1.4. Mã hóa tín hiệu điều khiển và hiển thị

Tín hiệu điều khiển và hiển thị C&D được đặt ở đầu mỗi khung dữ liệu để hiển thị các thông tin về dữ liệu khi phát lại. Tín hiệu C&D là một ký tự 8 bit, đặt tên cho các bit này là P, Q, R, S, T, U, V, W. Như vậy khi đưa tín hiệu điều khiển và hiển thị C&D vào trong khung thì số ký tự trong khung tăng thêm 1 ký tự tức là 33, và một ký tự vẫn là 8 bit.

4.5.1.5. Biến điệu EFM

Một khung được thành lập bởi 33 ký tự (symbol), mỗi ký tự này gồm 8 bit, gồm 24 ký tự của data, 8 ký tự sửa sai P và Q, 1 ký tự dành cho tín hiệu C&D (control anh display). Khi định dạng khung các ký tự này được ghép nối lại với nhau thì lúc đó có thể xuất hiện một chuổi các bit 0 hoặc một chuổi các bit 1 làm cho thành phần DC có thể xuất hiện trong quá trình xử lý tín hiệu và làm giảm thành phần xung nhịp làm ảnh hưởng đến chất lượng tín hiệu. Để khắc phục các hiện tượng này dữ liệu trong khung sẽ được thực hiện điều chế EFM (Eight to Fourteen bit Modulation) tức mỗi ký tự 8 bit sẽ được điều chế thành ký tự 14 bit và ký tự 14 bit này phải thỏa qui luật EFM (qui luật 2-10).

Qui luật FEM “ số lượng từ 2 đến 10 bit 0 được chèn giữa các kênh bit 1”.

Tại sao phải điều biến EFM ký tự 8 bit thành ký tự 14 bit. Ta thấy rằng trong ký tự 8 bit thì có tất cả là 28 =256 ký tự được tạo ra, còn ký tự 14 bit thì ta có tất cả 214 =16.384 ký tự, trong số ký tự 14 bit này thì có 267 ký tự thỏa qui luật EFM còn

104

Page 107: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

các ký tự còn lại thì không thỏa. Nên 267 ký tự này đủ để biểu diển cho 256 ký tự 8bit, còn nếu ta chọn ký tự 13 bit thì số ký tự thỏa qui luật EFM sẽ nhỏ hơn 256 ký tự 8 bit thì không đủ để biểu diễn, còn nếu ta chọn ký tự 15 bit thì số ký tự thỏa qui luật EFM sẽ tạo ra rất lớn sẽ gây tốn kém bộ nhớ khi xử lý. Ví dụ:

1100010100001000: không thỏa qui luật EFM

1010001010000000: không thỏa qui luật EFM

1001000010010000: thỏa qui luật EFM

Khi chuyển đổi ký tự từ 8 bit sang 14 bit không có một qui luật biến đổi nào mà để thực hiện được điều này mạch lọc số sẽ chọn lọc ra các từ thỏa mãn tương ứng để chuyển đổi. Ví dụ:

Ký tự 8 bit Ký tự 14 bit

11111011 10001000010010 11111100 01000000010010

11111101 00001000010010 11111110 00010000010010 11111111 00100000010010

Mục đích của điều biến EFM là tăng độ nhạy thông tin bằng cách thu hẹp dải thông bị chiếm chổ, tăng thành phần xung nhịp khi xử lý do mỗi ký tự khi xử lý đòi hỏi phải có một phần tử xung nhịp, giảm thành phần DC xuất hiện khi xử lý nếu có các bit 0 liên tục thì vệt tín hiệu sẽ trở nên mất các bit, thêm vào đó thông tin xung nhịp bị mất đi các vùng có bit và không có bit trên đĩa được đọc ở khoảng nhỏ hơn 3T và lớn 11T ngăn cản thành phần tần số cao hơn và sự mất các phần tử xung nhịp. Để khắc phục điều này thì các bit phải không được xuất hiện liên tiếp hai bit 1 cũng như không xuất hiện nhiều hơn mười bit 0 liên tiếp.

Xung NRZI (Non Return to Zero Invertted) sẽ được tạo ra từ dữ liệu của EFM, xung này sẽ có sườn xung xuất hiện tại các bit 1 của dữ liệu EFM, tại các vị trí này xung NRZI sẽ bị đảo mức xung tín hiệu. Ví dụ ứng với dữ liệu EFM ta có được xung NRZI:

EFM data 0 0 1 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0

Xung NRZI

Như vậy sau công đoạn điều chế EFM thì số ký tự trong khung vẫn là 33 ký tự, mỗi ký tự có 8 bit được chuyển đổi thành 14 bit .

105

Page 108: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

4.5.1.6. Các bit ghép trong khung

Khi điều biến EFM mỗi ký tự 14 bit thỏa qui luật 2-10, nhưng khi ta ghép nối các ký tự này lại với nhau trong khung thì có thể không thỏa qui luật EFM. Ví dụ khi bit cuối cùng của mảng dữ liệu đứng trước và bit đầu tiên của mảng dữ liệu theo sau đều là 1 thì lúc đó ghép nối hai mảng dữ liệu này không còn thỏa qui luật EFM nữa. Vì vậy sau khi điều chế EFM mỗi ký tự 14 bit được cộng thêm vào 3 bit ghép (merging bit), để đảm bảo khi ghép nối các ký tự lại thì luôn thỏa quy luật EFM.

Các bit ghép này có thể là: 010, 100, 001, 000…

Ví dụ:

10 0 1 0 0 0 1 0 0 0 1 0 0 0 0 0 1 0

* * *

Bit ghép Ký tự sau Ký tự đầu

10 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 1 0

* * * Bit ghép Ký tự sau Ký tự đầu

Các bit ghép được chọn đưa vào các ký tự sau cho giá trị DSV càng gần tới giá trị zero càng tốt. Giá trị DSV là giá trị tổng số đạt được khi chuổi bit hệ thống diễn tiến dưới giả định rằng mức cao của dạng sóng là +1 và mức thấp là –1.

Như vậy sau khi đưa ba bit ghép vào ký tự trong khung thì số ký tự trong khung vẫn là 33 ký tự, mỗi ký tự sẽ có 17 bit. Ví dụ

DVS = +2 - 7 + 2 -2 + 2 –2 +2 – 4 +4 = -1 tại t 1

0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 * * * 1 0 0 1 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1

Bit gheùp

+2 -7 +2 -2 +2 +2 +4 - 2 - 4

t 0 t 1

4.5.1.7. Tín hiệu đồng bộ khung

Sau khi đã hoàn tất việc điều chế EFM, mỗi khung dữ liệu được sẽ được đưa thêm vào một mã đồng bộ hay còn gọi là tín hiệu đồng bộ khung. Tín hiệu đồng bộ khung được đặt ở đầu mỗi khung dùng để xác định thời gian bắt đầu của một khung mới và kết thúc của một khung cũ. Tín hiệu đồng bộ khung này gồm có 24 bit mẫu và 3 bit ghép như vậy có tất cả là 27 bit, do số lượng bit chuẩn như vậy nên nó không được gọi là một ký tự.

106

Page 109: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Tín hiệu đồng bộ khung khung này cũng dùng làm thành phần báo vận tốc quay của đĩa khi phát lại. Khi phát lại căn cứ vào tần số của đồng bộ khung fFCK mà biết được vận tốc quay hiện tại của đĩa, nó là cơ sở dùng để điều chỉnh vận tốc quay đĩa của mạch Spindle servo.

Sync = 24 bit có dạng : 100000000001000000000010

Tần số đồng bộ khung là số khung đọc được trong 1 giây:

f = 1/ 136.05 = 7,35Khz

Như vậy sau khi đưa tín hiệu đồng bộ vào trong khung thì số ký tự trong khung vẫn là 33 ký tự, mỗi ký tự sẽ có 17 bit.

4.5.1.8. Hoàn tất tín hiệu ghi

Tín hiệu audio nguyên mẫu dạng tương tự sau khi qua các công đoạn điều chế như trên cuối cùng biến thành tín hiệu dạng số, các chuổi dữ liệu này được sắp xếp thành từng khung nằm nối tiếp nhau trên các track của đĩa khi ghi. Mỗi khung như vậy có tất cả là 588 bit hệ thống và được ghi trên đĩa dưới dạng các cấu trúc vật lý là các vệt lồi và lõm.

Sync C&D Data1 CIRC-Q Data2 CIRC-P

1 Frame = 588 bit

M M M M M M

Hình 4.14. Dạng khung dữ liệu đầy đủ

Thời gian xử lý khung: 136,05 μs ứng với hệ vận tốc CLV = 1,25 m/s

Tần số đồng bộ khung là số khung đọc được trong 1 giây:

f = 1/ 136,05 = 7,35Khz

Tổng số bit trong mỗi khung dữ liệu là 588 bit bao gồm các thành phần sau:

Sync word = 24 + 3 (bit ghép) = 27 bit

Control word = 14 +3 =17 bit

Data 1 = (14 +3 ) x 12 =204 bit

Parity P = (14 +3) x 4 = 68 bit

Data 2 = (14 +3 ) x 12 =204 bit

Parity Q = (14 +3) x 4 = 68 bit

107

Page 110: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Như vậy thời gian đọc một khung dữ liệu là: 135,05 μs

Suy ra thời gian đọc 1 bit dữ liệu

st μ23,0588

05,135==

Tần số xung đồng bộ khung chính bằng số khung đọc được trong một giây

Hzf 735005,135

1==

Tần số xung điếm bit:

MHzf 3218,405,135

588==

Tín hiệu này còn gọi là xung BCK hay fBCK = 4,3218MHz

Từ tín hiệu audio điều biến dạng số sẽ đưa đến khối đầu quang để điều biến thành tín hiệu quang sau đó ghi lên CD bởi các cấu trúc vật lý là các bit và flat. Độ dài các pit sẽ thay đổi từ 3T đến 11T tùy theo dữ liệu EFM điều biến

Audio data 0 1 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0

11T 3T Xung NRZI

Độ dài pit

4.5.2. Mạch xử lý tín hiệu khi phát lại

Mạch xử lý tín hiệu khi phát lại thực hiện ngược với khi ghi, khi ghi tín hiệu audio nguyên mẫu dạng tương tự được biến đổi thành dạng số, sau đó được điều chế và định dạng thành từng khung dữ liệu, khi phát lại mạch xử lý tín hiệu thực hiện ngược lại với khi ghi tức là giải điều chế tín hiệu số để phục chế lại tín hiệu audio tương tự.

Như biểu diễn ở sơ đồ mạch xử lý như biệu diễn ở hình 4.15, khi phát lại chùm tia laser từ đầu đọc chiếu lên bề mặt CD khi gặp các pit và flat thì phản xạ trở về qua hệ thống thấu kính trong đầu quang đến bán lăng kính chùm tia đổi phương 900 và cấp tín hiệu cho bốn diode cảm quang ABCD. Tín hiệu quang nhận được từ các diode cảm quang này sau đó được biến đổi thành tín hiệu điện và cấp cho mạch xử lý tín hiệu khi phát lại gồm các mạch giải điều chế tín hiệu, giải đan xen, tách mã phụ và cuối cùng là mạch biến đổi tín hiệu audio từ dạng số trở về tín hiệu dạng tương tự để phục hồi lại tín hiệu như nguyên mẫu.

108

Page 111: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

I/V converter

I/V converter

add

D/A convert

Asymetry

EFM

Focus servo

Focus servo

Data strobe

DSP EFM demod Error correct Timing control Digital filter Data mute

A

Hình 4.15. Sơ đồ khối máy CD

4.5.2.1. Mạch RF

Mạch RF làm nhiệm vụ biến đổi tín hiệu audio nhận được từ các diode cảm quang để tín hiệu ngỏ ra có dạng xung EFM, xung này là cơ sở để phục chế lại tín hiệu audio.

Hình 4.16. Sơ đồ khối RF máy CD

Khối I/V converter: biến đổi dòng điện ra điện áp. Khối photo detector có nhiệm vụ nhận tín hiệu quang đổi thành tín hiệu dòng điện. Tín hiệu dòng điện này được biến đổi thành tín hiệu điện áp. Thực chất của mạch này là khối Op-amp có

A B

C D

I/V converter

I/V converter

add Wave

sharper

Asymetry

EFM out

Focus servo

Focus servo

B

D C

RAM

Wave sharp

S/H

S/H

Muting LPF

Muting LPF

Digital I/O

Giao tiếp với vi xử lý

Data

BCK

RLCK

Data BCK RLCK

L out

R out

Digital out

109

Page 112: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

tính chất trở kháng vào lớn để có thể biến đổi một sự dao động nhỏ của dòng điện thành một dao động lớn của điện áp ở ngõ ra.

Khối Addition amp: là mạch khuếch đại cộng, mạch này sắp xếp các tín hiệu A+C và B+D từ một bộ photo detector được tạo ra nhờ mạch biến đổi I-V thành một tín hiệu đơn. Tín hiệu này là một chuổi các dạng sóng từ 3T đến 11T và được gọi là biểu đồ hình mắt (eye pattern).

Khối Asymetry and Wave sharp: là mạch sửa dạng sóng và sửa dạng hình học có nhiệm vụ đổi tín hiệu RF ngõ ra thành các chuổi số nhị phân để cung cấp cho mạch xử lý tín hiệu số, chu kỳ lý tưởng của RF là 50%. Do đó mạch sửa dạng hình học phải hiệu chỉnh sao cho chu kỳ không đổi.

LPF

+

_

+

_ Điện áp

trung bình

RF in

Điện áp sai

EFM out

Wave sharp

Asymetry

Hình 4.17. Sơ đồ mạch sửa dạng tín hiệu

4.5.2.2. Khối Data Strobe

Mạch này làm nhiệm vụ tách các bit clock được đồng bộ hóa với dữ liệu của EFM. Tín hiệu EFM được thiết kết sau cho nó không làm mất thành phần xung nhịp. Đầu tiên vòng quay của đĩa được kiểm soát để giữ cho chu kỳ không đổi của tín hiệu EFM nhờ vào mạch Spindle servo.

Data strobe

Giải mã NRZI

Sync detector

EFM data

Đến mạch DSP

EFM

Bit clock

Frame sync

Hình 4.18. Sơ đồ mạch Data strobe

110

Page 113: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Nếu mạch Spindle servo kiểm soát chu kỳ sai lệch của tín hiệu EFM được tái tạo khoảng 5% thì mạch Data strobe sẽ bị khóa để cho phép tạo ra xung nhịp clock.

Để tái tạo các bit clock mạch tách dò cạnh làm việc để tách các cạnh. Tiếp theo mạch so pha thực hiện so sánh giữa tín hiệu cạnh và ngỏ ra VCO = 4,3218Mhz, các tín hiệu sai biệt như thế được tạo ra có thể tái tạo các bit clock nhờ vào việc kiểm soát tần số dao động của VCO.

Delay

Phase comparision

LPF

VCO 4,3218M

EFM in EFM

Clock out

Tách dò cạnh

Hình 4.19. Sơ đồ mạch điều chỉnh phase tín hiệu

4.5.2.3. Mạch hoàn điệu NRZI

Từ tín hiệu EFM data, mạch hoàn điệu NRZI sẽ phục chế lại xung NRZI, xung này có cạnh xuất hiện tại các bit 1 và tại các thời điểm này sẽ đổi mức tín hiệu. Từ EFM data cũng phục chế lại xung clock BCK bằng cách mỗi bit dữ liệu EFM data sẽ tách thành một chu kỳ xung clock.

0 0 1 0 0 1 0 0 0 0 1 0 0 1 0 EFM data

Xung NRZI

3T 5T 3T

Bit clock

Tách tín hiệu đồng bộ khung và mạch bảo vệ: tín hiệu từ mạch data strobe đưa đến là một chuổi các bit 0 và 1 nối tiếp. Nó không thể cho biết điểm bắt đầu và kết thúc của khung dữ liệu. Khi ghi dữ liệu được định dạng thành từ khung mỗi khung 588 bit, đầu mỗi khung lại có tín hiệu đồng bộ khung. Tín hiệu đồng bộ khung có bề rộng xung là 11T-11T tín hiệu này không được có trong dữ liệu của âm thanh, bằng cách dò tín hiệu đồng bộ này, phần trước của dữ liệu có thể được nhận diện.

111

Page 114: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Tuy nhiên dạng tín hiệu tương tự như tín hiệu đồng bộ có thể xuất hiện do sự cố các lỗi như trầy xướt đĩa... mạch bảo vệ tín hiệu đồng bộ hoạt động để lấy ra các tín hiệu tương tự như thế để bổ sung vào phần tín hiệu đồng bộ đã bị mất đó. Khi tín hiệu đồng bộ không được phát hiện, mạch bù tín hiệu này sẽ tính toán thời gian sao cho và bù đắp tín hiệu đồng bộ này.

Sync signal Pattern det

SupplementarySignal

generator

Time gate generator

- +EFM

Sync signal

Hình 4.20. Sơ đồ mạch tách đồng bộ khung

Mạch này nhận diện tín hiệu đồng bộ theo mẫu 11T-11T, quá trình này tạo ra tín hiệu đồng bộ. Tín hiệu được lấy ra theo từng khung. Từ tín hiệu này, tín hiệu cổng thời gian được tạo ra để quan sát tín hiệu đồng bộ và bù vào phần tín hiệu đồng bộ đã mất hoặc bị sai.

4.5.2.4. Mạch xử lý tín hiệu số (Digital Signal Processor)

RAM write control

EFM Demodulatior

Error correction

RAM ROM

RAM read control

Subcode separation

RAM

EFM signal

To system control

Digital output

Data BCK LRCK

Sync signal Bitclock

Hình 4.21. Sơ đồ khối mạch DSP

Mạch xử lý tín hiệu số nhận vào ba tín hiệu: Data, BCK, Sync để xử lý cho ra ba tín hiệu cơ bản là Data, BCK, LRCK để cấp cho mạch D/A converter.

4.5.2.5. Hoàn điệu tín hiệu EFM

Các tín hiệu nhạc được lượng tử mỗi 16 bit được chia thành 8 bit cao và 8 bit thấp. Chúng được đổi thành dữ liệu 14 bit gọi là tín hiệu EFM. Tín hiệu 8 bit sẽ

112

Page 115: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

phân biệt được 28=256 trường hợp, chúng chứa các dữ liệu 0 và 1 liên tiếp nhau.Tín hiệu EFM 14 bit được thiết lập theo luật 2 đến 10 bit “0” được kẹp giữa 2 bit “1”. Khi có sự xuất hiện liên tiếp các mức 0, điều đó có nghĩa là có sự hiện diện của thành phần DC của tín hiệu, mà có thể gây ra khó khăn lớn trong quá trình tái tạo dữ liệu. Để giải quyết vấn đề này, một chuỗi dữ liệu không có các số 1 xuất hiện liên tiếp hoặc với số lượng từ 2 tới 10 số 0 được chọn từ 214 = 16.384 thành phần phân biệt của 14 bit dữ liệu. Dữ liệu đã được chọn này được tạo ra tương ứng với 8 bit dữ liệu để thực hiện biến điệu NRZI. Trong quá trình phát lại, các tín hiệu EFM 14 bit được đưa vào mạch hoàn điệu EFM. Mạch này được cài vào trong IC xử lý tín hiệu số (DSP). Mạch hoàn điệu EFM đối chiếu với bảng chuyển đổi 14-8 bit để được nạp vào ROM để đổi dữ liệu 14 bit ra 8 bit.

4.5.2.6. RAM

Trong mạch DSP bộ nhớ RAM thực hiện chức năng lưu trữ tạm thời các dữ liệu nhằm tăng tốc cho bộ xử lý số, đồng thời cũng làm các nhiệm vụ như

Loại bỏ bất ổn (Jitter): data đọc từ đĩa bị thay đổi do sự quay không đồng đều của đĩa. Sự thay đổi này gọi là sự bất ổn (Jitter). Sự bất ổn có thể được loại trừ bằng cách ghi data chứa bất ổn đó lên RAM. Việc đọc data như thế nhờ một xung đồng hồ chính xác lấy ra từ dao động thạch anh.

Giải đan xen (de-interleave): thứ tự data bị thay đổi để ngăn ngừa các tín hiệu analog ở ngõ ra bị gián đoạn, hoặc gây ra bởi sai số data liên tiếp hoặc sự xáo trộn dữ liệu do sự trầy xước đĩa…Sự hoán đổi dữ liệu được thực hiện trên mỗi 4 khung (frame). Quá trình này được gọi là đan xen.

Trong quá trình tái tạo dữ liệu, cần phải lưu trữ dữ liệu trong 108 khung lên RAM để đưa ra theo thứ tự nguyên thuỷ của nó. Chức năng này gọi là giải đan xen (De interleave).

Lưu trữ mã phụ: với lưu ý là 8 bit mã phụ data trong một khung được phân phối 98 khung cùng hình thành nên một mã phụ đơn. Như vậy, RAM lưu trữ 98 khung data mã phụ.

Nhận diện sai số và sửa sai: dữ liệu được tái tạo có thể chứa nhiều sai số hoặc mất dữ liệu do sự trầy xước của đĩa, bụi… khi “1” trở thành “0” và ngược lại, sẽ gây ra sự khiếm khuyết như trên, điều này được gọi là sự sai mã (Code Error).

4.5.2.7. Mạch biến đổi D/A

Mạch biến đổi D/A (D/A converter) đổi tín hiệu audio dạng số thành tín hiệu audio dạng analog có dải động rộng hơn, nhằm để phục chế lại tín hiệu audio nguyên mẫu. Mạch D/A Converter đòi hỏi có những khả năng như sau: biến đổi

113

Page 116: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

D/A: 16 bit; tốc độ thay đổi: 20μs/2channel; độ méo hài (harmonic dictortion): 0,003%; dải rộng 96dB.

4.6. MÁY PHÁT CD

Máy CD (Compact Disc Player) là thiết bị dùng để phát lại tín hiệu trên đĩa compact, trong các máy CD dân dụng thường chỉ có mạch phát lại tín hiệu mà không có mạch ghi. Dựa vào yêu cầu và mục đích sử dụng, máy CD có nhiều loại khác nhau như: máy hát CD gia đình, máy CD dùng trên xe hơi, máy CD xách tay, máy CD kết hợp. . .

RF Amp Servo amp

Focus Servo

Tracking Servo

Sled Servo

Spindle Servo

Bitclock separate EFM demodulation Sync det

Data strobe

Deinterleave Error correction Sub code

RAMData Signal Processing

System control

Loading motor Display Sensor Power

Key matrix

D/A

LPF

LPF

L- out

R- out

Head phone

Servo

Spindle motor

Sled motor

Đĩa compact

Hình 4.22. Sơ đồ khối máy CD

Khối RF: nhiệm vụ biến đổi tín hiệu quang thành tín hiệu điện và khuếch đại tín hiệu này cấp cho khối servo và xử lý tín hiệu âm thanh

Khối Data strobe: khối này nhận tín hiệu từ khối RF để tách bit clock giải điều chế EFM để trả lại mã nhị phân 8 bit của tín hiệu nguyên thủy. Ngoài ra khối này còn có nhiện vụ tách tín hiệu đồng bộ khung để cấp cho mạch Spindle servo.

Khối DSP: khối này được gọi là khối xử lý tín hiệu số nhận tín hiệu từ data strobe cấp cho mạch giải đan xen, sửa sai, và tách mã phụ.

114

Page 117: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Khối xử lý audio: khối này nhận tín hiệu âm thanh từ DSP cấp cho mạch biến đổi D/A. Tín hiệu kênh trái và kênh phải ngõ ra được lấy ra nhờ mạch tách kênh gồm hai mạch LPF.

Khối servo gồm có 4 mạch servo cơ bản như sau:

Focus servo: khối này nhận tín hiệu từ RF để điều chỉnh cuộn dây hội tụ, làm dịch chuyển vật kính theo phương thẳng đứng để chùm tia hội tụ đúng trên bề mặt CD.

Tracking servo: khối này nhận tín hiệu từ mạch RF cấp điện áp thay đổi cuộn tracking làm dịch chuyển vật kính theo phương nằng ngang để chùm tia laser luôn đọc đúng các track.

Sled servo: khối này nhận tín hiệu điều khiển từ mạch tracking servo để đưa ra điện áp điều chỉnh Sled motor, tạo tác động điều chỉnh cụm quang học theo từng bước trên các track từ phía vùng tâm đĩa ra ngoài. Ngoài ra trên máy CD còn trang các hệ thống nạp đĩa hoặc đưa đĩa ra ngoài. Toàn bộ vận hành của máy được điều khiển bởi khối vi xử lý.

Spindle servo: khối này có nhiệm vụ nhận tín hiệu phản hồi từ mạch xử lý tín hiệu số cung cấp điện áp điều khiển vận tốc quay của Spindle motor. Khối này phải đảm bảo vận tốc quay đĩa theo hệ thống CLV tức vận tốc dài không đổi nhưng vận tốc gốc thay đổi từ 500 vòng/phút khi cụm quang học ở trong cùng và giảm dần còn 200 vòng/phút khi cụm quang học di chuyển ra ngoài biên.

Khối hiển thị: khối này có nhiệm vụ hiển thị các chế độ làm việc của máy: thời gian phát bản nhạc, số bản nhạc, đếm số track đang phát ...

Khối xử lý: khối này có nhiệm vụ nhận tín hiệu từ các khối đưa về để xuất ra các lệnh điều khiển các hoạt động của máy theo các chế độ làm việc tương ứng. Ngoài ra khối xử lý còn có nhiệm vụ tạo ra các tín hiệu data, clock để giao tiếp với các mạch DSP, mạch servo ...

4.7. MÁY PHÁT VCD

Máy VCD (Video Compact Disc Player) là thiết bị dùng để phát lại tín hiệu trên đĩa hình VCD. Về cấu tạo, máy đọc đĩa CD nhạc và VCD có các bộ phận giốnh nhau như: cụm quang học, khối RF amp, khối DSP và khối servo. Trên thực tế, máy đọc VCD luôn kèm theo chức năng đọc đĩa nhạc CD một cách tự động.

Trên máy VCD người ta thiết kế mạch giải nén tín hiệu hình MPEG, đổi tín hiệu hình từ số ra tương tự (video DA) và khối giải mã R,G,B cấp cho ngõ ra video. Bên cạnh đó, người ta còn thực hiện các chức năng giải mã âm thanh hai kênh trái phải, xử lý karaoke, ngắt lời, tăng giảm tone…để cấp cho ngõ audio out. Tất cả các

115

Page 118: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

tiêu chuẩn của máy CD đều đúng đối với máy VCD. Tuy nhiên, đối với máy VCD còn có những tiêu chuẩn khác như:

- Tín hiệu NTSC 3,58/PAL (có thể thay đổi được trên mạch giải nén).

- Mức tín hiệu video ở ngõ ra: 1VPP.

- Trở kháng: 75Ω, không cân bằng.

- Thời gian phát tối đa: 74 phút

RF Amp Servo

Focus Servo

TrackingServo

Sled Servo

Spindle Servo

DSPData signal processing

MPEG

Decoder

Data BCK RLCK

System control

Loading motor Display Sensor Power

Key matrix

D/A

LPF

LPF

L- out

R- out

Head phone

Servo

Spindle motor

Sled motor

Đĩa compact

Audio process

VideoD/A

RGB encod OSD

Video out

DRAM

ROM

Video and audio processor

Hình 4.23. Sơ đồ khối máy VCD

Do tín hiệu video có dải tần rộng và dung lượng dữ liệu lớn nên trước khi ghi tín hiệu lên đĩa người ta phải tiến hành nén phổ tần lại cho thích hợp, trong quá trình phát lại người ta phải tiến hành giải nén tín hiệu. Sơ đồ khối mạch giải nén tín hiệu khi phát lại được biểu diễn ở hình 4.24.

Hiện nay, người ta đã thống nhất tiêu chuẩn nén hình trong VCD là MPEG-1 với hình ảnh có độ phân giải là 252×288 và tần số quét dọc là 25Hz đối với hệ PAL, độ phân giải 352×240 và tần số quét dọc là 30Hz đối với hệ NTSC.

116

Page 119: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Máy VCD có khả năng đưa ra hình ảnh có hệ màu PAL và NTSC nhờ sự can thiệp vào phím ấn đổi hệ trên remote control hoặc phím trước mặt máy. Vì vậy, khi sử dụng máy VCD ta không cần quan tâm đến hệ màu và tiêu chuẩn dòng quét, tần số quét, bản thân đĩa VCD cũng không phân biệt các chuẩn này. Việc đổi các chuẩn sẽ được thực hiện bởi các mã thông tin trên các đường dữ liệu mà khối giải mã MPEG nhận được.

Laser Pickup

RF Amp DSP

MPEG Video

Decoder

Video DAC

RGB EncoderR,G,B

OSD Data clock

RF converter

(μp)

Video out

Video out

Mạch xử lý audio

Hình 4.24. Sơ đồ mạch xử lý tín hiệu video trong máy VCD

4.7.1. Khối giải nén MPEG video

Khối giải nén MPEG làm nhiệm vụ giải nén tín hiệu video và audio khi phát lại, do trong lúc ghi cả hai tín hiệu này cùng được nén và ghi lên VCD. Khối giải nén cũng là bộ phận khác nhau căn bản giữa máy CD và VCD.

Tín hiệu từ khối DSP cấp cho khối giao tiếp chủ (host interface) theo ba đường tín hiệu, sau đó cấp cho khối DRAM controller, tại khối này có nhiều đường data (dữ liệu), address (địa chỉ), điều khiển (control) liên lạc với bộ nhớ RAM ở bên ngoài. Cuối cùng, khối video display là khối giao tiếp với mạch D/A của bộ phận hình ảnh.

DRAM controller

Host interface

Video display unit

MPEG decording

Internal processor

Colour space converter

Data FIFO

Data control

Data BCK LRCK

DRAM BUS

Hình 4.25. Sơ đồ khối mạch MPEG

117

Page 120: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

4.7.2. RAM và ROM sử dụng trong máy VCD

DRAM (Dynamic Random Access Memory): bộ nhớ truy xuất trực tiếp loại động, gọi tắt là RAM động. Các bộ nhớ RAM động sử dụng trong VCD thường có dung lượng từ 1M đến 16Mbyte, trong khi đó bộ nhớ ROM thường được sử dụng với dung lượng khoảng 1Mbyte. Chúng thường sử dụng kèm với mạch giải nén MPEG để lưu trữ dữ liệu và tăng tốc độ xử lý trên IC giải nén.

MPEG DECODER

MD, MA

MD

OE

D0 – Dn

A0 – An

ROM

Hình 4.26. Sơ đồ giao tiếp IC ROM và MPEG

ROM (Read Only Memory) là bộ nhớ chỉ đọc, ROM sử dụng trong VCD thường có dung lượng nhỏ hơn DRAM, chúng cũng được liên lạc trực tiếp lên khối giải nén video. Các chân địa chỉ A (address) có thể là các tuyến địa chỉ nhớ MA (memory address) hoặc dữ liệu nhớ MD (memory tata) liên lạc với mạch giải nén.

4.7.3. Khối RGB-DAC

Khối RGB-DAC có nhiệm vụ chuyển đổi các bit dữ liệu chứa hình ảnh bao gồm các thông tin về chói, màu, đồng bộ…thành tín hiệu dạng tương tự để có thể cung cấp cho ngõ vào của máy thu hình (màn hình thử). Sơ đồ khối của mạch RGB-DAC được thể hiện như hình 4.26.

Input buffer encoder Latch Buffer D/A C

Digital input

RGB output

Hình 4.27. Sơ đồ khối RGB-DAC

Thông thường người ta đưa dữ liệu theo ba tuyến khác nhau, mỗi tuyến chứa 8-16 bit đổi thành các tín hiệu R,G, B dạng tương tự.

4.7.4. Khối giải mã RGB

Khối giải mã RGB có nhiệm vụ lấy các tín hiệu R,G,B dạng tương tự tại ngõ ra để tái tạo các tín hiệu truyền hình, các tín hiệu đồng bộ ngang (H.sync), đồng bộ dọc (V.sync)..

118

Page 121: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

4.7.5. Khối giải ném âm tần

Trong máy đọc đĩa hình, ngoài khối giải nén tín hiệu hình, người ta thiết kế khối chức năng giải nén tín hiệu âm thanh nhằm tái tạo tín hiệu âm thanh đã được nén cùng với tín hiệu hình. Sơ đồ khối của khối giải nén âm tần như hình 4.27.

MPEG AUDIO

MPEG VIDEO Audio

SW

LPF

LPF

D/A

RAM

L out

R out

Hình 4.28. Sơ đồ khối mạch giải nén âm tần

Ngõ ra tín hiệu âm thanh này được lấy từ dữ liệu của khối giải nén hình ảnh MPEG, sau đó được xử lý giải nén, chuyển đổi D/A, tách hai kênh trái phải riêng biệt sau đó khuếch đại cấp cho hai ngõ audio out L-R. Ngoài ra, trên khối giải nén âm tần người ta còn thực hiện các chức năng dành cho karaoke bao gồm các tầng mix giữa các ngõ vào micro và âm nhạc nền, tăng âm tone cho phần mic…

4.7.6. Khối vi xử lý chủ

Khối vi xử lý chủ (host μcom) trên máy đọc VCD có nhiệm vụ giao tiếp với khối giải nén hình thông qua các đường liên lạc HA (host address), HD (host data). Giao tiếp với khối giải nén âm thanh, giao tiếp với các bộ nhớ ROM/RAM và giao tiếp với khối vi xử lý chính của máy.

4.8. KHỐI SERVO MÁY CD

Khối servo trong máy CD gồm có bốn mạch servo chính: focus servo, tracking servo, sled servo, spindle servo, làm nhiệm vụ điều chỉnh vận tốc quay và pha quay của các motor, đồng thời điều chỉnh chùm tia laser của đầu đọc, đảm bảo cho việc ghi phát tín hiệu trên CD luôn được trung thực.

4.8.1. Focus servo

Sơ đồ mạch focus servo như biểu diễn ở hình 4.28. Khối này nhận tín hiệu từ RF, điều chỉnh cuộn dây hội tụ, làm dịch chuyển vật kính theo phương thẳng đứng để chùm tia hội tụ đúng trên bề mặt CD để tín hiệu phát lại là trung thực nhất.

Tùy thuộc vào vị trí của vật kính so với CD mà chùm sáng có các hình dạng khác nhau. Cường độ sáng nhận được từ các diode A+C và B+D được đưa đến mạch khuếch đại so sánh để tạo ra tín hiệu sai lệch hội tụ (FE), sau đó đến mạch so

119

Page 122: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

pha, mạch khuếch đại thúc cấp điện áp sai lệch cho cuộn dây hội tụ sẽ tạo ra từ trường di chuyển vật kính theo phương thẳng đứng sao cho khoảng cách của vật kính đúng với bề mặt CD để chùm tia hội tụ lên CD thành một điểm cực nhỏ khi đó tín hiệu phát lại là trung thực nhất.

A B

C D

I/V

Hình 4.29. Sơ đồ khối mạch Focus servo máy VCD.

Khi khoảng cách vật kính đúng với CD thì chùm sáng hội tụ lên các diode cảm quang là vệt sáng hình tròn, khi đó cường độ sáng nhận được của A+C=B+D làm cho áp sai lệch hội tụ tạo ra từ mạch khuếch đại so sánh bằng 0, tức là vật kính đã đúng không cần điều chỉnh.

Khi khoảng cách vật kính quá gần với CD thì chùm sáng hội tụ lên các diode cảm quang là vệt sáng hình elip đứng, khi đó cường độ sáng nhận được của diode A+C > B+D làm cho áp sai lệch hội tụ tạo ra từ mạch khuếch đại so sánh có giá trị dương (+), điện áp này cấp cho cuộn dây tạo từ trường di chuyển vật kính xa CD.

converter

I/V converter A + C

+

_

Focus Error

Laser diode

Pit

Đĩa compact Tia chính

Phase correc Drive

Focus coil

B + D

Tia phụ E

Bán lăng kính

Phương đứng

A B

D C

+ _ 0

Vật kính đúng với CD

V+ A B

D C

+ _

Vật kính quá gần CD

120

Page 123: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Khi khoảng cách vật kính quá xa với CD thì chùm sáng hội tụ lên các diode cảm quang là vệt sáng hình elip ngang, khi đó cường độ sáng nhận được của diode A+C < B+D làm cho áp sai lệch hội tụ tạo ra từ mạch khuếch đại so sánh có giá trị âm (-), áp này cấp cho cuộn dây tạo từ trường di chuyển vật kính gần lại CD.

A B

D C

+

_ V-

Vaät kính quaù xa CD

4.8.2. Tracking servo

Khối này nhận tín hiệu từ mạch RF cấp điện áp thay đổi cuộn tracking làm dịch chuyển vật kính theo phương nằng ngang để chùm tia laser luôn đọc đúng các track. Khi phát lại, hai chùm tia laser phụ E và F chiếu lên bề mặt CD gặp các pit phản xạ trở lại, khi đến bán lăng kính chùm tia đổi phương 900 sau đó rọi lên 4 diode cảm quang ABCD. Tùy thuộc vào vị trí của chùm tia chính so với các đường track, mà chùm sáng phản xạ lại của E và F có cường độ khác nhau.

I/V converter

I/V converter F

+

_

Tracking Error

Laser diode

Pit

Đĩa compact Tia chính

Phase correct

Drive

Tracking coil

E

Tia phụ F

Bán lăng kính

Phương ngang

E F

Tia phụ E

Hình 4.30. Sơ đồ khối mạch Tracking servo máy VCD

Cường độ sáng của diode E và F được đưa đến mạch khuếch đại so sánh sẽ tạo ra tín hiệu sai lệch tracking (TE), sau đó đến mạch so pha, mạch khuếch đại thúc cấp điện áp sai lệch cho cuộn dây hội tụ tạo ra từ trường di chuyển vật kính theo

121

Page 124: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

phương nằm ngang sao cho chùm tia chính luôn đọc đúng các track để tín hiệu phát lại là trung thực nhất.

E

F

E

F

E

F

+ -

0

+ -

-

+ -

+

Hình 4.31. Biểu diễn vị trí lệch của các tia phụ

Khi chùm tia chính đúng đọc đúng track, khi đó ánh sáng phản xạ của hai tia phụ lên hai diode E và F có cường độ bằng nhau, khi đó áp sai lệch tracking từ mạch so sánh bằng 0 tức là vị trí của vật kính đã đúng không cần điều chỉnh

Khi chùm tia chính lệch sang bên trái, khi đó ánh sáng phản xạ của hai tia phụ lên hai diode E và F có cường độ khác nhau, cường độ sáng nhận được của diode E>F khi đó áp sai lệch tracking từ mạch so sánh có giá trị âm (-), áp sai lệch này cấp cho cuộn dây tạo từ trường di chuyển vật kính sang bên phải giúp cho tia chính đọc đúng track để tín hiệu phát lại là trung thực nhất.

Khi chùm tia chính lệch sang bên phải, khi đó ánh sáng phản xạ của hai tia phụ lên hai diode E và F có cường độ khác nhau, cường độ sáng nhận được của diode E<F khi đó áp sai lệch tracking từ mạch so sánh có giá trị dương (+), áp sai lệch này cấp cho cuộn dây tạo từ trường di chuyển vật kính sang bên trái giúp cho tia chính đọc đúng track để tín hiệu phát lại là trung thực nhất.

4.8.3. Mạch Spindle servo

Mạch này có nhiệm vụ nhận tín hiệu phản hồi từ mạch xử lý tín hiệu số DSP cung cấp điện áp điều khiển vận tốc quay và pha quay của Spindle motor. Khối này phải đảm bảo vận tốc quay đĩa theo hệ thống CLV tức vận tốc dài không đổi từ 1,2 đến 1,4 m/s nhưng vận tốc gốc thay đổi từ 500 vòng/phút khi cụm quang học ở trong cùng và giảm dần còn 200 vòng/phút khi cụm quang học di chuyển ra ngoài biên. Mạch tự động điều chỉnh vận tốc quay motor như ở hình 4.32.

122

Page 125: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

RF D/A

LPF

LPF

L- out

DSP

Frequency comparison

XTAL 7350Hz

MDA M

R- outfFCK tách được

Hình 4.32. Sơ đồ khối mạch điều chỉnh vận tốc quay Spindle motor

Để thực hiện được điều này mạch điều chỉnh vận tốc lấy tín hiệu đồng bộ khung (fFCK) tách được khi đọc lại để so sánh với vận tốc chuẩn tạo ra từ dao động thạch anh, kết quả tạo ra áp sai lệch vận tốc cấp cho mạch MDA để điều chỉnh lại vận tốc quay motor.

Mạch điều chỉnh phase quay: mạch này phải đảm bảo pha quay của motor quay luôn được ổn định, tức làm đảm bảo sau cho pha của xung clock tương ứng với data khi phát lại (BCK) phải cùng pha với xung clock chuẩn đưa vào tri xuất dữ liệu.

RF D/A

LPF

LPF

L- out

DSP

Frequency comparison

XTAL 4,3218MHz

MDA M

R- out

FBCK = 4,3218MHz

Hình 4.33. Sơ đồ khối mạch điều chỉnh phase quay Spindle motor

Để thực hiện được điều này mạch điều chỉnh pha quay motor lấy tín hiệu so sánh là pha của xung clock tương ứng với dữ liệu khi phát lại (fBCK) có tần số đã ổn định bởi mạch điều chỉnh vận tốc, để so sánh với pha của xung clock chuẩn f0SC=4,3218MHz tạo ra từ dao động thạch anh chuẩn, kết quả tạo ra áp sai lệch về pha cấp cho mạch MDA để điều chỉnh lại pha quay của motor.

4.8.4. Mạch Sled servo

123

Page 126: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Khối này nhận tín hiệu điều khiển từ mạch tracking servo để đưa ra điện áp điều chỉnh sled motor, tạo tác động điều chỉnh cụm quang học theo từng bước trên các track từ phía vùng tâm đĩa ra ngoài, sau cho chùm tia luôn đọc đúng các track. Mạch sled servo còn gọi là mạch chỉnh thô, ngoài ra trên máy CD còn trang bị các hệ thống nạp đĩa hoặc đưa đĩa ra ngoài. Toàn bộ vận hành của máy được điều khiển bởi khối vi xử lý.

Tracking servo

Driver Mạch tích phân

Tầng so sánh

Tầng lái

M

TEO

Hình 4.34. Sơ đồ khối mạch Sled servo máy VCD

Điện áp trung bình của tín hiệu tracking error (TE) từ mạch tracking servo đưa tới, có giá trị răng theo thời gian, tín hiệu này được đưa tới mạch tích phân để sửa dạng tính hiệu sau đó đưa tới tầng so sánh để so sánh với thành phần chuẩn kết quả áp sai lệch sled motor tạo ra để lái sled motor sau cho vật kính được giữ trong tầm điều chỉnh so với điện áp chuẩn ngay tại tâm của hệ cơ.

4.9. KHỐI VI XỬ LÝ

Khối vi xử lý là bộ phận trung tâm, làm nhiệm vụ điều hành tất cả các hoạt động trong máy, bằng cách tác động điều khiển trực tiếp đến tất cả các khối giúp cho việc ghi phát tín hiệu diễn ra một cách đồng bộ.

Tác động đến khối cơ: điều khiển sự hoạt động của các phần tử trong khối cơ để thực hiện việc nạp đĩa vào, lấy đĩa ra, quay đĩa…

Tác động đến khối nguồn, điều khiển việc cấp nguồn PC (power control) cho các mạch điện trong máy.

Tác động đến khối tín hiệu, điều khiển việc xử lý tín hiệu khi ghi và phát tương ứng với từng chế độ làm việc của máy.

Tác động đến khối chỉnh cơ, thực hiện việc điều khiển vòng quay của các motor giúp cho việc ghi phát tín hiệu diễn ra bình thường.

Để tiện lợi cho việc khảo sát khối vi xử lý trong máy người ta phân chia ra thành từng khu vực khác nhau. Dựa vào chức năng hoạt động của khối, người ta phân chia khối vi xử lý ra làm 3 khu vực khảo sát chính như sau:

Khu vực phục vụ chính cho vi xử lý: là các điều kiện cần thiết để cho vi xử lý làm việc như: nguồn AT (5V), xung clock chuẩn, mạch Reset...

Khu vực các lệnh ngõ vào: có thể phân ra làm 3 loại

124

Page 127: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Các lệnh ngõ vào từ các phím điều khiển, các phím nằm phía trước mặt máy, thông qua các phím nhấn này thì lệnh được đưa về vi xử lý. Các lệnh ngõ vào từ các cảm biến (sensor), thông thường các lệnh này được thiết kế để làm các mạch bảo vệ trong máy hoặc thực hiện các chuyển động nối tiếp trong máy. Lệnh vào từ mạch tín hiệu, là các lệnh được đưa về vi xử lý để điều khiển từng chế độ làm việc của máy.

Khu vực các lệnh ngõ ra: có thể chia làm 4 loại.

Lệnh ra điều khiển hoạt động của các motor trong các chế độ làm việc như: play, close/open, stop...Lệnh ra đều khiển đóng mở các mạch điện tín hiệu trong các chế độ làm việc như điều khiển mạch data strobe, mạch DSP mạch công tắc E–E, mạch xử lý audio...Lệnh ra điều khiển các mạch đèn chỉ thị như điều khiển các đèn hiển thị ở các chế độ làm việc của máy…Lệnh ra điều khiển các nguồn PC (nguồn điều khiển) để cung cấp các mức nguồn cho mạch điện hoạt động.

4.9.1. Khu vực phục vụ chính vi xử lý

Cấp nguồn cho vi xử lý: trước hết là nguồn áp AT(5V) cung cấp cho vi xử lý, nguồn này sẽ xuất hiện ngay khi mới cấp điện vào để vi xử lý sẵn sàng làm việc khi tiếp nhận các lệnh mới.

Nguồn xung clock chuẩn: vì hoạt động bằng xung nên vi xử lý phải được cung cấp một xung chuẩn thật ổn định gọi là xung clock. Thông thường xung clock chuẩn này được tạo ra từ mạch dao động thạch anh. Thực ra, bên trong vi xử lý là tập hợp của các mạch điện dạng số như các bộ đếm, các thanh ghi dịch... cho nên xung clock là cơ sở để tạo ra các số nhị phân và để truy xuất các dữ liệu trong khi xử lý. Thạch anh tạo xung dao động cấp cho vi xử lý có thể nằm trong hoặc ngoài vi xử lý như hình 4.33.

Vi xử lý

OSC

Vi xử lý

OSC Clock in

Hình 4.35. Cấu trúc của mạch dao động thạch anh

Đối với loại mạch sử dụng dao động thạch anh ngay bên trong vi xử lý, ta có thể nhận dạng được nhờ chân lệnh clock nối ra bên ngoài. Đối với mạch sử dụng dao động từ bên ngoài, ta có thể nhận dạng nhờ chân clock in.

Lệnh reset (chân ALC): chân lệnh này nhằm trả dữ liệu của vi xử lý trở về trạng thái ban đầu khi mới cấp điện vào để vi xử lý sẵn sàng tiếp nhận các lệnh mới.

125

Page 128: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Ví dụ máy đang hoạt động ở chế độ play, lúc đó dữ liệu trong vi xử lý tương ứng với trạng thái play, bổng nhiên bị cúp điện. Khi có điện trở lại thì chân lệnh reset sẽ tác động trả dữ liệu trong vi xử lý về trạng thái ban đầu.

4.9.2. Khu vực các lệnh vào vi xử lý

4.9.2.1. Lệnh vào từ các phím điều khiển

Lệnh vào từ các phím điều khiển (key input) là những lệnh vào tác động thông qua các phím điều khiển nằm phía trước mặt máy như: play, close/open, FF... hoặc các phím điều khiển từ remote cotrol để đưa về vi xử lý. Để thực hiện được các lệnh điều khiển loại này người ta thường dùng phương pháp ma trận phím như hình 4.34.

AD1 AD2 AD3 KE1 KE2 KE3

AD1 AD2 AD3 KE1 KE2 KE3

Xung địa chỉ

Vixử lý

Data Clock Ready

IC giải mã

Xung địa chỉ

Hình 4.36. Sơ đồ mạch giải mã phím lệnh

Ở phương pháp này, người ta thiết lập các đường xung địa chỉ AD1, AD2, AD3...và các đường nhận xung lệnh ngõ vào KE1, KE2, KE3...Các xung địa chỉ có độ rộng khác nhau từ vi xử lý đi ra rồi lại đi vào vi xử lý thông qua các phím điều khiển như: play, close/open, stop...từ đó vi xử lý sẽ hiểu được phím lệnh nào đã được tác động. Ví dụ khi ngõ vào KE1 nhận được xung có độ rộng nhỏ nhất thì đó là phím Eject được nhấn, cũng ngõ vào KE2 nhưng nếu nhận được xung AD3 có độ rộng lớn nhất thì đó là lệnh stop được tác động.

4.9.2.2. Lệnh vào từ các cảm biến

Cảm biến vị trí khay đĩa (tray sensor): có nhiệm vụ nhận dạng vị trí khay đĩa đang ở ngoài hay trong máy nhờ một khoá điện hoặc một cảm biến quay. Khay đĩa dịch chuyển theo rãnh trượt thông qua chuyển động quay của loading motor. Vị trí của khay đĩa ở trong hay ngoài hệ cơ được nhận diện bởi tray SW, có khi còn được gọi là open hay close SW dựa vào các mức cao hay thấp do các khoá điện tác động tạo ra.

126

Page 129: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Chốt định vị khay đĩa

SW 2

Rãnh trượt khay đĩa

SW 1

Hình 4.37. Sơ đồ cảm biến vị trí khay đĩa

Sử dụng khóa điện: bình thường SW hở, vi xử lý nhận mức cao H. Khi đĩa đã vào trong máy, SW đóng vi xử lý nhận mức thấp, ra lệnh ngắt motor loading.

Open Close

Vi xử lý MDA Motor

5V

R1

SW R1

Hình 4.38. Sơ đồ mạch cảm biến vị trí khay đĩa dùng khóa điện

Sử dụng photo transistor: người ta dựa vào khoảng che của hệ cơ để nhận biết trạng thái của khay đĩa. Chẳng hạn, khi đĩa ở vị trí ngoài cùng, ánh sáng từ led hồng ngoại không đến được photo transistor, transistor ngưng hoạt động, chân tray sensor ở mức cao. Khi đĩa ở vị trí trong cùng, ánh sáng đi đến photo transistor làm transistor dẫn, vi xử lý nhận mức thấp, lệnh điều khiển MDA làm ngắt động cơ.

Open Close Vi xử lý

MDA Motor

5V

R2

R3

R1

Hình 4.39. Sơ đồ mạch cảm biến vị trí khay đĩa dùng bộ cảm quang

Cảm biến nhận diện vị trí cụm quang học: trong máy cụm quang học được bố trí trên hệ cơ chuyển động tịnh tiến từ trong ra ngoài hoặc từ ngoài vào trong

127

Page 130: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

theo phương vuông góc với các đường tròn đồng tâm của đĩa. Để dịch chuyển cụm quang học, người ta sử dụng sled motor. Khoá điện nhận dạng vị trí cụm quang học được sử dụng để khống chế chuyển động của khối này khi ở vị trí trong cùng hoặc ngoài cùng so với đĩa. Ví dụ trong các máy Sony, khoá điện up/down được trang bị để nhận dạng trạng thái của cụm quang học với mạch điện được minh hoạ như hình 4.40.

UP

Vi xử lý

5V

R1

SW 1 R1

5V

R1

SW 2 R2 DOW

Cụm quang học

Thanh trượt

Đĩa compact

Sled motor

Hình 4.40. Sơ đồ cảm biến nhận diện vị trí cụm quang học

Mạch cảm biến điều khiển từ xa: thông thường khối giải mã tín hiệu hồng ngoại được bố trí ngay bên trong vi xử lý. Để nhận tín hiệu từ bộ điều khiển từ xa tới, người ta sử dụng bộ thu tín hiệu hồng ngoại IR (infrared receiver). Mô hình mạch có thể được biễu diễn như hình 4.41.

R/C in

Vi xử lý

5V

Hình 4.41. Sơ đồ mạch điều khiển từ xa

4.9.3. Khu vực các lệnh ra

4.9.3.1. Lệnh ra điều khiển mở nguồn PC

Tương tự như máy VCR, trên máy CD, VCD người ta thiết kế mạch điều khiển đóng mở nguồn cung cấp bằng cách tác động lệnh power on/ off. Điện áp ở ngõ ra có thể được sử dụng để cung cấp cho các khối servo, DSP…và còn có thể được dùng để cung cấp cho khối hiển thị.

4.9.3.2. Các lệnh điều khiển motor

128

Page 131: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

Các lệnh điều khiển motor thường tồn tại dưới dạng một đường lệnh hay tổ hợp nhiều đường lệnh điều khiển thể hiện dưới dạng mức logic (L/H). Thông tường để điều khiển các motor thực hiện nhiều chế độ làm việc người ta thiết kế các mã lệnh điều khiển bằng cách tổ hợp tuyến tính các chân lệnh điều khiển từ vi xử lý.

4.9.3.3. Lệnh mở nguồn Diode laser

Để tăng tuổi thọ của diode laser cũng như bảo vệ mắt khi chưa có đĩa vào máy, người ta không cấp nguồn cho diode laser khi khay ở vị trí bên ngoài, bằng cách thiết kế đường lệnh mở nguồn cho diode laser.

Khi chân LD on = L, transistor Q dẫn, nguồn cấp cho diode laser, đây là mô hình chung nhất, thường gặp nhất trong các máy CD. Mạch tự động điều chỉnh công suất phát ta laser (APC) cơ bản thường được dùng trong các máy CD có cấu trúc như hình 4.43.

LD ON

CPU

Mạch APC

LD MD

Q +5V

Hình 4.42. Sơ đồ mạch điều khiển đóng mở diode laser

Lệnh điều khiển đóng mở nguồn cấp tia laser xuất phát từ vi xử lý gọi là LD on tác động ở mức thấp, thường được sử dụng mạch có cấu trúc như hình 4.43.

LD

C151

LD on MD

R152

R153

VR151

R102

R101 R103

R104

R105

R106

C105

C106 R107

Hình 4.43. Sơ đồ mạch điều điều chỉnh công suất phát tia laser

129

Page 132: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

4.9.3.4. Lệnh câm âm thanh

Lệnh mute (audio mute) xuất phát từ khối vi xử lý thường được dùng để làm câm tín hiệu âm thanh ngõ ra bằng cách ngắt âm thanh ở ngõ ra, nối mass ngõ ra hoặc khống chế khối DSP. Các dạng làm câm âm thanh ở ngõ ra.

Làm câm bằng mức logic: ở đây người ta sử dụng mức logic H hoặc L để ngắt âm thanh. Khi chân mute = H, Q1 ngưng, Q2 và Q3 dẫn, nối mass âm thanh ở ngõ ra.

Mute

CPU

Q1+5V

• • + -

• • + -

L- out

R- out

Q2

Q3

Hình 4.44. Sơ đồ mạch làm câm tín hiệu audio.

Làm câm bằng chương trình: phương pháp này được thực hiện trên các máy hiện đại. Khi sản xuất, người ta nạp chương trình ngắt vào bộ nhớ. Trong trường hợp ngắt, một chuỗi xung nối tiếp được cấp vào IC DSP, bằng cách tách dò xung làm ngắt (bằng số lượng xung, căn cứ vào sự đột biến về cạnh hoặc mức logic) mà khối DSP sẽ hoạt động hay bị khoá. Mô hình hoạt động của phương thức này được minh hoạ như hình 4.45.

CPU

DSP

Hình 4.45. Sơ đồ mạch làm câm tín hiệu audio.

4.9.3.5. Lệnh ra điều khiển khối giải mã hiển thị

Khối giải mã hiển thị (display) hiện nay được thiết kế theo hai dạng: bố trí ngay bên bên ngoài ngoài hoặc trong vi xử lý.

130

Page 133: Audio Video

Chương 4: Ghi phát tín hiệu audio và video

CPU +

DISPLAY DISPLAY

-Vcc 3VAC

G0 - Gm

S0 - Sm

3VAC

Hình 4.46. Sơ đồ mạch giao tiếp điều khiển và hiển thị.

Khối giải mã hiển thị bố trí chung với vi xử lý: khi đó ở bên ngoài người ta bố trí các chân giao tiếp với đèn hiển thị, đó là các chân G (grid), S (segment). Sơ đồ giao tiếp được minh hoạ như hình 4.46.

Khối hiển thị ở bên ngoài: trong trường hợp này người ta thiết kế các chân dữ liệu (aata), xung nhịp (clock), báo sẵn sàng (ready)…để giao tiếp giữa vi xử lý và mạch giải mã hiển thị (display decoder). Mô hình hoạt động được biểu diễn như hình 4.47.

DECODER

DISPLAY

-Vcc VAC

G0 - Gm

S0 - Sm

VAC

Data Clock

CPU

5V

. Hình 4.47. Sơ đồ mạch giao tiếp điều khiển và hiển thị

131

Page 134: Audio Video

Chương 5: Nén dữ liệu audio và video

Chương 5

NÉN DỮ LIỆU AUDIO VÀ VIDEO 5.1. GIỚI THIỆU

Tín hiệu audio và video khi biến đổi thành tín hiệu số thì dung lượng dữ liệu là rất lớn, làm ảnh hưởng đến việc lưu trữ cũng như truyền dẫn tín hiệu. Số lượng dữ liệu được tạo ra bởi ADC của tín hiệu audio và video nhiều đến mức audio và video số sẽ không sử dụng được nếu dữ liệu này không giảm xuống. Thực tế, khả năng nén dữ liệu audio và video là một trong những phương pháp cho phép hệ thống số sử dụng ít dải band tần hoặc khả năng lưu trữ nhưng đồng thời lại tạo ra chỉ tiêu cao hơn và giá thấp hơn hệ thống analog.

5.2. CÁC THUỘC TÍNH NÉN

Những minh họa trên hình 5.1, nén dữ liệu luôn được thực hiện hai quá trình bổ sung nén và giải nén. Nén thường chỉ được thực hiện trong những phần của hệ thống có sẵn khả năng chứa dữ liệu hay giới hạn tốc độ dữ liệu như các kênh thông tin hay thiết bị lưu trữ. Bộ phận nén hoạt động ở đầu ra của bộ phận hệ thống bị nén, và bộ phận giải nén hoạt động tại điểm mà dữ liệu phải ngược trở lại định dạng ban đầu. Bộ phận nén và giải nén có thể được đặt trên cùng một box hoặc ở khoảng cách xa nhau, ví dụ như khi dữ liệu được nén để phát quảng bá tới nhiều người sử dụng ở những địa điểm khác nhau. Mỗi người sử dụng phải giải nén trước khi sử dựng dữ liệu.

Nén Giải nén Kênh truyềnDữ liệu đầu vào

Dữ liệu đầu ra

Hình 5.1. Quá trình nén dữ liệu

5.2.1. Các thuật toán

Việc mô tả chi tiết về mặt kỹ thuật của kỹ thuật nén được gọi là thuật toán. Một thuật toán thường được miêu tả theo phương diện toán hạng, tuy nhiên các phương tiện khác như sơ đồ khối, biểu đồ xác định thời gian cũng có thể được sử dụng. Mặc dù số lượng các phương pháp nén chung bị giới hạn, do vậy dẫn dến hiện tượng tồn tại một số lượng lớn các thuật toán. Do các bộ nén và giải nén đều phải thực hiện quá trình xử lý tương đương đối với hệ thống, vấn đề chuẩn hóa các thuật toán trở nên rất quan trọng.

132

Page 135: Audio Video

Chương 5: Nén dữ liệu audio và video

5.2.2. Nén tổn hao và nén không tổn hao

Một ưu thế lớn của hệ thống số là các nhà thiết kế hệ thống được phép chọn khả năng tái tạo dữ liệu (và thông tin mà nó biểu thị ) một cách hoàn hóa. Các phương pháp mã hóa và phát hiện sửa lỗi giúp các hệ thống lớn lưu trữ, xử lý, và truyền dữ liệu mà không gây lỗi cho dù nó phải thực hiện bao nhiêu lần đi nữa. Đây là cơ sở cho hệ thống máy tính tài chính trên toàn thế giới, xử lý hàng tỷ đô la mà không nhầm lẫn một đồng xu nào. Thậm chí trong hệ thống này, có thể sử dụng nén dữ liệu nhưng phải là nén không tổn hao tức là phương pháp nén sẽ không gây ra bất cứ một tổn hao nào cho dữ liệu. Đây là khả năng hoàn toàn có thể bởi vì hầu hết dữ liệu thật đều có chứa các mô hình lặp lại của một vài dạng mà nén mà bộ xử lí có thể tìm ra và sau đó sắp xếp để truyền một cách có hiệu quả hơn. Nhìn chung, thuật toán nén không tổn hao không phụ thuộc vào việc nhận biết bất cứ thông tin gì về dữ liệu sẽ được truyền-nó sẽ hoạt động với bất cứ loại dữ liệu nào, nhưng chỉ tiêu (cấp độ nén) có thể phụ thuộc vào một vài con số thống kê dữ liệu.

Nén không tổn hao được sử dụng cho audio và video nhưng khả năng của nó rất hạn chế. Hầu hết kĩ thuật nén audio và video đều là nén tổn hao, tương đương với việc một số dữ liệu có thể bị tổn hao hoặc thay đổi. Tuy nhiên, tên của trò chơi là để tìm những dữ liệu có thể bị loại bỏ bởi bộ xử lí nén nhưng sẽ không ảnh hưởng đến hình dạng của ảnh hay âm thanh đến tay người nghe khi tín hiệu được tái tạo lại để hiển thị. Nếu tổn hao hoạt động bởi vì các tín hiệu audio và video số có thể chứa thông tin đóng góp vào quá trình tái tạo âm thanh như khi được nhìn hoặc nghe sử thật bởi một người nào đó. Sơ đồ nén tổn hao phụ thuộc vào hiểu biết về kiểu dữ liệu, định dạng và sử dụng của nó.

Tiêu chí trên đây cho nén tổn hao không chỉ là mối quan tâm duy nhất ; cấp độ tổn hao có thể chấp nhận được phụ thuộc vào quá trình nào sẽ được sử dụng nén trong một hệ thống. Ví dụ, trong quá trình sản xuất và sản xuất hậu kì, rất ít tổn hao có thể được chấp nhận trước khi nó bắt đầu ảnh hưởng không tốt tới quá trình xây dựng chương trình. Do vậy mà nhà sản xuất sẽ không chấp nhận nén tổn hao, tại đầu cuối của hệ thống sau cho hình ảnh được rõ ràng đến người xem.

5.2.3. Nén đối xứng - không đối xứng

Các kỹ thuật nén có sự tham gia của một lượng xử lý nào đó để nén dữ liệu và sau đó, lượng xử lý cần nhiều hơn để giải nén dữ liệu ở đầu cuối của hệ thống. Các quá trình này thường cần tới số lượng và số lần tham gia rất đáng kể của phần cứng cũng như phần mềm để thực hiện mỗi quá trình. Nén đối xứng có nghĩa là quá trình nén và giải nén gần bằng nhau về lượng tham gia của phần cứng, phần mềm và thời gian xử lý. Ví dụ, nếu thỏa mãn việc nén video trong thời gian thực trên một máy

133

Page 136: Audio Video

Chương 5: Nén dữ liệu audio và video

tính cá nhân và sau đó phát lại trên cùng hệ thống thì khi đó thuật toán đối xứng là hoàn toàn thích hợp.

Tuy nhiên, thuật toán đối xứng hoạt động trên một hệ thống nhỏ phải đặt giới hạn cho độ phức tạp của hệ thống được sử dụng. Như sẽ thấy sau này, hiệu quả của nén có thể được cải thiện bằng cách sử dụng những thuật toán phức tạp hơn, thậm chí ngay khi giải nén được thực hiện trên một hệ thống nhỏ. Điều này dẫn đến khả năng xảy ra các thuật toán không đối xứng, tức là quá trình nén yêu cầu một hệ thống lớn, chuyên dụng và có thể không hoạt động trong thời gian thực, nhưng quá trình giải nén lại được thực hiện trong thời gian thực, trên một hệ thống nhỏ, có giá thành thấp. Nén không đối xứng rất quan trọng đặc biệt trong các hệ thống phát lại chúng như truyền hình quảng bá hay CD-ROM. Nhiều khi, nén có thể được thực hiện trước trên hệ thống lớn, được lưu trữ, và sao chép để sau này phân phối cho các phương tiện truyền tới người sử dụng.

5.2.4. Cấp độ nén

Sẽ thỏa mãn nếu như việc xác định số lượng cấp độ nén thực hiện bởi một hệ thống đặc biệt và sau đó so sánh với các hệ thống khác theo cách này. Người ta thường hay đề cập đến tỷ lệ nén, là tỷ lệ giữa dữ liệu vào và dữ liệu ra của quá trình nén. Với kỹ thuật nén không tổn hao, đây là phương pháp rất hiệu quả khi nội dung thông tin của dữ liệu không đổi. Tuy nhiên, tỷ lệ nén là một thuật ngữ không thỏa mãn với nén không tổn hao, trừ khi nó có đủ thông tin bổ xung về số lượng tổn hao tín hiệu do nén gây ra.

Một cách tốt hơn để so sánh các sơ đồ nén tổn hao là trích chỉ tiêu tín hiệu của hệ thống ở tốc độ dữ liệu đã cho hoặc tốc độ dữ liệu cho mức xác định của chỉ tiêu kỹ thuật. Tuy nhiên, điều này trở nên khó khăn bởi vì nén có thể đưa vào các thông số rất khó xác định số lượng. Cuối cùng, có nhiều cách đánh giá chủ quan yêu cầu để so sánh giữa các hệ thống nén tổn hao, nhưng phải tránh việc trích dẫn tỷ số nén.

Nhiều trường hợp đòi hỏi hệ thống video số hoạt động với tốc độ dữ liệu ổn định. Ví dụ, một hệ thống truyền dẫn có thể có tốc độ dữ liệu không đổi, môi trường tốc độ không đổi như CD-ROM hoặc các phương tiện phân phối khác. Thuật toán nén có tổn hao có thể được thiết kế cho tốc độ dữ liệu cố định bằng cách cho phép biến thiên một lượng của độ giảm chất lượng ảnh. Điều ngược lại cũng có thể xảy ra, chất lượng ảnh ổn định với tốc độ dữ liệu thay đổi. Trong cả hai trường hợp, các quyết định điều phải thực hiện một cách chính xác trong quá trình nén.

5.3. CÁC PHƯƠNG PHÁP CHUNG

Một số phương pháp nén chung cùng tồn tại, song các thuật toán chỉ sử dụng một trong số đó. Phần này sẽ đề cập đến một trong những phương pháp chung này

134

Page 137: Audio Video

Chương 5: Nén dữ liệu audio và video

5.3.1. Các phương pháp không tổn hao

Mặc dù nén không tổn hao không thường được sử dụng cho audio hay video song những phương pháp như thế vẫn được sử dụng như một phần của thuật toán tổn hao. Mọi phương pháp không tổn hao đều phụ thuộc vào những con số thống kê dữ liệu nào đó mặc dù chúng không cần biết rõ sẽ biểu thị dữ liệu nào. Phụ thuộc vào các ứng dụng, do vậy nhiều phương pháp không tổn hao đôi khi gay ra tổn hao cách lấy xấp xỉ trong các tính toán của mình.

5.3.1.1 Mã độ dài thay đổi

Dữ liệu nói chung có thể có chứa các giá trị lặp lại một số lần, ví dụ như trong một hình được ghi biểu đồ mẫu có một vùng đồng màu. Các pixel kề nhau trong vùng này sẽ có cùng giá trị. Dữ liệu này có thể được nén bằng cách nhận biết khi nào thì một chuỗi các giá trị lặp lại xảy ra và truyền giá trị một lần cùng với mã thứ hai biểu thị việc tính toán số lần giá trị lặp lại. Đây được gọi là mã có độ dài thay đổi (RLE). RLE phải có phương tiện để nhờ đó bộ giải nén có khả năng nhận biết khi nào giá trị RLE xảy ra. Điều này thường được thực hiện bằng cách tạo ra một giá trị dự trữ, giá trị này không bao giờ hoặc hiếm khi xuất hiện trong các giá trị của dữ liệu. Ví dụ, giá trị 25510 trong một hệ thống 8 bit có thể được dự trữ với mục đích này. Giá trị dự trữ đó được gọi là mã thoát. Khi bắt gặp mã thoát, bộ giải nén sẽ biến hai giá trị tiếp theo biểu thị một giá trị pixel và số lần lặp lại của nó. Điều này được minh họa trên hình 5.2.

010 022 079 000 010 063 063 063 063 063 063 241 254 198 087

010 022 079 000 010 255 063 006 241 254 198 087

6 giá trị lặp

Đếm lặp

Giá trị

Mã thoát

Hình 5.2. Ví dụ về mã độ dài thay đổi

Do vậy, một đối tượng đơn lặp lại sẽ lấy ba từ dữ liệu để truyền, vì vậy sẽ không có độ tăng ích khi sử dụng phương pháp này cho đến khi có hơn ba từ lặp lại. Lưu ý là không cần thiết phải ngăn dữ liệu đầu vào có chứa giá trị mã giải thoát đã dự trữ. Nếu điều này xảy ra, hai mã thoát có thể được truyền cùng nhau để ấn định là từ dữ liệu có giá trị thoát.

5.3.1.2. Mã thống kê

135

Page 138: Audio Video

Chương 5: Nén dữ liệu audio và video

Nén dữ liệu cũng có thể thực hiện bằng cách quan tâm đến việc thống kê của dữ liệu đầu vào. Nếu biết chắc chắn các giá trị từ được sử dụng nhiều hơn giá trị từ khác, người ta có thể thiết lập một hệ thống mã để chuyển các giá trị sự kiện xuất hiện nhiều với một mã ngắn (ít bit), ngược lại các giá trị xuất hiện ít hơn có thể sử dụng các mã bit dài hơn. Một hệ thống mã sử dụng nguyên lý này là mã Morse trong điện báo. Trong các hệ thống số, phương pháp phổ biến nhất là nguyên lý này là dùng mã Huffman, nó được sử dụng rộng rãi trong các thuật toán nén video. Mã Huffman hoạt động ở mức bit, một ví dụ trên hình 5.3. Hiệu quả của mã phụ thuộc vào khả năng nhận biết trước xác suất xuất hiện của sự kiện PS của mỗi giá trị dữ liệu. Một cây nhị phân được tạo từ các giá trị sắp xếp theo bậc giảm dần của xác suất. Các mã được tạo bằng cách đọc từ đầu ra của cây nhị phân (từ điểm A) ngược trở lại đầu vào của cây nhị phân, và lấy các giá trị bit từ mỗi nhánh. Giống như phương pháp thích ứng mô hình, bộ nén phải thiết lập một bảng các thông số hay bảng tra cứu và gửi kèm theo dữ liệu tới bộ giải nén. Mã thống kê cũng được gọi là mã entropy.

Hình 5.3. Ví dụ mã hóa Huffman giá trị 3 bit

0 0,04

1 0,15

2 0,10

3 0,10

4 0,08

5 0,07

6 0,05

7 0,05

Giá trị Ps

0

100

101

1100

1101

1110

11110

11111

Giá trị 3 4 0 0 0 1 0 21bit

Mã 1100110 15bit10001000

Hình 5.3. Ví dụ mã Huffman giá trị 3 bit

5.3.2 Các phương pháp tổn hao

Các phương pháp nén tổn hao vốn cần phải quan tâm tới định dạng dữ liệu cũng như ý nghĩa ứng dụng của tất cả các bit hoặc từ trong dữ liệu. Việc quan tâm đến người sử dụng dữ liệu và khả năng nhìn hoặc nghe của họ ở điều kiện nhìn xác

136

Page 139: Audio Video

Chương 5: Nén dữ liệu audio và video

định cũng rất cần thiết. Ví dụ, nếu video chỉ được xem ở tỉ lệ nhìn rộng, một số thông tin chi tiết có thể bị khử một cách cẩn thận mà người xem không thể nhận biết được. Mặc khác, nếu các điều kiện nghe và nhìn được yêu cầu nhiều hơn, rất ít thông tin bị mất mà không được báo. Trong trường hợp đó phải cần đến các phương pháp nén tinh xảo hơn.

5.3.2.1 Cắt bỏ

Trong các phương pháp khử dữ liệu không cần thiết gồm có hai phương pháp là cắt bỏ và lấy mẫu con. Cắt bỏ là xóa đi một vài trong số những bit kém hiệu quả nhất từ các mẫu. Đây chính là tái lượng tử đã được đề cập trong chương trước và nó phải được thực hiện riêng để duy trì càng nhiều thông tin càng tốt.

Với những điều kiện lý tưởng, các mẫu thành phần video phải có tối thiểu là 8 bit/pixel, nhưng dưới những điều kiện xem kém lý tưởng hơn, phải giảm tới 6 bit/pixel mà không gây ra sự suy giảm đáng kể nào. Bởi vì SNR lượng tử sẽ giảm 6dB trong mỗi bit được khử, cho nên việc cắt bỏ không phải là một giải pháp tốt, hơn nữa giảm dữ liệu sẽ kéo theo chỉ tiêu giảm.

Quá trình lấy mẫu audio chất lượng cao cần đến ít nhất là 16 bit/mẫu. Tuy nhiên, rất nhiều hệ thống audio có thể hoạt động hiệu quả với mức thấp như 8 bit/mẫu, đặc biệt đối với lời nói, tại đó dải thông có thể bị hạn chế và tiêu chuẩn chính đề ra là dễ hiểu.

5.3.2.2. Lấy mẫu con

Các mẫu được sử dụng rộng rãi cho thành phần độ chói nhiều hơn là cho các thành phần video hiệu màu. Kỹ thuật này dựa trên cơ sở thực tế là mắt người có độ phân giải với màu sắc kém hơn với độ chói, vì vậy dải tần tín hiệu màu (tỷ lệ lấy mẫu) có thể được giảm mà người xem không nhận thấy được sự suy giảm. Đây được gọi là lấy mẫu con hoặc là giảm tỷ lệ lấy mẫu và như trong truyền hình analog, đó là một phần của hầu hết các hệ thống nén video số. Lấy mẫu con giảm giới hạn Nyquist tới giá trị được biểu thị bởi tỷ lệ lấy mẫu con và cũng phải cần đến quá trình lọc riêng để tránh chồng phổ.

5.3.2.3 Các bảng màu

Đối với một vài mục đích của video, có thể giảm số lượng bit/pixel bằng cách biến bản thân giá trị pixel thành một chỉ số trong bảng các giá trị màu được chọn lọc từ một số lượng bit/pixel rất lớn. Ví dụ, tiêu chuẩn PC VGA cung cấp một chế độ 8 bit/pixel có khả năng lựa chọn 256 màu sắc từ một bảng màu 18 bit. Các hệ thống khác sử dụng các số bit khác nhau, 256 màu sẽ làm cho việc tái tạo ảnh tự nhiên kém hơn nhưng, dưới những điều kiện thích hợp, việc tái tạo có thể có kết quả tốt đáng ngạc nhiên. Điều này đặc biệt đúng nếu các màu sắc của bảng được chọn lọc

137

Page 140: Audio Video

Chương 5: Nén dữ liệu audio và video

cho từng ảnh một. Có thể cải thiện được ảnh tốt hơn bằng cách sử dụng kỹ thuật dithering để tạo được các màu không có trong bảng bằng cách thay đổi màu sắc ở các pixel kề nhau. Nếu người xem ở khoảng cách xa vừa đủ, họ sẽ không nhận thấy các pixel độc lập, mắt sẽ tổng hợp các pixel kề nhau thành những màu sắc phối hợp.

Tuy nhiên các bảng màu có những hạn chế rất nghiêm trọng nếu áp dụng cho ảnh động, bởi vì chuyển động của các ảnh tự nhiên sẽ tạo ra các hiệu ứng giả mà người xem có thể nhận thấy rõ (ví dụ như hiệu ứng đường viền). Đối với ảnh động, tốt hơn hết là sử dụng màu trực tiếp với nhiều số bit/pixel hơn (ví dụ 16) và sử dụng các phương pháp nén khác.

5.3.2.4. Mã vi sai

Đối với cả audio và video, lượng thay đổi biên độ từ mẫu này tới mẫu khác khiến sự phân bổ xác suất giảm theo biên độ. Nếu tính đến điều này thì người ta có thể nén bằng cách ghi mã vi sai giữa các mẫu hơn là bản thân chúng. Nếu các vi sai biên độ lớn ít xảy ra, các giá trị vi sai có thể được truyền với số bit nhỏ hơn số bit chứa trong mẫu ban đầu. Quá trình ghi mẫu này được gọi là PCM vi sai (DPCM) và là thành viên của một mã lớn hơn đó là mã dự đoán. Trong DPCM đơn giản, việc dự báo một mẫu được dựa trên mẫu trước cộng với một số gia.

47 53 58 60 57 50 40 30 26 26 26 26 26 27 27 28 29 30 32 47 80 96 90 61

0

50

Khác biệt 6 5 2 -3 -7 -10 -10 -4 0 0 0 0 1 1 1 2 15 23 16 -6 -29

Làm tròn 4 bit 6 5 2 -3 -7 -7 -7 -7 -2 0 0 0 1 1 1 2 8 8 8 8 8

47 53 58 60 57 50 42 35 28 26 26 26 26 27 27 28 29 30 32 40 48 56 64 720

50

Quá tải

Ban đầu

Hình 5.4 PCM vi sai: a)mã hoá DPCM;b)giải mã DPCM

138

Page 141: Audio Video

Chương 5: Nén dữ liệu audio và video

Trong DPCM, khi một giá trị vi sai lớn xuất hiện, hệ thống DPCM sẽ bị quá tải (slope overload), có thể gây ra hiện tượng méo nhất thời khá nghiêm trọng, xem hình 5.4(b). Lưu ý là một vài giá trị vi sai đã được sửa để giúp hệ thống khôi phục lại từ hiện tượng quá tải. Điều này được thực hiện bằng kiến trúc dự đoán được miêu tả dưới đây.

Một dạng tiến bộ hơn của DPCM đã được phát triển nhằm cải thiện chỉ tiêu kỹ thuật với các giá trị vi sai thay đổi, mối quan hệ giữa các bit của giá trị vi sai và vi sai thực mà chúng biểu diễn được điều chỉnh dựa vào mức độ các giá trị vi sai lớn tín hiệu. Ví dụ, một hệ thống tiêu biểu có thể có 4 bit cho các giá trị vi sai, nó có khả năng cho phép 16 bước tái tạo khác nhau. Tuy nhiên, nếu các vi sai tín hiệu hoạt động ở các mức thấp 16 bước tái tạo vi sai này có thể được làm nhỏ đi. Nếu các vi sai trong tín hiệu tăng, một cơ cấu thích ứng sẽ tăng kích cỡ của các bước lên, vì vậy các mức 16 bước có thể truyền vi sai lớn. Đây được gọi là DPCM thích ứng (ADPCM) thường được sử dụng cho nén audio. ADPCM có thể thực hiện nén theo tỉ lệ 4:1 trên các tín hiệu audio nói chung. Vẫn có thể có một vài hiện tượng méo xảy ra khi cơ cấu thích ứng dịch chuyển kích cỡ của các bước thực hiện, nhưng khi tính đến cấp độ nén, điều này có thể chấp nhận được cho nhiều mục đích.

5.3.2.5 Mã dự đoán

Hình 5.5 là một sơ đồ khối minh họa cách thức DPCM được sử dụng phổ biến như cơ cấu ghi mã dự đoán. Khối bộ dự đoán thực hiện quá trình dự đoán mẫu tiếp theo từ mẫu hoặc các mẫu trước. Kết quả của bộ dự đoán sau đó sẽ được so sánh với mẫu tiếp theo và vi sai được truyền đi. Bên thu, sau đó có thể tái tạo lại các mẫu bằng cách sử dụng các giá trị vi sai và một modul bộ dự đoán giống bên phát.

Bộ lượng tử

Bộ dự đoán

Đầu vào Đầu ra +

-

Bộ dự đoán

Đầu vào Đầu ra +

+

a)

b)Hình 5.5. Mã dự đoán: a) mã hóa, b) giải mã

139

Page 142: Audio Video

Chương 5: Nén dữ liệu audio và video

Đối với DPCM, bộ dự đoán chỉ đơn giản là so sánh mẫu trước với mẫu tiếp theo để tạo ra giá trị vi sai, giá trị vi sai sẽ được truyền đi. Tuy nhiên, người ta có thể xây dựng các bộ dự đoán phức tạp hơn, ví dụ như bộ dự đoán đường dốc đánh giá mẫu tiếp theo dựa vào đường dốc giữa hai mẫu trước…Sự thành công của phương pháp này phụ thuộc vào quá trình phát triển thuật toán dự đoán dùng để tính toán các đặc tính của dữ liệu nén.

5.3.2.6. Mã lời nói

Với đặc thù của điện thoại, rất nhiều phương pháp đã được phát triển đặc biệt cho việc ghi mã theo kỹ thuật số của giọng nói hay lời thoại. Tiêu chuẩn cho điện thoại là PCM tuyến tính với quá trình lượng tử hóa luật μ ở 8000 mẫu/giây và 8 bit/mẫu, cho tốc độ dữ liệu là 64 kbit/giây. Tuy nhiên, nhiều phương pháp nén tiên tiến đôi khi được sử dụng để giảm tốc độ dòng bit cho những mục đích riêng biệt. Phương pháp tốt nhất cho ghi mã lời nói là dựa vào lấy mẫu dải âm thoại của người cho hệ thống điện tử. Kỹ thuật này có thể hoạt động rất tốt với lời nói, nhưng nó không hiệu quả đối với các âm thanh nói chung. Các phương pháp này được trình bày trong lý thuyết điện thoại.

5.3.2.7. Mã chuyển đổi

Xử lý trực tiếp với các mẫu tín hiệu ban đầu không phải là cách tốt nhất để biểu lộ sự dư thừa về tín hiệu có thể bị loại bỏ trong khi nén đặc biệt với video, vì đây thường là tín hiệu hai hoặc ba chiều (ngang, dọc, và thời gian). Do vậy phải nhờ đến một cách khác gọi là chuyển đổi, là sự biểu diễn xen kẽ thông tin có thể thực hiện bằng quá trình xử lý toán học. Mọi chuyển đổi đều phải thực hiện cả quá trình ngược lại quá trình chuyển đổi được thực hiện trong quá trình giải nén.

Đối với các ảnh, việc coi khối pixel hai chiều là một đơn vị rất hữu ích. Một sự lựa chọn đơn giản là lấy 8 pixel ở mỗi hướng, tổng số là 64 giá trị. Hãy quan sát về mặt không gian, một khối 8×8 chỉ là một mảnh nhỏ của một hình, thậm chí còn không thể nhận biết được cái gì, nhưng bằng cách chuyển đổi nó sang miền tần số, các thành phần được quan sát thấy hết sức quan trọng đối với công đoạn tái tạo hoàn chỉnh. Điều này chủ yếu dựa trên nguyên tắc các tần số không gian cao khó nhìn thấy được hơn so với các tần số không gian thấp.

Sự chuyển đổi đầu tiên áp dụng lý thuyết này là chuyển đổi cosin rời rạc (DCT), có liên quan đến chuyển đổi Fourier thường được sử dụng để trích các thành phần tần số của một dạng sóng tùy ý. Chuyển đổi Fourier hoạt động trên những dạng sóng liên tục (analog) nhưng phiên bản hoạt động trên một nhóm các mẫu lấy từ một dạng sóng tương tự cũng có thể đáp ứng được. Sự chuyển đổi dựa vào các mẫu này đã cho ra tiền tố “rời rạc”. Chuyển đổi Fourier cho dù có rời rạc hay không thì cũng phát ra một tập hợp các thành phần tần số cosin và sin, có thể được quan sát

140

Page 143: Audio Video

Chương 5: Nén dữ liệu audio và video

giống như một tập hợp các thành phần tần số có các giá trị pha và biên độ. Có thể đơn giản hơn khi sự chuyển đổi Fourier rời rạc được thực hiện trên một tập hợp các mẫu dữ liệu tiếp theo các ảnh phản chiếu của chúng theo trục thời gian. Thành phần sin của chuyển đổi Fourier có thể hủy bỏ, chỉ để lại các thành phần cosin. Đây là chuyển đổi cosin rời rạc. Nó có đặc tính là một khối 8×8 của 64 mẫu được chuyển thành một khối 8×8 của thành phần cosin biểu thị tần số không gian ở hai chiều. Xét về mặt toán học, nó có thể được biểu thị dưới dạng:

( ) ( ) ( ) ( )⎥⎦⎤

⎢⎣⎡ +

⎥⎦⎤

⎢⎣⎡ Π+

= ∑∑= = 16

12cos16

12cos,)()(41,

7

0

7

0

πvyuxyxfvCuCvuFx y

(5.1)

Trong đó: là các chỉ số trong khối 8x8 của pixel.

u và v là là các chỉ số trong khối 8×8 của các hệ số đầu ra

( )2

1=wC với w=0

( ) 1=wC với w>0

Từ (5.1) diễn đạt thành lời có ý nghĩa là mỗi hệ số DCT được tính toán bằng cách lấy tổng của tất cả các mẫu đầu ra với một hàm trọng số cosin, hàm này phụ thuộc vào vị trí của hệ số ở mảng đầu ra và vị trí của mỗi mẫu trong mảng đầu vào. Đây là một phép tính đồ sộ ngay cả khi đã đơn giản hóa, nó vẫn thường được thực hiện trong một IC thông thường. Một vài đặc điểm của IC được minh họa trên hình 5.7. Đầu ra của quá trình xử lý DTC là một mảng 8×8 giá trị biểu thị biên độ các thành phần tần số không gian (5.7b) trong khối 8×8 đã được xử lý. Tại điểm này, quá trình xử lý DTC không tạo ra nén, có 64 pixel trong khối và hiện tại có 64 hệ số DTC. Tuy nhiên, các hệ số này lại tạo điều kiện thuận lợi cho quá trình xử lý tiếp theo trong quá trình nén.

50 20 10 0 0 2 0 0 30 15 12 0 0 0 0 0 12 11 10 0 0 1 0 0 5 6 0 0 0 3 0 0 0 3 4 0 3 0 0 0 2 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 0

50 20 30 12 15 10 0 12 11 5 0 6 10 0 0 2 0 0 0 3 2 0 0 4

0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 3 3 0 0 0 0 0 0 2 0 0 1 E0B

DCT

Tần số chiều ngang

Tần

số c

hiều

dọc

Hình 5.6. Chuyển đổi cosin rời rạc:a) khối 8×8 pixel, b)khối 8×8 hệ số, c) đọc ra zic-zag

141

Page 144: Audio Video

Chương 5: Nén dữ liệu audio và video

Việc xếp các hệ số theo trật tự tần số tăng dần là rất có ích như minh họa trên hình 5.6c, đây được gọi là xếp theo trật tự zic-zăc. Tại đó các thành phần tần số cao hơn thường là các giá trị 0 hoặc nhỏ hơn. Bởi vì các thành phần tần số này không quá quan trọng, nên chúng có thể được lượng tử hóa thô mà không cần mất nhiều thông tin trong hình. Vì vậy, chỉ cần thiết phải truyền các thành phần tần số có giá trị không phải là 0, và dữ liệu sẽ giảm một cách đáng kể. Ở một vài điểm nào đó, tất cả các hệ số đều là 0. Một dấu hiệu đánh dấu kết thúc khối (EOB) được đặt tại đó và cũng sẽ không có một giá trị nào được sử dụng nữa. Các hệ số còn lại thường được mã hóa với mã RLE entropy

5.3.2.8. Bù chuyển động

Ảnh động tạo ra sự dư thừa đáng kể từ khung hình này đến khung hình kế tiếp. Rất nhiều phần trong khung hình có thông tin không thay đổi, một vài phần có thể đứng im và các phần khác có thể là các phần của khung hình trước vừa dịch chuyển đi chút ít. Theo nguyên lý này, bất cứ thứ gì đã tồn tại trong khung hình trước đều không cần phải được truyền lại, nó chỉ cần được sao chép bằng máy thu hình từ một bản lưu trữ của khung hình trước. Chức năng chỉ ra cái mới hoặc cũ trong một khung hình được gọi là bù chuyển động. Đây là một trong những nhiệm vụ phức tạp nhất của nén video, thực tế hiệu quả của bù chuyển động luôn bị hạn chế do khả năng tính toán và tốc độ.

Khung hình trước

Khung hình hiện tại

Khung hình dự báo

Khung hình còn lại được truyền

_

Vector chuyển động

Hình 5.7. Bù chuyển động

142

Page 145: Audio Video

Chương 5: Nén dữ liệu audio và video

Cũng như với mã chuyển đổi, bù chuyển động được dựa vào quá trình xử lý ảnh trong khối. Đưa ra một khung hình (đầu tiên) hoàn chỉnh như là điểm xuất phát, các khối từ khung hình tiếp theo (thứ 2) được lấy và so sánh với các vùng của khung hình thứ nhất để xác định xem có điểm nào trùng khớp ở bất cứ vị trí nào trên khung hình thứ nhất hay không. (Khối có thể đã dịch chuyển giữa các khung hình). Nếu tìm thấy điểm trùng khớp, một vector chuyển động sẽ được tạo ra cho máy thu sử dụng để dự đoán vùng của khung hình thứ hai bằng cách sao chép nó từ khung hình thứ nhất. Biết rằng số lượng chuyển động giữa các khung hình thường không quá lớn nên chỉ cần thiết tìm kiếm một khu vực nhỏ xung quanh vị trí của khối được kiểm tra. Thậm chí như vậy, số lượng thao tác tính toán ở đây cũng rất lớn và có thể cần thiết phải hạn chế phạm vi tìm kiếm so với thực tế cần thiết. Các khối không được tìm thấy ở khung hình trước phải được mã hóa bằng các phương tiện khác và truyền đi đầy đủ.

Hình 5.7 là sơ đồ của quá trình này, nó minh họa hoạt động trong một cảnh chỉ có một vật chuyển động nhỏ (một con chim) nhưng có camera dõi theo. Điều này có nghĩa là cảnh phải trải qua một hiệu ứng quay quét, ở đây hầu hết các khối của khung hình mới tồn tại ở những vị trí tương tự trong khung hình trước, vì vậy có thể sử dụng cấp độ nén cao hơn cho loại cảnh này.

5.4. CÁC THUẬT TOÁN THÔNG DỤNG

Các nguyên tắc được bàn trong phần trước nhìn chung đều được sử dụng với các thuật toán thông dụng. Phần này sẽ đề cập đến một số thuật toán để chỉ ra cách thức hoạt động của nó.

5.4.1. JPEG

Ảnh động chỉ là một chuỗi các hình đang được truyền ở tốc độ đủ để người xem có thể nhìn thấy như là một ảnh chuyển động liên tục. Một phương pháp nén ảnh động là nén từng ảnh một và truyền kết quả thu được thành một dòng bit đơn. Bất cứ một phương pháp nén hình ảnh chuyển động nào cũng có thể được sử dụng nhưng một trong những phương pháp nén tốt nhất đã được phát triển bởi JPEG của ISO/IEC và được gọi là nén JPEG.

Tiêu chuẩn nén ảnh JPEG không phải là một thuật toán đơn lẻ mà giống như là một hộp công cụ của các kỹ thuật nén, nó có các chế độ (mode) và các sự lựa chọn với các ứng dụng nén hình dạng chuyển động liên tục trên phạm vi lớn. Có thể lựa chọn cả nén tổn hao và nén không tổn hao, số bit/mẫu khác nhau, các độ phân giải khác nhau, và một vài thuật toán khác nhau. Có bốn chế độ hoạt động:

Không tổn hao-ảnh được tái tạo lại một cách chính xác. Toàn bộ các chế độ khác bị tổn hao.

143

Page 146: Audio Video

Chương 5: Nén dữ liệu audio và video

Liên tục-chế độ này mã hóa theo trật tự ảnh đã được quét, đây là cách thông thường mà ảnh vẫn được xử lý.

Tăng dần-đây là phương pháp mã hóa đa đường truyền đi một ảnh thô trước tiên, ảnh này sẽ nhanh chóng được hiển thị ở máy thu. Tiếp sau đó là các quá trình mã hóa lặp lại với độ phân giải theo thứ tự tăng cao hơn, có thể được hiển thị nhằm đưa ra chất lượng ảnh ngày càng tốt hơn.

Thứ bậc-trong chế độ này, ảnh được mã hóa ở nhiều độ phân giải, người sử dụng có thể chọn độ phân giải để hiển thị ảnh.

Việc cung cấp sự lựa chọn cấu hình trong JPEG có nghĩa là tiêu chuẩn có thể phù hợp cho nhiều ứng dụng khác nhau và có thể nâng cấp trong tương lai để có thể tiếp tục nghiên cứu và phát triển công nghệ nén hình. Đây là đặc điểm rất quan trọng và thỏa mãn đối với các tiêu chuẩn nén.

Mã hóa JPEG

Tạo định dạng xen kẻ

Bảng đặc điểm kỹ

thuật

Định dạng giải mã

Giải mã JPEG

Bảng đặc điểm kỹ

thuật

ảnh nguồn

ảnh tái tạo

Hình 5.8. Kiến trúc JPEG

Hình 5.8 là một sơ đồ khối của kiến trúc JPEG. Ảnh nguồn được mã hóa dưới sự điều khiển của một hoặc nhiều bản đặc điểm kỹ thuật. Dữ liệu đã mã hóa được đặt vào định dạng xen kẽ JPEG để phát tới người sử dụng. Đây là định dạng có thể được lưu trữ hoặc truyền. Ở đầu thu, bảng đặc điểm kỹ thuật và dữ liệu mã hóa được tách riêng và quá trình xử lý ngược lại được thực hiện để khôi phục ảnh ban đầu.

Tất cả các loại hình mã hóa, trừ chế độ không tổn hao, đều dựa vào DCT. Hình 5.9 minh họa quá trình xử lý chi tiết cho chế độ hoạt động liên tục. Mỗi thành phần của hình nguồn được chia thành các khối 8x8 pixel. Quá trình xử lý DTC trước được sử dụng cho khối này. Việc này cho kết quả là một số DC và 63 thành phần tần số cao hơn, mỗi một thành phần sẽ được lượng tử hóa theo một bảng 64 giá trị lượng tử.

Bảng lượng tử này là đặc điểm kỹ thuật đầu tiên của thuật toán; nó phải do người sử dụng cung cấp và trở thành một phần của dòng dữ liệu được truyền tới máy thu. Người sử dụng có thể điều khiển sự thỏa hiệp giữa cấp độ nén và chất lượng của ảnh bằng cách xác định bảng. Nội dung của bảng lượng tử là kích cỡ của

144

Page 147: Audio Video

Chương 5: Nén dữ liệu audio và video

bước sẽ được sử dụng; các giá trị của hệ số DCT được chia cho kích thước của bước tương ứng và kết quả được làm tròn tới số bit đã xác định. Vì vậy, giá trị lượng tử lớn hơn sẽ cho kết quả là lượng tử thô và điều đó có nghĩa là các giá trị lớn hơn sẽ được làm tròn về 0.

DCT trước

Trật tự zig-zac

Lượng tử

Mã hóa entropy

Bảng đặc điểm kỹ

thuật

Bảng đặc điểm kỹ

thuật

Xác định xen kẻ

Nguồn từ khối 8x8

Hình 5.9. Xử lý JPEG cho chế độ hoạt động liên tục

Tiếp theo quá trình lượng tử hóa, hệ số DC được mã hóa ngược lại với các hệ số DC của khối hình trước, 63 hệ số đã lượng tử sau đó được đặt theo trật tự zic-zac và được mã hóa thống kê theo cả phương pháp Huffman hoặc theo phương pháp số học như trình bày trong tiêu chuẩn. Trong cả 2 trường hợp, phải cần đến một đặc điểm kỹ thuật của bảng thứ hai để xác định ghi mã thống kê. Một lần nữa người sử dụng có thể thay đổi bảng này để điều khiển chỉ tiêu nén.

Bước cuối cùng của quá trình mã hóa là tập hợp dữ liệu nén và đặc điểm kỹ thuật của bảng vào một dòng bit một chiều theo định dạng xen kẽ, điều này được minh họa trên hình 5.10. Các phần khác nhau của dòng bit xen kẽ bị làm mất tính tuyến tính bởi các mã đã đánh dấu, các mã này bao gồm hai byte- byte thứ nhất là tất cả các số 1 (0xFF trong mã HEX) và byte thứ hai là bất cứ giá trị nào khác ngoài 0 hoặc 0xFF.(Lưu ý rằng nếu một byte 0xFF xảy ra trong dữ liệu của dòng bit, nó sẽ được mã hóa như là 0xFF00 để tránh bị coi như là một dấu hiệu). Các dấu này trông giống như các mã giải thoát đã được mô tả cho RLE trong phần 5.3.1.1

SO

I

SO

F Header khung

Quét 1 …..Quét 2 Quét n

EO

I

SO

S Header

quét Dữ liệu mã hóa entropy

Hình 5.10. Định dạng xen kẻ JPEG

145

Page 148: Audio Video

Chương 5: Nén dữ liệu audio và video

Byte thứ hai của dấu hiệu xác định kiểu dấu hiệu và một vài kiểu dấu hiệu có các thông số bổ sung kèm theo. Trong trường hợp này hai byte đầu tiên sau dấu hiệu luôn chỉ rõ độ dài của khối thông số tiếp theo. Vì vậy, ví dụ một header của khung hình có một dấu hiệu đặc biệt được xác định, và sau đó một thông số độ dài sẽ chỉ rõ có thêm bao nhiêu byte trong header. Đây là một phương pháp thông dụng để xác định các header của dòng bit.

Như minh họa trên hình 5.10, dữ liệu của hình đã mã hóa cho một hình đơn ( khung hình) được truyền đi trong khối được gọi là quét, (đối với các định dạng DCT liên tục) bao gồm tất cả thành phần của ảnh dưới dạng được chèn. Các đặc điểm kỹ thuật của bảng được phát đi trước tiên, vì vậy chúng có thể đáp ứng cho quá trình giải nén dữ liệu quét xảy ra sau này. Header của khung hình và header quét có chứa chi tiết định dạng ảnh và quá trình giải nén của nó.

Nén JPEG có thể thực hiện nén dữ liệu ảnh với bộ phân giải tự nhiên cao,theo tỉ lệ 10:1 hoặc hơn với sự suy giảm có thể nhìn thấy rõ rệt. Một vài ảnh có thể được nén nhiều còn một vài ảnh khác có thể được nén ít và tất nhiên, các điều kiện nhìn cũng sẽ ảnh hưởng đến cấp độ nén có thể chấp nhận được.

5.4.2 M-JPEG

Định dạng giao diện JPEG hỗ trợ cho nhiều quá trình quét trong một khung hình và nếu các quá trình quét tương ứng với các khung hình của một dòng ảnh động. Tức là khi ấy ảnh động được nén. Do một dòng chuyển động thường phải chịu sự suy giảm ảnh nhiều hơn một ảnh thường bởi vì hiệu ứng trung bình của khung hình có thể đạt được trong nhiều trường hợp là rất nhiều hơn cả tỉ lệ nén 10:1 đã đề cập ở trên. Phương pháp này đôi khi được sử dụng do có thể thực hiện những ý đồ nén quan trọng với quá trình xử lý đơn giản hơn so với hệ thống nén chuyển động phức tạp như MPEG. Đây được gọi là JPEG chuyển động hay M-JPEG. Bởi vì tiêu chuẩn JPEG được sử dụng chỉ cho hình nên có không có phần cung cấp cho thành phần audio được yêu cầu cùng với ảnh động.

5.4.3 MPEG

Nén JPEG quan tâm đến nén sự dư thừa không gian trong các ảnh nhưng không chú ý tới bất cứ sự dư thừa nào tồn tại giữa các khung hình liên tục của một dòng ảnh động. Một tập đoàn nghiên cứu khác IEC/ISO, tập đoàn chuyên gia ảnh động (MPEG) được thành lập để chuyên giải quyết vấn đề này và cho đến nay họ đã chuẩn hóa hai định dạng: MPEG-1 Và MPEG-2 .Sự khác nhau giữa tiêu chuẩn này nằm ở tốc độ dữ liệu và chất lượng ảnh – MPEG-1 được thiết kế cho tốc độ truyền dữ liệu tới tận 1,5 Mb/s và hoạt động trong giới hạn này để đạt được các ảnh có chất lượng tốt nhất có thể. MPEG-2 hoạt động với tốc độ dữ liệu tới 20 Mb/s và cho chất ảnh cao hơn; nó được sử dụng cho ảnh của hệ thống HDTV cũng như trong hệ

146

Page 149: Audio Video

Chương 5: Nén dữ liệu audio và video

thống ATV Grand Alliance đã được chuẩn hóa bởi ATSC và trong truyền hình quảng bá phát vệ tinh. Ở đây sẽ bàn đến phiên bản của MPEG-2.

Nén MPEG áp dụng cho tất cả các quá trình như của JPEG bao gồm DCT, lượng tử hóa, mã entropy và cộng thêm bù chuyển động để nén dư thừa xen kẽ khung hình. Như với JPEG, các quá trình này được thực hiện theo cách thức rất linh hoạt, cho phép người sử dụng điều chỉnh nén để phù hợp với những ứng dụng chuyên biệt và nội dung của ảnh.

Khoảng cách dòng

Dòng quét

Mẫu tín hiệu chói Mẫu tín hiệu CB

Mẫu tín hiệu CR CB, CR cùng vị trí

Hình 5.11. Mô hình lấy mẫu không gian MPEG-2

MPEG-2 sử dụng quá trình lấy mẫu con các thành phần hiệu màu theo tỉ lệ 2:1 theo cả hàng dọc và hàng ngang. Nó khác với quá trình lấy mẫu con của ITU-R Ree.BT.601,chỉ lấy mẫu con theo hang ngang. Với lý do này, và cũng để thừa nhận là tốc độ dữ liệu của độ chói bị giảm xuống bởi một hệ số 2 khác so với tỉ lệ 4:2:2, lấy mẫu con MPEG-2 được gọi là 4:2:0. Mô hình lấy mẫu không gian được minh họa trên hình 5.12. Các mẫu CR và CB có cùng vị trí không gian nhưng vị trí nó bị dịch chuyển đi một nửa độ cao của dòng so với các mẫu độ chói. Điều này được thực hiện để các vị trí lấy mẫu độ chói sẽ như nhau cho cả nguồn quét cách dòng, hoặc có thể tăng dần; tuy nhiên với yêu cầu là giá trị của mẫu phải được nội suy từ những mẫu lấy đồng thời với mẫu độ chói.

Do cần thiết phải giảm mô hình lấy mẫu thành khối 8x8 cho DTC và quá trình xử lý bù ảnh động, quá trình lấy mẫu con 4:2:0 cần đến một quan niệm là khối khác:

147

Page 150: Audio Video

Chương 5: Nén dữ liệu audio và video

khối lớn .Đây là một nhóm 2x2 gồm khối độ chói 8x8 (vì vậy sẽ là 16x16) có liên quan đến 2 khối mẫu các thành phần hiệu màu 8x8, một cho CR và một cho CB. Hầu hết quá trình xử lý MPEG-2 đều thực hiện với khối lớn do chúng là đơn vị không gian nhỏ nhất có thể được biểu thị bởi một số tích phân của các khối 8x8 cho tất cả các thành phần tín hiệu.

B

Hình 5.12. Thứ tự khung MPEG

I B P B P B P B I 1 2 3 4 5 6 7 8 9 1 3 2 5 4 7 6 9 8

Hình 5.12. Biểu diễn mô hình lấy mẫu không gian

Với phần bù chuyển động, mỗi khung hình đều được dựa vào vị trí sai từ khung hình trước, song phải bắt đầu quá trình khung hình thứ nhất. Vì vậy, MPEG-2 cung cấp các khung hình hoàn toàn tự mã hóa giống như ảnh của JPEG. Các khung hình này được gọi là khung hình 1. Các khung hình được dự đoán từ khung hình trước bằng bù chuyển động được gọi là khung hình P. Một kiểu khung hình thứ ba cũng được cung cấp dựa vào dự đoán từ khung hình trước và khung hình tiếp theo – đây được gọi là dự đoán hai hướng. Nhưng khung hình này được gọi là khung hình B. Khung hình B có thể được nén thậm chí nhiều hơn khung hình P nhưng yêu cầu phải có một khung hình mới ở bộ giải mã trước khi khung hình B được giải nén, do vậy phải sử dụng cách thức truyền các khung hình không theo thứ tự trong dòng truyền. Đây cũng không phải là vấn đề quá khó, trừ phi phải cần lưu trữ nhiều hơn ở máy thu và cộng thêm khoảng trễ vào quá trình nén và giải nén. Tiêu chuẩn cung cấp cho đặc điểm này và ứng dụng của nó được xác định ở thời điểm mã hóa.

Hình 5.13 là sơ đồ một chuỗi khung hình, minh họa cách sử dụng của khung hình I-P và B và trật tự truyền xảy ra. Do I là các khung hình được nén ít nhất, nên ứng dụng của nó phải được tối thiểu hóa để đạt được tốc độ dữ liệu thấp nhất nhưng I vẫn yêu cầu theo định ký cho dòng video để bản thân nó có thể phục lại sau khi chuyển mạch kênh hoặc ngưng hoạt động do lỗi. Tiêu chuẩn nêu rõ, ít nhất cứ 133

148

Page 151: Audio Video

Chương 5: Nén dữ liệu audio và video

khung hình sẽ xuất hiện khung hình I-hầu hết các hệ thống đều cung cấp số khung hình nhiều hơn như vậy .Điều này được xác định ở bộ mã hóa.

Lượng tử hóa

DCT

Bù chuyển động

Đánh giá chuyển động

Lưu trữ khung hình

Lượng tử hóa ngược

DCT ngược

Mã hoá dòng bit

Nén phần lỗi dự báo

Video đã mã hóa

Đầu vào video

Lưu trữ khung hình tái tạo

Vector chuyển động

Hình 5.13. Quá trình xử lý MPEG

Hình 5.14 là một sơ đồ khối xử lý nén MPEG-2 trình bày các nguyên lý đã đề cập từ trước tới giờ.Quá trình xử lý được thực hiện trên khối 8x8 tại một thời điểm. Nếu khung hình hoặc khối lớn, được ghi mã hóa trong các pixel sẽ trực tiếp vào quá trình xử lý DTC. Đối với các khối đã ghi mã xen kẽ, bước đầu tiên là thực hiện bù ảnh động sử dụng các khung hình mỏ neo lưu trữ từ khung hình trước khung hình sắp tới. Kết quả này được sử dụng so sánh với các pixel đầu vào và các visai để khối chuyển tới quá trình xử lý DCT.Ở đầu ra của DTC ,các hệ số được lượng tử hóa theo bảng lượng tử. sẽ có các bảng khác nhau, phụ thuộc vào việc sử dụng ghi mã trong hay mã xen kẽ. Kết quả của quá trình lượng tử hóa được sắp xếp theo trật tự và sử dụng mã entropy để truyền.

Một vòng bổ sung sẽ giải mã các vi sai của DCT vì vậy, các khung hình dự trữ được sử dụng cho bù chuyển động sau này bị suy giảm bởi quá trình lượng tử hóa từ việc tích tụ khi các khung hình được dự đoán từ khung này đến khung khác.

Quá trình mã hóa phải có sự lựa chọn liên quan đến kiểu dự đoán khung hình và lượng tử hóa. Những sự lựa chọn này có thể được thực hiện dựa trên cơ sở khối lớn, nếu cần. Vì vậy, nó trở thành một nghệ thuật để khởi động bộ mã hóa nhằm, đạt được khả năng nén tốt nhất với tốc độ dữ liệu cho trứơc. Tham gia vào quá trình này còn có bộ mã hóa có khả năng tự động hóa rất tinh xảo.

5.4.4. Video của máy tính cá nhân

Mặc dù video MPEG được sử dụng cho máy tính cá nhân và đưa ra những chi

149

Page 152: Audio Video

Chương 5: Nén dữ liệu audio và video

tiết tuyệt vời, song vẫn cần đến một phần cứng chuyên biệt, trừ trường hợp ở nhưng máy tính cá nhân cực nhanh. Một số thuật toán nén khác nhau đã phát triển một cách đặc biệt. ứng dụng riêng cho máy tính cá nhân. Các thuật toán này tạo ra sự thỏa hiệp khác nhau giữa cấp độ nén và chất lựợng ảnh để giảm các yêu cầu tính toán cho quá trình giải mã.Hầu hết các thuật toán này được thiết kế như các hệ thống không đối xứng. Một số tiêu chuẩn đã sẵn sangf đáp ứng là Indeo của Intel, Video cho Windows của Microsoft, Quick time của Apple (cho Macinstosh và các máy tính cá nhân dùng Window ) và CinePark của SuperMac. Trong những trường hợp này, phần mềm giải mã đã sẵn sàng cung ứng nhưng phần mềm giải mã hóa (và cả phần cứng )thường là độc quyền và phải mua. Do là độc quyền nên chi tiết của các thuật toán này không đữợc bàn đến ở đây.

5.4.5 Audio AC-3

Hệ thống audio của hệ thống ATSC ATC là một ví dụ nén audio số điển hình. Hệ thống này cung cấp tới 5.1 kênh âm thanh vòm stereo chất lượng cao, với tổng tốc độ dự liệu 385 kb/s (kênh 0.1 là kênh loa trầm phụ có tần số thấp ). Bộ mã hóa AC-3 tạo ra một dòng bít tổng hợp có thể được đóng gói và trộn với gói video trong hệ thống vận chuyển ATSC.

Như trong hệ thống nén video MPEG, nén audio AC-3 được thực hiện bằng cách chuyển đổi tốc độ dự liệu thành miền tấn số, đông thời đây cũng là mục tiêu cho lượng tử hóa thô. Tuy nhiên, đối video,việc chuyển đổi tần số, thời gian được thực hiện khác. Các mẫu audio đầu vào ở tấn số 48 khz được tập hợp các khối ghép 512 mẫu. Mỗi mẫu đầu vào được biểu thị thành hai trong số các khối. và bằng cách sử dụng một loạt mờ chồng giữa các khối, khả năng nghe thấy sự ghép khối được loại bỏ.

Mã hóa hình bao phổ

Đầu vào audio PCM

Bộ lọc băng phân tích

Chỉ định bit

Hình 5.14. Sơ đồ khối bộ mã hóa AC-3

Hình 5.14 là sơ đồ khối của bộ mã hóa AC-3. Các khối mẫu được chuyển thành hệ số nhờ bộ xử lý băng của bộ lọc phân tích. Đầu ra của bộ xử lý này là một chuỗi các hệ số trong một định dạng dấu phẩy đặc biệt .Các số mũ biểu thị phổ tín

Lượng tử Định dạng khung AC-3

Dòng bit đã mã hóa

150

Page 153: Audio Video

Chương 5: Nén dữ liệu audio và video

hiệu thô và được mã hóa riêng rẽ từ phần định trị của định dạng dấu phẩy động.Dòng bít ở đầu ra cho mỗi trong số 6 khối audio được tập hợp thành một khung audio biểu thị 1536 mẫu audio trước khi nén hoặc 32 ms audio. Cấu trúc của khung được minh họa trên hình 5.17. Khung bắt đầu bằng một từ động bộ,tiếp theo là một header thông tin dòng bit (BSI) mô tả sự phân phối audio. Sau đó đến dự liễu audio được nén cho 6 khối mẫu và một mã phát hiện sửa lỗi CRC ở cuối. Khung cũng chuẩn bị đầy đủ cho dự liệu phụ trợ không bắt buộc.

Đồn

gbộ

Hea

derB

SI

Khối audio

0

Khối audio

1

Khối audio

2

Khối audio

3

Khối audio

4

Khối audio

5

CR

C

Aux

Hình 5.17. Cấu trúc khung AC-3

Cùng với nén, hệ thống AC-3 cũng đưa ra một vài đặc điểm thú vị khác tạo điều kiện thuận lợi cho quá trình tái tạo âm thanh chất lượng cao. Một đặc điểm đáng lưu ý là hệ thộng có thể có cấu hình của nén dải rộng. Trong rất nhiều hoạt động. thường phải sử dụng nén dải rộng của audio để cải thiện vấn đề trào kệnh và khả năng nghe được âm thanh trong các môi trường nghe kém hoặc nghe với trang thiết bị tái tạo có công suất hạn chế . Nếu điều này được thực hiện ở cuối quá trình chèn, nó sẽ buộc người xem phải sử dụng cùng một dải giới hạn, không cần quan tâm đến chất lượng của thiết bị và môi trường tái tạo. Với AC-3, nén giải động xảy ra ở đầu thu nhờ các mã nén được truyền cùng với các tín hiệu. Vì vậy, máy thu có thể chọn số lượng nén để áp dụng . Và dải động gốc đầy đủ cũng sẵn sàng cung cấp cho những hệ thống có khả năng tái tạo lại nó.

Một đặc đỉểm khác của AC-3 là tiêu chuẩn hóa âm lượng. Khi chuyển mạch giữa các nguồn, hoặc các kênh tín hiệu khác nhau, người ta thường gặp phải sự thay đổi âm lượng thành phần đối thoại của audio. Điều này rất khó kiểm soát bởi vì các ứng dụng khác nhau cần đến các số lượng khoảng trống trên mức đối thoại để phù hợp với âm thanh khác. Tiêu chuẩn AC-3 đặt ra yêu cầu phải có một thông số được truyền cùng với audio để nhận dạng mức mà tại đó đối thoại được thiết lập trong toàn bộ dải động audio.Giá trị này có thể được sử dụng ở máy thu để tiêu chuẩn hóa tất cả các kênh, vì vậy đối thoại luôn có cùng âm lượng.

151

Page 154: Audio Video

MỤC LỤC

Chương 1: ðẠI CƯƠNG VỀ AUDIO VÀ VIDEO

1.1 Quá trình phát triển ........................................................................................................1

1.2 Ảnh tự nhiên ..................................................................................................................1

1.3 Âm thanh tự nhiên .........................................................................................................2

1.4 Tái tạo âm thanh tự nhiên ..............................................................................................4

1.5 Thị giác con người .........................................................................................................5

1.6 Thính giác của con người...............................................................................................9

1.7 Quét ảnh .......................................................................................................................10

1.8 Biểu diễn màu sắc ........................................................................................................15

1.9 Các tín hiệu video tương tự..........................................................................................22

1.10 Tín hiệu audio tương tự..............................................................................................25

1.11 Chuyển ñổi tín hiệu tương tự sang số ........................................................................29

1.12 Giảm tạp âm...............................................................................................................30

1.13 Hệ thống video số ......................................................................................................31

1.14 Audio số .....................................................................................................................33

1.15 Audio ña kênh ............................................................................................................35

Chương 2: SỐ HOÁ TÍN HIỆU AUDIO VÀ VIDEO

2.1 Giới thiệu .....................................................................................................................36

2.2 Các bước của ADC ......................................................................................................36

2.3 Chọn tần số lấy mẫu.....................................................................................................49

2.4 Chuyển ñổi dạng số sang tương tự...............................................................................54

Chương 3: TRUYỀN DẪN AUDIO VÀ VIDEO SỐ

3.1 Giới thiệu .....................................................................................................................56

3.2 Công nghệ truyền dẫn số..............................................................................................56

3.3 Phương tiện truyền dẫn ................................................................................................74

3.4 Các hệ thống truyền dẫn ..............................................................................................77

Chương 4: GHI PHÁT TÍN HIỆU AUDIO VÀ VIDEO SỐ

4.1 Giới thiệu .....................................................................................................................88

4.2 Thiết bị lưu trữ audio – video số..................................................................................88

4.3 Khối ñầu quang ............................................................................................................93

4.4 Ghi phát tín hiệu trên CD.............................................................................................97

Page 155: Audio Video

4.5 Xử lí tín hiệu audio khi ghi và phát .............................................................................99

4.6 Mạch phát CD ...........................................................................................................114

4.7 Máy phát VCD...........................................................................................................115

4.8 Khối servo máy CD ...................................................................................................119

4.9 Khối vi xử lí ...............................................................................................................124

Chương 5: NÉN DỮ LIỆU AUDIO VÀ VIDEO SỐ

5.1 Giới thiệu ...................................................................................................................132

5.2 Các thuộc tính nén .....................................................................................................132

5.3 Các phương pháp chung ............................................................................................134

5.4 Các thuật toán thông dụng .........................................................................................143

Page 156: Audio Video

TÀI LIỆU THAM KHẢO

1. Arch C.Luther, Principle of Digital Audio and Video, Artech Hause, Inc. Boston. London.

2. Bài giảng môn học Audio & Video và truyền hình, Khoa điện tử viễn thông, Đại học Bách khoa Hà Nội.

3. TS. Đỗ Hoàng Tiến, Audio & Video số, Nxb Khoa học và Kỹ thuật Hà Nội, 2002.

4. PGS.TS. Nguyễn Kim Sách, Truyền hình số có nén và Multimedia, Nxb Khoa học và Kỹ thuật Hà Nội, 2000.

5. Ths. Đặng Quốc Anh, bài giảng Mạng Viễn thông thế hệ mới, Học viện Bưu chính Viễn thông Tp.HCM.