· Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người,...

24
MỞ ĐẦU Ngày nay với sự phát triển mạnh mẽ của Công nghệ thông tin và internet đã đem lại những thay đổi sâu sắc trong xã hội và trong cuộc sống. Theo đó thông tin thường được lưu trữ và truyền tải dưới dạng dữ liệu số như tệp văn bản, hình ảnh, âm thanh, video,… Dưới sự trợ giúp của phần mềm người dùng có thể dễ dàng tạo ra các bản sao chép có chất lượng tương tự dữ liệu bản gốc. Mạng Internet toàn cầu đã biến thành một xã hội ảo nơi diễn ra quá trình trao đổi thông tin trong mọi lĩnh vực. Trong môi trường mở như hiện nay xuất hiện những vấn nạn sao chép, tái tạo phân phối trái phép, làm giả dữ liệu số,… Vì vậy việc chống lại những vấn nạn trên đang là mối quan tâm lớn của nhiều nhà nghiên cứu trong lĩnh vực này. Việc thực thi quyền sở hữu dữ liệu là một yêu cầu quan trọng và đòi hỏi các giải pháp đồng bộ, bao gồm các khía cạnh về kỹ thuật, tổ chức và luật pháp,... Một trong những giải pháp được các nhà nghiên cứu trong và ngoài nước quan tâm nhiều hiện nay đó là sử dụng kỹ thuật thủy vân để bảo vệ bản quyền, xác thực thông tin.

Transcript of  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người,...

Page 1:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

MỞ ĐẦU

Ngày nay với sự phát triển mạnh mẽ của Công nghệ thông tin và internet

đã đem lại những thay đổi sâu sắc trong xã hội và trong cuộc sống. Theo đó

thông tin thường được lưu trữ và truyền tải dưới dạng dữ liệu số như tệp văn

bản, hình ảnh, âm thanh, video,… Dưới sự trợ giúp của phần mềm người

dùng có thể dễ dàng tạo ra các bản sao chép có chất lượng tương tự dữ liệu

bản gốc. Mạng Internet toàn cầu đã biến thành một xã hội ảo nơi diễn ra quá

trình trao đổi thông tin trong mọi lĩnh vực. Trong môi trường mở như hiện

nay xuất hiện những vấn nạn sao chép, tái tạo phân phối trái phép, làm giả dữ

liệu số,… Vì vậy việc chống lại những vấn nạn trên đang là mối quan tâm lớn

của nhiều nhà nghiên cứu trong lĩnh vực này.

Việc thực thi quyền sở hữu dữ liệu là một yêu cầu quan trọng và đòi hỏi

các giải pháp đồng bộ, bao gồm các khía cạnh về kỹ thuật, tổ chức và luật

pháp,... Một trong những giải pháp được các nhà nghiên cứu trong và ngoài

nước quan tâm nhiều hiện nay đó là sử dụng kỹ thuật thủy vân để bảo vệ bản

quyền, xác thực thông tin.

Xuất phát từ thực tế trên, tác giả lựa chọn đề tài “Nghiên cứu kỹ thuật

thủy vân cơ sở dữ liệu quan hệ ứng dụng bảo vệ bản quyền”, nhằm nghiên

cứu các kỹ thuật thủy vân đối với cơ sở dữ liệu quan hệ trong ứng dụng bảo

vệ bản quyền.

Mục tiêu của luận văn là nghiên cứu thủy vân cơ sở dữ liệu quan hệ đảm

bảo tính bản quyền. Do mỗi kiểu dữ liệu của cơ sở dữ liệu quan hệ có những

đặc điểm riêng nên đòi hỏi khi thủy vân các kỹ thuật thủy vân phải phù hợp

với những đặc điểm của dữ liệu được thủy vân. Vì vậy luận văn này tác giả

tập trung nghiên cứu sử dụng kỹ thuật thủy vân chèn ảnh nhị phân vào thuộc

tính dữ liệu kiểu văn bản có nhiều từ.

Page 2:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

Phát triển các kết quả nghiên cứu về mặt lý thuyết, trên cơ sở cài đặt thử

nghiệm, đánh giá và đưa ra những phương pháp, kỹ thuật mới, cải tiến.

Đề tài có ý nghĩa lớn đối với ngành Công nghệ thông tin trong việc

chứng minh quyền sở hữu đối với cơ sở dữ liệu quan hệ sau khi đã được phân

phối hoặc chuyển giao, đặc biệt là trên môi trường mạng internet.

Bố cục của luận văn gồm: Phần mở đầu, các chương nội dung và tài liệu

tham khảo.

Chương 1: Nghiên cứu tổng quan về thủy vân cơ sở dữ liệu quan hệ

Chương 2: Lược đồ thủy vân cơ sở dữ liệu quan hệ trong ứng dụng bảo

vệ bản quyền

Chương 3: Phát triển lược đồ lược đồ thủy vân cơ sở dữ liệu quan hệ ứng

dụng bảo vệ bản quyền.

Page 3:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

Chương 1

TỔNG QUAN VỀ THỦY VÂN CƠ SỞ DỮ LIỆU QUAN HỆ

1.1. Giấu tin

1.1.1. Khái niệm giấu tin

Có nhiều phương pháp bảo vệ thông tin dữ liệu số trong đó giấu tin là

một trong những phương pháp được quan tâm nhiều hiện nay.

Giấu tin là kỹ thuật nhúng một lượng thông tin số vào trong một đối

tượng dữ liệu số khác. Một trong những yêu cầu cơ bản của giấu tin là đảm

bảo tính chất ẩn của thông tin được giấu, đồng thời không làm ảnh hưởng đến

chất lượng của dữ liệu gốc.

Giấu tin khác với mật mã ở chỗ trong khi kỹ thuật giấu tin mật là tìm

cách ẩn giấu thông điệp vào một phương tiện số như hình ảnh, audio, video

mà người ngoài cuộc khó có thể phát hiện được sự hiện hữu của thông điệp

trong phương tiện số đó mặc dù người ngoài cuộc có thể có nó trong tay. Còn

trong khoa học mật mã người ta tìm cách để biến đổi bản thông điệp có ý

nghĩa thành một dãy mã ngẫu nhiên để liên lạc với nhau trên mạng công cộng

mà người ngoài cuộc có thể có được sự hiện hữu của dãy mã ngẫu nhiên đó

nhưng khó có thể chuyển thành bản thông điệp ban đầu nếu không có “khóa”

để giải mã của thông điệp.

Page 4:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

Hình 1.1: Quá trình giấu tin

Hình 1.2: Quá trình tách (lấy ra) thông tin đã giấu

1.1.2. Phân loại giấu tin

Do kỹ thuật giấu tin mới được hình thành trong thời gian gần đây nên

những nhu cầu liên quan đến vấn đề giấu tin vẫn chưa được giải quyết một

cách triệt để. Nhiều phương pháp mới theo nhiều khía cạnh khác nhau đã và

đang được tiến hành nghiên cứu, đề xuất.

Dựa trên việc thống kê sắp xếp các công trình đã công bố trên một số tạp

chí, cùng với thông tin về tên và tóm tắt nội dung của các công trình đã công

bố trên Internet, có thể chia lĩnh vực giấu tin ra làm hai hướng lớn, đó là giấu

tin bí mật (Steganography) và thủy vân (Watermark).

Page 5:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

Giấu tin bí mật (Steganography) quan tâm tới ứng dụng che giấu các bản

tin đòi hỏi độ bí mật và dung lượng càng lớn càng tốt.

Thủy vân (Watermark) quan tâm đến ứng dụng giấu các mẩu tin ngắn

nhưng đòi hỏi độ bền vững lớn của thông tin cần giấu (trước các biến đổi

thông thường của dữ liệu).

Đối với từng hướng lớn của giấu tin là giấu tin mật và thủy vân, quá trình

phân loại theo các tiêu chí khác có thể tiếp tục được thực hiện như dựa theo

ảnh hưởng các tác động từ bên ngoài có thể chia thuỷ vân thành hai loại, một

loại bền vững với các tác động sao chép trái phép, loại thứ hai lại cần tính

chất hoàn toàn đối lập là dễ bị phá huỷ trước các tác động từ bên ngoài.

Hình 1.3: Tổng quan về giấu tin

1.1.3. Môi trường giấu tin

Giấu tin trong ảnh: Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng

chất lượng ảnh ít bị thay đổi hoặc thay đổi nhỏ và không thể nhận biết được

bằng thị giác của con người, nó chỉ có thể bị phát hiện bởi ứng dụng, công

nghệ của máy tính. Ngày nay ảnh số được sử dụng rộng rãi và phổ biến nên

Page 6:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

giấu thông tin trong ảnh đã được nghiên cứu và ứng dụng trong nhiều lĩnh

vực.

Giấu tin trong audio: Thông tin sẽ được giấu cùng với dữ liệu âm thanh.

Đối với giấu thông tin trong ảnh phụ thuộc vào hệ thống thị giác của con

người thì giấu thông tin trong audio lại phụ thuộc vào hệ thống thính giác của

con người. Vì vậy với môi trường giấu tin trong audio sẽ gặp một số khó khăn

như hệ thống thính giác của con người nghe được các tín hiệu ở các giải tần

rộng, công suất lớn nên khó khăn đối với các phương pháp giấu tin trong

audio, tiếp theo đó là kênh truyền tin cũng ảnh hưởng đến chất lượng thông

tin sau khi giấu.

Giấu tin trong video: Thông tin sẽ được giấu cùng với dữ liệu video.

Phương pháp giấu tin video được sử dụng phổ biến là phương pháp phân bố

đều, phương pháp này đươc đưa ra bởi tác giả Cox. Ý tưởng cơ bản của

phương pháp này là phân phối thông tin dàn trải theo tần số trong dữ liệu gốc.

1.2. Thủy vân

1.2.1. Lịch sử ra đời thủy vân

Khái niệm thủy vân đã ra đời từ lâu và được các công nhân nhà máy giấy

ở Italia sử dụng. Các tờ giấy được thủy vân sẽ mỏng hơn và có hoa văn trên

đó. Ý nghĩa của việc thủy vân này giúp các xưởng sản xuất giấy đánh dấu

bản quyền trên tờ giấy của họ làm ra. Thuật ngữ thủy vân bắt nguồn từ một

loại mực vô hình và chỉ hiện lên khi nhúng vào nước.

Thủy vân số được coi là ra đời từ năm 1954 với bằng sáng chế của Emile

Hembrooke. Tuy nhiên, nghiên cứu thủy vân vẫn chưa được đặt ra như một

lĩnh vực nghiên cứu độc lập cho tới những năm 1980 và khái niệm thủy vân

chỉ được hoàn thiện vào giữa những năm 90 của thế kỷ 20.

Page 7:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

Agrawal và Kiernan (2002) đưa ra những đề xuất đầu tiên về kỹ thuật

thủy vân trên cơ sở dữ liệu quan hệ bởi nhu cầu cấp thiết của người chủ dữ

liệu muốn bảo vệ sản phẩm của mình trước những tấn công bên ngoài. Các

tác giả đã đề xuất một lược đồ thủy vân trong đó dữ liệu có thể chấp nhận

những thay đổi nhỏ mà không ảnh hưởng đến giá trị sử dụng của chúng.

Mục đích của thủy vân: Các lược đồ thủy vân khác nhau được thiết kế để

phục vụ cho các mục đích khác nhau, cụ thể là: bảo vệ bản quyền, đảm bảo sự

toàn vẹn hay phát hiện giả mạo, khoanh vùng, chứng minh quyền sở hữu,...

Đối với các lược đồ thủy vân dùng để bảo vệ bản quyền cho cơ sở dữ liệu

quan hệ là thủy vân bền vững.

1.2.2. Khái niệm thủy vân

Thủy vân là kỹ thuật nhúng thông tin vào dữ liệu (dữ liệu có thể là văn

bản, hình ảnh, audio, video hay cơ sở dữ liệu,...) trước khi phân phối dữ liệu

trên môi trường trao đổi thông tin nhằm xác định thông tin về chủ sở hữu

hoặc nhận biết sự tấn công trái phép từ bên ngoài đối với dữ liệu đã được thủy

vân. Thông tin giấu trong dữ liệu được gọi là thủy vân (watermark).

Hình 1.4: Các loại thủy vân

1.2.3. Thủy vân bền vững (robust watermark)

Page 8:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

Thủy vân bền vững là kỹ thuật nhúng thủy vân vào dữ liệu sao cho khi

phân phối dữ liệu trong môi trường mở thủy vân này luôn tồn tại bền vững

với dữ liệu gốc và không dễ bị phá hủy trước những biến đổi, tấn công dữ

liệu. Kỹ thuật này thường được sử dụng trong các ứng dụng bảo vệ bản

quyền, chứng minh quyền sở hữu. Trong những ứng dụng này, thủy vân đóng

vai trò là thông tin sở hữu của người chủ hợp pháp. Thủy vân được nhúng

trong sản phẩm như một hình thức dán tem bản quyền. Trong trường hợp này

thủy vân phải tồn tại bền vững với sản phẩm nhằm chống lại việc tẩy xóa, làm

giả hay biến đổi phá hủy thủy vân. Một yêu cầu đối với thủy vân bền vững là

nếu muốn loại bỏ thủy vân thì chỉ có một cách đó là phá hủy sản phẩm.

Trong thủy vân bền vững được chia làm hai loại là thủy vân ẩn và thủy

vân hiện.

Thủy vân ẩn: Là thủy vân mà mắt thường không thể nhìn thấy thủy vân,

chỉ chủ sở hữu sản phẩm mới có khả năng nhìn thấy được sau khi giải mã

khóa. Trong bảo vệ bản quyền, thủy vân ẩn mang tính bất ngờ hơn trong việc

phát hiện sản phẩm bị đánh cắp. Người chủ sở hữu sẽ chỉ ra bằng chứng là

thủy vân đã được nhúng trong sản phẩm.

Thủy vân hiện: Là loại thủy vân được hiện ngay trên sản phẩm và người

dùng có thể nhìn thấy được giống như các biểu tượng logo trên các sản phẩm,

trên các kênh truyền hình mà ta thường thấy. Các thủy vân hiện trên sản phẩm

thường dưới dạng chìm, mờ hoặc trong suốt để không gây ảnh hưởng đến chất

lượng sản phẩm gốc. Đối với thủy vân hiện, thông tin bản quyền hiển thị ngay

trên sản phẩm.

1.2.4. Thủy vân dễ vỡ (fragile watermark)

Thủy vân dễ vỡ là kỹ thuật nhúng thủy vân sao cho khi phân phối sản

phẩm trong môi trường mở nếu có bất cứ sự biến đổi nào làm thay đổi sản

Page 9:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

phẩm gốc thì thủy vân đã được giấu trong đó sẽ không còn nguyên vẹn như

trước khi giấu, tức là nó dễ bị biến đổi trước những tấn công dữ liệu. Kỹ

thuật này thường được dùng trong các ứng dụng xác thực thông tin, đảm bảo

sự toàn vẹn dữ liệu, chống xuyên tạc.

Ví dụ: Để bảo vệ chống xuyên tạc một bức ảnh hay một dữ liệu nào đó ta

nhúng một thủy vân vào trong bức ảnh hay dữ liệu đó rồi phân phối, quảng bá

trên môi trường mở. Khi cần kiểm tra lại ảnh, dữ liệu ta sử dụng hệ thống đọc

thủy vân. Nếu không đọc được thủy vân hoặc thủy vân bị sai lệch nhiều so

với thủy vân ban đầu đã được nhúng vào dữ liệu thì có nghĩa là dữ liệu đó đã

bị thay đổi.

1.3. Cơ bản về cơ sở dữ liệu quan hệ

1.3.1. Khái niệm cơ sở dữ liệu

Cơ sở dữ liệu là bộ sưu tập về các loại dữ liệu tác nghiệp bao gồm: chữ

viết, văn bản, đồ họa, hình ảnh,... được lưu trữ dưới dạng file dữ liệu trên

băng từ, đĩa từ,... Cấu trúc lưu trữ dữ liệu tuân theo các nguyên tắc dựa trên lý

thuyết toán học. Cơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều

người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

phần đều có thể sử dụng và khai thác nó nhằm thỏa mãn nhu cầu khai thác

thông tin

1.3.2. Mô hình cơ sở dữ liệu quan hệ

Mô hình cơ sở dữ liệu quan hệ được tiến sĩ E.F. Codd phát triển vào năm

1970. Loại cơ sở dữ liệu này đã loại bỏ được những vấn đề liên quan đến các

Page 10:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

thiết kế cơ sở dữ liệu khác. Sử dụng mô hình này có thể giảm thiểu việc dư

thừa dữ liệu, tiết kiệm được không gian lưu trữ và có khả năng truy xuất dữ

liệu hiệu quả. Hiện nay cơ sở dữ liệu quan hệ đang được sử dụng phổ biến

cho các ứng dụng.

Mô hình cơ sở dữ liệu quan hệ lưu trữ dữ liệu trên một hoặc nhiều bảng,

mỗi bảng gồm nhiều hàng (row), nhiều cột (column) và được gọi là một quan

hệ. Trong thực tế các hàng, các cột được gọi tên theo thuật ngữ là bản ghi

(record) và trường (field).

Hình 1.5: Biểu diễn quan hệ

- Thực thể: Là đối tượng có trong thế giới thực mà ta cần mô tả các đặc

trưng của nó.

Ví dụ: Thực thể NHANVIEN. Các đặc trưng của thực thể NHANVIEN

gồm: Mã nhân viên (1), Họ (Trần Văn), Tên (An) Ngày sinh (15/4/1971),...

- Thuộc tính: Là tên các cột của quan hệ, các dữ liệu thể hiện các đặc

trưng của thực thể, mỗi thuộc tính có một kiểu dữ liệu tương ứng.

Page 11:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

Hình 1.6: Biểu diễn thuộc tính

- Miền thuộc tính: Tập các giá trị có thể có của thuộc tính gọi là miền giá

trị của thuộc tính đó gồm có tên, kiểu dữ liệu, khuôn dạng,...

Ví dụ: Ten: kiểu dữ liệu và Text, Ngaysinh, kiểu dữ liệu: date/time, khuôn

dạng: dd/mm/yyyy

- Bộ dữ liệu: Là các dòng (bản ghi) của quan hệ không kể dòng tên của

các thuộc tính, mỗi bộ chứa giá trị cụ thể của các thuộc tính.

Hình 1.7: Biểu diễn bộ dữ liệu

- Quan hệ: Cho R={A1,A2,...,An}(trong đó R là tên quan hệ, A1,A2,...,An

là các thuộc tính) là một tập hữu hạn các thuộc tính khác rỗng. Mỗi thuộc tính

Ai R; i=1÷n có một miền giá trị xác định.

Mô hình cơ sở dữ liệu quan hệ thường biểu diễn một quan hệ trên tập các thuộc tính bằng bảng 2 chiều. Các thuộc tính của quan hệ là các cột A1,A2,...,An, các hàng của quan hệ được gọi là

Page 12:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

các bộ (bản ghi), ký hiệu r và giá trị của mỗi bộ gồm m thành phần. Quan hệ r

được biểu diễn bởi bảng sau:

A1 A2 ... An

r1 r1. A1 r1. A2 ... r1. An

r2 R2. A1 R2. A2 ... R2. An

... ... ... ... ...

rm rm. A1 rm. A2 ... rm. An

Ví dụ:

SINHVIEN(MaSV Ten Ngaysinh Điachi)

HCN01 Hải 12/10/1987 Hà Nội

HCN02 Bình 06/08/1989 Hải Phòng

HCN03 Minh 28/10/1990 Nghệ An

HCN04 Hoa 17/09/1991 Quảng Ninh

Trong đó các thuộc tính là MaSV: Mã sinh viên; Ten: tên; Ngaysinh:

Ngày sinh; Diachi: Địa chỉ. Bộ giá trị là (HCN01, Hải, 12/10/1987, Hà Nội).

- Lược đồ quan hệ: Tập tất cả các thuộc tính trong một quan hệ cùng với

mối liên hệ giữa chúng được gọi là lược đồ quan hệ.

- Khóa của quan hệ: Trong một lược đồ quan hệ luôn tồn tại một thuộc

tính hay một tập các thuộc tính có khả năng biểu diễn duy nhất các thuộc tính

còn lại. Nói cách khác giá trị của một hay nhiều thuộc tính có thể xác định

duy nhất giá trị các thuộc tính khác. Ví dụ Số chứng minh thư sẽ xác định

được tất cả thông tin về người mang chứng minh thư đó. Tập thuộc tính có

tính chất như trên được gọi là khoá của lược đồ quan hệ. Thông thường trong

một lược đồ quan hệ có thể tồn tại nhiều khoá. Trong số đó sẽ chọn một khoá

làm khoá chính sao cho đơn giản và không nhập nhằng thông tin. Giá trị

Page 13:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

các thành phần của khoá không thể nhận giá trị null hay các giá trị không xác định.

Khóa của quan hệ R xác định trên tập thuộc tính R={A1, A2,...A} là tập

con K R sao cho bất kỳ hai bộ khác nhau t1, t2 r luôn thỏa t1.K ≠ t2.K.

Khóa là khái niệm quan trọng trong thiết kế cơ sở dữ liệu quan hệ. Khóa

thường được áp dụng trong việc tìm kiếm và cập nhật dữ liệu trong các quan

hệ cơ sở dữ liệu.

1.4. Thủy vân cơ sở dữ liệu quan hệ

Thủy vân cơ sở dữ liệu quan hệ là kỹ thuật cho phép người chủ dữ liệu có

thể nhúng thủy vân vào cơ sở dữ liệu quan hệ của mình để đánh dấu quyền sở

hữu dữ liệu. Thủy vân thường mô tả những thông tin có thể chứng minh

quyền sở hữu dữ liệu như tên chủ sở hữu, nguồn gốc dữ liệu,... Việc nhúng

thông tin đòi hỏi thủy vân được nhúng trong dữ liệu không thể bị giả mạo

hoặc tẩy xóa nhằm bảo vệ bản quyền hoặc đảm bảo sự toàn vẹn dữ liệu.

* Khóa thủy vân:Khóa thủy vân là một lượng dữ liệu bí mật chỉ có chủ sở hữu cơ sở dữ

liệu biết và lựa chọn nhằm mục đích xác định thủy vân trong lược đồ thủy

vân. Khóa thủy vân thường được ký hiệu là K và khóa K này sẽ được kết hợp

với thủy vân để nhúng vào cơ sở dữ liệu cũng như để phát hiện thủy vân.

1.5. Một số yêu cầu đối với thủy vân

Tùy thuộc vào mục đích và ứng dụng mà các yêu cầu của hệ thống thủy

vân được đặt ra, tuy nhiên trên thực tế thủy vân đòi hỏi một số yêu cầu sau:

- Tính bền vững (Robustness): Tính bền vững là yêu cầu quan trọng của

thủy vân, tùy vào từng loại ứng dụng mà yêu cầu này được đặt ra cao hay

thấp. Nếu ứng dụng vào bảo vệ quyền sở hữu thì thủy vân cần phải bền vững

Page 14:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

cao, còn với ứng dụng chống xuyên tạc thì yêu cầu tính bền vững thấp (thủy

vân dễ vỡ).

- Tính dễ vỡ (fragile): Ngược lại với thủy vân bền vững, thủy vân dễ vỡ

khi có bất kỳ tấn công nào lên dữ liệu thì thủy vân không còn nguyên vẹn.

- Tính không nhận thấy được (imperseptibility): Tính không nhận thấy

được nghĩa là các thay đổi do thủy vân gây ra không lớn và thấp hơn mức

cảm thụ của con người.

- Tính bảo mật (security): Sau khi đã nhúng thủy vân vào dữ liệu chỉ

người có quyền mới được phép chỉnh sửa và phát hiện được thủy vân, điều

này được thực hiện nhờ vào khóa. Khóa được dùng để nhúng và phát hiện

thủy vân trong dữ liệu.

- Tính tìm lại thủy vân: Có thể cần hoặc không cần đến dữ liệu gốc vẫn có

thể tìm lại được thủy vân đã nhúng.

- Khả năng kiểm chứng: Nghĩa là sau khi thủy vân đã nhúng vào dữ liệu,

có khả năng cho phép kiểm tra sự tồn tại của thủy vân trong dữ liệu.

Page 15:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

1.6. Ứng dụng của thủy vân

1.6.1. Bảo vệ quyền tác giả (copyright protection)

Bảo vệ quyền tác giả là ứng dụng cơ bản nhất của kỹ thuật thủy vân. Một

số thông tin nào đó mang ý nghĩa quyền sở hữu tác giả sẽ được nhúng vào sản

phẩm, thủy vân đó chỉ một mình chủ sở hữu hợp pháp sản phẩm đó có và

được dùng để chứng minh cho quyền sở hữu sản phẩm. Giả sử có một sản

phẩm dữ liệu dạng đa phương tiện như ảnh, âm thanh, video cần được lưu

thông trên mạng. Để bảo vệ sản phẩm chống lại hành vi lấy cắp, làm nhái, thì

cần phải có một kỹ thuật để đánh dấu bản quyền vào sản phẩm. Việc đánh dấu

này không làm ảnh hưởng lớn đến sản phẩm và khó có thể hủy bỏ được thủy

vân vì nếu muốn hủy bỏ thủy vân thì gần như phải phá hủy luôn sản phẩm.

1.6.2. Phát hiện xuyên tạc thông tin

Thông tin được giấu trong cơ sở dữ liệu quan hệ, sau đó các thông tin này

sẽ được sử dụng để nhận biết xem dữ liệu gốc có bị thay đổi hay không. Thủy

vân thường được nhúng dạng ẩn để tránh sự chú ý của bên ngoài. Trong các

ứng dụng người ta luôn muốn tìm được vị trí bị xuyên tác cũng như xác định

được những thay đổi của dữ liệu. Yêu cầu đối với ứng dụng này là khả năng

giấu thông tin cao và là thủy vân dễ vỡ.

Bằng kỹ thuật phát hiện thủy vân ta có thể lấy thông tin đã giấu vào trong

dữ liệu đó ra. Nếu thông tin lấy ra trùng với thông tin ban đầu đem giấu thì

chứng tỏ dữ liệu gốc không bị thay đổi. Ngược lại, thông tin lấy ra và thông

tin ban đầu có sự khác biệt thì chứng tỏ dữ liệu đã bị thay đổi, xuyên tạc.

1.6.3. Lấy dấu vân tay, dán nhãn

Trong ứng dụng lấy dấu vân tay hay dán nhãn thủy vân được sử dụng để

nhận diện người gửi hay người nhận một dữ liệu nào đó. Trong các ứng dụng,

Page 16:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

dữ liệu thủy vân là dữ liệu được công bố công khai, chủ sở hữu dữ liệu muốn

ngăn cản sao chép và phân phối trái phép bằng cách nhúng một thủy vân riêng

(hoặc dấu vân tay) trong mỗi bản sao của dữ liệu. Nếu tại một thời điểm nào

đó sau này, các bản sao trái phép của các cơ sở dữ liệu được tìm thấy, thì

nguồn gốc của bản sao chép có thể được xác định bằng lấy dấu vân tay. Với

những ứng dụng này yêu cầu đảm bảo độ an toàn cao cho các thủy vân, tránh

khả năng xóa dấu vết trong khi phân phối.

1.6.4. Điều khiển thiết bị

Các thiết bị phát hiện thủy vân (sử dụng phương pháp phát hiện thủy vân

đã giấu mà không cần thông tin gốc) được gắn sẵn trong các thiết bị ghi đọc

và tùy thuộc vào việc có thủy vân hay không để điều khiển (cho phép hoặc

không cho phép) truy cập.

1.7. Các dạng tấn công thủy vân cơ sở dữ liệu quan hệ

Cập nhật thông thường: Cập nhật thông thường là dạng tấn công cập nhật

dữ liệu như: thêm, sửa, xóa, thay đổi vị trí các bộ dữ liệu (các bản ghi), thông

thường đối với dạng tấn công này kẻ tấn công thường không nhận biết được

cơ sở dữ liệu đã được thủy vân, các kỹ thuật thuỷ vân phải đảm bảo thủy vân

đã nhúng trong cơ sở dữ liệu không bị mất khi bị kẻ lấy trộm thêm, sửa, xóa,

thay đổi vị trí thứ tự cơ sở dữ liệu.

Tấn công có chủ đích (tấn công độc hại): Tấn công có chủ đích là dạng

tấn công mà kẻ lấy trộm cơ sở dữ liệu có thể biết cơ sở dữ liệu họ ăn trộm có

chứa thủy vân, nhưng vẫn cố gắng để xóa thủy vân này hoặc dùng các phương

pháp, phương tiện khác để đòi quyền sở hữu trái phép. Để bảo vệ quyền sở

hữu cơ sở dữ liệu trước dạng tấn công này thủy vân phải đảm bảo tính bí mật

và bền vững cao để kẻ tấn công khó phát hiện quy luật hay thuật toán thủy

vân của cơ sở dữ liệu.

Page 17:  · Web viewCơ sở dữ liệu là tài nguyên thông tin dùng chung cho nhiều người, bất kỳ người dùng nào có quyền sử dụng, khai thác toàn bộ hay một

1.8. Tóm tắt chương

Chương này đã trình bày các khái niệm cơ bản về giấu tin, thủy vân, cơ

sở dữ liệu quan hệ và mô hình cơ sở dữ liệu quan hệ. Cụ thể trình bày các

khái niệm về giấu tin, phân loại giấu tin, thủy vân, phân loại thủy vân, cơ sở

dữ liệu quan hệ, thủy vân cơ sở dữ liệu, khóa thủy vân, ứng dụng của thủy

vân, một số dạng tấn công thủy vân cơ sở dữ liệu quan hệ thường gặp,…