Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

150
1 ĐẠI HC HUTRUNG TÂM ĐÀO TO TXA HOÀNG TRNG PHÁN SINH HC PHÂN T(KHÁI NIM, NGUYÊN LÝ & QUÁ TRÌNH) Huế - 2012

description

LINK MEDIAFIRE: https://www.mediafire.com/?nvlx8xbrc6j2cgs LINK SFSHARE: http://sfshare.se/ux9qkkyyq0kj

Transcript of Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

Page 1: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

1

ĐẠI HỌC HUẾ TRUNG TÂM ĐÀO TẠO TỪ XA

HOÀNG TRỌNG PHÁN

SINH HỌC PHÂN TỬ (KHÁI NI ỆM, NGUYÊN LÝ & QUÁ TRÌNH)

Huế - 2012

Page 2: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

2

L�i nói đ�u

Để góp phần đổi mới nội dung giáo trình Sinh học phân tử của Trung tâm Đào tạo Từ xa – Đại

học Huế theo hướng cập nhật kiến thức cũng như phương pháp dạy - học phù hợp với đối tượng

đặc thù, chúng tôi đã tham cứu nhiều tài liệu và cố gắng biên soạn giáo trình trên tinh thần ấy.

Nội dung giáo trình gồm tám chương bao quát các kiến thức cơ bản của Sinh học phân tử mà

học viên và sinh viên của Trung tâm và các trường Đại học cần nắm vững để có thể vận dụng tốt

vào trong công tác nghiên cứu và giảng dạy của mình.

Chương 1: Cấu trúc và chức năng của các đại phân tử sinh học

Chương 2: Tổ chức bộ gen các sinh vật

Chương 3: Cấu trúc và chức năng của gen

Chương 4: Tái bản của các bộ gen

Chương 5: Phiên mã và dịch mã

Chương 6: Điều hòa sự biểu hiện của gen

Chương 7: Các biến đổi của bộ gen

Chương 8: Các phương pháp sinh học phân tử và công nghệ ADN tái tổ hợp

Mở đầu mỗi chương có phần giới thiệu và mục tiêu giúp người học xác định các chủ đề chính

cần tìm hiểu. Sau mỗi chương có phần Tóm tắt nhằm giúp người học nắm nội dung khái quát của

chương. Cuối cùng là phần Câu hỏi và Bài tập, với 15-25 câu mỗi chương, yêu cầu người học tập

vận dụng hiểu biết của mình vào giải quyết chúng trước khi sang chương mới. Đặc biệt, trong khi

biên soạn chúng tôi có đưa thêm phần Hướng dẫn Trả lời Câu hỏi và Bài tập cuối mỗi chương cùng

với một số vấn đề liên quan thiết yếu khác vào phần Phụ lục (đặt ở cuối sách) nhằm giúp người học

tra cứu, tham khảo cách học và giải quyết vấn đề khi cần.

Hy vọng rằng giáo trình này sẽ đáp ứng được nhu cầu học tập của học viên và sinh viên về môn

học vốn dĩ rất mới và rất khó này. Tuy nhiên, vì khuôn khổ có hạn nên một số chủ để không thể đề

cập sâu hơn trong sách này. Hơn nữa, với khả năng có hạn, chắc chắn sách không thể tránh khỏi

các sai sót trong khi biên soạn. Chúng tôi rất mong nhận được sự phê bình và chỉ bảo của quý đồng

nghiệp và bạn đọc để giáo trình được hoàn chỉnh hơn trong lần in sau.

Huế, ngày 20 tháng 2 năm 2012

Tác giả

HOÀNG TRỌNG PHÁN

Page 3: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

3

Chương 1

CẤU TRÚC VÀ CHỨC NĂNG

CỦA CÁC ĐẠI PHÂN TỬ SINH HỌC

Đối với các nghiên cứu sinh học cơ sở, bốn đại phân tử quan trọng phải kể đến là các các axit nucleic, protein, polysaccharide và lipid. Tuy nhiên, trên quan điểm của sinh học phân tử, protein và các axit nucleic là hai loại hợp chất quan trọng nhất mà chủ yếu là ADN và các thành phần của chúng. Việc nghiên cứu cấu trúc và chức năng của các axit nucleic thực sự bắt đầu từ giữa thế kỷ XX. Vào năm 1944, O.T. Avery, MacLeod và McCarty lần đầu tiên chứng minh ADN là vật chất mang thông tin di truyền. Kế đó, sự khám phá ra cấu trúc phân tử ADN bởi James Watson và Francis Crick năm 1953 cùng với những hệ quả của nó đã là một trong những sự kiện khoa học nổi bật nhất của thế kỷ XX, đặt nền tảng cho sự ra đời và phát tiển của di truyền học và sinh học phân tử.

Trong chương này, chúng ta lần lượt tìm hiểu các vấn đề sau: (i) Cấu trúc và chức năng của các axit nucleic; (ii) Cấu trúc và chức năng của protein; (iii) Cấu trúc và chức năng của các polysaccharide và lipid; và (iv) Các liên kết hóa học cơ bản trong các hệ thống sống.

1. Cấu trúc và chức năng của các Axit Nucleic

1.1. Đại cương về các axit nucleic

Ngày nay chúng ta đều biết rằng vật chất di truyền hay bộ gen của các sinh vật trên trái đất là các axit nucleic mà hầu hết là acid deoxyribonucleic (ADN) và ở một số ít virus là acid ribonucleic (ARN). Điều này đã được chứng minh qua các thí nghiệm kinh điển nổi tiếng, đó là: (i) Thí nghiệm biến nạp ở vi khuẩn được thực hiện đầu tiên bởi Griffith (1928) và sau đó là nhóm nghiên cứu của Avery và cộng sự (1944); (ii) Thí nghiệm của Hershey và Chase ở thể thực khuẩn T2; và (iii) Thí nghiệm của Conrat và Singer ở virus đốm thuốc lá (1956).

Các axit nucleic là những đại phân tử sinh học có trọng lượng phân tử lớn với thành phần gồm các nguyên tố C, H, O, N và P. Chúng được cấu thành từ các đơn phân (monomer) - các nucleotide; các đơn phân này nối với nhau bằng các liên kết phosphodiester tạo thành cấu trúc đa phân (polymer) gọi là các chuỗi, mạch hay sợi polynucleotide - cấu trúc sơ cấp của các phân tử ADN và ARN.

Vật chất di truyền có các đặc tính thiết yếu sau:

(1) Đặc tính thông tin sinh học: Nó chứa đựng toàn bộ thông tin di truyền cần thiết cho việc xác định cấu trúc của các protein đặc thù của mỗi loài (các gen cấu trúc) và điều khiển các hoạt động sinh trưởng, phân chia và biệt hoá tế bào.

(2) Đặc tính tái bản: Đó là khả năng tự sao chép chính xác, đảm bảo thông tin di truyền của thế hệ sau giống với thế hệ trước.

(3) Đặc tính hoạt động của các gen: Các gen trong bộ gen có khả năng tổng hợp ra các sản phẩm là những phân tử tham gia vào mọi động sống căn bản của tế bào. Đó là các quá trình phiên mã, dịch mã và điều hòa hoạt động của các gen.

(4) Đặc tính biến đổi: Đó là khả năng bị biến đổi của các bộ gen từ các quá trình khác nhau

Page 4: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

4

như đột biến, tái tổ hợp, các yếu tố di truyền vận động. Chính sự biến đổi này tạo ra các nguồn biến dị di truyền đa dạng và phong phú cho quá trình chọn lọc và tiến hoá của sinh giới kể từ khi sự sống bắt đầu hình thành trên trái đất cách đây chừng 3 tỷ rưỡi năm.

1.2. Cấu trúc của các nucleotide

Đơn vị cấu trúc cơ sở của các axit nucleic là các nucleotide. Mỗi nucleotide gồm có: 1 bazơ nitơ, 1 đường pentose, và 1 axit phosphoric.

Bazơ nitơ - thành phần đặc trưng của các nucleotide - là các hợp chất purine và pyrimidine dị vòng chứa nitơ có tính kiềm. ADN chứa bốn loại bazơ chính là adenine (A), guanine (G), thymine (T) và cytosine (C); trong ARN cũng chứa 4 loại như thế, chỉ khác là uracil thay cho thymine (Hình 1.1). Ngoài ra, trong ADN còn có mặt các bazơ bị biến đổi chủ yếu do sự methyl hoá ở các vị trí khác nhau, ví dụ: 5-methylcytosine, 5-hydroxymethylcytosine, 7-methylguanine v.v. (Hình 1.2).

Đường pentose của ARN là D-ribose và của ADN là 2'-deoxy-D-ribose (ký hiệu D chỉ dạng đường quay phải trước ánh sáng phân cực để phân biệt với dạng L quay trái không có trong thành phần của các axit nucleic tự nhiên). Các phân tử đường này đều có cấu trúc vòng. Vì các nguyên tử carbon ở đây xếp liên tục nên được đánh số thứ tự có dấu phẩy trên đầu, ví dụ C1', C2' cho đến C5' (Hình 1.3).

Hình 1.1. Cấu trúc 5 loại bazơ có mặt trong ADN và ARN.

Page 5: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

5

Hình 1.2. Một số dạng bazơ bị biến đổi chủ yếu do sự methyl hoá.

Hình 1.3. (a) Cấu trúc của các phân tử đường ribose và deoxyribose. (b) Cấu trúc của ribonucleotide Adenine trong ARN.

Hai phân tử đường này khác nhau ở C2'; trong ribose đó là nhóm hydroxyl và trong deoxyribose là một nguyên tử hydro. Từ các gốc đường khác nhau này tạo ra hai loại nucleotide - ribonucleotide và deoxyribonucleotide - cấu tạo nên hai loại axit nucleic khác nhau là ARN và ADN. Cần để ý rằng, trong các phân tử đường này có ba vị trí quan trọng có chứa nhóm hydroxyl (–OH) tự do, đó là: (i) nhóm –OH ở vị trí C1' có khả năng hình thành liên kết N-glycosid với gốc -NH của các bazơ để tạo thành các nucleoside; (ii) nhóm -OH ở vị trí C5' có khả năng hình thành liên kết ester với nhóm phosphate để tạo ra các nucleotide; và (iii) nhóm –OH ở vị trí C3' có khả năng hình thành liên kết phosphodiester với nhóm phosphate của một nucleotide khác để tạo chuỗi polynucleotide. Như vậy, tính phân cực trong gốc đường mà từ đó quyết định tính phân cực của các chuỗi polynucleotide được thể hiện ở hai vị trí C3' và C5'.

Trong các nucleotide của ADN và ARN, nhóm phosphate liên kết với các nucleoside tại C5'. Mỗi nucleoside được tạo thành do một bazơ nối với đường tại C1' bằng một liên kết N-glycoside. Cụ thể, C1' nối với N1 của pyrimidine hoặc với N9 của purine. Tên gọi chính thức hay danh pháp của các nucleoside bắt nguồn từ các bazơ tương ứng, trong đó các nucleoside là dẫn xuất của purine có đuôi là -osine và các dẫn xuất của pyrimidine có đuôi là -idine (Bảng 1.1).

Tóm lại, mỗi nucleotide gồm 3 thành phần kết dính với nhau như sau: gốc đường nối với bazơ

tại C1' bằng một liên kết β-glycosid và nối với nhóm phosphate tại C5' bằng một liên kết

phosphomonoester (Hình 1.4).

Bảng 1.1. Tên gọi của các nucleoside và nucleotide của ARN và ADN

Bazơ Nucleoside Nucleotide

ARN

Adenine (A) Adenosine Adenosine 5'-monophosphate (AMP)

Guanine (G) Guanosine Guanosine 5'-monophosphate (GMP)

Cytosine (C) Cytidine Cytidine 5'-monophosphate (CMP)

Page 6: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

6

Uracil (U) Uridine Uridine 5'-monophosphate (UMP)

ADN

Adenine (A) Deoxyadenosine Deoxyadenosine 5'-phosphate (dAMP)

Guanine (G) Deoxyguanosine Deoxyguanosine 5'-phosphate (dGMP)

Cytosine (C) Deoxycytidine Deoxycytidine 5'-phosphate (dCMP)

Thymine (T) Deoxythymidine Deoxythymidine 5'-phosphate (dTMP)

1.3. Cấu trúc của các chuỗi polynucleotide

Các nucleotide trong ADN hoặc ARN nối với nhau bằng các mối liên kết đồng hoá trị (covalent) có tên là liên kết 3',5'-phosphodiester (giữa gốc đường của nucleotide này với nhóm phosphate của nucleotide kế tiếp), tạo thành chuỗi polynucleotide. Vì vậy các chuỗi này bao giờ cũng được kéo dài theo chiều 5'→3' (đầu 5' mang nhóm phosphate và đầu 3' chứa nhóm -OH tự do). Chúng có bộ khung vững chắc gồm các gốc đường và phosphate xếp luân phiên nhau, còn các bazơ nằm về một bên. Trình tự các bazơ vì vậy được đọc theo một chiều xác định 5'→3'. Đây là cấu trúc sơ cấp của ADN và ARN (Hình 1.5).

Hình 1.4. Cấu trúc của một deoxyribonucleotide (dAMP)

Thông thường người ta biểu diễn trình tự bazơ 5'→3' theo chiều từ trái sang phải. Hình 1.5 cho thấy các chuỗi ADN và ARN chỉ khác nhau bởi bazơ U hoặc T và gốc đường trong các nucleotide của chúng. Nếu bỏ qua sự khác biệt về gốc đường, ta có thể hình dung trình tự các bazơ của hai chuỗi polynucleotide của ADN và ARN đều sinh trưởng theo chiều từ 5' đến 3' (5'→3'), như sau:

Chuỗi ADN: (5') pApApTpTpCpTpTpApApApTpTpC -OH (3')

Chuỗi ARN: (5') pApApUpUpCpUpUpApApApUpUpC -OH (3')

Cần lưu ý rằng: (1) Các hợp chất dùng để polymer hoá là các nucleoside triphosphate, nhưng

Page 7: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

7

các monomer của axit nucleic lại là monophosphate. Phản ứng trùng hợp này được xúc tác bởi các enzyme ADN polymerase và ARN polymerase. (2) Các oligonucleotide là những đoạn có độ dài thường là ~10-100 nucleotide. Các oligoribonucleotide tồn tại trong tự nhiên và được sử dụng như là những đoạn mồi (primer) trong tái bản ADN và cho các mục đích khác nhau trong tế bào. Các oligonucleotide tổng hợp có thể tạo ra bằng sự tổng hợp hoá học và là nguyên liệu thiết yếu cho các kỹ thuật sinh học phân tử, như: giải mã di truyền trong ống nghiệm; xác định trình tự ADN, phản ứng trùng hợp chuỗi bằng polymerase (polymerase chain reaction = PCR), lai tại chỗ (in situ hybridization), mẩu dò axit nucleic, lai axit nucleic v.v.

Chuỗi polynucleotide c ủa ẢN sai khác ở: Ribose (-OH) và baz ơ Uracil

Hình 1.5. Cấu trúc chuỗi polynucleotide của ADN (trên) và của ARN.

1.4. Cấu trúc của phân tử ADN

1.4.1. Thành phần hóa học của ADN

Bảng 1.2. Thành phần bazơ của ADN ở một số loài

Sinh vật A% T% G% C% CT

GA

++

CG

TA

++

Phage lambda 21,3 22,9 28,6 27,2 1,00 0,79

Phage T7 26,0 26,0 24,0 24,0 1,00 1,08

Mycobacterium tuberculosis 15,1 14,6 34,9 35,4 1,00 0,42

Escherichia coli 24,7 23,6 26,0 25,7 1,03 0,93

Aspergillus niger (nấm mốc) 25,0 24,9 25,1 25,0 1,00 1,00

Saccharomyces cerevisiae 31,3 32,9 18,7 17,1 1,00 1,79

Triticum (lúa mỳ) 27,3 27,1 22,7 22,8 1,00 1,19

Zea mays (ngô) 26,8 27,2 22,8 23,2 0,98 1,17

Salmo salar (cá hồi) 29,7 29,1 20,8 20,4 1,02 1,43

Page 8: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

8

Gallus domestica (gà nhà) 29,5 27,7 22,4 20,4 1,08 1,34

Homo sapiens (người) 30,9 29,4 19,9 19,8 1,01 1,52

Hình 1.6. (a) R. Franklin; (b) Nhiễu xạ tia X của ADN, và (c) Ảnh chụp.

Erwin Chargaff (1949) lần đầu tiên áp dụng phương pháp sắc ký giấy vào việc phân tích

thành phần hóa học của ADN các loài khác nhau đã khám phá ra rằng (Bảng 1.2): (i) Số lượng bốn

loại bazơ trong ADN là không bằng nhau; (ii) Tỷ lệ tương đối của các bazơ là không ngẫu nhiên;

trong tất cả các mẫu ADN nghiên cứu có tương quan về hàm lượng (%) giữa các bazơ: A ≈ T và

G≈ C, nghĩa là tỷ số (A+G)/(T+C)≈ 1; và (iii) Mỗi loài có một tỷ lệ (A+T)/(G+C) đặc thù.

1.4.2. Cấu trúc của chuỗi xoắn kép ADN

Vào năm 1951-1952, việc nghiên cứu cấu trúc ba chiều của ADN bằng phân tích nhiễu xạ tia

X được bắt đầu bởi Maurice Wilkins và Rosalind Franklin (Hình 1.6). Các bức ảnh chụp được gợi ý

rằng ADN có cấu trúc xoắn gồm hai hoặc ba chuỗi. Tuy nhiên, giải pháp đúng đắn nhất là chuỗi

xoắn kép bổ sung do Watson và Crick đưa ra năm 1953 (Hình 1.7 và 1.8). Mô hình này hoàn hoàn

toàn phù hợp với các số liệu của Wilkins và Franklin cũng như của Chargaff. Sự kiện này mở ra

một bước ngoặt mới cho cho sự ra đời và phát triển nhanh chóng của sinh học phân tử. Với phát

minh về mô hình cấu trúc phân tử ADN, Watson và Crick cùng chia sẻ với Wilkins giải thưởng

Nobel năm 1962.

Page 9: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

9

Hình 1.7. J.Watson (trái) và F.Crick cùng với M. Wilkins bên cạnh mô hình cấu trúc phân tử ADN làm nên tên tuổi của họ.

Mô hình Watson-Crick (hay ADN dạng B) có các đặc điểm sau:

(1) ADN gồm hai chuỗi đối song song (antiparallel) cùng uốn quanh một trục trung tâm theo chiều xoắn phải, với đường kính 20Ao (1Angstrom = 10-10m), gồm nhiều vòng xoắn lặp lại một cách đều đặn và chiều cao mỗi vòng xoắn là 34 Ao, ứng với 10 cặp bazơ (base pair = bp).

(2) Các bộ khung đường-phosphate phân bố ở mặt ngoài chuỗi xoắn và các bazơ nằm ở bên trong; chúng xếp trên những mặt phẳng song song với nhau và thẳng góc với trục phân tử, với khoảng cách ~3,4 Ao.

(3) Hai mạch đơn của ADN gắn với nhau bằng các liên kết hydro giữa các cặp bazơ đối diện (nằm cách nhau khoảng 3Ao) theo nguyên tắc bổ sung, đó là: A-T (2 liên kết hydro) và G-C (3 liên kết) - Hình 1.8 và 1.9a.

(4) Tính chất bổ sung theo cặp bazơ dẫn đến sự bổ sung về trình tự các bazơ giữa hai mạch đơn của mỗi chuỗi xoắn kép. Vì vậy, trong bất kỳ một phân tử ADN mạch kép nào hoặc một đoạn

của nó bao giờ cũng có: A = T và G = C; nghĩa là: [A + G] = [T + C] hay A G

1T C

+ =+

, còn tỷ lệ

A T

G C

++

là đặc thù cho từng loài. Như vậy, mô hình cấu trúc chuỗi xoắn kép của Watson-Crick

(1953) hoàn toàn thoả mãn các kết quả nghiên cứu của Chargaff (1949); và các biểu thức A = T và G = C còn gọi là các quy luật Chargaff (Chargaff's rules).

Vì vậy, khi biết trình tự bazơ ở một mạch đơn của ADN, ta có thể xác định được trình tự bazơ ở mạch bổ sung của nó. Ví dụ:

Mạch 1 (cho trước): 5'- AATTCTTAAATTC -3'

Mạch 2 (bổ sung): 3'- TTAAGAATTTAAG -5'

Tóm lại, hai đặc điểm quan trọng nhất trong cấu trúc ADN là sự phân cực ngược chiều của hai mạch đơn (5'→3' và 3'→5') và nguyên tắc bổ sung của các cặp bazơ (A-T và G-C). Đây là hai

Page 10: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

10

nguyên lý căn bản chi phối các cơ chế di truyền ở cấp độ phân tử (tái bản, phiên mã và dịch mã), mà ta có thể hình dung tổng quát ở sơ đồ gọi là Giáo lý trung tâm của Sinh học phân tử.

Hình 1.8. Các mô hình cấu trúc chuỗi xoắn kép ADN.

(a) (b)

Hình 1.9. (a) Hai kiểu kết cặp bazơ bổ sung A-T và G-C. (b) Sơ đồ minh họa các khả năng kết cặp “1 pyrimidine - 1 pyrimidine”, “1 purine - 1 purine”, và “1 purine - 1 pyrimidine” (xem giải thích trong bài).

Cần lưu ý rằng, theo nguyên tắc kết cặp các bazơ đối diện trên 2 mạch đơn của ADN có thể có các trường hợp sau: "1 pyrimidine - 1 pyrimidine", "1 purine - 1 purine", "1 purine - 1 pyrimidine" như ở Hình 1.9b Tuy nhiên, như ta thấy, hai trường hợp đầu cho thấy chúng hoặc là quá mỏng hoặc quá dày so với đường kính phân tử. Chỉ có trường hợp "1 purine - 1 pyrimidine" là phù hợp. Như vậy có thể có 4 kiểu kết cặp là A-T, G-C, A-C và G-T; trong đó chỉ có hai kiểu A-T

Page 11: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

11

và G-C là bền vững, còn các kiểu A-C và G-T vì chỉ có một liên kết hydro, kém bền nên chúng chỉ xuất hiện như là ngoại lệ khi có sự hỗ biến của các bazơ và hậu quả là dẫn tới sự phát sinh các đột biến thay thế bazơ dạng đồng hoán trong quá trình tái bản ADN (chương 7).

1.4.3. Các dạng biến đổi của ADN

Mô hình Watson-Crick hay ADN dạng B là cấu trúc phổ biến. Tuy nhiên, sau này người ta còn phát hiện ra nhiều dạng xoắn phải khác (A, C, D...); chúng có một số biến đổi so với ADN-B (Bảng 1.3). Bên cạnh các dạng ADN xoắn phải (A, B, C...), Alexander Rich và đồng sự (1979) còn phát hiện thêm một dạng ADN xoắn trái duy nhất cho đến nay. Dạng ADN này có bộ khung zigzag uốn gập khúc theo chiều xoắn trái, mỗi vòng xoắn dài 45,6Ao chứa 12 cặp bazơ. Nhìn chung, so với ADN dạng B, ADN-Z dài và thon gầy hơn, các rãnh lớn bị dẹt ra phần bề mặt của chuỗi xoắn; còn ADN dạng A ngắn và mập hơn (Hình 1.10; Bảng 1.3).

Bảng 1.3. Một số đặc điểm chính của các ADN dạng A, B và Z.

Dạng Chiều xoắn Số bp/vòng xoắn Đường kính chuỗi xoắn

A Phải 11,0 23Ao

B Phải 10,0 19Ao

Z Trái 12,0 18Ao

Những vùng nào của ADN có chứa các purine và pyrimidine sắp xếp xen kẽ nhau trên một mạch thì có thể tiếp nhận cấu hình ADN-Z, ví dụ:

5'--CGCGCG--3'

3'--GCGCGC--5'

Sự chuyển đổi này diễn ra thuận lợi bởi sự có mặt của 5-methylcytosine và bởi trạng thái siêu xoắn âm (negative supercoiling). ADN là một phân tử động học, vì vậy nó có thể chuyển từ một cấu hình này sang một cấu hình khác dựa trên các lực bên ngoài trong tế bào. Sự chuyển đổi từ dạng B sang dạng Z có thể có liên quan đến sự điều hoà biểu hiện gen. Cấu trúc này cũng có mặt trong các tế bào sống với một tỷ lệ rất nhỏ song chức năng của nó còn chưa thật sự hiểu rõ.

Hình 1.10. Các mô hình ADN dạng A, B và Z.

1.4.4. Đặc tính hóa lý của ADN

Một trong những đặc điểm quan trọng nhất của ADN là hai mạch đơn bổ sung của nó gắn với

Page 12: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

12

nhau bằng các liên kết hydro, vốn là lực hóa học yếu nên chúng có thể bị phân hủy dưới tác dụng của các enzyme, năng lượng... làm cho hai mạch đơn của chuỗi xoắn kép tách rời nhau, gọi là biến

tính (denaturation). Nhờ đó ADN mới có thể tái bản và các gen có thể phiên mã và biểu hiện ra sản phẩm của chúng. Mặt khác, ADN có thể phục hồi trạng thái ban đầu gọi là hồi tính (renaturation).

Bằng thực nghiệm, người ta đã chứng minh điều đó bằng cách sử dụng các tác nhân vật lý và hóa học khác nhau. Chẳng hạn, khi đun nóng từ từ khi đun nóng từ từ dung dịch chứa ADN thì ở nhiệt độ vừa phải, thì các phân tử ADN bị biến tính từng phần, và khi tăng lên tới nhiệt độ gần 100oC (thường là 90-95oC) thì các liên kết hydro của chúng bị phá hủy hoàn toàn và hai mạch bổ sung tách ra (biến tính hoàn toàn). Điều đó có thể giải thích như sau: Vì mỗi cặp A-T chỉ có hai liên kết hydro, kém bền hơn so với mỗi cặp G-C có tới ba liên kết, cho nên các vùng giàu cặp A-T sẽ tách từng phần trước, trong khi các vùng giàu cặp G-C vẫn giữ nguyên đặc tính xoắn kép và chỉ tách ở nhiệt độ cao. Ngược lại, khi làm nguội từ từ dung dịch ADN nóng chảy hoàn toàn này thì các mạch đơn thường cặp lại với mạch bổ sung của chúng và làm phục hồi cấu trúc chuỗi xoắn kép như lúc đầu. Đây là hai quá trình thuận-nghịch.

– Biến tính hay sự tách hai mạch của chuỗi xoắn kép ADN

Trong khi các tỷ số G với C và A với T trong ADN của một sinh vật là cố định, thì hàm lượng GC (tỷ lệ phần trăm của G + C) có thể sai khác nhau một cách đáng kể giữa các ADN thuộc các loài khác nhau. Bảng 1.4 cho thấy hàm lượng GC của ADN nhiều loài sinh vật. Các trị số này biến thiên từ 22% đến 73%, và điều đó được phản ảnh trong sự sai khác về các đặc tính của ADN.

Nhiệt độ mà tại đó các mạch ADN tách nhau một nửa được gọi là nhiệt độ nóng chảy (melting temperature), ký hiệu là Tm. Tm là điểm giữa của pha chuyển tiếp và nó tùy thuộc vào hàm lượng GC của ADN, nghĩa là đặc trưng cho ADN mỗi loài. Trên thực tế, hàm lượng GC của ADN càng cao thì Tm của nó càng cao (Hình 1.12). Ví dụ, ADN của E. coli với 50-51% GC thì có Tm là 69-70oC. Tương tự, kết quả xử lý nhiệt đối với ADN phế cầu khuẩn Streptococcus pneumoniae và nhiệt độ nóng chảy của nó được đo bằng sự gia tăng độ hấp thụ ở 260-nm cho phép thu được đường cong nóng chảy của vi khuẩn này. Tm cho ADN này dưới những điều kiện như thế là khoảng 85oC (Hình 1.11).

Bảng 1.4. Hàm lượng tương đối (G + C) của các ADN khác nhau

Nguồn ADN (G+C)% Nguồn ADN (G+C)%

Dictyostelium (mốc nhầy) 22 Lách chuột 44

Streptococcus pyogens 34 Tinh trùng cá hồi 44

Bacillus cereus 37 B. subtilis 44

Hemophilus influenzae 39 Escherichia coli 51

Saccharomyces cerevisiae 39 Phage T7 51

Tuyến ức bê 40 Phage T3 53

Gan chuột (Rattus) 40 Neurospora crassa 54

Streptococcus pneumoniae 42 Herpes simplex virus 72

Mầm lúa mỳ 43 Mycobacterium phlei 73

Page 13: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

13

Hình 1.11. Đường cong nóng chảy của ADN Streptococcus pneumoniae. ADN sợi kép bị biến tính

bởi việc đun nóng và nhiệt độ nóng chảy của nó được đo bằng sự tăng độ hấp thụ ở bước sóng

260 nm. Điểm mà tại đó 50% cặp bazơ bị biến tính hay một nửa ADN có dạng sợi đơn gọi là

nhiệt độ nóng chảy (Tm). Ở ví dụ này là khoảng 85oC. (Phỏng theo P. Doty, The Harvey Lectures

55:121, 1961).

– Sự phục hồi trạng thái nguyên thể của ADN hay hồi tính

Một khi hai mạch của ADN tách ra, dưới những điều kiện thích hợp chúng có thể kết hợp trở

lại và phục hồi trạng thái ban đầu. Góp phần vào hiệu quả "hồi tính" này của ADN có nhiều nhân

tố. Dưới đây nêu lên ba nhân tố quan trọng nhất: (i) Nhiệt độ tối ưu cho sự hồi tính của một ADN là

khoảng 25oC dưới nhiệt độ nóng chảy của nó; (ii) Nồng độ ADN trong dung dịch cũng quan trọng.

Trong giới hạn hợp lý, nồng dộ ADN càng cao thì hai mạch bổ sung sẽ càng dễ dàng bắt gặp nhau

trong một thời gian nào đó. Nói cách khác, nồng độ càng cao thì sự hàn gắn trở lại càng nhanh. (iii)

Thời gian cho phép hai mạch hàn gắn trở lại càng dài thì sự hồi tính xảy ra càng dễ dàng.

Hình 1.12. Mối quan hệ giữa nhiệt độ nóng chảy của ADN và hàm lượng GC. ADN chỉ có AT (AT-DNA) là các ADN tổng hợp bao gồm chủ yếu là A và T (hàm lượng GC = 0). (Phỏng theo P. Doty, The Harvey Lectures 55:121, 1961).

Page 14: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

14

1.4.5. Chức năng của ADN

Ngày nay, chúng ta đều biết rằng ADN hay bộ gen của tất cả các sinh vật nói chung có chức năng chính là mang đầy đủ toàn bộ thông tin di truyền đặc trưng của loài. Thông tin này được ghi lại dưới dạng mật mã, gọi là mã di truyền, chứa đựng trong các gen cấu trúc cũng như các yếu tố điều

hòa để điều khiển mọi hoạt động sinh trưởng, phân chia và biệt hoá của tế bào. Các chức năng và cơ chế truyền đạt thông tin di truyền chính yếu của ADN được mô tả tóm tắt như dưới đây.

Hơn nữa, ADN hay vật chất di truyền nói chung đều có khả năng tự sao chép một cách chính xác bản thân nó trong quá trình tái bản (replication). Đấy là cơ sở của sự tự nhân đôi nhiễm sắc thể và phân chia tế bào, qua đó truyền đạt vật chất di truyền cho thế hệ sau. Đó còn là các quá trình hoạt động và điều hoà sự biểu hiện của các gen trong bộ gen, thường được kể đến như là các quá tình phiên mã (transcription) và dịch mã (translation) để tổng hợp các phân tử ARN và cuối cùng là các protein tham gia vào các cấu trúc và hoạt động cơ sở của tế bào. Nhờ đó mà con cái sinh ra thường giống với cha mẹ, mỗi loài duy trì sự ổn định tương đối bộ gen của mình và nói rộng ra là, nhờ đó mà sự sống được duy trì một cách liên tục kể từ khi sự sống bắt đầu hình thành trên trái đất cách đây chừng ba tỷ rưỡi năm.

Mặt khác, ADN còn có khả năng phát sinh các biến đổi trong quá trình phát triển cá thể và sinh sản. Đó là các đột biến gen (gene mutations) gây ra bởi tác động của các tác nhân vật lý và hoá học khác nhau, hoặc do chính các sai sót trong quá trình tái bản, hoặc do sự dịch chuyển vị trí của bản thân các gen trong bộ gen - các yếu tố di truyền vận động (transposable genetic elements) hay còn gọi là các gen nhảy (jumping genes) – gây nên sự biến động của bộ gen và biến đổi ở kiểu hình. Ngoài ra, đó còn là các quá trình tái tổ hợp di truyền (genetic recombination) tạo nên các biến dị tổ hợp phong phú và đa dạng trong quá trình sinh sản của sinh vật. Chính các quá trình biến đổi đa dạng này đã không ngừng tạo nên các nguồn biến dị di truyền sơ cấp và thứ cấp cho sự chọn lọc và tiến hoá của sinh giới.

2. Cấu trúc và chức năng của protein

2.1. Cấu trúc của protein

Các protein là những polymer sinh học được tạo ra bởi sự kết nối của các axit amin (amino acid) với nhau bằng các liên kết peptide. Có 20 loại L-α-axit amin được phát hiện trong các protein của các tế bào.

Về cấu trúc, nói chung, mỗi axit amin gồm có một nguyên tử carbon alpha (Cα) ở vị trí trung tâm, đính xung quanh nó là một nhóm ạmin (-NH2), một nhóm carboxyl (-COOH), một nguyên tử hydro (-H) và một gốc R hay chuỗi bên đặc trưng cho từng loại axit amin (Hình 1.14). Khi ở trạng thái dung dịch, các nhóm amin và carboxyl thường phân ly thành trạng thái ion, tương ứng là +H3N- và -COO− (Hình 1.13).

Page 15: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

15

(a)

(b)

Hình 1.13. (a) Cấu trúc chung của các axit amin. (b) Một dipeptide.

Hai axit amin nối với nhau bằng một liên kết peptide (−CO−NH−) giữa nhóm carboxyl của axit amin này với nhóm amin của axit amin kế tiếp và loại trừ một phân tử nước; cứ như thế các axit amin kết nối với nhau tạo thành một chuỗi gồm nhiều axit amin, gọi là polypeptide (Hình 1.15). Mỗi chuỗi polypeptide luôn luôn có chiều xác định +H3N → COO− (do tác dụng của peptydyl-

transferase) và được đặc trưng về số lượng, thành phần và chủ yếu là trình tự sắp xếp của các axit amin.

Có bốn mức độ cấu trúc của các protein (xem Hình 1.16).

Cấu trúc protein bậc I là trình tự sắp xếp của các axit amin trong một chuỗi polypeptide. Đây là bậc cấu trúc cơ sở quan trọng nhất của tất cả các protein do gen quy định.

Page 16: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

16

Hình 1.14. Cấu tạo của 20 loại axit amin thuộc các nhóm khác nhau.

Hình 1.15. Sự hình thành liên kết peptide giữa các axit amin.

Hình 1.16. Bốn bậc cấu trúc của protein.

Page 17: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

17

Cấu trúc protein bậc II xảy ra khi trình tự các axit amin trong một chuỗi polypeptide nối với nhau bằng các liên kết hydro. Cấu trúc này có hai kiểu cơ bản, đó là: chuỗi xoắn alpha (xoắn trái) và tấm beta (gấp nếp).

Cấu trúc protein bậc III xảy ra khi các lực hấp dẫn nào đó có mặt giữa các vùng xoắn alpha và các tấm beta gấp nếp trong một chuỗi polypeptide, hình thành nên một cấu trúc cuộn gập có dạng khối cầu. Một số protein chức năng có cấu trúc kiểu này, ví dụ myoglobin...

Cấu trúc protein bậc IV là một protein gồm hai hoặc nhiều chuỗi polypeptide cùng loại hoặc khác loại kết hợp với nhau. Có khá nhiều protein chức năng có kiểu cấu trúc này; một số như hemoglobin còn có thêm ion kim loại như Fe++ trong túi hem của nó.

2.2. Chức năng của protein

Nói chung, protein là các hợp chất hữu cơ vốn là cơ sở của sự sống, với các chức năng thiết yếu sau đây (Hình 1.17):

Hình 1.17. Tổng quát về cấu trúc và chức năng của protein.

(i) Các protein là thành phần cấu tạo cơ sở của các tế bào, bao gồm các màng tế bào, các bào quan, bộ máy di truyền của chúng. Đó cũng là các protein dạng mạch làm thành các cơ quan, bộ phận trên cơ thể các động vật, như: collagen làm nên xương, sụn, gân và da; keratin cấu tạo nên các lớp ngoài cùng của da và tóc, móng, sừng và lông;

(ii) Các enzyme đóng vai trò xúc tác cho tất cả các phản ứng hóa học trong tế bào và cơ thể đều là những protein hình cầu. Quan trọng nhất là các enzyme tham gia vào các con đường chuyển hóa và các enzyme tham gia vào các quá trình truyền thông tin di truyền trong tế bào (Hình 1.18).

Page 18: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

18

Hình 1.18. Lysozyme lòng trắng trứng gà. (a) Lysozyme tự do. (b) Lysozyme có cơ chất bám vào. (Phỏng theo Horton et al, 2006).

(iii) Các kháng thể (antibodies) trong hệ thống miễn dịch, còn gọi là các immunoglobulin, làm ra hàng ngàn protein khác nhau vốn được sinh ra trong huyết thanh máu phản ứng lại với các kháng

nguyên (antigens). Chúng đóng vai trò bảo vệ cơ thể chống lại sự xâm nhập của các vật lạ.

(iv) Các hormone protein bắt nguồn từ các tuyến nội tiết thì không hoạt động như các enzyme. Thay vì kích thích các cơ quan đích, chúng kiểm soát các hoạt động quan trọng, như tốc độ chuyển hóa và sản xuất các enzyme tiêu hóa và sữa chẳng hạn. Insulin (từ tuyến tụy) điều hòa sự chuyển hóa carbohydrate bằng cách kiểm soát các mức glucose trong máu. Thyroglobulin (từ tuyến giáp) điều hòa các quá trình chuyển hóa nói chung; calcitonin cũng từ tuyến giáp làm hạ thấp mức calci máu.

(v) Ngoài ra, các protein còn là nguồn dinh dưỡng chính cung cấp năng lượng cho tế bào và cơ thể duy trì các hoạt động trao đổi chất và lớn lên. Ví dụ hemoglobin mang các sinh chất theo máu đi khắp cơ thể; các fibrinogen và fibrin được biến đổi từ nó vốn có trong máu cần thiết cho quá trình đông máu. Các protein cơ mà chủ yếu là myosin phối hợp với actin tạo thành actomyosin, chịu trách nhiệm cho hoạt động co cơ...

3. Cấu trúc và chức năng của các Polysaccharide

3.1. Cấu trúc của các Polysaccharide

Các polysaccharide và hợp chất carbohydrate nói chung có hành phần hóa học gồm các nguyên tố C, H và O, theo tỷ lệ thông thường là 1:2:1 hay (CH2O)n. Đơn phân cấu tạo nên chúng là các monosaccharide, chủ yếu là glucose. Các monosaccharide nối với nhau bằng các liên kết

glycosid tạo thành các chuỗi polysaccharide. (Hình 1.19 và 1.20)

Hình 1.19. (a) Glucose và (b) cellulose. Cellulose là một polymer mạch thẳng do các gốc glucose nối với nhau bằng các liên kết glycosid.

Page 19: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

19

Hình 1.20. Sự hình thành các disaccharide Lactose (a) và Sucrose (b) bằng các liên kết β1,4- và α1,2-glycosid.

3.2. Chức năng của các Polysaccharide

Các polysaccharide có hai chức năng quan trọng nhất trong tế bào, đó là tham gia vào cấu tạo và dự trữ năng lượng. Về cấu tạo, cellulose tạo nên vách tế bào thực vật và nó là hợp chất hữu cơ có mặt phổ biến trong sinh quyển. Về năng lượng, nguồn dự trữ năng lượng ở tế bào động vật là glycogen, trong khi đó ở các tế bào thực vật là tinh bột.

4. Cấu trúc và chức năng của Lipid

4.1. Cấu trúc của Lipid

Đon vị cấu trúc cơ sở của lipid là các axit béo. Mỗi axit béo bao gồm một chuỗi hydrocarbon đính vào nhóm carboxyl (–CÔOH); chúng khác nhau về chiều dài của mạch, số carbon cũng như số lượng và vị trí của các liên kết đôi carbon-carbon (C=C). Các axit béo phổ biến trong các tế bào có số nguyên tử carbon thường là 14, 16, 18 hoặc 20 (xem Bảng 1.5). Các axit béo thường được viết tắt Cx:y, trong đó x là số lượng carbon trong chuỗi và y là số liên kết đôi. Chuỗi hay mạch hydrocarbon dài của một axit béo có thể không chứa liên kết đôi thì gọi là axit béo no hay bão hòa (saturated) hoặc có một hay nhiều liên kết đôi thì gọi là axit béo không no hay không bão hòa

(unsaturated).

Bảng 1.5. Một số axit béo chiếm ưu thế trong các phospholipid (Lược từ Lodish et al, 2008)

Tên phổ biến của các axit

(Dạng ion hóa trong ngoặc đơn) Viết tắt Công thức hóa học

Các axit béo bão hòa:

Palmitic (palmitate) C16:0 CH3(CH2)14COOH

Stearic (stearate) C18:0 CH3(CH2)16COOH

Các axit béo không bão hòa:

Oleic (oleate) C18:1

CH3(CH2)7CH=CH(CH2)7COOH

Linoleic (linoleate) C18:2

CH3(CH2)4CH=CHCH2CH=CH(CH2)7COOH

Page 20: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

20

Tất cả các phosphoglyceride đều là những phân tử lưỡng cực (amphipathic), có một cái đuôi kỵ nước (thường là hai chuỗi axit béo) và một cái đầu ưa nước (hydrophilic head; Hình 1.21a,b). Trong dung dịch nước, hiệu quả ưa nước và các kiểu tương tác van der Waals đưa lại sự tổ chức và ổn định các phospholipid vào một trong ba cấu trúc sau: micelle, liposome hoặc là màng hai lớp (Hình 1.21c).

4.2. Chức năng của Lipid

Lipid là thành phần cấu tạo quan trọng của các màng sinh học (biomembrane; Hình 1.21), ngăn cách giữa các tế bào với môi trường chung quanh, giữa các khoang trong tế bào sinh vật nhân chuẩn, đồng thời nó là nơi bám của một số protein.

Cũng như glucose, các axit béo là nguồn năng lượng cho nhiều tế bào và được bảo quản dưới dạng triacylglycerol (xem Hình dưới) trong mô mỡ. Ngoài ra, các axit béo còn là những chất tiền thân cho phospholipid và nhiều lipid khác với một loạt chức năng khác nhau.

Hình 1.21. Cấu trúc của phospholipid. (a) Cấu trúc của phosphat-idylcholine, một phosphoglyceride điển hình, và (b) Mô hình cấu tạo của glycerophospholipid. (c) Tổ chức của các phospholipid trong cấu trúc của một micelle, liposome và màng hai lớp trong dung dịch nước.

Page 21: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

21

5. Các liên kết hóa học cơ bản và vai trò của chúng

5.1. Các liên kết đồng hóa trị trong các đại phân tử sinh học

Liên kết hóa học là lực hút giữa các nguyên tử hay các phân tử với nhau. Có hai loại liên kết cơ bản với vai trò khác nhau, đó là: Các liên kết cộng hóa trị và các liên kết hóa học yếu (Hình 1.22).

5.1.1. Các liên kết cộng hóa trị hay đồng hóa trị (covalent)

Đó là các lực hóa học mạnh giữ chặt sự nối kết giữa các nguyên tử trong một phân tử hoặc tạo ra các đại phân tử có cấu trúc bền vững. Ví dụ, cầu disulfur (–S–S–), liên kết ester... (xem Bảng 1.6). Ở đây, xin nhắc lại các liên kết đồng hóa trị quan trọng trong việc kết nối các đơn phân để tạo thành các cấu trúc đa phân chính yếu sau:

+ Các liên kết N-glycosid và liên kết ester nối kết giữa C1' và C5'của gốc đường với bazơ và nhóm phosphate trọ ra cấu trúc các nucleotide. Các nucleotide nối với nhau bằng các liên kết

phosphodiester tạo thành các chuỗi polynucleotide – cấu trúc bậc I của các phân tử axit nucleic.

+ Các axit amin nối với nhau bằng các liên kết peptid tạo thành các chuỗi polypeptide – cấu trúc bậc I của các phân tử protein.

+ Các monosaccharide kết hợp với nhau bằng các liên kết glycosid tạo thành các polysaccharide; ví dụ các glucose nối với nhau bằng các liên kết β1,4-glycosid để tạo ra sợi cellulose.

Bảng 1.6. Một số nhóm chức năng và liên kết đồng hóa trị cơ bản

5.1.2. Các liên kết hóa học yếu

Đó là các tương tác không phải đồng hóa trị (noncovalent interactions), có mức năng lượng thấp thường dễ bị phá vỡ và chỉ tồn tại trong một thời gan ngắn. Các liên kết này đóng vai trò rất quan trọng trong các hệ thống sống; chúng được hình thành do sự tương tác giữa các thành phần của một phân tử hay giữa các phân tử với nhau. Có bốn loại liên kết hóa học yếu cơ bản (Hình 1.22 và 1.23), đó là:

(i) Liên kết hydro là lực hóa học yếu được hình thành do sự tương tác giữa nguyên tử hydro (H) với nguyên tử oxy (O) hoặc nguyên tử nitơ (N) của các phân tử khác nhau. Trong các hệ thống sống, chính sự có mặt của các nhóm amin (–NH2) và hydroxyl (–OH) trong thành phần của các axit

Page 22: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

22

nucleic, protein và carbonhydrate cho phép hình thành các liên kết hydro nội trong các đại phân tử này cũng như sự tương tác giữa chúng trong môi trường cơ bản của sự sống là nước.

Như đã biết, các liên kết hydro trong các cặp G-C và A-T hoặc A-U không chỉ giúp ổn định cấu trúc các phân tử ADN và ARN mà còn cho phép chúng thực hiện các chức năng di truyền đặc thù như tái bản, phiên mã và dịch mã. Trong protein, các liên kết hydro có vai trò đặc biệt trong việc hình thành cấu trúc bậc II như xoắn α hay phiến β, cấu trúc bậc III... và từ đó quy định cấu hình đặc trưng của từng protein (Hình 1.16).

Hình 1.22. Năng lượng tương đối của các liên kết đồng hóa trị và các tương tác không phải đồng hóa trị. Các năng lượng liên kết được xác định là năng lượng cần thiết để phân hủy một kiểu liên kết cụ thể. So với các tương tác không phải đồng hóa trị thì các liên kết đồng hóa trị có lực mạnh gấp 100 đến 1.000 lần. Năng lượng của các tương tác không phải đồng hóa trị lớn hơn nhiệt năng của nhiệt độ phòng (25oC) một chút. Nhiểu quá trình sinh học kèm theo sự giải phóng năng lượng khi thủy phân một liên kết phosphoanhydride trong ATP (Theo Lodish et al, 2006).

(ii) Liên k ết ion là lực tương tác tĩnh điện giữa hai nguyên tử hay hai nhóm có điện tích khác dấu (nhóm tích điện âm gọi là cation và nhóm tích điện dương gọi là anion). Bởi vì điện tử liên kết không phân chia đồng đều cho hai phía nên liên kết này không được xếp vào nhóm các liên kết đồng hóa trị. Trong hệ thống sống, đáng kể nhất đó là mối liên kết ion giữa các histone với ADN trong nhân hay các protein và enzyme thực hiện các quá trình tái bản, phiên mã, điều hòa hoạt động của các gen cũng như của cả bộ gen, Về thực chất, đó là sự tương tác giữa cấu hình không gian đặc trưng của các protein với các đoạn trình tự đặc thù trên ADN.

Hình 1.23. Tính chất bổ sung phân tử và việc bám dính của các protein nhờ các tương tác không

Page 23: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

23

phải đồng hóa trị. (Lodish et al, 2006).

(iii) T ương tác van der Walls là lực tương tác không đặc hiệu xuất hiện giữa hai nguyên tử khi chúng tiến lại gần nhau và gây ra sự phân cực nhất thời trên phân tử. Đó là kết quả của các lực hút và đẩy của các đám mây điện tử trong một khoảng cách xác định. Ví dụ, đó là sự tương tác giữa enzyme và cơ chất (Hình 1.18), giữa kháng nguyên và kháng thể...

(iv) Tương tác kỵ nước (hydrophobic) là lực thúc đẩy các phân tử hoặc các vùng không phân cực (non-polar) của chúng liên kết với nhau thay vì liên kết với các phân tử nước; vì thế gọi là tương tác kỵ nước hay “ghét nước”, “sợ nước”. Các tương tác dạng này đóng vai trò quan trọng trong việc ổn định trạng thái của các phân tử protein, các phức hợp của protein với các phân tử khác... (Hình 1.23)

Tóm lại, các kiểu liên kết hóa học yếu đóng vai trò vô cùng quan trọng đối với các hệ thống sống. Nhờ có số lượng lớn các liên kết này mà các đại phân tử axit nucleic, các protein và các hệ thống sống nói chung vừa có tính ổn định vừa có tính linh động, vừa đảm bảo sự liên lạc giữa các bộ phận và sự hài hòa của cả hệ thống.

TÓM T ẮT

(1) Các axit nucleic (ADN và ARN) và protein là các đại phân tử sinh học quan trọng nhất của sự sống. Bộ gen của tuyệt đại đa số sinh vật là ADN; protein là sản phẩm của các gen chứa đựng trong ADN. Mỗi loài có một bộ gen (genome) và một bộ protein (proteome) đặc thù và ổn định. Các polysaccharide tham gia vào cấu tạo và dự trữ năng lượng. Phospholipid là thành phần cấu tạo quan trọng của các màng sinh học, còn các axit béo là nguồn năng lượng cho nhiều tế bào.

(2) Đơn phân của ADN và ARN là các nucleotide. Mỗi nucleotide có công thức cấu tạo tổng quát là: Bazơ – Đường – Phosphate, với bazơ là thành phần đặc trưng. Trong ADN có 4 loại là A, G, T và C, còn trong ARN có U thay cho T. Các nucleotide nối với nhau bằng các liên kết phosphodiester tạo thành các polynucleotide theo chiều 5’→3’.

(3) Hầu hết ADN có cấu trúc đúng như mô hình của Watson – Crick, với hai đặc điểm quan trọng nhất là: Sự ngược chiều của hai mạch đơn và tính chất bổ sung của các cặp bazơ. Hệ quả của nguyên tắc bổ sung là trong ADN luôn có A = T và G = C (còn gọi là quy luật Chargaff).

(4) Do tính chất đặc thù của các liên kết hydro mà ADN có thể biến tính và hồi tính. Nhờ đó ADN có thể thực hiện các quá trình truyền thông tin di truyền trong tế bào như tái bản, phiên mã và dịch mã.

(5) Đơn vị cấu trúc cơ sở của protein là 20 loại α-axit amin; chúng nối với nhau bằng các liên kết peptide để tạo thành các chuỗi polypeptide. Protein có 4 bậc cấu trúc I, II, III và IV. Các protein đảm nhận các chức năng khác nhau trong tế bào, như: cấu trúc, xúc tác, điều hòa, bảo vệ...

(6) Các tương tác hóa học yếu như liên kết hydro, liên kết ion... đóng vai trò rất quan trọng đối với các hệ thống sống. Nhờ đó các phân tử axit nucleic và protein vừa có tính ổn định về cấu trúc vừa có tính linh động trong các quá trình di truyền, sinh hóa-sinh lý của tế bào.

CÂU HỎI VÀ BÀI T ẬP

1. Các axit amin nối với nhau bằng các liên kết ___(a)___ và tạo nên cấu trúc bậc I gọi là ___(b)___.

2. Các nucleotide nối với nhau bằng các liên kết ___(a)___ và tạo nên cấu trúc bậc I gọi là

Page 24: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

24

___(b)___.

3. Trong các nucleotide của ADN và ARN, bazơ nitơ và phosphate lần lượt đính vào hai nguyên tử cacbon __(a)__ của gốc đường bằng các liên kết đồng hóa trị tương ứng là __(b)__.

4. Cellulose được tạo thành từ các đơn phân là ___(a)___ nối với nhau bằng các liên kết ___(b)___.

5. Công thức cấu tạo của một nucleotide trong ADN và ARN là: Phosphate - Bazơ - Đường. (a) Đúng. (b) Sai.

6. Nếu một mạch đơn của ADN chứa 1500 nucleotide và nucleotide loại A chiếm tỷ lệ 20%, thì kết quả mỗi trường hợp sau đây đối với ADN mạch kép của nó sẽ như thế nào? (a) Số nguyên tử phosphor? (b) Số lượng nucleotide từng loại; (c) Tổng số liên kết ester trong các nucleotide? (d) Tổng số liên kết phosphodiester? (e) Tổng số liên kết hydro?

7. Hai đặc điểm quan trọng nhất trong cấu trúc của ADN là __(a)__ và __(b)__.

8. Cấu trúc bậc I của protein gọi là ___(a)___ , đặc trưng bởi ___(b)___ có chiều N→C và loại liên kết hóa học yếu là ___(c)___.

9. Hemoglobin có mức độ cấu trúc cao nhất là ___(a)___ với bốn chuỗi polypeptide khác nhau, đó là ___(b)___ và ___(c)____.

10. Lipid là thành phần cấu tạo quan trọng của ___(a)___; chúng có đơn vị cấu trúc cơ sở là ___(b)___. Tất cả các phosphoglyceride đều là những phân tử ___(c)___, có một đuôi ___(d)___ và một đầu __(e)__.

11. Phân tích và so sánh cấu trúc các nucleotide của ADN và ARN.

12. Trình bày sự hình thành các chuỗi polynucleotide của ADN và ARN và chỉ ra những điểm giống nhau và khác nhau giữa chúng.

13. So sánh đơn phân và cấu trúc bậc I của protein và axit nucleic.

14. Tại sao chỉ từ 20 loại axit amin nhưng trong sự sống có thể có vô số loại protein khác nhau? (a) Một peptide gồm 5 axit amin khác nhau có thể có bao nhiêu cách sắp xếp khác nhau? (b) Câu hỏi tương tự cho một polypeptide có 30 axit amin, với 6 loại sau: 10 Phe, 6 Ser, 5 Leu, 4 Lys, 3 His và 2 Arg.

15. Tại sao nói mô hình Watson-Crick thỏa mãn thành phần hóa học của ADN hầu hết các sinh vật, nhưng không thoả mãn bộ gen của một số virus? Cho ví dụ.

16. Tính chất bổ sung và ngược chiều được thể hiện như thế nào trong cấu trúc và cơ chế tái bản của ADN?

17. Liên kết hydro là gì và có vai trò như thế nào trong cấu trúc và chức năng của ADN và protein?

18. Tại sao trong ADN chỉ tồn tại hai kiểu kết cặp bazơ A-T và G-C mà không là A-C và G-T? Nếu xảy ra các kiểu kết cặp A-C và G-T, trong điều kiện nào và hậu quả là gì? Cho các sơ đồ minh họa.

19. Thế nào là biến tính và hồi tính của ADN? Giải thích và cho biết ý nghĩa sinh học cũng như ứng dụng của các hiện tượng này.

20. Hãy ước tính số lượng từng loại nucleotide và tổng số liên kết hydro trong ADN của một loài vi khuẩn, biết rằng bộ gen của vi khuẩn này chứa 4,6 triệu cặp nucleotide và có tỷ lệ

Page 25: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

25

(A+T)/(G+C) bằng 1.

21. Hãy xác định tỷ lệ % của các nucleotide trong ADN của bò, biết rằng tỷ số (A+T)/(G+C) của ADN này là 1,35.

22. Bộ gen một loài động vật có tỷ lệ (A+T)/(G+C) là 1,5 và chứa khoảng 3 tỷ cặp nucleotide. Hãy tính số lượng từng loại nucleotide và số lượng liên kết hydro có thể có trong bộ gen nói trên.

23. Nếu tỷ lệ (A+T)/(G+C) ở một mạch đơn của ADN là 0,2 thì tỷ lệ này ở mạch bổ sung và của cả phân tử sẽ như thế nào? Tại sao?

24. Cho biết tỷ lệ (A+G)/(T+C) trên một mạch của một phân tử ADN là 0,3. Tỷ lệ này ở mạch bổ sung là như thế nào? và trong toàn bộ phân tử ADN xoắn kép là bao nhiêu?

25. Hàm lượng cặp bazơ G-C của ADN thể thực khuẩn T3 (một loại virus ký sinh ở E. coli) là 53%. Theo lý thuyết, hàm lượng hay tỷ lệ %(G+C) của mARN thể thực khuẩn T3 là bao nhiêu?

Page 26: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

26

Chương 2

TỔ CHỨC BỘ GEN CÁC SINH VẬT

Để có thể đi sâu nghiên cứu đặc điểm và cơ chế của quá trình tái bản các bộ gen ở các sinh vật (chương 3) cũng như các nội dung liên quan ở các chương về sau, trước tiên chúng ta sẽ tìm hiểu một cách đại cương về thành phần và tổ chức bộ gen của các nhóm sinh vật. Chương này sẽ lần lượt trình bày và phân tích các vấn đề sau:

(i) Đại cương về các nhóm sinh vật trong sinh giới.

(ii) Virus là gì? Bộ gen của các virus được tổ chức như thế nào?

(iii) Thế nào là sinh vật nhân sơ (prokaryote)? Bộ gen của các sinh vật nhân sơ mà đại diện là vi khuẩn E. coli được tổ chức như thế nào?

(iv) Sinh vật nhân chuẩn (eukaryote) bao gồm những nhóm nào? Bộ gen của chúng mà đại diện là con người có các thành phần chính yếu nào và được tổ chức ra sao?

(v) Mối quan hệ giữa kích thước bộ gen và trình độ tiến hoá của các sinh vật được hiểu như thế nào?

1. Đại cương về các nhóm sinh vật

Từ những thập niên đầu của thế kỷ XX các nhà khoa học phân chia sự sống thành hai giới là động vật và thực vật, các vi khuẩn được xếp vào giới thực vật. Mãi đến 1969, Whitaker chia toàn bộ sự sống ra làm 5 giới: Monera (hay prokaryote), Protista (tức Protozoa hay động cật nguyên sinh), Plantae (thực vật), Fungi (nấm) và Animalia (động vật).

Tuy nhiên, vào cuối thập niên 1970, Carl Woese dựa vào kết quả các nghiên cứu của mình về trình tự các gen ARN ribosome (rARN) của nhiều sinh vật khác nhau đã đi đến kết luận rất mới, đó là: Một lớp các sinh vật mà lâu nay được xếp vào nhóm vi khuẩn (bacteria) lại có các gen rARN giống với các eukaryote hơn là các vi khuẩn như E. coli. Carl Woese đặt tên cho chúng là archaebacteria (vi khuẩn cổ), để phân biệt với các vi khuẩn thật hay eubacteria. Ngày càng có nhiều bằng chứng sinh học phân tử tích lũy được thì vấn đề này càng trở nên rõ ràng, ở chỗ: Archaebacteria cần phải được tách thành một nhóm riêng. Vì vậy Woese đã đổi tên chúng thành archaea.

Ngày nay chúng ta đều biết rằng, tất cả sự sống được gộp vào 3 siêu giới hay vực (domain), đó là: bacteria, eukaryota và archaea (Hình 2.1). Mặc dù về mặt vật lý, archaea giống như các vi khuẩn, nhưng một số khía cạnh sinh học phân tử thì chúng tỏ ra giống với các eukaryota hơn.

Page 27: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

27

Hình 2.1. Sơ đồ ba siêu giới hay là cây phát sinh sự sống.

Điều đáng nói ở đây là các archaea sinh sống ở những vùng khắc nghiệt nhất trên trái đất. Một số trong chúng là các thermophile, nghĩa là các sinh vật “ưa nhiệt” (“heat-lovers”); chúng có thể sinh sống được tại các khu vực nóng bức với nhiệt độ trên 1000C gần các các rãnh nứt địa nhiệt sâu dưới lòng đại dương hay các suối nước nóng ở Công viên Quốc gia Yellowstone (Yellowstone National Park, Mỹ). Một số khác là các halophile (các sinh vật “ưa thích halogen”; halogen-lovers); chúng có thể chống chịu được nồng độ muối rất cao mà thường thì các sinh vật khác không thể sống được. Và một nhóm khác nữa là các methanogen, nghĩa là sinh vật sản xuất methan (“methane-producers”) mà môi trường sống của chúng là dạ dày của bò; điều đó giải thích tại sao các con bò lại là nguồn sinh khí methane tốt đến vậy.

Do tính chất đặc thù của bộ môn, trong giáo trình này chúng ta đề cập chủ yếu vẫn là hai nhóm đầu, đó là: các sinh vật nhân sơ và sinh vật nhân chuẩn, thường gọi là prokaryote và eukaryote, bởi vì chúng được nghiên cứu kỹ nhất. Dù vậy ở chương cuối cũng có nói đến loài archaea mà từ đó Kary Mullis đã chiết xuất và sử dụng enzyme Taq-polymerase DNA để tạo dòng ADN in vitro, gọi là phương pháp PCR. Và cũng biết rằng Methanococcus jannaschii (thuộc nhóm archaea) là một trong những sinh vật đầu tiên có bộ gen được xác định trình tự đầy đủ.

2. Tổ chức bộ gen của các virus

Virus là nhóm “sinh vật” bé nhất chưa có cấu tạo tế bào, không tồn tại đơn độc mà ký sinh bắt buộc ở các tế bào sinh vật nhân sơ (prokaryote) hoặc sinh vật nhân chuẩn (eukaryote); chỉ trong điều kiện đó chúng mới có khả năng tái bản và tổng hợp ARN và protein. Các virus ký sinh hoặc gây nhiễm vi khuẩn thì gọi là thể thực khuẩn (bacteriophage) hay phage. Các virus có cấu trúc tương đối đơn giản, với hai phần chính là lõi axit nucleic và vỏ protein. Một số virus ở thực vật hoặc các virus gây ung thư, AIDS, SARS ở người và động vật có bộ gen là ARN. Số còn lại bao gồm nhiều virus ký sinh ở vi khuẩn và động vật có bộ gen là ADN mạch kép hoặc mạch đơn, mạch thẳng hoặc mạch vòng (Bảng 1.3).

Page 28: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

28

Hình 2.2. (A) Sơ đồ cấu tạo của phage T2 ở E. coli. (B) Ảnh hiển vi điện tử của T4, một phage có quan hệ gần gũi với phage T2. (C) Sơ đồ cấu trúc của HIV - một retrovirus.

Hình 2.3. Bản đồ ADN mạch đơn dạng vòng của phage φX174 (A), với một số gen gối nhau (B).

3. Tổ chức bộ gen của các sinh vật nhân sơ (prokaryote)

Nhóm prokaryote bao gồm các vi khuẩn (bacteria) và vi khuẩn lam (cyanobacteria), là các sinh vật có cấu tạo tế bào đơn giản nhất. Vi khuẩn Escherichia coli (Hình 2.4) là đối tượng được sử

Page 29: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

29

dụng rộng rãi trong các nghiên cứu sinh học phân tử. Bộ gen chính của nó (Hình 2.5) là một phân tử ADN mạch kép vòng có kích thước lớn, tức nhiễm sắc thể chính (4.639.221 cặp bazơ, với 4289 gen mã hóa protein và 115 gen mã hóa các ARN khác). Nó thường tập trung ở một "vùng nhân" (nucleoid), không có màng nhân bao bọc và ở trạng thái siêu xoắn (supercoiled DNA) dưới sự kiểm soát của các topoisomerase. Ngoài ra, còn có nhiều ADN mạch kép trần dạng vòng khác có kính thước bé hơn rất nhiều, gọi là các plasmid.

Từ đầu thập niên 1990 đến nay, người ta còn phát hiện ra rằng bộ gen của một số vi khuẩn không chỉ gồm một phân tử ADN mạch kép dạng vòng (như ở Bacillus, E. coli, Pseudomonas v.v.) mà còn có thể có các trường hợp ngoại lệ sau đây: 1 ADN mạch thẳng (Borella = 0,91 Mbp); 2 ADN mạch vòng (V. cholera = 2,9 + 1,1 Mbp); hoặc 3 ADN vòng (Paracoccus denitrificans = 2,0 + 1,1 + 0,64 Mbp); hoặc thậm chí gồm một ADN mạch thẳng (2,1 Mbp) và một ADN mạch vòng (3,0 Mbp) như ở Agrobacterium tumefaciens v.v. Về phần các plasmid cũng vậy, ví dụ ở chi Borella có rất nhiều plasmid vòng và thẳng với kích thước biến thiên từ 5 đến 200 Kbp. (Chú thích: 1 Mbp = 103 Kbp = 106 bp).

(a) (b)

Hình 2.4. (a) Các tế bào E. coli. (b) ADN mạch kép vòng ở trạng thái siêu xoắn (trái) và giãn xoắn.

Hình 2.5. Tổ chức phân tử của bộ gen vi khuẩn E. coli.

Page 30: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

30

4. Tổ chức bộ gen của các sinh vật nhân chuẩn (eukaryote)

4.1. Cấu trúc chất nhiễm sắc

Các eukaryote là nhóm lớn nhất và tiến hóa đa dạng nhất về trình độ tổ chức cơ thể, bao gồm tất cả các sinh vật có cấu tạo tế bào (trừ vi khuẩn và vi khuẩn lam), có thể là đơn bào hoặc đa bào. Trong tế bào chứa hai hệ thống di truyền, bộ gen nhân và bộ gen tế bào chất. Bộ gen tế bào chất bao gồm các ADN mạch kép vòng, đó là: các ADN ty thể (mitochondrial DNA = mtDNA) có mặt trong tất cả các tế bào eukaryote, và ADN lạp thể (chloroplast DNA = cpDNA) chỉ có trong các tế bào thực vật.

Hình 2.6. Cấu trúc của nucleosome

Trong nhân tế bào eukaryote chứa nhiều nhiễm sắc thể; mỗi nhiễm sắc thể là một phức hợp nucleoprotein gọi là chất nhiễm sắc (chromatin), gồm một phân tử ADN mạch kép thẳng kích thước lớn kết hợp với các phân tử protein kiềm tính (giàu lysine và arginine) gọi là các histone.

Đơn vị tổ chức của cơ sở của nhiễm sắc thể eukaryote là các nucleosome (Hình 2.6) có đường kính khoảng 10-11 nm, gồm một khối cầu tám phân tử histone (H2A+ H2B +H3+H4)2, gọi là lõi

octamer và đoạn ADN có kích thước 146 bp quấn xung quanh nó 1¾ vòng (nói chung là ~160 bp quấn hai vòng quanh octamer, tùy từng loài). Một phân tử H1 bám vào các vùng ADN nối (linker DNA) bên ngoài nucleosome, giữ vững sự tương tác của ADN với các histone lõi. Các mức độ tổ chức hay sự hoá xoắn của nhiễm sắc thể eukaryote được mô tả ở Hình 2.7.

Page 31: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

31

Hình 2.7. Tổ chức ADN trong nhiễm sắc thể eukaryote.

Mức độ cấu trúc đầu tiên của chromatin được hình dung dưới dạng một chuỗi các nucleosome, hay sợi nucleosome (nucleosome fiber) có độ dày 10 nm (1 nanomet = 10 Ao). Mức thứ hai của cuộn gập chromatin có liên quan tới sự xoắn lại của sợi nucleosome tạo thành sợi dày 30 nm gọi là solenoid. Các histone H1 tham gia vào sự xoắn lại này bằng cách tương tác với các phân tử H1 khác. Mức thứ ba của sự hóa xoắn có lẽ là cuộn vòng của sợi 30 nm tạo thành một cấu trúc tương tự như bàn chải với các vòng đeo dính vào một cái giá ở trung tâm (dày ~300 nm). Đây chính là vùng giãn xoắn của nhiễm sắc thể, tương ứng với chất đồng nhiễm sắc (euchromatin). Sau đó các dãy vòng được sắp xếp trong các không gian ba chiều này cuộn chặt tạo thành các vùng gọi là chất

dị nhiễm sắc (heterochromatin) trên một chromatid với độ dày khoảng 700 nm. Tại kỳ giữa của nguyên phân, mỗi nhiễm sắc thể có cấu trúc điển hình gồm hai chromatid chị em dính chung nhau ở tâm động (centromere) với độ dày toàn bộ chừng 1400 nm. Như vậy, chất nhiễm sắc trong các tế bào eukaryote tồn tại ở hai dạng: Chất dị nhiễm sắc là các phần cuộn xoắn chặt và không có hoạt tính phiên mã; và chất đồng nhiễm sắc là các vùng giãn xoắn và chí ít cũng có tiềm năng hoạt tính.

Bảng 2.1. Tỷ lệ đóng gói các mức độ hóa xoắn của cấu trúc ADN.

Dạng chất nhiễm sắc Tỷ lệ đóng gói

ADN xoắn kép trần 1,0

Sợi nucleosome 10 nm 7 – 10

Sợi chromatin 30 nm do các nucleosome siêu xoắn 40 – 60

Page 32: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

32

Nhiễm sắc thể kỳ giữa co xoắn cực đại 8.000

4.2. Cấu trúc phân tử của centromere

Kết quả nghiên cứu gần đây cho thấy vùng lõi của centromere ở nấm men (S. cerevisiae) có kích thước khoảng 220 cặp nucleotide (tương đương 15-20 nm). Về cấu trúc, centromere có 3 đoạn trình tự CDE đặc thù nằm kế tiếp nhau theo chiều 5'→3' từ trái sang phải, ký hiệu là I, II và III; (Hình 2.8) trong đó:

– đoạn CDE-I có 8 cặp bazơ đặc thù là: RTCACRTG;

– đoạn CDE-II có ~78 đến 86 cặp bazơ đặc thù, với 91-95% cặp AT;

– đoạn CDE-III có 26 cặp bazơ đặc thù, đó là:

TGTTTRTG–TTTCCGAAA – – – –AAAAA

(Lưu ý: R ở đây biểu thị cho một bazơ purine, A hoặc G)

Với cấu trúc lõi ấy mà chúng có thể tương tác với các phức hợp protein đặc thù giúp cho sợi thoi có thể bám vào tâm động.

(a) (b)

Hình 2.8. (a) Ảnh chụp bộ NST cho thấy các vùng tâm động bắt màu đặc thù. (b) Sơ đồ một đoạn sợi nucleosome băng qua vùng lõi tâm động, vị trí tiếp xúc với sợi thoi. (c) Trình tự đặc thù của lõi centromere (CDE I, II và III) được bào tồn cao độ trong tiến hóa.

4.3. Cấu trúc phân tử của telomere

Mỗi nhiễm sắc thể eukaryote có hai đầu mút với cấu trúc đặc trưng gọi là telomere. Các kết quả nghiên cứu đầu tiên của Elizabeth Blackburn và cs (1989) cho hay các telomere không chứa gen; thay vì thế chúng có cấu trúc đơn giản gồm những trình tự ngắn (6-8 bp) lặp lại nối tiếp cả ngàn lần và đặc thù cho từng loài (Hình 2.9).

Chẳng hạn, ở Tetrahymena, một nhóm động vật nguyên sinh có lông tơ, trình tự này là

Page 33: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

33

(TTGGGG)n; ở Caenorhabditis = (CCCTCCC)n; ở bọn Oxytrichia thuộc Euplotes = (CCCCAAA)n v.v. Ở người và các động vật có vú, trình tự telomere là 5'-TTAGGG-3' lặp lại ~1.000 - 2.000 lần, khoảng biến thiên phát hiện được trong các tế bào ở các giai đoạn khác nhau là 150 - 2.000 lần (Yakoob và cs, 1999).

Các nghiên cứu gần đây cho thấy: enzyme telomerase (chịu trách nhiệm tổng hợp các telomere) chỉ có mặt trong các tế bào mầm, các tế bào gốc phôi, các tế bào ung thư và các eukaryote đơn bào như Tetrahymena thermophila. Trong khi đó, các tế bào soma bình thường của động vật có vú không thấy có telomerase. Điều đó cho phép lý giải tại sao các tế bào mầm cũng như các tế bào ung thư có khả năng phân chia gần như là vô hạn. Ngược lại, các tế bào soma chỉ có thể tiến hành khoảng 30-50 lần nguyên phân, và sau đó chúng mất hẳn khả năng phân chia, bước vào giai đoạn lão hóa và chết tự nhiên.

Hình 2.9. Ảnh chụp cho thấy các telomere với màu vàng đặc trưng (trái). Trình tự telomere của Tetrahymena (A) và mô hình vòng-T ở đầu mút nhiễm sắc thể (B).

4.4. Thành phần ADN trong bộ gen người

Nói chung, trong mỗi bộ gen eukaryote bao gồm các kiểu ADN chính sau đây, để cho tiện ta lấy bộ gen người làm thí dụ :

- ADN bản sao đơn (single-copy/unique), nghĩa là các gen có mặt chỉ một lần trong bộ gen; loại này chiếm ~75% và bao gồm hầu hết các gen.

- ADN lặp lại (repetitive) bao gồm một số gen được lặp lại vài lần cho đến hàng ngàn lần trong bộ gen. Nhóm này được chia làm hai loại:

+ ADN lặp lại kiểu phân tán (interspersed): loại này chiếm khoảng 15% và phân bố rải rác khắp bộ gen giữa các gen cũng như bên trong các gen; bao gồm các trình tự Alu (là các đoạn ADN dài khoảng 300 bp và được lặp lại khoảng 300.000 lần trong bộ gen; chúng có thể có mặt ở chỗ tiếp giáp hoặc bên trong các gen trong các intron hoặc các vùng không được dịch mã) và cả các đoạn

lặp nối tiếp có số lượng biến thên (VNTRs = variable numbers of tandem repeats), vốn là các đoạn lặp ngắn chỉ vài cặp bazơ nhưng có chiều dài sai khác, còn gọi là các tiểu vệ tinh (minisatellite or microsatellite). Ví dụ: các đoạn lặp phân tán trong các đoạn trình tự Alu (Alu sequences):

Page 34: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

34

5'– GCTGCGG........GCTGAGG........GCTGAGG –3'

+ ADN vệ tinh (satellite) hay ADN lặp lại nối tiếp (tandem): loại này chiếm khoảng 10% và được lặp lại rất nhiều lần, bao gồm các trình tự đơn giản thường khu trú ở các tâm động (centromere) và các đầu mút (telomere) của các nhiễm sắc thể. Ví dụ: các đoạn lặp nối tiếp thuộc các microsatellite hay telomere:

5'– ...TTAGGGTTAGGGTTAGGGTTAGGG... –3'

Nhìn chung, bộ gen người có các đặc điểm sau:

• Bộ gen nhân (xem sơ đồ):

- Bộ gen đơn bội có khoảng 3,2 tỷ cặp bazơ; hầu như tất cả mức độ phức tạp của nó đều nằm trong lớp ADN bản sao đơn (~75%);

- Chứa khoảng 25.000 gen mã hóa protein, trong đó đa phần là các gen phân đoạn với cấu trúc phức tạp;

- Các gen chứa từ 1 cho đến trên 75 exon;

- Các gen sai khác nhau về chiều dài, biến thiên từ dưới 100 cho đến khoảng 2.400.000 cặp bazơ là chiều dài lớn nhất của gen được biết cho đến nay. Đó chính là gen gây rối loạn dưỡng cơ DMD thuộc NST X;

- Trình tự Alu có mặt khắp bộ gen v.v.

• Bộ gen ty thể (Hình 2.10):

Một số đặc điểm chính về cấu trúc và chức năng của ADN ty thể người như sau: (Nguồn: Harding AE, Trends Neurol Sci 1991;14:132.)

Page 35: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

35

Hình 2.10. ADN ty thể của người.

- Mỗi mtADN mạch kép dạng vòng có một sợi nặng (H) và một sợi nhẹ (L); nó chứa 16.569 bp, với 37 gen mã hóa cho các enzyme và các tARN, rARN, trong đó có 22 gen tARN, 2 gen rARN (16S và 12S), và 13 vùng mã hóa protein của chuỗi hô hấp, bao gồm:

+ 7 tiểu đơn vị của NADH dehydrogenase (phức hợp I);

+ Cytochrome b của phức hợp III;

+ 3 tiểu đơn vị của cytochrome oxidase (phức hợp IV);

+ 2 tiểu đơn vị của ATP synthase.

- Mã di truyền có sai khác chút ít so với mã phổ biến, ở chỗ:

+ UGA (codon kết thúc của mã chuẩn) được đọc là Trp;

+ AGA và AGG (codon mã chuẩn cho Arg) được đọc là codon kết thúc.

- Chứa rất ít trình tự không được dịch mã.

- Tỷ lệ đột biến cao (gấp 5 đến 10 lần so với ADN nhân).

- Các so sánh về trình tự của các mtADN cung cấp bằng chứng về nguồn gốc tiến hóa của bộ

linh trưởng (Primates) và các loài khác.

5. Kích thước bộ gen và tính phức tạp về mặt ti ến hoá

Dựa trên các kết quả phân tích bộ gen của các virus và vi khuẩn cũng như của bộ gen đơn bội

ở eukaryote, cho phép khái quát như sau: Kích thước của bộ gen tăng lên tương đối cùng với mức

độ phức tạp về mặt tiến hóa. Thật vậy, từ bảng 2.2 cho thấy kích thước bộ gen của các virus nói

chung là rất nhỏ so với nhóm prokaryote, và kích thước bộ gen của các prokaryote lại tỏ ra quá đơn

giản so với ngay cả một eukaryote đơn bào như nấm men. Trong khi ADN của một vi khuẩn điển

hình như E. coli chỉ có ~4,6 triệu cặp bazơ và chứa ~4.290 gen mã hóa protein, thì phage MS2 là

một trong các virus bé nhất, bộ gen ARN của nó cũngchỉ có 3.569 bazơ với tất cả 4 gen; hoặc có

kích thước lớn như virus Epstein-Barr (ADN mạch kép vòng) cũng chỉ có 172.282 bp với tất cả 80

gen.

Page 36: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

36

Nếu xét trên cả hai nhóm prokaryote và eukaryote, ta thấy rằng kích thước các bộ gen biến

thiên rất lớn: bộ gen một vi khuẩn sống tự do được biết là bé nhất chứa khoảng 600.000 cặp bazơ,

trong khi các bộ gen của người và chuột chỉ khoảng 3 tỷ bp. Nếu xét riêng ở nhóm eukaryote, ta đã

biết mỗi loài có một số lượng nhiễm sắc thể đặc trưng và nó không phản ánh trình độ tiến hóa của

các loài. Tuy nhiên, về mặt nào đó rõ ràng là có sự tương quan thuận giữa hàm lượng ADN của các

bộ gen đơn bội và nấc thang tiến hóa của các động-thực vật. Dù vậy vẫn có một số ngoại lệ so với

quy tắc này!

Hàm lượng ADN và nghịch lý giá trị C

Mặc dù Psilotum nudum, đôi khi gọi là "dương xỉ lông", là một loại thực vật đơn giản hơn

nhiều so với loài Arabidopsis thaliana vốn là một thực vật có hoa thuộc họ cải, nhưng nó lại có kích

thước bộ gen lớn hơn tới 3.000 lần. Đó là do trên 80% bộ gen của nó là ADN lặp lại không chứa

thông tin di truyền nào cả! Hay một số thực vật (ngô, loa kèn) hay một số động vật (như lưỡng thê,

cá) lại có kích thước bộ gen lớn gấp nhiều lần so với lớp thú (bảng 2.2). Một số lưỡng thê chứa

ADN nhiều hơn bộ gen chúng ta đến 30 lần, nhưng chắc chắn không phải là chúng phức tạp gấp

chúng ta 30 lần!

Bảng 2.2. Kích thước bộ gen của một số sinh vật thường gặp

Bộ gen sinh vật Số bp Số gen Số lượng NST

Virus

Thể thực khuẩn MS2 3.569 4 1 (ARN m.đơn)

Virus đốm thuôc lá (TMV) 6.400 4 1 (ARN m.đơn)

Virus cúm (Influenza) 13.500 12 8 (ARN m.đơn)

Thể thực khuẩn ØX174 5.386 10 1 (ADN m.đơn)

Thể thực khuẩn lambda 48.502 60 1 (ADN m.kép)

Thể thực khuẩn T4 200.000 165 1 (ADN m.kép)

Poxvirus 187.000 300 1 (ADN m.kép)

Prokaryote (và các ADN của ty thể, lạp thể)

Ty thể người 16.569 37 1

Ty thể (Arabidopsis) 366.923 57 1

Lạp thể (Arabidopsis) 154.478 128 1

Mycoplasma genitalium 580.000 480 1

Methanococcus 1,7 Mbp 1.500 1

Escherichia coli 4,6 Mbp 4.300 1

Agrobacterium tumefaciens 4,7 Mbp 5.400 1

Myxococcus 9,5 Mbp 9.100 1

Eukaryote (bộ gen đơn bội)

Saccharomyces cerevisiae 12,5 Mbp 5.700 16

Drosophila melanogaster 140 Mbp 13.000 4

Page 37: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

37

Caenorhabditis elegans 100 Mbp 19.000 6

Người (Homo sapiens) 3.300 Mbp 22.000 23

Arabidopsis thaliana 115 Mbp 25.000 5

Chuột (Mus musculus) 220 Mbp 25.000 19

Lúa (Oryza sativa ) 430 Mbp 45.000 12

Người ta gọi tổng hàm lượng ADN trong bộ gen đơn bội là giá trị C (C-value). Với phân tích

ở trên cho thấy không hề tồn tại một mối quan hệ ổn định nhất quán giữa giá trị C và tính phức tạp

của một sinh vật (như lưỡng thê với thú); cái đó gọi là nghịch lý giá trị C (C-value paradox).

Kích thước ADN của một số bào quan

Từ bảng 2.3 cho thấy ADN của một số bào quan có vẻ đơn giản và không có dấu hiệu tiến hóa

rõ rệt. Nói chung, kích thước mỗi phân tử ADN ty thể của người và các động vật có vú thường nằm

trong khoảng 15.000-17.000 cặp bazơ; trong khi đó, kích thước một ADN lạp thể ở phần lớn tế bào

các thực vật thường biến thiên trong khoảng 130.000 - 150.000 bp. Còn các plasmid của một số tế

bào thực vật thường có kích thước rất bé khoảng 1-2 ngàn cặp bazơ.

Bảng 2.3. Kích thước ADN bào quan ở một số sinh vật nhân chuẩn

ADN ty thể Cặp bazơ Plasmid Cặp bazơ

Người (Homo sapiens) 16.569 O. sativa (indica) 1.485

D. melanogaster 19.517 O. sativa (jap.) 2.135

S. cerevisiae 85.779 Ngô (Zea mays) 1.913

ADN lạp thể Brassica 11.640

Lúa O. sativa (indica) 134.494 N. crassa (3 loại) 3.581

O. sativa (japonica) 134.525 – 3.675

Ngô (Zea mays) 140.384 – 7.050

Triticum aestivum 134.545

Chúng ta cũng cần biết qua các sinh vật mô hình (Hình 2.11), tức các sinh vật đã được di

truyền học và sinh học phân tử nghiên cứu rất kỹ và đã giải trình tự đầy đủ bộ gen của chúng. Tên

tuổi chúng, chẳng hạn ruồi giấm Drosophila hay E. coli... nổi tiếng đến độ bạn chỉ cần gõ tên và các

bộ máy tìm kiếm như Google sẽ cho bạn hàng triệu hình ảnh và các thông tin chi tiết đến không

ngờ.

Ở đây, chúng tôi lược nêu số lượng cặp bazơ trong bộ gen (đơn bội) và số lượng các gen khác

nhau có mặt trong mỗi bộ gen của các sinh vật mô hình được ước tính gần đây (Bảng 2.4). Qua đó

bạn sẽ thấy được tuy có sự tương đồng giữa chúng về số gen hoặc thậm chí kích thước bộ gen

nhưng hoàn toàn không có chút tương đồng nào về trình độ tiến hóa của chúng!

Page 38: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

38

Bảng 2.4. Kích thước bộ gen (đơn bội) và số gen khác nhau trong bộ gen của các sinh vật mô

hình (Nguồn: Eberhard Passarge, 2007)

Loài sinh vật Tên thường gọi Số Mb Số gen

Homo sapiens Con người 3.000 ~22.000

Chimpanzee Hắc tinh tinh 3.000 1,2% sai khác

Canis domesticus Chó nhà 24.100 19.300

Zebrafish Cá ngựa vằn 1.600 ~22.000

Mus musculus Chuột 2.500 ~25.000

Anopheles gambiae Muỗi anôphen 278 ~14.000

D. melanogaster Ruồi giấm 180 13.600

C. elegans Giun tròn 97 19.000

S. cerevisiae Nấm men bia 12,1 6.300

E. coli Vi khuẩn E. coli 4.700 4.300

Arabidopsis thaliana Thực vật có hoa 125 ~25.000

Hình 2.11. Các sinh vật mô hình tiêu biểu.

TÓM T ẮT

(1) Tất cả sự sống được gộp vào 3 siêu giới (domain): bacteria, eukaryota và archaea. Tuy nhiên, trong sinh học phân tử, các nghiên cứu kỹ nhất là các prokaryote và eukaryote, các virus virus ký sinh trên chúng.

Page 39: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

39

(2) Bộ gen của virus rất đa dạng và đơn giản, chỉ là 1 phân tử axit nucleic - ADN hoặc ARN, mạch kép hoặc mạch đơn, dạng thẳng hoặc vòng; kích thước ngắn và chứa ít gen.

(3) Bộ gen của tế bào prokaryote gồm có NST chính và các plasmid. Thông thường chỉ có 1 NST chứa 1 phân tử ADN mạch kép vòng, vài triệu cặp bazơ và chứa vài ngàn gen; một số plasmid có mang gen kháng thuốc được sử dụng rộng rãi trong kỹ thuật ADN tái tổ hợp.

(4) Các tế bào eukaryote có hai bộ gen: Bộ gen nhân và bộ gen tế bào chất. Mỗi NST trong nhân chứa 1 ADN mạch kép thẳng, kích thước lớn liên kết với các histone dưới dạng các nucleosome. Nếu như bộ gen nhân chứa hầu hết các gen và các thành phần quan trọng của tế bào thì bộ gen tế bào chất là các ADN mạch kép vòng, ngắn có trong ty thể (mtADN) và trong lạp thể ở tế bào thực vật (cpADN); chúng chỉ chứa vài chục gen liên quan chủ yếu đến hệ thống tổng hợp ATP và protein của bào quan.

(5) Trình độ tiến hóa của các sinh vật không hoàn toàn tỷ lệ với kích thước bộ gen cũng như số lượng các gen mà chủ yếu phụ thuộc vào mức độ tổ chức tinh vi và phức tạp của chúng.

CÂU HỎI VÀ BÀI T ẬP

26. Bộ gen của virus HIV là hai phân tử ARN mạch đơn, mỗi phân tử có gắn một phân tử enzyme phiên mã ngược.

(a) Đúng. (b)Sai.

27. Bộ gen chính của tất cả các vi khuẩn là một phân tử ADN trần, mạch kép dạng vòng.

(a) Đúng. (b) Sai.

28. Giữa kích thước bộ gen, số lượng gen và trình độ tiến hóa của các sinh vật có sự tương quan thuận.

(a) Đúng. (b) Sai.

29. Bộ gen của E. coli là 1 phân tử ADN mạch kép vòng có kích thước chừng __(a)__ cặp bazơ, chứa khoảng __ (b)__ gen cấu trúc nhau.

30. Đơn vị tổ chức cơ sở của các nhiễm sắc thể sinh vật nhân chuẩn là __(a)__, có đường kính khoảng __(b)__ Angstrong, gồm một lõi octamer chứa __ (c)__ phân tử histone được quấn bên ngoài bới một đoạn __(d)__ dài chừng 140-160 bp.

31. Các mức độ hóa xoắn của ADN trong tổ chức phân tử của nhiễm sắc sinh vật nhân chuẩn có đường kính 2, 11 và 30 nm được gọi tương ứng là: __(a)__, __(b)__, và __(c)__.

32. Sự hóa xoắn của ADN tong nhiễm sắc thể có hai ý nghĩa chính là __(a)__ và __(b)__..

33. Các histone H1 bám giữ các vị trí __(a)__ và __(b)__ trên mỗi nucleosome; chúng đóng vai trò quan trọng trong __(c)__.

34. Hai đầu mút của mỗi nhiễm sắc thể sinh vật nhân chuẩn có cấu trúc đặc trưng gọi là các __(a)__. Đó là các đoạn trình tự __(b)__, ví dụ ở người là __(c)__; với các vai trò chính yếu là __(d)___.

35. Hãy làm sáng tỏ nhận định sau: Nhóm virus có trình độ tổ chức "cơ thể" sơ khai nhất với các bộ gen rất đơn giản và đa dạng.

Page 40: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

40

36. Hiện nay sinh giới được phân thành những siêu giới (domain) nào và dựa trên cơ sở nào? Hãy dựa vào sơ đồ "cây sự sống" để chọn vài ví dụ thích hợp cho mỗi siêu giới và chỉ ra mối quan hệ tiến hóa tổng quát giữa chúng.

37. Trình bày các hiểu biết về các thành phần chính trong tổ chức của bộ gen vi khuẩn E. coli.

38. Phân tích và trình bày tổ chức phân tử của nhiễm sắc thể sinh vật nhân chuẩn, các mức độ đóng xoắn và ý nghĩa của hiện tượng đó.

39. Trình bày hiểu biết hiện nay về các thành phần chính trong tổ chức phân tử của bộ gen người.

40. Phân tích cấu trúc của telomere và centromere ở các nhiễm sắc thể eukaryote và cho biết vai trò của các cấu trúc này.

Page 41: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

41

Chương 3

CẤU TRÚC VÀ CHỨC NĂNG CỦA GEN

Gen (gene) là khái niệm trung tâm của di truyền học và sinh học phân tử. Nội hàm của khía niệm gen không ngừng được phát triển và hoàn thiện cùng với sự phát triển của di truyền học và sinh học phân tử đặc biệt trong hơn nửa thế kỷ qua. Tuy nhiên, căn cứ vào những khám phá gần đây, để đưa ra được một định nghĩa chính xác về gen càng trở nên khó khăn hơn bao giờ hết. Gen là thành phần thiết yếu của bộ gen, chứa đựng thông tin dưới dạng mật mã di truyền (genetic code). Sự truyền đạt thông tin từ gen đến protein được thực hiện bởi hai quá trình cơ bản là phiên mã (transcription) và dịch mã (translation) như ở Hình 3.1.

Trong chương này, chúng ta lần lượt tìm hiểu các nội dung chính sau:

(i) Gen là gì và có quá trình lịch sử phát triển như thế nào?

(ii) Trong bộ gen của các sinh vật có những loại gen nào và chúng khác với các thành phần còn lại của bộ gen ra sao? Cấu trúc và tổ chức của gen ở các sinh vật nhân sơ và nhân chuẩn có gì giống và khác nhau?

(iii) B ản chất của mã di truyền là gì và đã được khám phá bằng cách nào? Mã di truyền có những đặc tính nào và ứng dụng ra sao?

Hình 3.1. Sự truyền thông tin từ trong gen đến protein và ảnh hưởng lên kiểu hình của cơ thể sinh

vật.

1. Sự phát tri ển của khái niệm gen

1.1. Các quan niệm của Mendel về gen

Mendel là người đầu tiên nêu lên định nghĩa về gen năm 1865 (thuật ngữ gene được Johannsen đưa ra năm 1909). Theo đó, gen là đơn vị di truyền tồn tại ở dạng hạt riêng biệt, xác

định một tính trạng cụ thể trong cặp tính trạng tương phản. Đây mới chỉ là sự suy luận thuần túy, là sự tiên đoán tài tình của Mendel về sự tồn tại tất yếu của gen. Quan niệm chính xác hơn về cơ sở vật chất và chức năng của gen nảy sinh từ nhiều nguồn nghiên cứu độc lập trong suốt 50 năm đầu của thế kỷ XX.

Page 42: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

42

1.2. Các quan niệm của trường phái Morgan về gen

Trường phái Morgan (1926) cho rằng gen là đơn vị di truyền nằm trên NST không thể chia nhỏ hơn, và nó đóng ba vai trò: (i) Đơn vị chức năng: mỗi gen tồn tại như một thể thống nhất toàn vẹn, xác định sự phát triển của một tính trạng cụ thể; (ii) Đơn vị tái tổ hợp: trao đổi chéo chỉ xảy ra giữa các gen mà không xảy ra bên trong phạm vi một gen; và vì gen không bị chia nhỏ bởi trao đổi chéo nên nó được xem là đơn vị cấu trúc cơ sở; và (iii) Đơn vị đột biến: gen bị biến đổi như một đơn vị hoàn chỉnh và cho ra một kiểu hình đột biến (–) so với kiểu dại (+).

Tuy nhiên, bản chất hóa học của gen là gì và nó xác định tính trạng như thế nào vẫn còn là điều bí ẩn! Phải chăng trao đổi chéo không xảy ra trong gen? Phải chăng mỗi gen chỉ cho một kiểu đột biến?

1.3. Giả thuyết “ một gen - một enzyme” của Beadle và Tatum

Một hướng nghiên cứu khác là tập trung vào phương diện chức năng sinh hóa của gen. Năm 1902, Archibald Garrod gợi ý rằng rối lạn chuyển hóa alkapton niệu (alcaptonuria) bắt nguồn từ một sai hỏng của một enzyme đặc thù và được di truyền theo kiểu lặn nhiễm sắc thể thường, mà ông gọi là sai sót chuyển hóa bẩm sinh. Đến năm 1941, Beadle và Tatum mới làm sáng tỏ ý tưởng trên bằng các thí nghiệm gây đột biến bằng tia X ở Neurosporora. Để giải thích các tổn thương sinh hóa đặc thù do đột biến, họ lập luận rằng: (i) Trong tế bào, các quá trình chuyển hóa xảy ra dưới dạng các chuỗi phản ứng sinh hóa; (ii) Mỗi phản ứng do một enzyme xúc tác; (iii) Mỗi enzyme do một gen xác định (nếu như một gen bị đột biến thì enzyme của nó sai hỏng và kéo theo cả chuỗi phản ứng không thể thực hiện được, kết quả là tạo ra kiểu hình đột biến). Từ đó G. Beadle và E. Tatum đề xuất “giả thuyết một gen - một enzyme” nổi tiếng; mở đường cho sự ra đời của di truyền học-sinh hóa. Sau đó, quan niệm này được mở rộng thành “một gen - một protein” và chính xác hóa bằng mệnh đề “một gen - một polypeptide” nhờ các nghiên cứu về hemoglobin của L. Pauling (1949) và V. Ingram (1957).

Kể từ khi Avery và đồng sự (1944) chứng minh “ADN là vật chất mang thông tin di truyền”, và đặc biệt là sau khi Watson và Crick khám phá ra cấu trúc ADN năm 1953, quan niệm về gen không ngừng được phát triển và chính xác hóa. Trước tiên, ta hãy tìm hiểu công trình nghiên cứu của Benzer về cấu trúc tinh vi của gen.

1.4. Quan niệm của Benzer về các đơn vị di truyền học

Các công trình nghiên cứu của Seymour Benzer (từ 1957 đến 1961) đã chứng minh rằng, gen không phải là đơn vị tái tổ hợp hay đột biến. Qua phân tích tỷ mỉ hàng trăm thể đột biến ở vùng rII của phage T4 (ký sinh ở E. coli), Benzer đã thiết lập được bản đồ chi tiết vùng này và khẳng định phần lớn các trao đổi chéo xảy ra trong phạm vi một gen. Đồng thời ông chỉ rõ vùng rII chứa hai đơn vị chức năng riêng biệt (rIIA và rIIB), gọi là các cistron. Mỗi cistron gồm nhiều đơn vị tái tổ hợp và đơn vị đột biến, gọi là các recon và muton. Từ đây Benzer đã định nghĩa lại các thuật ngữ di truyền học do ông đề nghị như sau: (i) Đơn vị chức năng (hay cistron) là một đoạn xác định của ADN (~1.200 cặp bazơ) mang thông tin cấu trúc của một polypeptide cụ thể mà giới hạn của nó được xác định bằng trắc nghiệm cis-trans. (ii) Đơn vị tái tổ hợp (recon): đơn vị cấu trúc bé nhất của cistron (~2-3 cặp nucleotide) và tái tổ hợp chỉ có thể xảy ra giữa các recon. (iii) Đơn vị đột biến (muton): đơn vị bé nhất của cistron (~4-5 cặp nucleotide) có khả năng biến đổi do đột biến.

Page 43: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

43

Lưu ý rằng hiện nay thuật ngữ cistron được sử dụng rộng rãi và nó đồng nghĩa với gen cấu

trúc; còn muton và recon vì tương đương với một cặp nucleotide - không phải là đơn vị di truyền học, cho nên tự chúng mất ý nghĩa và không còn giá trị sử dụng nữa, ngoại trừ giá trị lịch sử.

Thuật ngữ cistron của Benzer có nghĩa là đơn vị chức năng di truyền không chia nhỏ mà có thể được xác định bằng phương pháp phân tích bổ sung (complementation analysis); trong đó gen mà cụ thể là sản phẩm của nó được trắc nghiệm về khả năng bù đắp cho một đột biến tại một gen tương ứng trong cùng tế bào. Sự bổ sung liên tiếp các sản phẩm dẫn tới phục hồi kiểu hình dại.

Cơ sở của phân tích bổ sung là trắc nghiệm cis-trans (cis-trans test), mà từ đây nảy sinh thuật ngữ cistron ở chỗ các cặp đột biến có nguồn gốc độc lập được xét qua các cấu hình cis (đều) và trans (lệch). Trắc nghiệm cis được dùng làm đối chứng (Hình 3.2a), vì nếu như cả hai đột biến đều có mặt trong một bộ gen thì bộ gen kia phải là kiểu dại ở cả hai locus và sinh ra các sản phẩm bình thường, vì vậy cho kiểu hình dại (Hình 3.2b). Trắc nghiệm trans là phép thử bổ sung và xác định gới hạn của đơn vị chức năng. Nếu như các đột biến nằm trong các gen khác nhau, nghĩa là thuộc cấu hình trans, thì mỗi một bộ gen có thể bổ sung sản phẩm mà gen kia không tạo ra được. Khi có đủ tất cả các sản phẩm gen cần thiết thì tế bào biểu hiện kiểu dại (Hình 3.2c), nghĩa là có sự bổ sung dương tính. Nếu như cả hai đột biến thuộc cùng một gen và có mặt ở cấu hình trans, thì mỗi một bộ gen có thể mang một bản sao đột biến của gen đó và không có sản phẩm hoạt động chức năng được tạo ra trong tế bào, nghĩa là không có sự bổ sung nên sẽ cho kiểu dại (Hình 3.2d).

Hình 3.2. Sơ đồ trắc nghiệm cis-trans. (a) con đường chuyển hóa bình thường; (b) trắc

nghiệm cis; (c) và (d) trắc nghiệm trans. [S là cơ chất; I là sản phẩm trung gian; P là sản phẩm cuối cùng mà ở đây là sắc tố đặc trưng cho kiểu hình dại; các mũi tên chỉ các enzyme sinh ra từ các cistron 1 và cistron 2].

Sự phân tích bổ sung ở vi khuẩn và nấm men bia về sau cũng chỉ ra rằng gen là một cistron. Phương pháp này tỏ ra hữu ích cho việc xác định chức năng của gen, số lượng cũng như trật tự hoạt động của các gen trong một con đường chuyển hóa cụ thể của tế bào.

2. Cấu trúc và chức năng của gen

2.1. Gen và bộ gen

Trước tiên, ta hãy định nghĩa tổng quát về gen như sau: Gen là một đọan xác định của bộ gen

Page 44: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

44

mã hóa thông tin cho một polypeptide hoặc một phân tử ARN chức năng (tARN, rARN...). Mặc dù vậy, định nghĩa này vẫn không thể bao gồm đầy đủ chức năng và cấu trúc của gen trong toàn bộ sinh giới, bởi vì các chiến lược cho sự biểu hiện của gen và tổ chức bộ gen ở prokaryote và eukaryote là rất khác nhau.

Bây giờ ta hãy nêu sơ lược về các yếu tố hay thành phần di truyền của bộ gen. Trong một bộ gen, các thành phần được biểu hiện ra sản phẩm, nghĩa là được phiên mã thì gọi là các gen cấu trúc; còn các thành phần không được biểu hiện thì không gọi là gen.

– Xét theo nghĩa rộng, các gen cấu trúc bao gồm: (i) Các gen mã hóa các mARN mà từ đó xác định cấu trúc của protein thì gọi là gen mã hóa protein (protein-coding gene) - đây là nhóm gen quan trọng nhất của các tế bào và là chủ đề chính xuyên suốt nội dung cuốn sách này; (ii) Các gen mã hóa các tARN; (iii) Các gen mã hóa các rARN; và (iv) Các gen mã hóa nhiều loại ARN khác ở các tế bào eukaryote (xem Bảng 3.1).

– Các thành phần không phải gen rất đa dạng, chúng đóng vai trò như là những tín hiệu điều hòa hoạt động của các gen (ví dụ các vùng khởi động = promoter) hay kiểm soát sự tái bản của bộ gen (các khởi điểm tái bản), các vùng đệm phân cách giữa các gen... Đối với các prokaryote, đó còn là các vùng vận hành (operator). Đối với các eukaryote, có vô số yếu tố như vậy: các đoạn tăng cường (enhancer), các trình tự gây bất hoạt gen (silencer), các trình tự ADN lặp lại của telomere v.v.

Nhìn chung, việc định nghĩa và phân loại gen có tính chất tương đối và thường xuyên được sửa đổi, chẳng hạn các khám phá về các gen phân đoạn (split gene) và các phương thức cắt nối chọn lọc đối với các bản sao sơ cấp của chúng ở các eukaryote mà chúng ta sẽ nghiên cứu sau này. Tuy nhiên, nếu nhìn toàn cục thì một khái niệm thống nhất nổi bật về đặc tưng của sự sống, đó là: tất cả các sinh vật từ virus, vi khuẩn cho đến con người đều có chung hệ thống mật mã di truyền chứa đựng trong các gen của bộ gen và được sử dụng để tổng hợp các protein của tế bào cũng như tái bản của các bộ gen qua đó truyền lại cho thế hệ sau.

2.2. Các thành phần cấu trúc của gen

Tổ chức của một gen có thể bao gồm các vùng riêng biệt với chức năng đặc thù sau đây (xem Bảng 3.1).

Hình 3.3. Cấu trúc tổng quát của một gen.

Tại locus bất kỳ, một vùng ADN được phiên mã có thể gọi là một đơn vị phiên mã (transcription unit = TU). Như đã đề cập, ở prokaryote, một đơn vị phiên mã có thể gồm nhiều gen; trong khi đó ở eukaryote, các đơn vị phiên mã hầu như bao giờ cũng tương đương với một gen. Đối với các gen mã hóa protein, rõ ràng là có một sự phân cách giữa vùng được dịch mã thành chuỗi

Page 45: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

45

polypeptide và vùng không được dịch mã.

Ở vi khuẩn, vùng được dịch mã là khung đọc mở (ORF), trong đó các gen ngăn cách nhau bằng các đoạn đệm (spacer) gọi là các vùng không mã hóa bên trong (internal noncoding region). Các gen nằm ở hai đầu của một operon cũng được kèm bởi một vùng không mã hóa có tên là vùng

5' không được dịch mã (5' untranslated region = 5'-UTR) hay đoạn dẫn đầu (leader sequence) và vùng 3' không được dịch mã (3'-UTR) hay đoạn theo sau (trailer sequence). Về bản chất, chúng là các đoạn điều hòa; chẳng hạn, vùng 5'-UTR có chứa trình tự Shine-Dalgarno giàu bazơ purine kiểm soát sự bám vào của ribosome trong bước mở đầu dịch mã, còn vùng 3'-UTR thường đóng vai trò quan trọng trong ổn định mARN.

Ở eukaryote, vùng mã hóa của các gen cũng được kèm bởi các vùng UTR điều hòa, và cả hai vùng 5'-UTR và 3'-UTR cũng như khung đọc mở có thể bị gián đoạn bởi các đoạn không mã hóa (các intron) mà sau đó chúng sẽ được cắt bỏ trước khi mARN trưởng thành đi ra tế bào chất. Như thế, bất kỳ đoạn nào mà rốt cuộc bị loại bỏ khỏi bản sao pre-ARN thì được gọi là các đoạn đệm

được phiên mã (transcribed spacer).

Bảng 3.1. Các thuật ngữ được dùng để chỉ các thành phần chức năng khác nhau của các gen (theo Twyman 1998, có sửa đổi)

Thuật ngữ Định nghĩa

Alen (allele) Một biến thể về trình tự của một gen.

Cistron Một đơn vị chức năng di truyền, một vùng của ADN mã hóa một sản phẩm đặc thù.

Vùng mã hóa, khung đọc mở (ORF)

Một vùng của ADN được dịch mã thành protein. Ở vi khuẩn, đó là một gen. Ở eukaryote, vùng mã hóa có thể bị gián đọan bởi các intron.

Gen phân đoạn (split gene)

Gen mã hóa protein gồm các đoạn không mã hóa (intron) nằm xen giữa các đoạn mã hóa (exon).

Gen (gene)

Ở vi khuẩn, một cistron mã hóa một polypeptide hoặc phân tử ARN. Ở eukaryote, một đơn vị phiên mã có thể mã hóa một hoặc nhiều sản phẩm hoặc đóng góp vào một sản phẩm.

Locus gen

Vị trí của một gen trên một nhiễm sắc thể, kể cả các yếu tố điều hòa liền kề. Thuật ngữ locus được dùng theo cách riêng để chỉ vị trí của gene-marker, yếu tố điều hòa, khởi điểm tái bản, v.v..

Operon Một locus của vi khuẩn có chứa nhiều gen (mà được phiên mã như là một bản sao polycistron đơn) và các yếu tố điều hòa chung của chúng.

Pseudogen (gen giả)

Một trình tự không hoạt động chức năng vốn có cấu trúc tương tự một gen hoạt động chức năng.

Đoạn đệm được phiên mã

Bất kỳ phần nào của đơn vị phiên mã của 1 gen ARN hay operon gen ARN sẽ bị loại bỏ trong khi tạo ra các phân tử ARN trưởng thành.

Đơn vị phiên mã, vùng được phiên mã

Một vùng của ADN được phiên mã thành ARN. Ở các eukaryote, đó là một gen. Ở vi khuẩn, nó thường bao gồm nhiều gen.

Page 46: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

46

Vùng không được dịch mã (UTR)

Các vùng của đơn vị phiên mã không được dịch mã thành protein. Các UTR kề bên một vùng mã hóa hay operon được gọi là 5'-UTR và 3'-UTR.

2.3. Các gen ở prokaryote

Ở các prokaryote và eukaryote bậc thấp, thường có một mối quan hệ đơn giản giữa gen và sản phẩm của nó. Trong hầu hết trường hợp, có một sự tương ứng “một gen - một sản phẩm”; sự đồng

tuyến tính giữa gen và chuỗi polypeptide của nó đã được Yanofsky xác nhận năm 1961. Vì vậy ở các sinh vật này, gen và cistron là tương đương: gen là đơn vị chức năng, mang thông tin di truyền được biểu hiện trọn vẹn.

Cần lưu ý rằng: (1) Ở vi khuẩn, các gen đồng nghĩa với vùng mã hóa hay khung đọc mở (ORF), trong khi đó ở các eukaryote nó đồng nghĩa với đơn vị phiên mã. Đó là vì các gen vi khuẩn thường được sắp xếp trong một operon (xem Chương 6), và được phiên mã chung trong một phân tử mARN gọi là mARN đa cistron (polycistronic mRNA). Trái lại, ở các eukaryote, hầu hết các gen được phiên mã riêng rẽ dưới dạng các mARN đơn cistron (monocistronic mRNA). (2) Trong các gen mã hóa protein của vi khuẩn không có các intron như ở eukaryote mà chúng ta sẽ tìm hiểu ngay sau đây (xem Hình 3.4).

Hình 3.4. (a) Ở vi khuẩn, các gen không có intron. (b) Ở eukaryote, các gen mã hóa protein chủ yếu là gen phân đoạn.

2.4. Các gen ở eukaryote

Ở các bộ gen eukaryote bậc cao, thông thường có một mối quan hệ phức tạp giữa gen và sản phẩm của nó. Hầu hết các gen của eukaryote bậc cao đều có chứa các intron (intervening sequence), tức các đoạn không mã hóa protein, nằm xen giữa các exon (expressed sequence) - các đoạn mã hóa protein. Các gen như vậy được gọi là gen phân đoạn (split gene), gen khảm (mosaic gene) hay gen đứt quãng (interrupted gene). Loại gen này được Phillip Sharp phát hiện lần đầu tiên năm 1977 mà lúc đó ông gọi là “Gene in pieces”.

Một dụ kinh điển về gen phân đoạn là gen ovalbumin ở gà đã được E. Chambon xác định đầy đủ trình tự nucleotide năm 1981 (Hình 3.5).

Page 47: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

47

Hình 3.5. Gen phân đoạn. (a-b) Vi ảnh điện tử và sơ đồ minh họa sự lai hoá giữa mARN trưởng thành được đánh dấu với mạch khuôn của gen thuộc ADN bị biến tính. Các vùng ký hiệu A→G là các intron của mạch khuôn gen, do không có vùng bổ sung tương ứng trên mARN để kết cặp nên chúng xuất hiện dưới dạng các vòng. (c) Cấu trúc của gen ovalbumin, gồm đoạn mã hoá “leader” (L) với các exon 1-7 (hàng trên) và số cặp bazơ tương ứng (hàng dưới); xen kẽ giữa chúng là các intron.

2.5. Các gen mã hóa protein ở người

Cho đến nay được biết các gen trong bộ gen của sinh vật nhân chuẩn phần lớn là các gen phân đoạn. Hình 3.6 và Bảng 3.2 và Bảng 3.3 cho thấy các đặc điểm của một số gen mã hoá protein trong bộ gen người.

Bảng 3.2. Sự tương phản về kích thước gen, kích thước mARN và số lượng intron của một số gen ở người (1 kb = 1.000 bp).

Gen Kích thước gen (kb)

Kích thước mARN (kb)

Số lượng intron

Insulin 1,7 0,4 2

Collagen [pro-α-2(1)] 38,0 5,0 50

Albumin 25,0 2,1 14

Phenylalanine hydroxylase 90,0 2,4 12

Dystrophin (DMD) 2000,0 17,0 50

Bảng 3.3. Số lượng và kích thước của các exon và intron trong các gen α-, β-, và γ-globin của hemoglobin người, kể cả 5'-UTR và 3'-UTR của đơn vị phiên mã (TU).

TU của Globin Đầu 5' E1 I1 E2 I2 E3 Đầu 3'

alpha 37 93 113 204 141 129 112

beta 50 93 130 222 850 126 132

Page 48: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

48

gamma 53 93 122 222 886 126 87

ββββ-globin

HGPRT(HPRT)

toàn b ộ = 1.660 bp; các exon = 990 bp

histone

nhân t ố VIII

toàn b ộ = 400 bp; exon = 400 bp

toàn b ộ = 42.830 bp; các exon = 1263 bp

toàn b ộ = ~186.000 bp; các exon = ~9,000 bp

Hình 3.6. Một số gen mã hoá protein trong bộ gen người. Một số gen như các gen của histone là không có intron, còn đa số các gen đều có chứa ít nhất một intron, ví dụ: gen β-globin có 3 exon và hai intron; gen mã hoá hypoxanthine-guanine phosphoribosyl transferase (HGPRT) có 9 exon và dài gấp gen histone khoảng 100 lần, tuy nhiên mARN của nó chỉ dài gấp chừng ba lần mARN histone; gen của nhân tố VIII gây đông máu có quá nhiều intron (biểu thị bằng các đường kẻ đứng mảnh).

Các khám phá sau này còn cho thấy các sự kiện rắc rối nẩy sinh đối với nhiều gen phân đoạn, ở chỗ: thông tin trong một gen được sử dụng một cách chọn lọc để sinh ra nhiều sản phẩm khác nhau, gọi là cắt-nối chọn lọc (alternative splicing). Các sản phẩm có quan hệ về cấu trúc này thường có các chức năng khác nhau. Hình 3.7 cho thấy hai kiểu loại bỏ các intron từ các gen phân đoạn ở eukaryote.

Hình 3.7. Hai kiểu loại bỏ intron từ các gen phân đoạn ở eukaryote.

Page 49: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

49

Ngoài ra, có vài trường hợp trong đó cần tới hai gen để sinh ra một sản phẩm mARN đơn thông qua kiểu cắt-nối chéo (trans-splicing) hoặc biên tập ARN (RNA editing). Chẳng hạn, khám phá mới nhất cho thấy glucose 6-phosphate dehydrogenase là một enzyme có mặt trong các tế bào hồng cầu người; nó bao gồm hai dạng thứ yếu và chính yếu; dạng đầu có trình tự các axit amin thuộc gen trên nhiễm sắc thể X; và dạng sau gồm hai peptide được mã hóa từ thông tin của hai nhiễm sắc thể, các axit amin trong đoạn 1-53 được mã hóa trên nhiễm sắc thể số 6 và các axit amin ở đoạn tiếp theo 54-479 được mã hóa trên nhiễm sắc thể X. Một lần nữa, tất cả các trường hợp này nói lên một điều rằng, để đưa ra một định nghĩa chính xác về gen là không hề đơn giản!

3. Mã di truyền

Gen hay ADN được cấu tạo từ bốn loại nucleotide, trong khi đó protein được cấu tạo bởi 20

loại axit amin. Vấn đề đặt ra là, các gen mã hóa cho các sản phẩm protein của chúng bằng cách

nào?

Bằng suy luận, ta có thể suy đoán rằng mỗi axit amin không thể được xác định bởi đơn vị mã

gồm một, hai hoặc bốn nucleotide bởi một đằng còn chưa đủ và một đằng khác lại quá dư thừa. Có

lẽ nó phải là một nhóm gồm ba nucleotide (43 = 64). Với 64 kiểu bộ ba hoá ra là đủ thừa để mã hoá

cho 20 loại axit amin. Như thế, một axit amin được xác định bởi trung bình ba bộ ba khác nhau.

Phải chăng mã di tryền là mã bộ ba?

Năm 1961, S.Brenner, F.Crick và L.Barnett đã phân tích chi tiết nhiều thể đột biến của phage

T4 nhận được bằng cách xử lý acridin, tác nhân gây các đột biến mất hoặc thêm một cặp bazơ, đã

khẳng định mã di truyền là mã bộ ba (triplet code) đúng như dự đoán. Như vậy, đơn vị mã (coding

unit) gồm ba nucleotide xác định một axit amin gọi là codon.

3.1. Giải mã di truyền

Việc tiếp theo là xác định xem mỗi axit amin cụ thể được mã hoá bởi một hoặc một số bộ ba

nào. Cũng trong năm 1961, M.Nirenberg và H. Matthaei lần đầu tiên sử dụng mARN nhân tạo có

thành phần bazơ biết trước được tổng hợp bằng enzyme polynucleotide phosphorylase (do Ochoa

tìm ra năm 1959) và hệ thống tổng hợp là dịch chiết tế bào E. coli bao gồm đầy đủ các yếu tố

(ribosome, tARN, axit amin, enzyme, ATP...) cần thiết cho tiến hành giải mã di truyền in vitro. Với

mARN chỉ chứa toàn U, poly(U), chuỗi polypeptide sinh ra chỉ chứa toàn phenylalanine (Phe).

Điều đó chứng tỏ UUU là bộ ba mã hoá của Phe.

Sau đó, Gobind Khorana đã tiến hành các thí nghiệm sử dụng các mARN tổng hợp có chứa

hai, ba hoặc bốn nucleotide được kết nối theo kiểu lặp lại để tiến hành giải mã. Ví dụ: (i) Với

mARN nhân tạo chứa hai bazơ là poly(UC) hay UCUCUC..., sẽ chứa hai codon xen kẽ UCU và

CUC (chú ý rằng sự dịch mã in vitro khởi đầu tại vị trí ngẫu nhiên). Kết quả là thu được một

polypeptide gồm hai axit amin xen kẻ nhau là serin và leucin, poly(Ser-Leu); (ii) Với mARN tổng

hợp gồm các bộ ba lặp lại sẽ được dịch thành các homopolypeptide. Ví dụ, poly(UUC) có thể được

đọc là (UUC-UUC), hoặc (UCU-UCU), hoặc (CUU-CUU) tùy thuộc vào vị trí bắt đầu dịch mã. Và

kết quả là có ba loại polypeptide được tổng hợp, poly(Phe) hoặc poly(Ser) hoặc poly(Leu) v.v.

Từ các kết quả thu được bằng cách đó Khorana đã xác định được 'nghĩa' của phần lớn các

codon có thành phần bazơ không đồng nhất, và việc giải toàn bộ hệ thống mã di truyền (genetic

code) được hoàn tất vào tháng 6 năm 1966. Với công lao to lớn đó Khorana và Nirenberg được trao

giải thưởng Nobel năm 1968. Từ đây cho phép xây dựng nên bảng mã di truyền (Bảng 3.4) với các

Page 50: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

50

đặc tính được trình bày dưới đây.

Bảng 3.4. Mã di truyền (trên mARN, chiều codon N1N2N3 là 5'→3')

Bảng mã tra thuận Bảng mã tra ngược

N1 N2 N3 A.amin Codon (5'→3')

U C A G Ala GCN

U

U Phe Leu Arg CGN + AGA, AGG

C Ser Asn AAU, AAC

A Tyr ■ ■ Asp GAU, GAC

G Cys ■ Trp Cys UGU, UGC

Gln CAA, CAG

C

U Leu Glu GAA, GAG

C Pro Gly GGN

A His Gln His CAU, CAC

G Arg Ile AUU, AUC, AUA

Leu CUN + UUA, UUG

A

U Ile Met► Lys AAA, AAG

C Thr Met (►) AUG

A Asn Lys Phe UUU, UUC

G Ser Arg Pro CCN

Ser UCN + AGU, AGC

G

U Val Thr ACN

C Ala Trp UGG

A Asp Glu Tyr UAU, UAC

G Gly Val GUN

KT (■) UAA, UAG, UGA

Chú thích:

(1) N = U, C, A hoặc G

► : Codon mở đầu (MĐ) ■ : Codon kết thúc (KT)

(2) Viết tắt bằng ba chữ cái thông dụng của các axit amin.

Tên đầy đủ Viết tắt Tên đầy đủ Viết tắt

Alanine Ala Leucine Leu

Arginine Arg Lysine Lys

Aspartic acid Asp Methionine Met

Asparagine Asn Phenylalanine Phe

Cysteine Cys Proline Pro

Glutamic acid Glu Serine Ser

Glutamine Gln Threonine Thr

Glycine Gly Tryptophan Trp

Page 51: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

51

Histidine His Tyrosine Tyr

Isoleucine Ile Valine Val

Mở đầu MĐ (►) Kết thúc KT (■)

3.2. Các đặc tính của mã di truyền

- Mã di truyền là mã bộ ba (triplet code). Các bộ ba cuả mARN gọi là codon (mã) và bộ ba đặc trưng của tARN có thể khớp với codon của mARN theo nguyên tắc bổ sung gọi là anticodon (đối mã) (Hình 3.8).

Hình 3.8. Các phân tử tARN mang axit amin Ser (trái) và Tyr (phải) đọc mã trên mARN bằng cách khớp anticodon của chúng với codon của mARN.

- Mã di truyền không gối lên nhau (non-overlapping). Mỗi codon là một đơn vị độc lập, và thông tin của mARN được đọc lần lượt qua các codon theo chiều 5'→3' bắt đầu từ codon khởi đầu.

- Mã di truyền có tính liên tục, không bị ngắt quãng (unpunctuated).

- Mã di truyền có các codon khởi đầu (initiation) và kết thúc (termination) nằm ở hai đầu 5' và 3' của mARN đóng vai trò là tín hiệu khởi đầu và kết thúc tổng hợp chuỗi polypeptide.

- Mã di truyền có tính đơn trị, rõ ràng (unambigous). Mỗi codon xác định chỉ một axit amin hoặc là tín hiệu kết thúc dịch mã.

- Mã di truyền có tính thoái hóa (degenrate). Với tất cả 61 codon có nghĩa (sense codon) trong khi chỉ có 20 loại axit amin, vì vậy mỗi axit amin có thể được xác định bởi nhiều hơn một codon. Các codon cùng xác định một axit amin như thế gọi là các codon đồng nghĩa, chúng thường khác nhau ở bazơ cuối (bazơ 3') – bazơ thoái hóa. Ví dụ, các axit amin Arg, Ser và Leu đều có sáu codon đồng nghĩa (Bảng 3.4).

- Mã di truyền có tính phổ biến (universal).

Đến đây ta có thể hình dung mối quan hệ giữa ADN-gen với sản phẩm mARN và protein của nó như ở Hình 3.9

Page 52: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

52

Hình 3.9. Mối quan hệ giữa ADN-gen với sản phẩm mARN và protein của nó

3.3. Những ngoại lệ so với mã di truyền “ phổ biến”

Bên cạnh tính phổ biến (universal) của hệ thống mã di truyền nói trên, các nghiên cứu gần đây cho thấy một vài chệch hướng mà hầu hết là xảy ra trong các bộ gen ty thể (Bảng 3.5). Tuy nhiên, ở các bào quan thực vật, sự biên tập ARN (ARN editing) là phổ biến và không rõ ràng, ở chỗ: Liệu phải chăng tất cả các trường hợp sai lệch so với mã phổ biến ở thực vật là các biến đổi thật hay là hậu quả của sự biên tập ARN trước khi dịch mã. Một vài thay đổi thỉnh thoảng cũng xảy ra ở các bộ gen vi khuẩn và bộ gen nhân của các eukaryote, nhưng thường thì liên quan với các codon kết thúc. Sự phân bố phát sinh chủng loại của các thay đổi này chỉ ra rằng mã di truyền vẫn còn tiến hóa.

Bảng 3.5. Các ngoại lệ so với mã “phổ biến”

Nguồn Codon Nghĩa phổ biến Nghĩa mới

Ty thể ruồi giấm UGA Kết thúc Tryptophan

AGA & AGG Arginine Serine

AUA Isoleucine Methionine

Ty thể động vật có vú AGA & AGG Arginine Kết thúc

AUA Isoleucine Methionine

UGA Kết thúc Tryptophan

Ty thể nấm men CUN (1) Leucine Threonine

AUA Isoleucine Methionine

UGA Kết thúc Tryptophan

Ty thể T.vật bậc cao UGA Kết thúc Tryptophan

CGG Arginine Tryptophan

Nhân của Protozoa (2) UAA & UAG K ết thúc Glutamine

Mycoplasma UGA Kết thúc Tryptophan

(1) N = U, C, A hoặc G; (2) Protozoa: Động vật nguyên sinh.

Page 53: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

53

3.4. Sự linh hoạt trong kết cặp bazơ giữa anticodon và codon

Mặc dù có 61 codon có nghĩa nhưng trên thực tế trong mỗi tế bào prokaryote và eukaryote chỉ có khoảng 40 phân tử tARN khác nhau. Tuy nhiên, trong tế bào chỉ có 20 loại axit amin được xác định bởi mã di truyền, nên một số loại tARN phải mang cùng một loại axit amin. Các bản sao tARN như thế có thể có trình tự anticodon giống nhau, trong trường hợp đó chúng có thể thay thế chức năng cho nhau. Các tARN khác thì mang các trình tự anticodon khác nhau và do vậy nhận biết các codon khác nhau; chúng được gọi là isoaccepting tARN, và độ giàu tương đối của chúng có thể ảnh hưởng tới cách thức sử dụng codon.

Năm 1966, F.Crick đưa ra một cách để giải thích về sự kết cặp “lỏng lẻo” có thể xảy ra ở vị trí thứ ba của các codon đồng nghĩa. Theo Crick, hai bazơ đầu tiên của một codon phải có sự kết cặp chính xác với anticdon (theo nguyên tắc bổ sung), còn bazơ cuối của codon thì có thể “ linh

hoạt” (wobble), ít đặc thù hơn so với vị trí bình thường của nó để hình thành nên sự kết cặp bazơ bất thường với anticodon. Đề nghị này được gọi là giả thuyết linh hoạt (wobble hypothesis).

Hình 3.10. Hai kiểu kết cặp bazơ với G ở vị trí linh hoạt và ba kiểu kết cặp bazơ với I (inosine) ở vị trí linh hoạt. Hình dưới (bên phải) cho thấy sự kết cặp linh hoạt xảy ra ở bazơ 5' của tARN với bazơ 3' của codon mã hóa Leucine.

Crick gợi ý rằng một bazơ G trong anticodon có thể cặp không chỉ với C ở vị trí thứ ba của

Page 54: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

54

một codon (vị trí linh hoạt), mà còn với U. Hơn nữa, ông còn lưu ý một trong số các nucleoside bất thường có mặt trong tARN là inosine (I), có cấu trúc tương tự với guanosine. Nucleoside này thông thường có thể kết cặp như G, vì vậy kỳ vọng nó sẽ cặp với C (kết cặp bổ sung) hoặc U (kết cặp linh hoạt) ở vị trí thứ ba của codon. Nhưng ông còn lưu ý rằng I vẫn còn có thể có kiểu kết cặp linh hoạt khác, bây giờ ta biết đó là cặp với A ở vị trí thứ ba của codon. Điều đó có nghĩa là, một anticodon có I ở vị trí thứ nhất về tiềm năng có thể cặp với ba codon khác nhau có bazơ cuối là C, U hoặc A. Các thí nghiệm sau này khẳng định điều dự đoán của Crick là hoàn toàn đúng và cho thấy các khả năng kết cặp bazơ linh hoạt ở Bảng 3.6 và Hình 3.10.

Bảng 3.6. Các nguyên tắc kết cặp linh hoạt anticodon-codon

Bazơ 5' của anticodon Bazơ 3' của codon

C G

G C hoặc U

A U

U A hoặc G

I U, C hoặc A

Rõ ràng, hiện tượng kết cặp linh hoạt này làm giảm đáng kể số lượng các tARN cần thiết để dịch mã di truyền. Ví dụ, để dịch mã các codon (5'→3') UUU và UUC mã hoá cho phenylalanine chỉ cần một tARNPhe mang anticodon (3'→5') AAG.

TÓM T ẮT

(1) Gen (gene) là khái niệm trung tâm của di truyền học và sinh học phân tử, bắt nguồn từ khái niệm “nhân tố di truyền” do Mendel đề xuất lần đầu vào năm 1865. Bản chất, cấu trúc và hoạt động của chúng chỉ mới được làm sáng tỏ dần trong hơn nửa thế kỷ qua kể từ ngày Watson – Crick khám phá ra cấu trúc phân tử ADN.

(2) Gen là một đoạn xác định của bộ gen mang thông tin xác định một polypeptide hoặc một phân tử ARN chức năng. Có nhiều loại gen và các yếu tố không phải gen với chức năng khác nhau trong một bộ gen.

(3) Ở sinh vật nhân sơ, không có các gen phân đoạn; mối quan hệ giữa gen và sản phẩm đơn giản: 1 gen → 1 polypeptide. Các gen có chức năng liên quan thường được tổ chức trong một operon. Trong khi ở các sinh vật nhân chuẩn, gen phân đoạn là phổ biến; mối quan hệ giữa gen và sản phẩm là rất phức tạp, ví dụ từ 1 gen có thể cho nhiều protein khác nhau.

(4) Gen là một đoạn xác định của bộ gen sinh vật - chủ yếu là ADN - mang thông tin di

truyền mã hóa cho một chuỗi polypeptide dưới dạng mật mã bộ ba. Có tất cả 64 bộ ba hay codon mã hóa cho 20 loại axit amin có trong tất cả các protein. Bên cạnh mã di truyền phổ biến còn có một số ngoại lệ xảy ra trong các hệ thống di truyền ty thể của nấm men bia, động vật có vú... Sự đọc mã trên các mARN bởi các tARN theo nguyên tắc bổ sung nhưng vẫn có sự linh hoạt bởi vì trong tế bào chỉ có khoảng 45-50 phân tử tARN khác nhau.

Page 55: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

55

CÂU HỎI VÀ BÀI T ẬP

41. Công trình của __(a)__ năm 1941 đã đề xuất giả thuyết nổi tiếng là: __(b)__.

42. Hiện tượng nhiều codon cùng xác định một axit amin được gọi là __(a)__ . Chỉ có hai trường hợp 1 codon xác định chỉ 1 axit amin, đó là __(b)__.

43. Quan hệ nào giữa gen và sản phẩm của nó mang tính phổ biến?

A. Một gen - một protein. B. Một gen - một enzyme.

C. Một gen - một polypeptide. D. Một gen - nhiều polypeptide.

44. Thuật ngữ và nội hàm khái niệm gen hiện nay được xem là tương đương với đơn vị di truyền học nào dưới đây?

A. Recon B. Cistron C. Muton D. Replicon

45. Trong công trình nghiên cứu cấu trúc tinh vi của gen, Seymour Benzer đã đề xuất ba thuật ngữ hay đơn vị di truyền học nào?

A. Operon, recon và muton. B. Cistron, codon và anticodon.

C. Exon, intron và operon. D. Muton, cistron và recon.

46. Nếu lai phân tử phát hiện một gen có 15 intron thì đây là loại gen gì và có bao nhiêu exon?

A. Gen cấu trúc; 16 exon. B. Gen mã hóa protein; 15 exon.

C. Gen phân đoạn; 16 exon. D. Gen điều hòa; 14 exon.

47. Sự nhận thức về gen diễn ra như thế nào qua các giai đoạn phát triển khác nhau của di truyền học và sinh học phân tử?

48. Về cơ bản, cấu trúc và tổ chức của các gen ở prokaryote và eukaryote khác nhau ở những điểm nào?

49. Thế nào là gen phân đoạn? exon và intron? Nêu các vai trò và ý nghĩa có thể có của các intron. Cho vài ví dụ về gen phân đoạn ở người.

50. Một gen có tỷ lệ phần trăm của A + 20%, T = 30% và tỷ số (A+G)/(T+C) = 1,5. Gen ấy là gen của nhóm sinh vật nào? và số lượng từng loại nucleotide là bao nhiêu, biết rằng tổng số nucleotide của gen là 3.000?

51. Kết quả phân tích một gen thu được số liệu sau: Gen chứa 3 intron I-1, I-2 và I-3 với số cặp bazơ tương ứng là 170, 450 và 110. Số lượng axit amin được mã hóa tương ứng bởi các exon E-1, E-2, E-3 và E-4 là 50, 100, 111 và 140. Hỏi: (a) Gen ấy là gen gì và thuộc nhóm sinh vật nào? (b) Chiều dài toàn bộ vùng mã hóa một protein của gen ấy là bao nhiêu cặp bazơ, nếu tính cả bộ ba kết thúc? (c) Giả sử ở nhiều mô của sinh vật này có sự cắt nối chọn lọc đối với pre-mARN, theo lý thuyết có thể có bao nhiêu protein được tạo ra từ gen này?

52. Tính thoái hóa của mã di truyền được hiểu như thế nào? Hãy chỉ ra các codon mã hoá cho các axit amin Trp, His, Val và Leu và cho biết trường hợp nào không có sự thoái hoá mã.

53. Giả thuyết kết cặp bazơ linh hoạt là gì? Giải thích và cho ví dụ.

54. Nếu một ARNm được tổng hợp từ hai loại ribonucleotide A và U với tỷ lệ ngang nhau, tần số của các codon mã hóa cho các axit amin có mặt trong các polypeptide sẽ như thế nào?

55. Người ta đã tổng hợp được các mARN nhân tạo từ hỗn hợp gồm hai loại ribonucleotid U và C với tỷ lệ cho trước là 5:1. Hãy xác định tần số của các codon có thể có trong các mARN và của các axit amin có thể có trong sản phẩm sau khi tiến hành tổng hợp protein trong ống nghiệm bởi

Page 56: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

56

mARN này.

56. Trong giải đoán mã di truyền, người ta đã sử dụng một loại phân tử mARN được tổng hợp với thành phần gồm 75% U và 25% G để tiến hành tổng hợp protein trong ống nghiệm. Kết quả phân tích và tính toán thành phần axit amin của các polypeptid sản phẩm cho thấy: có sáu axit amin Tryptophan, Glycine, Cysteine, Leucine, Valine và Phenylalanine với tần số tương ứng là 0,11; 0,15; 0,33; 0,33; 0,44 và 1,00. Không sử dụng bảng mã di truyền, anh (chị) hãy trình bày phương pháp xác định mã (codon) cho các axit amin nói trên. Biết rằng các codon cùng xác định một axit amin thường có hai nucleotid đầu giống nhau; và Cysteine được mã hóa bởi UGU.

57. Nếu sử dụng các phân tử ARNm nhân tạo có thành phần bazơ (UUC)n và (GAUA)n để tiến hành tổng hợp protein trong ống nghiệm, thành phần axit amin từ mỗi loại polypeptid sẽ như thế nào? Trường hợp nào không tổng hợp được protein? Tại sao?

58. Nếu sử dụng các ARNm nhân tạo có thành phần bazơ (UAC)n và (GUAA)n để tiến hành tổng hợp protein trong ống nghiệm, thành phần axit amin từ polypeptide thu được sẽ như thế nào? Có trường hợp nào không tổng hợp được protein? Tại sao?

59. Nếu sử dụng ba phân tử ARNm nhân tạo có thành phần gồm các bazơ được kết hợp ngẫu nhiên theo tỷ lệ sau đây để tiến hành tổng hợp protein trong ống nghiệm, thì tỷ lệ các axit amin được kết hợp trong các protein sẽ như thế nào? a) 1U:5C. b) 1A:1C:4U. c) 1A:1C.

60. Bằng thực nghiệm các nhà khoa học đã chỉ rõ hệ thống mã di truyền phổ biến có 61 codon đặc hiệu (mã hóa axit amin), trong khi số lượng các phân tử ARNt khác nhau trong tế bào các loài chỉ vào khoảng 45. Vấn đề có vẻ như mâu thuẫn nầy đã được lý giải như thế nào? Cho một số thí dụ minh họa.

Page 57: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

57

Chương 4

TÁI B ẢN CỦA CÁC BỘ GEN

Sau khi khám phá ra cấu trúc ADN, Watson và Crick đã đề xuất ba kiểu truyền thông tin di truyền có thể có trong các tế bào, đó là: (1) Tái bản (replication): ADN → ADN; (2) Phiên mã (transcription): ADN→ ARN; và (3) Dịch mã (translation): ARN→ Protein. Các kênh truyền thông tin này còn được gọi là Giáo lý trung tâm (Central Dogma) của sinh học phân tử. Mãi đến năm 1970, Baltimore và Temin trên cơ sở nghiên cứu cơ chế hoạt động của bộ gen ARN ở virus Sarcoma đã bổ sung thêm kênh ARN→ ADN, gọi là phiên mã ngược (reverse transciption).

Trong chương này chúng ta sẽ lần lượt tìm hiểu tổ chức phân tử của các bộ gen và các cơ chế của quá trình tái bản ADN ở các sinh vật, kể cả bộ gen ARN của một số virus.

Hình 4.1. Giáo lý trung tâm của sinh học phân tử (trái) và kiểu tái bản bán bảo toàn do Watson đề xuất.

1. Những nguyên tắc và đặc điểm chung của tái bản ADN

Tái bản (replication) là một đặc tính quan trọng nhất của vật chất di truyền, nhờ đó sự sống được duy trì liên tục, các loài bảo tồn được tính chất đặc trưng của mình, và con cái thường giống bố mẹ. Vậy ADN và các bộ gen nói chung được tái bản như thế nào?

(1) Tái bản theo kiểu bán bảo toàn và gián đoạn (discontinuous).

Trong khi khám phá ra mô hình cấu trúc ADN, chính Watson đã đưa ra dự đoán chính xác rằng sự tái bản ADN phải diễn ra theo kiểu bán bảo toàn (semi-conservative) như ở Hình 4.1. Đến 1956, Salvador Luria và Max Delbruck đề nghị ba kiểu tái bản có thể có (Hình 4.2): bán bảo toàn, bảo toàn (conservative) và phân tán (dispersive). Tuy nhiên, nhiều thí nghiệm sau đó đã nhanh chóng khẳng định sự tái bản ADN diễn ra theo kiểu bán bảo toàn.

Page 58: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

58

(a) (b) (c)

Hình 4.2. Mô hình tái bản bán bảo toàn của ADN do Watson đề xuất (a), và giả định về ba kiểu tái bản có thể có của Luria và Delbruck (a-c).

Điển hình là thí nghiệm của Meselson và Stahl năm 1958 ở E. coli bằng phương pháp đánh dấu đồng vị phóng xạ N15 (nitơ nặng) kết hợp với ly tâm siêu tốc (ultra-centrifugation). Đầu tiên cho vi khuẩn này sinh trưởng trên môi trường N15; rồi đưa trở lại môi trường N14 (nitơ nhẹ) và sau một, hai hoặc ba thế hệ đều có lấy các mẫu ADN. Để tách ADN nặng và nhẹ, người ta cho trộn lẫn các mẫu này với Cesium chloride (CsCl) trước khi đem ly tâm. Khi ly tâm, ADN có các tỷ trọng nặng (heavy), nhẹ (light) và trung bình (intermediate) sẽ tách thành các vạch tương ứng khác nhau trong ống nghiệm (Hình 4.3).

Các kết quả cho thấy rằng sau một thế hệ, 100% ADN mạch kép có tỷ trọng trung bình, nghĩa là một mạch nặng (từ dạng cha mẹ) và một mạch nhẹ (được tổng hợp mới). Kết quả này cho phép khẳng định sự tái bản xảy ra theo kiểu bán bảo toàn đúng như Watson dự đoán từ trước.

(2) Sự tái bản được bắt đầu tại vị trí đặc thù trên phân tử ADN và diễn ra đồng thời theo hai hướng ngược nhau gọi là khởi điểm tái bản hai hướng (bidirectional origin of replication). Nghĩa là, từ khởi điểm này ADN mạch kép mở xoắn thành hình vòng sinh trưởng theo hai hướng đối lập nhau tạo ra hai chạc tái bản (replication fork). Mỗi khởi điểm tái bản cùng với hai chạc như vậy goi là một đợn vị tái bản (replicating unit, hay replicon) được minh hoạ ở Hình 4.4. Mỗi phân tử ADN mạch kép vòng của vi khuẩn chỉ có một khởi điểm tái bản, trong khi mỗi phân tử ADN trong nhiễm sắc thể eukaryote có nhiều khởi điểm tái bản hoạt động theo một trình tự đặc thù (Hình 4.11).

Hình 4.3. Thí nghiệm Meselson-Stahl về sự tái bản bán bảo toàn của ADN.

Page 59: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

59

(3) Quá trình tái bản ADN phụ thuộc vào hệ thống gồm các protein và enzyme khác nhau. Mặc dù mỗi nhóm sinh vật có một hệ thống các enzyme và protein tái bản riêng, song chúng có các enzyme với vai trò chung nhất sau đây:

– Protein chuyên nhận biết và bám khởi điểm để hình thành nên “phức hợp mở” (open complex).

– ADN gyrase mở cuộn ADN siêu xoắn trước mỗi chạc tái bản.

– Helicase tháo xoắn ADN tại mỗi chạc.

– Protein SSB (single strand binding) bám vào vùng ADN mạch đơn do helicase tách ra, nhờ đó mỗi mạch đơn có thể làm khuôn cho tái bản.

– Primase xúc tác tổng hợp mồi (primer).

– Các ADN polymerase xúc tác chính cho việc tổng hợp ADN mới nhờ có hoạt tính polymerase 5'→3', một số còn có hoạt tính đọc sửa exonuclease 3'→5'. – Các đoạn mồi được cắt bỏ nhờ hoạt tính exonuclease 5'→3', còn việc lấp khoảng trống nhờ polymerase 5'→3'.

– ADN ligase hàn liền khe hở giữa các đoạn Okazaki bằng các liên kết 3',5'-phosphodiester.

(4) Tại mỗi chạc tái bản, trước tiên xảy ra sự tổng hợp các đoạn mồi ARN bởi vì các ADN polymerase tự nó không thể bắt đầu tổng hợp mới. Mặt khác, do hai mạch đơn của mỗi chạc phân cực ngược chiều nhau trong khi các enzyme ADN polymerase và ARN polymerase chỉ xúc tác theo chiều 5'“ 3', cho nên phương thức tái bản ADN diễn ra trên hai mạch khuôn là không giống nhau: một mạch liên tục hay còn gọi là mạch dẫn đầu (leading strand) và một mạch không liên tục hay còn gọi là mạch ra chậm (lagging strand). Kiểu tái bản như thế gọi là tái bản nửa gián đoạn (semi-discontinuous). Ở E. coli, sự tổng hợp không liên tục bởi các đoạn có độ dài 1.000-2.000 nucleotide (do R. Okazaki phát hiện đầu tiên năm 1969) nên gọi là các đoạn Okazaki (Okazaki fragments). Sau đó, các đoạn mồi sẽ được cắt bỏ và chỗ trống được thay thế bằng ADN, và các đoạn Okazaki được nối lại với nhau bởi enzyme ADN ligase.

Hình 4.4. Một đơn vị tái bản gồm một khởi điểm với hai chạc tái bản sinh trưởng theo hai hướng đối lập nhau. Mỗi chạc có một sợi dẫn đầu (tổng hợp liên tục) và một sợi ra chậm (tổng hợp các đoạn Okazaki).

2. Tái bản ADN ở prokaryote

2.1. Khởi điểm tái bản ADN ở E. coli

Như vừa đề cập ở trên, phân tử ADN mạch kép vòng của vi khuẩn chỉ có một khởi điểm tái bản,

Page 60: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

60

Hình 4.5. Sự tái bản ADN ở vi khuẩn bắt đầu tại một khởi điểm duy nhất. Hình bên phải là ảnh phóng xạ tự ghi hay ảnh chụp hiển vi điện tử, còn bên trái là sơ đồ mô phỏng.

2.2. Các enzyme tham gia tái bản ADN ở E. coli

2.2.1. Các enzyme tham gia tái bản ADN ở E. coli

Để tiện theo dõi, ta có thể tóm tắt vai trò của các enzyme tham gia tái bản ADN E. coli ở Bảng 4.1. Ngoài ra, ở Bảng 4.2 và 4.3 mô tả chi tiết thành phần các tiểu đơn vị của holoenzyme ADN polymerase III ở E. coli và cách thức kết hợp của chúng như sau.

Bảng 4.1. Vai trò của 3 loại ADN polymerase và một số enzyme khác tham gia tái bản ADN ở E. coli

Enzyme Vai trò

Protein dnaA Protein nhận biết và bám khởi điểm

ADN gyrase Mở ADN siêu xoắn trước mỗi chạc

Helicase (protein dnaB) Tháo xoắn ADN mạch kép tại mỗi chạc

Protein SSB (protein dnaG) Bám vào các vùng ADN mạch đơn

Primase (protein dnaG) Tổng hợp các đoạn ARN mồi

ADN polymerase I Loại bỏ mồi và tổng hợp ADN thay thế

ADN polymerase II Hoàn toàn không cần thiết cho tái bản

ADN polymerase III Tái bản ADN ở cả hai sợi của mỗi chạc

ADN ligase Nối các đoạn Okazaki (ở sợi ra chậm)

Protein RTP Protein kết thúc tái bản (bám vùng rtp)

Page 61: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

61

Bảng 4.2. Đặc tính của các ADN polymerase I, II và III từ E. coli.

Pol I Pol II Pol III

Chức năng chính Sửa chữa ADN và loại bỏ mồi

Sửa chữa ADN Tái bản ADN

Kích thước (kDa) 109 120 140

Các gen cấu trúc polA polB DnaE, N, Q, X, Z

Số phân tử/tế bào 400 10-20

Polymerase 5'→3' + + +

Exonuclease 3'→5' + + +

Exonuclease 5'→3' + – –

Bảng 4.3. Các tiểu đơn vị của Holoenzyme ADN polymerase III ở E. coli

TT Ti ểu đơn vị KLPT Chức năng

1 α 129,9 Hoạt tính của ADN polymerase

2 ε 27,5 Exonuclease 3'→5' (đọc sửa)

3 θ 8,6 Kích thích exonuclease ε

4 τ 71,1 Lõi dimerize, bám phức hợp γ

5 γ 47,5 Bám ATP

6 δ 38,7 Bám vào tiểu đơn vị β

7 δ' 36,9 Bám vào tiểu đơn vị γ và δ

8 χ 16,6 Bám vào SSB

9 ψ 15,2 Bám vào và γ

10 β 40,6 Mấu trượt

Chú thích: KLPT = khối lượng phân tử (kD). Sự kết hợp các tiểu đơn vị (lấy theo số thứ tự ở bảng) tạo thành các thành phần của Holoenzyme ADN polymerase III như sau:

1 + 2 + 3 = Lõi của Pol III 1 + 2 + 3 + 4 = Lõi + 4 = Pol III' 5 + 6 + 7 + 8 + 9 = Phức hợp γ (ATPase phụ thuộc ADN) 1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 = Pol III' + Phức hợp γ = Pol III*

1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 = Pol III* + β = Holoenzyme Pol III Pol III* là do Holoenzyme Pol III khuyết tiểu đơn vị β. [Nguồn: Từ Herendee và Kelly, Cell 84:6, 1996 (dẫn theo Weaver, 2011).]

2.3. Cơ chế tái bản ADN ở E. coli

2.3.1. Khởi đầu tái bản (initiation)

Đối với nhiễm sắc thể E. coli, sự tái bản bắt đầu tại một khởi điểm đặc thù duy nhất gọi là Ori (Hình 4.6 và 4.7). Quá trình diễn biến tại khởi điểm cho đến lúc hình thành hai chạc có thể tóm tắt như sau:

(1) Các protein bám khởi điểm dnaA được tổng hợp để bám Ori tạo ra cấu trúc nucleoprotein chuyên hoá của khởi điểm;

(2) Cấu trúc này mở xoắn vùng giàu AT để tạo ra “phức hợp mở”;

Page 62: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

62

(3) Hai phân tử helicase chui vào phức hợp mở làm mở xoắn khởi điểm theo cả hai hướng, tạo thành hai chạc tái bản. Khi cả hai mạch đơn của mỗi chạc tách ra thì các protein SSB bám vào. Nhờ vậy các mạch đơn được dùng làm khuôn hiệu quả cho các enzyme tái bản hoạt động.

(a)

Khởi đầu tổng hợp DNA tại khởi điểm (ori ) ở E. coli

5’3’

3’5’

trình tự DNA khởi điểm

bám vào của các protein dnaA

A A A

các protein dnaA tụ họp

DNA bị biến tính bởicác protein dnaAA

AA

A A

A

AA

AA A

A B C

các protein dnaB và dnaCbám vào DNA sợi đơn

dnaB tháo mở chuỗi xoắn kép

(b)

A

A

A

A A

A B C

dnaB tiếp tục mở chuỗi xoắn képvà thế chỗ các protein dnaA

GdnaG (primase) bám vào...

A

A

A

A A

AB C

G...và tổng hợp một đoạn mồi RNA

RNA primer(~5 nucleotide)

Hình 4.6. Tiến trình khởi đầu tái bản ADN ở E. coli. Mở đầu là sự bám vào Ori của các protein

dnaA (a) đến khi tổng hợp đoạn mồi đầu tiên bởi primasome (b).

Hình 4.7. Mô hình xoay của Cairns. Khi tái bản ADN mạch vòng đóng, hai mạch đơn của nó phải tách nhau ở mỗi chạc (F).

Khởi đầu trong tái bản ADN là sự tổng hợp một đoạn mồi ngắn bởi primase, mà ở E. coli là

phức hợp primasome. Kích thước đoạn mồi ở các sinh vật thường không vượt quá 12 nucleotide. Ở

E. coli, theo nghiên cứu của bà Okazaki và cs (1985), các đoạn mồi dài 10-12 nucleotide.

Page 63: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

63

2.3.2. Kéo dài (elongation)

Một khi primasome tổng hợp xong một mồi, đó là lúc sự kéo dài chuỗi ADN mới được bắt

đầu. Ở E. coli, enzyme chủ chốt cho quá trình này là ADN polymerase III hoàn chỉnh (holoenzyme),

một phức hợp gồm mười tiểu đơn vị là các polypeptide khác nhau. Mỗi phân tử cho một mạch

khuôn của chạc tái bản. Sự kéo dài trong suốt quá trình tổng hợp ADN ở E. coli rõ ràng là cần tới

một replisome (thể tái bản) do kết hợp giữa primasome và ADN polymerase III hoàn chỉnh. Tốc độ

tổng hợp trung bình là 1.000 nucleotide mỗi giây (Hình 4.8a).

Sự tái bản ADN kiểu nửa gián đoạn (semi-discontinuous) xảy ra tại mỗi chạc của ADN E.

coli như sau (Hình 4.8b):

� Trên mạch khuôn dẫn đầu (3'→5'): Trước tiên, enzyme primase hay primasome chỉ tổng

hợp một đoạn mồi ARN có chứa đầu 3'-OH tự do. Sau đó, enzyme hoàn chỉnh ADN polymerase III

bắt đầu kéo dài chuỗi ADN mới sinh trưởng theo chiều 5'→3' một cách liên tục.

(a)

Hình 4.8. (a) Cơ chế tổng hợp chuỗi ADN mới theo chiều 5'→3' bởi ADN polymerase III trên mạch khuôn có chiều ngược lại. (b) Phương thức tái bản nửa gián đoạn ở một chạc của ADN E. coli.

� Trên mạch khuôn ra chậm (5'→3'): Sự tổng hợp diễn ra không liên tục dưới dạng các đoạn Okazaki. Kích thước trung bình mỗi đoạn Okazaki ở E. coli là 1.000 - 2.000 nucleotide (ở các sinh vật nói chung là 100-1.000 nucleotide). Quá trình này có tính chu kỳ, đòi hỏi phải được “mồi hóa” nhiều lần, với sự tham gia lần lượt của bốn enzyme sau đây:

Page 64: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

64

(i) primase tổng hợp một đoạn mồi ARN (bổ sung với ADN khuôn);

(ii) ADN polymerase III hoàn chỉnh kéo dài đoạn Okazaki;

(iii) ADN polymerase I vừa cắt bỏ dần từng nucleotide của đoạn mồi vừa lấp khoảng trống bằng cách kéo dài dần đoạn Okazaki theo sau nó;

5’3’

3’5’

protein Rep (helicase)

protein bám sợi đơn(SSB)

BCG Primasome

pol I

pol III

pol III

DNA ligase

DNA gyrase – đây là một topoisomerase II, cắt và nối lại DNA để đưa các vùng siêu xoắnngược phía trước mỗi chạc

Hình 4.9. Các enzyme và protein tại mỗi chạc tái bản ADN E. coli.

(iv) ADN ligase hàn liền khe hở còn lại giữa hai đoạn Okazaki kề sát nhau bằng một liên kết 3',5'-phosphodiester.

Quá trình tổng hợp Okazaki trên mạch khuôn ra chậm diễn ra theo chu kỳ hoạt động của bốn enzyme nói trên, và nó diễn ra gần như đồng thời với quá trình tổng hợp liên tục trên mạch khuôn dẫn đầu của mỗi chạc tái bản. Hình 4.8 và 4.9 cho thấy sự hoạt động của các protein và enzyme tại mỗi chạc tái bản của ADN E. coli.

2.3.3. Kết thúc tái bản (termination)

Để hoàn thành công việc tái bản ADN, tế bào phải lấp đầy các khoảng trống do các ARN mồi bị cắt bỏ để lại. Đối với các ADN mạch vòng như của vi khuẩn thì không có vấn đề lấp tất cả các khoảng trống bởi vì bao giờ cũng có đầu 3' ADN khác nằm phía trước dùng làm mồi.

Thật vậy, cả hai chạc tái bản được bắt đầu từ một khởi điểm duy nhất (ori), và di chuyển hầu như cùng tốc độ, theo hai hướng đối lập nhau xung quanh nhiễm sắc thể mạch vòng cho tới khi chúng gặp nhau tại một điểm kết thúc chung đối xứng với ori. Theo Bastia và cs (1997) cũng như nhiều tác giả khác, đây là vùng chứa các trình tự đặc thù gọi là các điểm kết thúc tái bản (replication termini; Hình 4.10). Và tại các trình tự đặc thù này có các protein kết thúc tái bản (replication terminator protein = RTP) bám vào, và các phức hợp protein-ADN này ngăn cản sự di chuyển của các chạc tái bản. Sự ngừng lại của các chạc tái bản tại vùng kết thúc tạo nên bước đầu tiên trong quá trình hoàn thành một vòng tái bản và sau đó, tách rời hai nhiễm sắc thể con một cách có trật tự nhờ xúc tác của topoisomerase IV.

Page 65: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

65

Hình 4.10. Sơ đồ tổng quát về tái bản ADN E.coli.

3. Tái bản ADN ở prokaryote

3.1. Khởi điểm tái bản ADN ở eukaryote

Sự tái bản ADN của nhiễm sắc thể eukaryote diễn ra ở pha S của kỳ trung gian trước lúc tế bào bước vào phân chia theo kiểu nguyên phân hay giảm phân. Quá trình này chịu sự kiểm soát của rất nhiều hormone và protein theo cơ chế rất tinh vi và phức tạp.

Mỗi phân tử ADN trong nhiễm sắc thể eukaryote có nhiều khởi điểm tái bản hoạt động theo một trình tự đặc thù (Hình 4.11).

Hình 4.11. Mỗi ADN trong nhiễm sắc thể eukaryote có nhiều khởi điểm tái bản. Hình bên phải là

ảnh phóng xạ tự ghi hay ảnh chụp hiển vi điện tử, còn bên trái là sơ đồ mô phỏng. 3.2. Các enzyme tham gia tái bản ADN ở eukaryote

Các tế bào động vật có vú chứa 5 loại ADN polymerase khác nhau. Các polymerase ε, δ và α dường như tham gia vào tái bản ở cả hai sợi của ADN, trong đó polymerase α chịu trách nhiệm tổng hợp mồi, còn polymerase ε tổng hợp ở sợi dẫn đầu và polymerase δ tổng hợp ở sợi ra chậm. Polymerase β hình như thực hiện chức năng sửa chữa ADN. Polymerase γ có lẽ tái bản ADN ty thể (Weaver, 2011). Như vậy, so với một số hiểu biết gần đây thì vai trò của polymerase α là khá rõ, nhưng đặc biệt vai trò của các polymerase δ và ε thì hầu như đảo ngược hoàn toàn (xem Bảng 4.4).

Page 66: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

66

Bảng 4.4. Các vai trò có thể có của một số ADN polymerase ở eukaryote (dẫn theo theo Robert Weaver, 2011)

Enzyme Vai trò có thể

ADN polymerase α Tổng hợp mồi cho tái bản ở cả hai sợi

ADN polymerase β Sửa chữa ADN

ADN polymerase γ Tái bản ADN ty thể

ADN polymerase δ Kéo dài ở sợi ra chậm

ADN polymerase ε Kéo dài ở sợi dẫn đầu

Tóm tắt đặc điểm các enzyme tái bản ở prokaryote và eukaryote:

(i) Ở E. coli, cả ba loại protein dnaB, dnaC và dnaG hợp thành một phức hợp gọi là primasome (thể mở đầu).

(ii) Tất cả các ADN polymerase đều cần có mồi với một nhóm 3'-OH tự do; chúng xúc tác tổng hợp chuỗi theo một hướng 5'→3' và chỉ một số enzyme này có hoạt tính đọc sửa (proofreading activity) 3'→5'. Điển hình đó là tiểu đơn vị ε của ADN polymerase III với hoạt tính exonuclease 3'→5'. Nhờ vậy mà nó làm giảm đáng kể tần số phát sinh đột biến, thay vì là 10–5 bây giờ là 10–5 × 10–5 = 10–10.

(iii) Khác với E. coli, các tế bào người có năm loại ADN polymerase, trong đó ba loại chịu trách nhiệm tái bản ADN nhân là các ADN polymerase α, δ và ε.

(iv) Các đoạn mồi ARN ở E. coli là 10-12 bazơ, ở eukaryote ~5 bazơ.

(v) Các doạn Okazaki ở E. coli là khoảng 1.000-2.000 nucleotide, trong khi ở eukaryote chỉ ~100-200 nucleotide.

(vi) Tốc độ tổng hợp của ADN polymerase III ở E. coli là ~1.000 nucleotide/s; trong khi ở eukaryote tốc độ tổng hợp của các polymerase δ và ε chậm hơn. Loại kháng nguyên nhân làm tăng

sinh tế bào (proliferating cell nuclear antigen = PCNA) có vai trò trong cả tái bản lẫn sửa chữa. Một trong các chức năng của nó là dùng làm nhân tố trượt cho cả ADN polymerase δ và ε. PCNA giữ cho ADN polymerase đính vào sợi khuôn để tổng hợp nhanh hơn tới 40 lần.

(vii) Ngoài ra còn có một số enzyme và protein đặc thù tham gia kết thúc tái bản, tổng hợp các telomere hoặc cắt nối trong quá trình tái tổ hợp.

Hình 4.12 cho thấy sự hoạt động của các protein và enzyme tại mỗi chạc tái bản của ADN người.

5’3’

3’5’

helicase

SSB

pol αααα(hay pol δ)δ)δ)δ)

DNA ligase

topoisomerases I và II

PCNA

hoạt tính primasekết hợp với pol α

pol δδδδ

Sợi dẫn đầu

Sợi ra ch ậm

hoạt tínhexo 5’ → 3’kết hợp vớiphức hợp

pol εεεε

Hình 4.12. Các enzyme và protein tại mỗi chạc tái bản ADN người. Lưu ý: Ở đây thay polymerase

Page 67: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

67

δ bằng polymerase ε, và ngược lại.

3.3. Vấn đề tái bản các đầu mút của nhiễm sắc thể ở eukaryote

Như chúng ta đều biết, mỗi nhiễm sắc thể eukaryote chứa một phân tử ADN mạch kép mạch thẳng kết hợp với nhiều loại protein, có các đầu mút đặc trưng gọi là telomere. Một khi đọan mồi đầu tiên trên mỗi mạch được loại bỏ thì nó không có cách nào để bù đắp lại khoảng trống đó, bởi vì ADN không thể nào nới rộng theo chiểu 3'→5', và cũng chẳng có đầu 3' nằm phía trước như trong các ADN mạch vòng. Nếu quả thực như vậy thì các mạch ADN sẽ ngắn bớt đi sau mỗi lần tái bản. Vậy các tế bào eukaryote giải quyết vấn đề này như thế nào?

Các kết quả nghiên cứu đầu tiên của Elizabeth Blackburn và các đồng sự của bà đã giải đáp cho vấn đề này. Các telomere không chứa các gen; thay vì thế chúng có cấu trúc đơn giản gồm những trình tự ngắn (6-8 bp) lặp lại nối tiếp cả ngàn lần và đặc thù cho từng loài.

Chẳng hạn, ở Tetrahymena, một nhóm động vật nguyên sinh có lông tơ, trình tự này là (TTGGGG)n; ở Caenorhabditis: (CCCTCCC)n; ở bọn Oxytrichia thuộc Euplotes: (CCCCAAA)n; v.v. Ở người và các động vật có vú là 5'-TTAGGG-3' được lặp lại khoảng 1.000-2.000 lần (Hình 4.13) và khoảng biến thiên phát hiện được trong các tế bào ở các giai đoạn khác nhau là 150-2.000 lần.

Các đoạn lặp này được gắn thêm vào đầu 3' của các mạch ADN, không phải bằng tái bản bán bảo toàn, mà bằng một enzyme có tên là telomerase. Nếu như telomerase không cho phép một cơ chế tái bản bán bảo toàn, thì nó không thể sử dụng một mạch ADN làm khuôn cho mạch kia. Blackburn cho rằng đặc tính này là do một phân tử ARN nhỏ có mặt trong chính phân tử telomerase.

Hình 4.13. Sơ đồ tổ chức của một telomere trên nhiễm sắc thể người.

Thật vậy, telomerase là một ribonucleoprotein có bản chất của một enzyme phiên mã ngược (reverse transcriptase) ở chỗ, nó tổng hợp ADN từ một khuôn ARN (Hình 4.14). Chẳng hạn, telomerase của Tetrahymena có một ARN dài 160 nucleotide có chứa trình tự 3'-CAACCCCAA-5' làm khuôn cho tổng hợp các đoạn lặp 5'-TTGGGG-3' trong các telomere của nó. Ở người, phân tử ARN trong telomerase dài khoảng 450 nucleotide có chứa trình tự 3'-AAUCCC-5' (nằm trong đoạn ứng với vị trí 46-56) làm khuôn cho sự tổng hợp các đoạn lặp telomere 5'-TTAGGG-3' trên các mạch đơn có đầu mút 3'. Sau đó, ở mạch đối diện, ADN polymerase có thể hoàn thành việc tổng

Page 68: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

68

hợp “các đầu mút không đầy đủ” (incomplete ends) trên mạch đối diện sau khi đã được mồi hóa bên trong các telomere đó; và cuối cùng đoạn mồi sẽ bị cắt bỏ.

Hình 4.14. Mô hình tổng hợp các đoạn lặp telemere. (a) Telomerase sử dụng một đoạn ngắn của phân tử ARN để làm khuôn cho tổng hợp trình tự ADN bổ sung (telomere) vào đầu 3' của chuỗi xoắn kép. Ở người, trình tự được bổ sung là TTAGGG. (b) Để gắn thêm một đoạn lặp khác, telomerase lại dịch chuyển tới đầu mút của đoạn lặp vừa được tổng hợp.

Các nghiên cứu gần đây cho thấy: enzyme telomerase chỉ có mặt trong các tế bào mầm (germ cell), kể cả các tế bào gốc phôi (embryonic stem cell), các tế bào ung thư (cancer cell), và các eukaryote đơn bào như Tetrahymena thermophila. Trong khi đó, các tế bào soma bình thường của động vật có vú không có mặt telomerase, hoặc nếu có thì hàm lượng là rất không đáng kể.

Điều đó cho phép lý giải tại sao các tế bào mầm cũng như các tế bào ung thư có khả năng phân chia gần như là vô hạn; hay nói cách khác, telomerase và sự duy trì chiều dài telomere chính là chìa khóa cho sự bất tử của tế bào. Ngược lại, hậu quả của sự vắng bóng telomerase trong các tế bào soma (do gen mã hóa nó bất hoạt) là ở chỗ: cứ sau mỗi lần nguyên phân (mitosis), tất cả 92 telomere của các tế bào soma người đồng loạt mỗi cái bị mất đi chừng 100 cặp bazơ, nghĩa là khoảng 16 đoạn lặp TTAGGG. Theo lý thuyết, với tốc độ này, sau 125 lần nguyên phân các telomere sẽ biến mất hoàn toàn. Trên thực tế, các thí nghiệm khác nhau kể từ khám phá đầu tiên của Leonard Hayflick vào đầu thập niên 1960 cho đến nay (Greider và Blackburn 1996; Hayflick 1997; Shay và cs 2004...) đã xác nhận rằng: chỉ sau khoảng 40-60 lần nguyên phân, các tế bào soma mất hẳn khả năng phân chia và bước vào giai đoạn lão hóa (senescence) và chết tự nhiên. Cái đó được gọi là giới hạn Hayflick (Hayflick limit).

Chính quá trình rút ngắn telomere theo thời gian (nghĩa là số lần nguyên phân) như thế khiến người ta liên tưởng tới sự tồn tại của cái gọi là “đồng hồ di truyền cho sự lão hóa” (genetic clock for aging) và bắt đầu tiến hành các nghiên cứu về “hiệu ứng vị trí telomere” (telomere position effect = TPE). Đó là lý do tại sao các tế bào soma có số lần phân chia hữu hạn trước khi chúng chết và là một trong những lý do tại sao sự lão hóa và cái chết của mọi sinh vật như là một quy luật tất

Page 69: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

69

yếu đã được lập trình sẵn bên trong các tế bào, bên cạnh apoptosis – cái chết đã được lập trình của tế bào. Như thế, cái chết tất yếu trên phương diện sinh học, cái chết tự nhiên của thân xác đã được lý giải khá rõ ràng và đầy đủ. Từ các nghiên cứu này cũng đã mở ra triển vọng to lớn cho liệu pháp

ung thư cũng như vấn đề lão hóa và ngăn ngừa các bệnh tật phát sinh từ đó ở con người.

4. Tái bản ARN ở virus

4.1. Đặc điểm tái bản của các bộ gen ARN virus

Ở các virus có bộ gen ARN, phương thức tái bản của chúng rõ ràng là khác với các hệ thống tái bản ADN đã biết. Trước hết, các enzyme tổng hợp ARN không cần có mồi (primer), vì vậy không có cơ hội cho việc đọc sửa (proofreading). Ngoài ra, về mặt di truyền ARN là một phân tử kém bền so với ADN bởi vì nhóm hydroxyl có mặt ở nguyên tử C2' của gốc đường cho phép thủy phân liên kết phosphodiester giữa hai ribonucleotide và tạo thành liên kết phosphodiester vòng giữa các nhóm hydroxyl của C2' và C3' trong cùng một gốc đường; sau đó cấu trúc vòng này mở ra và để lại nhóm phosphate ở vị trí C3'. Sự kết hợp của hai đặc điểm trên là nguyên nhân làm hạn chế kích thước các bộ gen ARN. Các bộ gen này không thể kéo dài như ADN, hoặc không thể tránh khỏi tỷ lệ sai sót cao trong quá trình tái bản (10-3-10-4). Trên thực tế, bộ gen ARN lớn nhất được biết là một ARN mạch đơn với ~29.700 bazơ ở các coronavirus (virus gây dịch sốt viêm phổi cấp, SARS, với chủng gây bệnh phổ biến là H5N1... từng gây ra đại dịch toàn cầu vào năm 2002 ở một số nước châu Á, Canada... là một thí dụ). Đó cũng là lý do tại sao các virus ARN cho nhiều biến thể khác nhau đến như vậy, mặc dù kích thước bộ gen của chúng không lớn. Một mặt, chúng có thể tiến hóa nhanh để xâm nhập vào các hệ thống miễn dịch của vật chủ. Và mặt khác, nó gây khó khăn cho việc bào chế các vaccine và thuốc chống lại các biến thể của chúng. Chính điều này mà các virus ARN có thể trở thành một mối hiểm họa thực sự cho nhân loại, một thách thức đối với khoa học!

4.2. Tái bản của bộ gen ARN (ARN →→→→ ARN)

Kiểu truyền thông tin trực tiếp từ ARN sang ARN xảy ra trong các tế bào lây nhiễm virus ARN (chẳng hạn virus đốm thuốc lá và nhiều virus thực vật khác, kể cả các phage ARN như MS2...). Bộ gen ARN của các virus này có mang gen mã hoá enzyme tái bản đặc thù. Sau khi được tổng hợp trong tế bào chủ, enzyme này sử dụng bản thân ARN của virus làm khuôn để tổng hợp các phân tử ARN bổ sung. Đến lượt mình các ARN lại làm khuôn để tổng hợp trở lại các phân tử ARN của các virus thế hệ con.

4.3. Phiên mã ngược (ARN →→→→ cADN)

Phiên mã ngược (reverse transcription) là phương thức sao chép thông tin di truyền từ ARN sang ADN, chỉ xảy ra trong các tế bào động vật và người bị lây nhiễm bởi một số virus mang một ARN sợi đơn có khả năng gây khối u hoặc hai phân tử ARN như tong trường hợp HIV (Hình 4.15). Các virus này được gọi là retrovirus. Trên mỗi sợi ARN lõi của các virus này có đính một enzyme

phiên mã ngược (reverse transcriptase = RTase), ngoài ra còn có enzyme integrase.

Khi xâm nhập vào tế bào chủ, enzyme RTase sử dụng ARN của virus làm khuôn để tổng hợp

mạch ADN bổ sung (complementary DNA = cDNA hay cADN): ARN → cADN sợi đơn. Sau đó, sợi cADN này có thể làm khuôn để tổng hợp trở lại bộ gen của virus (cADN → ARN) hoặc tổng

hợp ra sợi ADN thứ hai bổ sung với nó (cADN sợi đơn → cADN sợi kép) - như trong trường hợp virus gây khối u - kết quả là tạo ra một cADN sợi kép. Phân tử cADN sợi kép được tổng hợp trước tiên trong quá trình lây nhiễm có thể xen vào ADN của vật chủ (nhờ enzyme integrase). Trạng thái

Page 70: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

70

tồn tại của cADN sợi kép này trong bộ gen vật chủ được gọi là ADN tiền virus (DNA provirus). Vì vậy, provirus được truyền lại cho các tế bào con thông qua sự tái bản của ADN vật chủ, nghĩa là các tế bào con cháu của vật chủ cũng rơi vào tình trạng có mầm bệnh ung thư. Các tế bào này sẽ mất khả năng kiểm soát sự sinh trưởng và phân chia bình thường, dẫn tới tăng sinh tế bào rất nhanh và tạo ra khối u (tumor). Đó chính là cơ chế gây ung thư bởi virus. Từ hiểu biết trên đây, người ta tinh chiết các enzyme phiên mã ngược ở các retrovirus để phục vụ kỹ thuật tạo dòng cADN tái tổ hợp (Chương 8).

Hình 4.15. Vi ảnh điện tử phóng đại phần bề mặt của HIV (A) Các hoạt động của một retrovirus HIV trong tế bào người (B).

TÓM T ẮT

(1) Tái bản là đặc tính quan trọng nhất của vật chất di truyền, nhờ đó các loài bảo tồn được đặc tính riêng của mình. Tái bản ADN diễn ra theo kiểu bán bảo toàn và gián đoạn với sự tham gia của nhiểu enzyme, quan trọng nhất là các ADN polymerase. Ở E. coli, có 3 loại ADN polymerase I, II và III; trong đó Pol III là enzyme tái bản chính. Ở tế bào nhân chuẩn có 5 loại ADN polymerase (α, β, γ, δ và ε), trong đó các polymerase ε, δ và α dường như tham gia tái bản ở cả hai sợi, α - tổng hợp mồi, ε - tổng hợp ở sợi dẫn đầu, và δ - tổng hợp ở sợi ra chậm, polymerase β đóng vai trò sửa chữa ADN, còn γ - tái bản ADN ty thể. Các ADN polymerase chỉ có thể bắt đầu tổng hợp ADN mới khi có các đoạn ARN ngắn làm mồi.

(2) Sự tái bản ADN ở các tế bào nhân sơ và nhân chuẩn bắt đầu tại những vị trí đặc thù trong ADN gọi là khởi điểm tái bản (Ori), từ đó mở xoắn tạo thành 2 chạc tái bản diễn tiến theo hai hướng ngược nhau. Mỗi khởi điểm cùng với hai chạc tái bản họp thành một đơn vị tái bản (replicon). Mỗi NST của vi khuẩn chỉ có một khởi điểm tái bản, trong khi mỗi NST eukaryote có nhiều khởi điểm.

(3) Sự tái bản tại mỗi chạc diễn ra theo kiểu nửa gián đoạn, nghĩa là một mạch được tổng hợp liên tục gọi là mạch dẫn đầu và mạch kia không liên tục còn gọi là mạch ra chậm. Ở E. coli, mỗi đoạn Okazaki có độ dài 1.000-2.000 nucleotide; ở sinh vật nhân chuẩn ~100-1.000.

Page 71: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

71

(4) Mỗi đầu mút của NST nhân chuẩn có trình tự 6-8bp đặc thù, lặp lại gọi là telomere. Ở người, đó là (TTAGGG)n. Sự tái bản các đầu mút do telomerase thực hiện. Khác với các tế bào sinh dục, các tế bào soma không có telomerase nên các telomere không được tái bản đầy đủ, vì vậy chúng ngắn dần sau mỗi nguyên phân. Sau 40-60 lần phân chia, các tế bào soma dừng lại và bước vào giai đoạn lão hóa.

(5) Sự tái bản của một số virus ARN khác nhau là không giống nhau, có thể là: ARN → ARN

→ ARN hoặc ARN → cADN → ARN.

CÂU HỎI VÀ BÀI T ẬP

61. Thứ tự hoạt động của các enzyme (Pol = ADN polymerase) trong tổng hợp các đoạn Okazaki ở mạch ra chậm của ADN E. coli là: __(a)__; __(b)__; __(c)__; __(d)__.

62. Sự tổng hợp mồi trong quá trình tái bản ADN ở E. coli được thực hiện bởi ___(a)___; thực chất đó là một loại polymerase chuyên tổng hợp ___(b)___.

63. Căn cứ vào hiểu biết mới nhất của sinh học phân tử, enzyme xúc tác chính cho quá trình tái bản ADN nhân trên mạch dẫn đầu và mạch ra chậm ở mỗi chạc tái bản tương ứng là:

A. ADN polymerase α và δ B. ADN polymerase γ và β

C. ADN polymerase ε và δ D. ADN polymerase δ và ε

64. Ở E. coli, loại ADN polymerase nào tham gia xúc tác tổng hợp chính ở cả hai mạch khuôn của mỗi chạc tái bản?

A. ADN polymerase I. B. ADN polymerase II.

C. ADN polymerase III. D. ADN polymerase I, II hoặc III.

65. Nếu cho một tế bào vi khuẩn có chứa một phân tử ADN bình thường trải qua 5 lần phân chia liên tiếp trong môi trường có các nucleotit được đánh dấu, thì sẽ thu được tất cả bao nhiêu tế bào con có ADN với cả hai mạch đơn đều chứa các nucleotit đánh dấu?

A. 32. B. 32. C. 30. D. 16.

66. Sự tái bản của các đầu mút ADN nhiễm sắc thể eukaryote phụ thuộc vào enzyme __(a)__, và chỉ xảy ra trong loại tế bào__(b)__.

67. Giả sử trên mạch khuôn ra chậm của một chạc tái bản ADN mạch kép vòng ở vi khuẩn phát hiện được tất cả 2.150 đoạn Okazaki. Có bao nhiêu đoạn mồi được tổng hợp trong quá trình tái bản ADN nói trên? A. 2152. B. 4301. C. 4320. D. 4302.

68. Phân tích các nguyên tắc và đặc điểm chung của tái bản ADN ở sinh vật nhân sơ (prokaryote).

69. Trình bày vai trò của các enzyme tham gia tái bản ADN ở sinh vật nhân sơ (prokaryote) mà đại diện là vi khuẩn E. coli.

70. Giải thích cơ chế tái bản ở một chạc tái bản của ADN E. coli và vẽ một sơ đồ minh hoạ.

71. Watson và Crick đã dựa vào đặc điểm cấu trúc nào của chuỗi xoắn kép để đưa ra dự đoán chính xác về kiểu tái bản bán bảo toàn của ADN? Trình bày thí nghiệm đầu tiên trên cơ thể sống nhằm chứng minh cho điều dự đoán ấy.

72. Hãy nêu những điểm giống nhau và khác nhau giữa các tế bào nhân sơ (prokaryote) và nhân

Page 72: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

72

chuẩn (eukaryote) về các vấn đề sau: (a) Khởi điểm tái bản; (b) Enzym tham gia tái bản.

73. Trong một thí nghiệm chứng minh sự tái bản của ADN ở E. coli, nếu như các vi khuẩn trước tiên được cho sinh trưởng ở môi trường chứa N15 trong nhiều thế hệ và sau đó quay lại môi trường chứa N14. Hỏi sau hai thế hệ sinh trưởng trên môi trường chứa N14 sẽ có bao nhiêu % ADN gồm 1 mạch nhẹ và 1 mạch nặng?

74. Trong quá trình tái bản của một ADN vi khuẩn có mạch kép dạng vòng, đã phát hiện được 550 đoạn Okazaki ở một chạc tái bản. Biết rằng để tổng hợp 1 mạch ADN mới hoặc 1 đoạn Okazaki cần phải có 1 đoạn ARN ngắn vài nucleotit làm mồi gọi là đoạn mồi. Hỏi có tất cả bao nhiêu đoạn mồi đã được tổng hợp trong quá trình tái bản của ADN đó? Giải thích.

75. Cho biết kích thước bộ gen của E. coli là 4,64 triệu cặp nucleotide và thời gian tái bản toàn bộ là 38 phút rưỡi. Tốc độ tổng hợp của ADN polimeraza III trung bình là bao nhiêu nucleotit mỗi giây (n/s)? và có bao nhiêu đoạn mồi đã được tổng hợp trong quá trình đó, nếu cho rằng: kích thước trung bình mỗi đoạn Okazaki tương đương với tốc độ tổng hợp trung bình của enzyme nói trên?

76. Giả sử có một mẩu ADN và đem nó phiên mã thành mARN, rồi tinh chiết ARN này. Sau đó cho hai mạch đơn ADN tách ra và phân tích thành phần bazơ của mỗi mạch và của mARN với số liệu ở bảng sau. Mạch nào của ADN làm khuôn cho tổng hợp mARN? Tại sao?

A% G% C% T% U%

ADN mạch 1 19,1 26,0 31,0 23,9 0

ADN mạch 2 24,2 30,8 25,7 19,3 0

mARN 19,0 25,9 30,8 0 24,3

77. Thế nào là “giới hạn Hayflick”? Hãy giải thích mối liên quan giữa telomere, telomerase với hiện tượng ung thư và lão hoá của tế bào.

78. Phân tích cấu trúc của telomere và cơ chế duy trì sự ổn định của đầu mút của các nhiễm sắc thể eukaryote.

79. Phiên mã ngược là gì? được phát hiện từ nhóm sinh vật nào? Giải thích cơ chế gây ung thư bởi virus loại này và cho biết các nhà khoa học đã lợi dụng hiểu biết từ sự khám phá này vào trong kỹ thuật di truyền như thế nào?

80. Sự tái bản của các bộ gen ARN ở một số virus khác với các hệ thống tái bản ADN ở những điểm nào? Tại sao kích thước bộ gen ARN thường nhỏ, nhưng chúng lại có khả năng gây nguy hiểm thực sự đối với các vật chủ?

Page 73: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

73

Chương 5

PHIÊN MÃ VÀ D ỊCH MÃ

Nói đến gen tức là nói đến ADN và các quan hệ của nó với ARN và protein trong sơ đồ Lý

thuyết trung tâm của Sinh học phân tử; trong đó các sợi đơn của ADN được dùng làm khuôn cho tái

bản (replication). Mặt khác, các gen có thể làm khuôn cho sự tổng hợp các ARN trong quá trình phiên mã (transcription). Đến lượt, các phân tử ARN này lại làm khuôn cho sự tổng hợp các chuỗi polypeptide mà từ đó tạo thành các protein, gọi là dịch mã (translation). Phiên mã và dịch mã là hai giai đọan chính trong sự biểu hiện của các gen mã hóa protein.

Trong chương này, chúng ta sẽ lần lượt tìm hiểu các vấn đề sau: (i) Quá trình phiên mã; (ii) Cấu trúc và chức năng của các loại ARN cơ bản trong tế bào; (iii) Quá trình dịch mã; và (iv) So sánh những điểm liên quan ở các tế bào prokaryote và eukaryote.

1. Phiên mã (Transcription)

1.1. Đặc điểm chung của phiên mã ở prokaryote và eukaryote

Phiên mã (transcription) là quá trình tổng hợp các ARN khác nhau từ thông tin di truyền chứa đựng trong ADN. Trừ các gen mã hóa protein trong các operon ở vi khuẩn, nói chung, các ARN mới được tổng hợp chỉ là các bản sao sơ cấp (primary transcript) gọi là các pre-ARN. Các pre-ARN này phải trải qua một quá trình sửa đổi để trở thành các ARN trưởng thành (mature) trước khi tham gia vào quá trình sinh tổng hợp protein của tế bào.

Hình 5.1. Cấu trúc chung của một gen hay đơn vị phiên mã.

Quá trình phiên mã (Hình 5.2) có các đặc điểm chung sau đây:

(i) Diễn ra dưới tác dụng của các enzyme ARN polymerase.

(ii) Vùng ADN chứa gen được mở xoắn cục bộ, và chỉ một mạch đơn gọi là mạch có nghĩa (sense) được dùng làm khuôn (template) cho tổng hợp ARN.

(iii) Phản ứng tổng hợp ARN diễn ra theo nguyên tắc bổ sung và được kéo dài theo chiều 5'→3', ngược với chiều của mạch khuôn như sau:

Mạch khuôn: 3'-A-T-G-C-5'

Mạch ARN: 5'-U-A-C-G-3'

(iv) Nguyên liệu là 4 loại ribonucleoside triphosphate: ATP, UTP, GTP, CTP.

(v) Sản phẩm của phiên mã là các ARN mạch đơn.

(vi) Sự khởi đầu và kết thúc phiên mã phụ thuộc vào các tín hiệu điều hoà là các trình tự ADN đặc thù nằm trước và sau gen được phiên mã.

Page 74: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

74

(vii) Quá trình phiên mã có thể chia làm ba bước: Mở đầu là sự tương tác giữa ARN polymerase với vùng promoter nhằm xác định mạch khuôn của gen và tổng hợp vài nucleotide; Kéo dài là giai đọan sinh trưởng tiếp tục của chuỗi ARN dọc theo mạch khuôn cho đến cuối gen; và Kết thúc phiên mã đặc trưng bằng sự giải phóng mạch ARN và ARN polymerase ra khỏi khuôn ADN.

Hình 5.2. Sự tổng hợp ARN trên mạch khuôn của gen (ADN) dưới tác dụng của ARN polymerase.

1.2. Phiên mã ở prokaryote

1.2.1. ARN polymerase ở prokaryote

Ở các prokaryote, đại diện là E. coli, ARN polymerase hoàn chỉnh (holoenzyme) là một

protein có nhiều tiểu đơn vị, gồm hai phần chính là yếu tố sigma (σ) và lõi enzyme. Yếu tố sigma (sigma factor) giúp cho ARN polymerase nhận biết và bám chặt vào promoter để có thể bắt đầu phiên mã tại vị trí chính xác, và lõi enzyme (polymerase core) đóng vai trò chính trong tổng hợp mạch ARN. Tất cả các lớp ARN ở E. coli đều được phiên mã bởi chỉ một ARN polymerase.

Sau đây là một số đặc tính hoạt động của ARN polymerase của E. coli (Bảng 5.1; Hình 5.3):

Bảng 5.1. Các thành phần cấu trúc của ARN polymerase prokaryote

Tiểu đơn vị Số lượng Vai trò

α 2 dùng để kết hợp holoenzyme ARN polymerase

β 1 hình thành liên kết phosphodiester

β' 1 bám khuôn ADN

σ 1 nhận biết promoter và khởi đầu phiên mã

α2ββ'σ ↔ αααα2ββ' + σσσσ

Holoenzyme = Lõi enzyme + Yếu tố sigma

(i) Khi bám vào promoter, ARN polymerase gây tháo xoắn ít nhất 10 bp, nhưng có lẽ là khoảng 17 bp ở vùng lân cận điểm bắt dầu phiên mã.

(ii) Búp phiên mã lan tỏa cùng với ARN polymerase làm lộ ra mạch khuôn vì vậy nó có thể được phiên mã. Thực tế, ARN polymerase của E. coli mở rộng ít nhất từ vị trí -44 đến +3 trong phức hợp mở của promoter.

Page 75: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

75

Hình 5.3. Mô hình chức năng của vùng đầu cuối C (C-terminal domain = CTD) của tiểu đơn vị α

ARN polymerase. (a) Trong lõi promoter, α CTD không được sử dụng, nhưng (b) trong một promoter có yếu tố UP, thì α CTD tiếp xúc với yếu tố UP. Lưu ý hai tiểu đơn vị α được mô tả: một cái nằm khuất sau cái kia.

(iii) Ti ểu đơn vị α của ARN polymerase có một vùng chức năng đầu C (C-terminal domain = CTD) uốn gập một cách độc lập sao cho có thể nhận biết và bám vào yếu tố điều hòa ngược dòng của promoter gọi là UP. Điều này cho phép sự tương tác chặt giữa polymerase và promoter.

(iv) Tiểu đơn vị α dùng để kết hợp holoenzyme ARN polymerase. Và điều này gây ra sự kết hợp các gốc chức năng ở vùng đầu mút N của α (α-NTD; N-terminal domain). Các điểm tiếp xúc giữa α-NTD và các tiểu đơn vị β và β' nằm trên các phía đối diện của dimer α-NTD so với các vùng đầu cuối C của dimer. (v) Tiểu đơn vị β lõi bám vào các nucleotide tại vị trí hoạt động của ARN polymerase nơi mà các liên kết phosphodiester được hình thành. Yếu tố σ cũng gần kề vị trí bám nucleotide, ít nhất trong pha khởi đầu.

1.3. Các promoter ở prokaryote

Các vùng khởi động (promoter) nói chung nằm kề trước gen và có chứa các đoạn trình tự đặc thù cho phép ARN polymerase nhận biết và bám chặt vào để khởi đầu phiên mã tại vị trí chính xác trên mạch khuôn của gen. Các promoter của các operon ở vi khuẩn nói chung có cấu trúc khá tương đồng. Đoạn trình tự quan trọng nhất của promoter được gọi là hộp TATA (TATA box) hay hộp Pribnow (Pribnow box). Đó là trình tự TATAAT nằm ở vị trí “-10'' (Hình 5.4). Ngoài ra, trong các promoter vi khuẩn còn có trình tự TTGACA ở gần vị trí ''-30'', gọi là đoạn nhận biết (recognition sequence). Đối với các gen mã hóa protein eukaryote, nằm phía trước điểm bắt đầu phiên mã chừng 75 nucleotide có trình tự GGCCAAATCT, thường được gọi là hộp CCAAT (CCAAT box) - đọc là “hộp cat”; nó đóng vai trò điều hòa tốc độ phiên mã (Hình 5.4).

* Lưu ý: Tất cả các trình tự tín hiệu đều được quy ước trên mạch đối khuôn của gen, vì chúng có trình tự giống với ARN được tổng hợp (chỉ khác là bazơ T trong gen được thay bởi U trong ARN). Các ký hiệu dấu '−' và '+' chỉ các vị trí trước và sau vị trí bắt đầu phiên mã, còn gọi là các yếu tố ngược dòng (upstream) và xuôi dòng (downstream).

Hình 5.4. Mô hình cấu trúc vùng khởi động (promoter) của E. coli.

Page 76: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

76

1.4. Các giai đoạn của quá trình phiên mã ở E. coli

- Giai đoạn bám và khởi đầu: Trước tiên, enzyme ARN polymerase hoàn chỉnh (holoenzyme) nhận biết và bám chặt vào promoter sẽ tháo xoắn một vùng có kích thước khoảng 12-17 cặp bazơ. Tổng hợp ARN thường được khởi đầu bằng nucleotide đầu tiên là ATP hoặc GTP. Sau khi holoenzyme ARN polymerase tổng hợp được một vài nucleotide, nhân tố sigma tách ra để đi vào một chu kỳ phiên mã khác, gọi là chu kỳ sigma (sigma cycle) (Hình 5.5).

- Giai đoạn kéo dài: Enzyme lõi tiến hành kéo dài chuỗi ARN theo chiều 5'→3' dọc theo mạch khuôn có chiều ngược lại. ARN polymerase lõi tiến đến đâu thì ADN được mở xoắn và phiên mã đến đấy; và vùng ADN đã được phiên mã đóng xoắn trở lại.

Hình 5.5. ARN polymerase bám promoter (trái) và các giai đoạn khởi đầu phiên mã ở E. coli.

- Giai đoạn kết thúc: Khi quá trình phiên mã tổng hợp xong hai đoạn kết thúc giàu GC và AT nằm đằng sau gen thì tại vùng đuôi mạch ARN hình thành cấu trúc ''kẹp tóc'' làm dừng sự phiên mã

của lõi ARN polymerase. Việc kết thúc một số bản sao ARNcần tới yếu tố rho (ρ) có bản chất protein, khiến cho mạch ARN vừa được tổng hợp và enzyme lõi được giải phóng ra khỏi ADN khuôn (Hình 5.6 và 5.7).

Hình 5.6. Mô hình cấu trúc vùng kết thúc phiên mã (terminator) của prokaryote

Page 77: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

77

Hình 5.7. Phiên mã ở E. coli, với sự hình thành cấu trúc “kẹp tóc” và tham gia của yếu tố Rho ở giai đoạn kết thúc phiên mã. Lưu ý, ở vi khuẩn sự dịch mã mARN được bắt đầu trong khi phiên mã đang còn tiếp diễn.

1.5. Phiên mã và sửa đổi ARN sau phiên mã ở eukaryote

1.5.1. Các ARN polymerase ở eukaryote

Ở các eukaryote, có ba loại ARN polymerase I, II và III với sự phân bố và chức năng chuyên hóa khác nhau đối với bộ gen trong nhân, như sau: ARN polymerase I ở trong hạch nhân (nucleolus) phiên mã phức hợp gen rARN cho sản phẩm gồm các rARN 18S, 28S và 5,8S; ARN polymerase II

có trong dịch nhân (nucleoplasm) phiên mã các gen mã hóa protein cho sản phẩm là các hARN - tiền chất của các mARN và cả gen cho các kiểu snARN; ARN polymerase III có trong dịch nhân phiên mã các gen tARN, rARN 5S, và cả snARN U6. Ngoài ra, ARN polymerase ở ty thể chịu trách nhiệm tổng hợp tất cả các ARN của ty thể (Bảng 5.2).

Bảng 5.2. Các ARN polymerase ở eukaryote

Polymerase Định khu Sản phẩm

ARN polymerase I hạch nhân các rARN 18S, 28S và 5,8S

ARN polymerase II dịch nhân các mARN, snARN

(và snARN U1, U2, U3, U4, U5)

ARN polymerase III dịch nhân các tARN, ARN 5S,

( và snARN U6, ARN 7S hay 7SL)

ARN polymerase ty thể ty thể tất cả các ARN của ty thể

1.5.2. Các promoter ở eukaryote

Các vùng khởi động (promoter) nói chung nằm kề trước gen và có chứa các đoạn trình tự đặc thù cho phép ARN polymerase nhận biết và bám chặt vào để khởi đầu phiên mã tại vị trí chính xác trên mạch khuôn của gen. Vấn đề này tương đối phức tạp ở các eukaryote, vì vậy ở đây ta chỉ xét các promoter của các gen mã hóa protein mà không đề cập các loại promoter của các gen mã hóa các ARN khác.

Các promoter của các gen mã hóa protein eukaryote và của operon vi khuẩn nói chung có cấu trúc khá tương đồng nhau. Nếu như hộp TATA ở vi khuẩn, có trình tự TATAAT nằm ở vị trí “-10'' thì đối với các gen mã hóa protein của eukaryote, đó là trình tự TATAAA nằm gần vị trí “-30” (Hình 5.8) và nó đặc trưng riêng cho các ARN polymerase II.

Page 78: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

78

Hình 5.8. Cấu trúc vùng khởi động (promoter) của eukaryote.

Nói chung, các vùng này được bảo tồn cao và đặc thù cho từng loại ARN polymerase nhất định, được gọi là các trình tự điều hòa (consensus sequences). Các đột biến thay thế bazơ tại các hộp TATA, nghĩa là làm cho nó bớt giống với trình tự được bảo tồn (ví dụ, TATAAT → TGTAAT) do đó sẽ làm yếu khả năng phiên mã của promoter (down mutation). Ngược lại, các đột biến làm cho các trình tự promoter trở nên giống với các trình tự điều hòa (ví dụ, TATCTT→ TATAAT), sẽ làm mạnh khả năng phiên mã của promoter (up mutation).

1.5.3. Sửa đổi sau phiên mã đối với sản phẩm của các gen phân đoạn

Để trở thành các phân tử mRNA trưởng thành có khả năng tham gia vào quá trình dịch mã trong tế bào chất, tất cả các bản sao mARN (pre-mRNA) của các gen mã hóa protein ở tế bào eukaryote đều phải trải qua quá trình sửa đổi ARN sau phiên mã ở trong nhân (RNA processing). Sau đó các phân tử mARN đi ra tế bào chất để tham gia vào quá trình dịch mã. Hai sự kiện sửa đổi chính yếu đối với bản sao mARN, đó là:

– Gắn thêm chóp m7Gppp và đuôi poly(A); và

– Cắt bỏ các intron và nối các exon hay còn gọi là splicing.

Các chóp 5' và đuôi poly(A) này có tác dụng bảo vệ mARN khỏi bị phân cắt bởi các enzyme trong tế bào chất (Hình 5.9). Về chi tiết, xem ở chương 6.

Hình 5.9. Các bước tổng quát của quá trình phiên mã và sửa đổi sau phiên mã đối với bản sao pre-mARN của các gen phân đoạn: (1) Lắp chóp 5’-m7Gppp cùng lúc phiên mã; (2) Gắn đuôi poly(A); và (3) Splicing – loại bỏ các intron và nôi các exon.

Page 79: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

79

2. Cấu trúc và chức năng của các ARN

Trên nguyên tắc, các ARN được cấu tạo từ các đơn phân là các ribonucleotide; các ribonucleotide này nối kết với nhau bằng các liên kết 3',5'-phosphodiester tạo thành các chuỗi polyribonucleotide - cấu trúc sơ cấp của các phân tử ARN (Chương 1). Đường pentose đặc trưng của ARN là ribose, còn thành phần bazơ, ngoài bốn loại cơ bản adenine (A), uracil (U), guanine (G) và cytosine (C), còn phát hiện khá nhiều dạng bazơ hiếm có mặt chủ yếu trong các tARN.

Có ba loại phân tử ARN cơ bản tham gia vào quá trình sinh tổng hợp protein của các tế bào, đó là: ARN thông tin (messenger RNA = mRNA), ARN vận chuyển (transfer RNA = tRNA), và ARN ribosome (ribosomal RNA = rRNA).

Nói chung, các phân tử ARN có kích thước bé hơn các phân tử ADN ở bất kỳ sinh vật cụ thể nào. Các phân tử ARN có thể là mạch đơn hoặc mạch kép, mạch thẳng hoặc mạch vòng nhưng phổ biến là dạng mạch đơn, thẳng (nhưng không thấy có các phân tử ARN mạch kép, vòng nào được mô tả). Loại ARN có hàm lượng cao nhất trong các tế bào là rARN.

Ở Bảng 5.3 cho thấy hàm lượng tương đối (%) và kích thước (trọng lượng phân tử và số nucleotide) của các phân tử ARN ở vi khuẩn E. coli.

Bảng 5.3. Các phân tử ARN ở E. coli

Loại ARN Chức năng (%) TLPT Số nucleotide

mARN Mã hoá các protein 5 Biến thiên Biến thiên

tARN Mang axit amin 15 2,5.101 ~ 75

rARN 5S Thành phần ribosome 80 3,6.101 120

16S Thành phần ribosome 0,55.103 1542

23S Thành phần ribosome 1,2.103 2904

Ngoài ba loại ARN chính (rARN, tARN và mARN) có mặt trong các tế bào prokaryote và eukaryote, các tế bào eukaryote còn có các loại ARN khác, như: (i) ARN dị nhân, hnARN (heterogenous nuclear RNA) với kích thước sai biệt rất lớn, chúng là tiền thân của các mARN trưởng thành sau này; (ii) các ARN nhân kích thước bé, snARN (small nuclear RNA), với các loại như U1 → U10... trong đó sáu loại đầu có vai trò quan trọng trong xử lý pre-mARN của các gen phân đoạn; và (iii) ARN tế bào chất, scARN (small cytoplasmic RNA) 7SL cần cho tổng hợp các protein chế tiết và bám vào màng; và một vài ARN khác nữa được giới thiệu ở Bảng 5.4.

Bảng 5.4. Các lớp ARN chức năng chính và phụ trong các tế bào.

Loại ARN Chức năng

1. Các lớp chính

mARN ARN được phiên mã từ các gen mã hoá protein, mang thông tin cho dịch mã. Một số bản sao tương tự mARN không được dịch mã, ví dụ XIST, H19 do cơ chế in dấu bộ gen bố mẹ (parental imprinting).

hnARN

(heterogenous mARN trước khi cắt-nối. Đó là các bản sao chưa được sửa đổi của các gen eukaryote; sở dĩ gọi như

Page 80: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

80

nuclear) vậy bởi vì tính đa dạng lớn về kích thước của nó so với tARN và rARN.

tARN Phân tử thích ứng thực hiện việc dịch mã. tARN cũng làm mồi cho tái bản ADN trong sự tái bản của các retrovirus.

rARN Thành phần cấu trúc chính của các ribosome, cần cho quá trình tổng hợp protein của tế bào.

2. Các lớp phụ

iARN (initiator)

Các trình tự ARN ngắn được dùng làm mồi cho sự tổng hợp ADN ở mạch ra chậm.

snARN (small nuclear) hay U-RNA (uridine-rich)

Các phân tử ARN trọng lượng phân tử thấp phát hiện được trong dịch nhân, là thành phần của các enzyme cắt bỏ các intron và các phản ứng xử lý (processing) khác; chúng chứa nhiều gốc uridine được sửa đổi.

snoARN (small nucleolar)

Các phân tử ARN trọng lượng phân tử thấp phát hiện được trong hạch nhân, có thể tham gia vào quá trình xử lý rARN (ARN processing).

scARN (small cytoplasmic)

Các phân tử ARN trọng lượng phân tử thấp phát hiện được trong tế bào chất với các chức năng khác nhau. Ví dụ ARN 7S thành phần của tiểu phần nhận biết tín hiệu và pARN (prosomal), một ARN bé kết hợp với khoảng 20 protein và được bọc gói với mARN trong mRNP hay thể thông tin vốn có tác dụng điều hoà sự biểu hiện của gen.

ARN của telomerase

Một ARN nhân có chứa khuôn cho các đoạn lặp telomere và là thành phần của enzyme telomerase.

gARN

(guide RNA) Một loại ARN được tổng hợp trong các roi động ở Trypanosoma; nó cung cấp khuôn cho biên tập ARN.

ARN antisense ARN ngược nghĩa bổ sung với mARN và có thể tạo thành một mạch đôi với nó để kìm hãm việc tổng hợp protein. Nó có trong nhiều hệ thống, nhưng rất phổ biến ở vi khuẩn; và cũng gọi là ARN bổ sung gây

nhiễu mARN.

Ribozyme Các phân tử ARN mà có thể xúc tác cho các phản ứng hoá học, các enzyme chứa ARN. Thông thường nó có hoạt tính tự xúc tác (các intron tự cắt), nhưng một ribonuclease P là một chất xúc tác đích thực (ví dụ xử lý tARN). Các ARN khác hoạt động hài hoà với các protein, ví dụ MRP endonuclease trong tái bản

Page 81: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

81

ADN ty thể.

(i) Vùng dẫn đầu (5'UTR) không được dịch mã nhưng có cấu trúc cần thiết cho sự bám vào của tiểu đơn vị ribosome bé (Hình 5.10).

(ii) Vùng mã hoá (coding region) nằm kề sau vùng 5'-UTR; nó mang thông tin cấu trúc của một chuỗi polypeptide, nếu là mARN của eukaryote (monocistronic) hoặc mang thông tin của nhiều polypeptide khác nhau và cách nhau bởi các đoạn đệm không được dịch mã, nếu là mARN prokaryote (polycistronic).

(iii) Vùng kéo sau (3'-UTR) nằm ở đuôi mARN, không được dịch mã.

2.1. ARN thông tin (mARN)

Các mARN là loại ARN quan trọng nhất được dùng làm khuôn trực tiếp cho quá trình tổng hợp polypeptide trong tế bào chất. Nhìn chung, các mARN có cấu trúc mạch thẳng, với kích thước khác nhau và đều có ba phần chính như sau:

Hình 5.10. Cấu trúc chung của mARN.

Hình 5.11. Cấu trúc của mARN prokaryote (a) và mARN eukaryote (b).

Ở Hình 5.11 cho thấy những điểm khác nhau trong cấu trúc của các mARN ở prokaryote và eukaryote, cho thấy cấu trúc “mũ” đặc trưng có mặt ở đầu 5' của tất cả các mARN trưởng thành ở eukaryote .

Trong nhân các tế bào eukaryote có các ARN nhân kích thước lớn và sai khác nhau rất lớn gọi là hnARN (heterogenous nuclear RNA) vốn là tiền thân của các mARN, các ARN nhân kích thước bé snARN (small nuclear RNA) có mặt trong thành phần của các enzyme splicing, và các ARN tế bào chất kích thước bé scARN (small cytoplasmic RNA).

Trong các tế bào động vật có vú, một vài loại mARN thì hết sức phong phú, trong khi đó hầu như mức độ phức tạp của mARN (số lượng loại mARN khác nhau) được đại diện bởi các mARN hiếm. Một điểm cần chú ý là sự biểu hiện của một gen tỷ lệ với độ phong phú của loại ARN tương

Page 82: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

82

ứng (một gen biểu hiện càng mạnh khi số bản sao của nó trong tế bào càng lớn).

2.2. Các ARN vận chuyển (tARN)

Mỗi phân tử tARN có hai chức năng chính là mang axit amin đã được hoạt hoá và đi đến phức hệ “ribosome-mARN” để tiến hành việc đọc dịch mã cho một codon cụ thể của mARN.

Trong thành phần nucleotide của các tARN có khá nhiều bazơ chuẩn bị biến đổi thành các bazơ sửa đổi nhờ hoạt động xúc tác của các enzyme sau phiên mã. Các bazơ này (còn gọi là các bazơ hiếm) tập trung chủ yếu ở các vòng thân (stem loops) như: 5',6'-dihydrouridine (DHU),

inosine (I), ribothymidine (T), pseudouridine (Ψ) v.v. (Hình 5.12).

Hình 5.12. Các bazơ hiếm có mặt trong ARN, chủ yếu là các tARN.

Mỗi tế bào có chừng 45-50 phân tử tARN khác nhau. Hầu hết các tARN có khoảng 75-80 nucleotide với cấu trúc bậc hai mở rộng do các tương tác cặp bazơ (A-U và G-C) ở một số đoạn của chúng (Hình 5.13) cũng như cấu trúc bậc ba. Đây là kiểu cấu trúc “lá ba thùy” gọn nhẹ, vững chắc phù hợp với các chức năng khác nhau của các tARN.

Nói chung, các phân tử tARN thường rất giống nhau ở nhiều đoạn và khác nhau chủ yếu ở bộ

ba đối mã (anticodon). Lưu ý rằng, bazơ hiếm Inosine (I) có mặt ở vị trí 5' của anticodon trong một số phân tử tARN có thể kết cặp linh hoạt với C, U hoặc A ở vị trí 3' của các codon trong mARN.

Mỗi tARN thường có 3-4 vòng trên thân (tính từ đầu 5') với chức năng khác nhau như sau (Hình 5.13):

(i) vòng I - DHU nhận biết aminoacyl-tARN synthetase;

(ii) vòng II - anticodon đọc mã trên mARN bằng sự kết cặp anticodon-codon (theo nguyên tắc bổ nhưng có sự linh hoạt; chương 3);

(iii) vòng III - phụ (extra loop) có thể không có ở một số tARN;

(iv) vòng IV - TΨC nhận biết ribosome để đi vào đúng vị trí tiếp nhận aminoacyl-tARN (vị trí

A).

Và cuối cùng, đoạn mạch thẳng -CCA ở đầu 3' là vị trí gắn vào của axit amin đã được hoạt hoá để tạo thành các aminoacyl-tARN.

Page 83: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

83

(a)

(b) Hình 5.13. (a) Cấu trúc bậc hai (trái) và bậc ba của tARN-Ala. (b) Một sơ đồ hóa khác về cấu trúc của tARN (trái) và hoạt động dịch mã trên mARN theo nguyên tắc bổ sung – ngược chiều giữa anticodon và codon.

2.3. ARN ribosome (rARN) và ribosome

Các rARN cùng với các protein đặc thù là những thành phần cấu trúc nên các ribosome là “nhà máy” tổng hợp protein của tế bào.

Ở vi khuẩn có 3 loại rARN có các hệ số lắng là 23S, 16S (Hình 5.14) và 5S, với số lượng nucleotide tương ứng là 2904, 1542 và 120 (Bảng 5.5). Ở tế bào eukaryote có 4 loại rARN với các hệ số lắng là 28S, 18S, 5,8S và 5S (Hình 5.15). Riêng các tế bào thực vật còn có các rARN được mã hoá bởi ADN lạp thể (chloroplast DNA = cpDNA).

Page 84: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

84

Hình 5.14. Cấu trúc bậc hai của rARN 16S.

Hình 5.15. Cấu trúc tổng quát các đơn vị phiên mã của pre-rARN ở các eukaryote. Ba vùng mã hóa (màu xanh) mã hóa các rARN 18S, 5.8S và 28S phát hiện được trong các ribosome của các eukaryote bậc cao hoặc một số loài tương đương với chúng. Thứ tự các vùng mã hóa trong các bộ gen này luôn luôn theo chiều 5'→3'. Sự thay đổi về độ dài các đoạn đệm được phiên mã (vàng nhạt) nói lên sự sai khác trong chiều dài của các đơn vị phiên mã (transcription unit) của pre-rARN ở các sinh vật khác nhau.

Mỗi ribosome hoàn chỉnh có hai tiếu đơn vị bé và lớn. Hai tiểu đơn vị này chỉ kết hợp với nhau tạo ra một ribosome hoạt động khi quá trình dịch mã trên mARN thực sự bắt đầu. Tiểu đơn vị bé bám vào mARN trước tiên trong dịch mã. Tiểu đơn vị lớn chứa hai vị trí: vị trí A là nơi bám vào của aminoacyl-tARN và vị trí P là chỗ dừng tạm của peptidyl-tARN. Trong tiểu đơn vị lớn có chứa peptidyl transferase. Enzyme này có chức năng tách gốc peptidyl ra khỏi tARN của nó (ở vị trí P) và nối với aminoacyl-tARN (ở vị trí A) bằng một liên kết peptide làm cho chuỗi polypeptide sinh trưởng dài ra theo chiều N→ C.

Các hợp phần cấu tạo nên các ribosome của prokaryote và eukaryote được trình bày ở Bảng 5.5 và Hình 5.16.

(a) (b)

Page 85: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

85

(c)

Hình 5.16. Cấu trúc ribosome của E. coli. (a) Ribosome 70S nhìn từ mặt bên với tiểu phần 30S particle (màu vàng) và tiểu phần 50S (đỏ) đang dính với nhau. (b) Ribosome 70S xoay một góc 90 độ so với hình (a). [Nguồn: J. Lake (1976), J. Mol. Biol. 105; p.155, fig.14]. (c) Sơ đồ các vị trí hoạt động của một ribosome.

3. Dịch mã (Translation)

Dịch mã (translation) hay tổng hợp protein là một quá trình sinh học quan trọng diễn ra trong tế bào chất, và phụ thuộc vào nhiều yếu tố; quan trọng nhất là các mARN, tARN và ribosome. mARN mang thông tin quy định trình tự kết hợp các axit amin vào chuỗi polypeptide, mà việc dịch mã mARN được thực hiện bởi các aminoacyl-tARN, còn ribosome đóng vai trò ổn định việc kết hợp giữa mARN với các tARN (Hình 5.18). Quá trình này được chia làm hai giai đoạn dưới đây.

Bảng 5.5. Thành phần cấu tạo của ribosome ở Prokaryote và Eukaryote

Vi khuẩn Tế bào động vật có vú

RIBOSOME 70S 80S

Đường kính 18-20 nm 20-22 nm

Tiểu đơn vị lớn 50S 60S

rARN 23S (2904 nt) 28S (4.718 nt)

5S (120 nt) 5,8S (160 nt)

5S (120 nt)

Protein 34 phân tử ~50 phân tử

Tiểu đơn vị bé 30S 40S

rARN 16S (1.542 nt) 18S (1.874 nt)

Protein 21 phân tử ~35 phân tử

3.1. Hoạt hoá axit amin

Quá trình này diễn ra trong bào tương tạo nguồn các tARN mang các axit amin sẵn sàng tham gia dịch mã. Mỗi axit amin được đính vào tARN thích hợp nhờ một enzyme aminoacyl-tARN

synthetase đặc thù. Trước tiên, enzyme này (E) xúc tác cho phản ứng ATP hoạt hoá axit amin, với sự có mặt của Mg2+, tạo ra phức hợp [aminoacyl-AMP + E]. (Hình 5.17)

R−CH(NH2)−COOH + ATP → E*[R−CH(NH2)−CO~AMP] + PP

Tiếp theo, cũng dưới tác dụng của enzyme đó, phức hợp này kết hợp với tARN thích hợp

Page 86: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

86

bằng liên kết đồng hoá trị để tạo ra aminoacyl-tARN.

E*[R−CH(NH2)−CO~AMP] + tARN → R−CH(NH2)−CO~tARN + AMP

3.2. Cơ chế dịch mã (tổng hợp chuỗi polypeptide)

Bước 1: Mở đầu (initiation)

Quá trình dịch mã bắt đầu khi một tiểu đơn vị ribosome bé bám vào mARN tại vị trí của codon khởi đầu AUG. Lúc này một phân tử tARN khởi đầu đặc thù mang methionine (ở vi khuẩn là formyl-Met; cấu trúc của Met và f-Met được giới thiệu dưới đây) đi vào và khớp anticodon của nó với codon mở đầu của mARN. Kế đó, tiểu đơn vị ribosome lớn bám vào tiểu đơn vị bé tạo ra một ribosome hoạt động hoàn chỉnh. Lúc này Met-tARN ở vị trí P và vị trí A để trống; một tARN thứ hai (aa2- tARN) đi vào vị trí A và khớp với codon thứ hai (Hình 5.20).

H2N-C-C-OH

H

R

--

O

=

ATP

H2N-C-C-O-P-O-ribose-adenine

H

R

--

O

=

amino acid

amino acid đãđược ho ạt hoá

PPi

tRNA

H2N-C-C-O

H

R

--

O

=

aminoacyl-tRNA

AMP

3’

Hoạt hoá amino acid vàgắn aa vào tRNA

Hình 5.17. Sự hoạt hoá axit amin và gắn axit amin đã hoạt hoá vào tARN.

Hình 5.18. Một ribosome đang tham gia dịch mã trên mARN cùng với các tARN mang các axir

amin tương ứng.

Ở E. coli, bước này có sự tham gia của các yếu tố mở đầu (IF-1, IF-2 và IF-3), GTP và đặc biệt là, sự tương tác giữa trình tự Shine-Dalgarno giàu purine ở vùng 5'-UTR của mARN với trình tự bổ sung của rARN 16S có mặt trong tiểu đơn vị ribosome bé (R30S). Nhờ đó R30S có thể bám

Page 87: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

87

vào mARN, nhận biết codon mở đầu AUG để có thể bắt đầu quá trình dịch mã tại vị trí chính xác (Hình 5.19).

Hình 5.19. Mở đầu dịch mã ở tế bào E. coli (trên) và trình tự Shine-Dalgarno ở vùng 5'UTR của E.

coli và các phage của chúng.

Bước 2: Kéo dài (elongation)

Quá trình kéo dài bắt đầu sau khi liên kết peptide đầu tiên được hình thành. Phản ứng này được xúc tác bởi enzyme peptidyl transferase, và kết quả là tạo ra một peptidyl-tARN ở vị trí A (fMet-aa2-tARN). Sau đó, ribosome lập tức chuyển dịch sang một codon mới dọc theo mARN theo chiều 5'→3'. Phản ứng này đẩy phân tử tARN tự do vốn ở vị trí P ra ngoài; lúc này peptidyl-tARN (fMet-aa2-tARN) nằm ở vị trí P và vị trí A lại để trống. Một chu kỳ dịch mã mới lại bắt đầu, một aminoacyl-tARN thứ ba (aa3-tARN) đi vào và khớp anticdon của nó với codon đang để trống ở vị trí A, một liên kết peptid thứ hai được hình thành (fMet-aa2-aa3-tARN), và ribosome lại dịch chuyển sang codon kế tiếp. Quá trình nói trên diễn ra một cách tuần tự dọc theo mARN theo chu kỳ ba bước nói trên, và làm cho chuỗi polypeptide dài dần ra cho đến dịch mã xong codon có nghĩa cuối cùng (Hình 5.21).

Bước 3: Kết thúc (termination)

Quá trình tổng hợp chuỗi polypeptide sẽ dừng lại khi một codon kết thúc được đưa đối diện với vị trí A để trống, vốn được nhận biết bởi một protein kết thúc gọi là nhân tố giải phóng RF (release factor). Sự có mặt của nó cùng với transferase cắt rời chuỗi polypeptide ra khỏi tARN cuối cùng và phóng thích hai tiểu đơn vị ribosome cũng như chuỗi polypeptide và tARN ra khỏi mARN (Hình 5.22).

Page 88: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

88

Hình 5.20. Mở đầu dịch mã ở tế bào E. coli. Hình dưới phân biệt cấu tạo của N-formylmethionine - axit amin Met đã được sửa đổi để chỉ chuyên làm nhiệm vụ mở đầu cho quá trình dịch mã ở tế bào vi khuẩn (nó được nhận biết và mang bởi một loại tARN mở đầu gọi là tRNAi

fMet) với loại Methionine bình thường.

Hình 5.21. Quá trình tổng hợp kéo dài chuỗi polypeptide.

Page 89: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

89

Hình 5.22. Quá trình kết thúc tổng hợp chuỗi polypeptide.

4. Những điểm khác biệt trong phiên mã và dịch mã ở prokaryote và eukaryote

(1) Trên đây mới chỉ phân tích hoạt động của một ribosome trên mARN. Thực ra, trên một mARN có rất nhiều ribosome cùng hoạt động, gọi là polyribosome hay polysome, tạo ra nhiều polypeptide giống nhau.

Hình 5.23. Nhiều ribosome (polysome) nối đuôi nhau trượt qua mARN để tổng hợp hàng loạt polypeptide trên một phân tử mARN.

(2) Trên nguyên tắc, axit amin mở đầu sẽ được cắt bỏ khỏi chuỗi polypeptide (sau khi tổng hợp được vài axit amin như trong trường hợp các vi khuẩn) hoặc trước khi chuỗi được tổng hợp đầy đủ (như ở trường hợp eukaryote). Tuy nhiên, ở các eukaryote không phải lúc nào axit amin mở đầu này cũng bị tách bỏ, mà trong một số protein nó vẫn được giữ lại.

(3) Sau khi được tổng hợp, các chuỗi polypeptide sơ cấp này sẽ được sửa đổi và chuyển sang các bậc cấu trúc cao hơn theo cách đặc thù để trở thành các protein hoạt động chức năng.

Page 90: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

90

(4) Tham gia vào các bước mở đầu, kéo dài và kết thúc còn có các yếu tố protein, với tên gọi tương ứng là các nhân tố mở đầu (IF: initiation factor), nhân tố kéo dài (EF: elongation factor; gồm EF-Tu và EF-G), và nhân tố giải phóng (release factor) với GTP và các ion Mg2+, K+ và NH+

4.

(5) Trong các tế bào prokaryote, do không có màng nhân và các mARN đa cistron vốn dĩ không phải qua sửa đổi sau phiên mã, cho nên các ribosome và các aminoacyl-tARN sẽ bám vào đầu 5' của mARN để bắt đầu quá trình dịch mã ngay trong khi ở đầu 3' của nó quá trình phiên mã đang còn tiếp diễn. Ngược lại, ở các tế bào eukaryote vì có màng nhân phân cách và các pre-mARN còn phải trải qua các công đoạn sửa đổi phức tạp sau phiên mã (tất cả đều diễn ra trong nhân), còn dịch mã diễn ra sau đó ở trong tế bào chất. Vì thế cho nên phiên mã và dịch mã rõ ràng là hai quá trình tách biệt nhau cả về cả không gian lẫn thời gian.

TÓM T ẮT

(1) Phiên mã và dịch mã là hai hai giai đọan chính trong sự biểu hiện của các gen mã hóa protein ở các tế bào. Phiên mã là quá trình tổng hợp các ARN từ mạch khuôn của các gen cấu trúc, xảy ra dưới tác dụng của các ARN polymerase theo nguyên tắc bổ sung và ngược chiều với mạch khuôn của gen. Còn quá trình tổng hợp protein diễn ra tại các ribosome trong tế bào chất trên khuôn của mARN, với sự tham gia của các tARN...

(2) Trong khi sự phiên mã tất cả các gen trong bộ gen ở sinh vật nhân sơ chỉ do 1 loại ARN polymerase đảm nhận, thì ở các tế bào sinh vật nhân chuẩn có tới 3 loại ARN polymerase I, II và III chịu trách nhiệm tổng hợp các loại ARN khác nhau của tế bào. Promoter là cơ chất tác động chính của các ARN polymerase, chúng có các trình tự bảo tồn cao độ - gọi là hộp TATA.

(3) Trong mọi tế bào đều có ba loại phân tử ARN tham gia vào quá trình tổng hợp protein: mARN, tARN và rARN. Ở các tế bào nhân chuẩn còn có nhiều loại ARN khác nữa thực hiện các chức năng khác nhau.

(4) Tổng hợp protein là quá trình phức tạp có sự tham gia của nhiều yếu tố, trong đó quan trọng nhất là các mARN, tARN và ribosome cũng như các enzyme và nguồn năng lượng cần thiết. Kết quả là tổng hợp ra các phân tử protein tham gia vào mọi hoạt động sống cơ sở của tế bào.

CÂU HỎI VÀ BÀI T ẬP

81. Trong quá trình dịch mã, ribosome dịch chuyển trên mARN ngay sau khi khớp bổ sung giữa anticodon và codon.

(a) Đúng. (b) Sai.

82. Về mặt tổ chức, mARN trưởng thành của prokaryote khác biệt một cách căn bản với mARN của eukaryote chủ yếu ở vùng nào?

A. Vùng khởi động. B. Vùng mã hoá protein.

C. Vùng theo sau hay 3'-UTR. D. Vùng dẫn đầu hay 5'-UTR.

83. Phiên mã là quá trình tổng hợp các ARN theo chiều _____ dưới tác dụng của ARN polymerase hoạt động dọc theo mạch khuôn có chiều ______.

A. 5' đến 3'; 5' đến 3. B. 5' đến 3'; 3' đến 5'.

C. 3' đến 5'; 5' đến 3'. D. 3' đến 5'; 3' đến 5'.

Page 91: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

91

84. Phát biểu nào sau đây về các gen mã hoá các histone là không đúng?

A. Đằng sau các gen không có trình tự AATAAA.

B. Các mARN trưởng thành không có đuôi poly(A).

C. Các mARN của chúng không có chóp m7Gppp.

D. Không có quá trình cắt-nối (splicing) sau phiên mã.

85. Sự đọc mã trên mARN diễn ra trung thực là do

A. peptidyl transferase. B. đoạn -CCA (3’).

C. aminoacyl~tARN synthetase. D. anticodon của tARN.

86. Phân tích cấu trúc và tổ chức của một gen điển hình cho bộ gen các sinh vật nhân chuẩn và vẽ một sơ đồ minh họa.

87. Một đoạn trình tự bazơ ở mạch đối khuôn của một gen mã hóa protein như sau: 5'-AACGTATTCAACTCA-3'. Hãy cho biết: (a) Trình tự bazơ của ARNm và trình tự axit amin tương ứng. (b) Đoạn polypeptid sẽ như thế nào nếu một đột biến đồng hoán xảy ra đối với nucleotid G trên mạch này?

88. Một đoạn trình tự của gen được cho như sau:

Mạch 1: 5'-AAATCGATTGGCACA-3'

Mạch 2: 3'-TTTAGCTAACCGTGT-5'

Hãy cho biết trình tự bazơ của ARNm (5'→ 3') và trình tự axit amin của peptide khi: (a) mạch 1 là mạch khuôn, và (b) mạch 2 là khuôn.

89. Giả sử một ARNm có trình tự mã hóa protein như sau:

5'-AUG-UUC-AUU-GAA-GGC-AUC-AAC-GGU-UAA-3'

Hãy xác định trình tự nucleotide của gen và trình tự axit amin của protein.

90. (a) Hàm lượng GC của ADN phage T3 là 53%. Bạn sẽ kỳ vọng hàm lượng G+C của mARN T3 ra sao? (b) Nếu cho trước hàm lượng purin của ADN T3 và không biết mạch nào được sao mã, bạn có thể dự đoán hàm lượng purin của mARN T3? Tại sao, hoặc tại sao không?

91. Phân tích ngắn gọn vai trò của các yếu tố tham gia vào quá trình sinh tổng hợp protein ở tế bào chất.

92. Anh (chị) hãy làm sáng tỏ nhận định sau: Khác với các tế bào tiền nhân, sự phiên mã và dịch mã ở các tế bào nhân chuẩn là các quá trình gián đoạn, tách biệt nhau cả về không gian lẫn thời gian.

93. Phân tích sự tương tác giữa ba thành phần chính là mARN, các aminoacyl~ARNt và ribosome để làm nổi bật vai trò quan trọng của chúng trong cơ chế tổng hợp chuỗi polypeptit.

94. Hãy chỉ ra những đặc điểm giống và khác nhau trong cấu trúc của các mARN trưởng thành của các tế bào prokaryote và eukaryote.

95. Nêu những điểm chính trong sửa đổi sau phiên mã đối với sản phẩm phiên mã sơ cấp của các gen phân đoạn và vai trò của các intron.

96. Phân tích sự phù hợp giữa cấu trúc và chức năng của các mARN.

97. Phân tích sự phù hợp giữa cấu trúc và chức năng của các tARN.

Page 92: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

92

98. Có những loại rARN nào trong các tế bào prokaryote và eukaryote? Chúng đóng vai trò gì trong tế bào?

99. Hãy cho biết sự giống nhau và khác nhau trong thành phần cấu tạo của các ribosome ở các tế bào prokaryote và eukaryote.

100. Dưới đây là sơ đồ của một ADN sợi kép được sao mã.

1. ________________

2. ________________

3.

Sợi 1 là sợi không làm khuôn. Sợi 3 là ARN sinh ra. Hãy đánh dấu các đầu 5’ và 3’ của ARN và sợi không làm khuôn, và của sợi khuôn.

Page 93: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

93

Chương 6

ĐIỀU HOÀ SỰ BIỂU HIỆN CỦA GEN

Trên thực tế, các gen không tồn tại riêng rẽ và hoạt động như những thực thể biệt lập với một cường độ ổn định. Trái lại, giữa các gen trong bộ gen có sự kiểm soát lẫn nhau và phụ thuộc vào điều kiện môi trường. Mỗi bộ gen tế bào là một hệ thống mở có khả năng tự điều chỉnh, đảm bảo sự hoạt động của các gen trong từng giai đoạn phát triển diễn ra hợp lý trước điều kiện cụ thể của môi trường. Sự điều hoà hoạt động của các gen được biểu hiện ở nhiều mức độ theo những cơ chế đặc thù cho từng nhóm loài. Đây là khía cạnh phức tạp nhất của sinh học phân tử. Hiểu được các nguyên lý của điều hòa hoạt động gen là nắm được chìa khóa đi vào bí ẩn của sự tồn tại được cất giấu kỹ trong các bộ gen.

Trong chương này, chúng ta lần lượt tìm hiểu các vấn đề sau: (i) Các nguyên lý chung trong sự điều hòa biểu hiện của gen ở các mức độ khác nhau của cả hai hệ thống, prokaryote và eukaryote, mà trọng tâm là điều hoà hoạt động gen của vi khuẩn ở mức phiên mã. (ii) Mô hình operon là gì? Ở vi khuẩn có các hệ thống operon nào và cơ chế điều hòa hoạt động của chúng ra sao? (iii) Ở eukaryote có các kiểu điều hòa cơ bản nào?

1. Đại cương về sự điều hòa biểu hiện của gen

Nói chung, sự điều hoà biểu hiện của gen ở các nhóm prokaryote và eukaryote diễn ra ở nhiều mức độ: phiên mã, sau phiên mã, dịch mã và sau dịch mã. Tuy nhiên, hai nhóm này có trình độ tiến hóa khác nhau nên phương thức tổ chức và điều hòa hoạt động của các gen là rất khác nhau.

Ở vi khuẩn, các gen liên quan với nhau về chức năng được xếp trong một tổ chức gọi là operon; chúng được phiên mã chung trong một phân tử mARN đa cistron và được dịch mã thành các protein trong khi phiên mã mà không phải trải qua quá trình sửa đổi sau phiên mã, ngoại trừ các gen mã hóa các tARN và rARN. Sự điều hòa sau dịch mã ở vi khuẩn, như đã xét ở chương trước, chủ yếu xảy ra ở giai đoạn mở đầu quá trình dịch mã, do sự tương tác giữa trình tự Shine-Dalgarno ở vùng 5'-UTR của mARN với trình tự tương ứng trong rARN 16S của tiểu đơn vị ribosome bé.

Trong khi đó ở sinh vật nhân chuẩn, hầu hết các gen là gen phân đoạn và không có tổ chức kiểu operon như ở sinh vật nhân sơ. Các gen phiên mã riêng biệt tạo thành các bản sao đơn sơ cấp gọi là pre-mARN đơn cistron; nó cũng có các exon và intron y như trong gen. Để có thể trỏ thành các phân tử mARN trưởng thành đi ra tế bào chất làm khuôn cho tổng hợp protein, các pre-mARN này phải trải qua các quá trình sửa đổi ở trong nhân, bao gồm: Lắp chóp m7Gppp ở đầu 5' và gắn

đuôi poly(A) ở đầu 3', và sau đó là cắt bỏ các intron trong một quá trình gọi là splicing. Ở nhiều gen còn có quá trình cắt nối chọn lọc tạo ra nhiều phân tử mARN khác nhau và do đó tạo ra nhiều protein hay peptide khác nhau từ sản phẩm pre-mARN của cùng một gen phân đoạn.

Page 94: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

94

Hình 6.1. Những điểm khác biệt nổi bật trong tổ chức và hoạt động của các gen mã hóa protein ở

prokaryote (A) và eukaryote (B).

2. Điều hoà biểu hiện gen ở prokaryote

2.1. Cấu trúc Operon

Phần lớn các gen trong bộ gen vi khuẩn được tổ chức thành các đơn vị hoạt động chức năng đặc trưng, gọi là các operon. Các gen cấu trúc trong một operon được điều hoà chung trong quá trình chuyển hoá một hợp chất nhất định của tế bào. Mô hình operon được F. Jacob và J. Monod (1961) đưa ra lần đầu tiên là operon Lactose (lac operon; để cho tiện ta viết: operon Lac) vốn được nghiên cứu kỹ nhất cho đến nay (Hình 6.2).

Tham gia vào điều hòa hoạt động của một operon gồm có bốn yếu tố thuộc hai thành phần chính: (i) các locus cấu trúc (structural loci) và (ii) các locus điều hòa (regulatory loci); trong đó nhóm sau bao gồm yếu tố vận hành, vùng khởi động và gen điều hòa.

- Một nhóm các gen cấu trúc (structural genes) liên quan về mặt chức năng, xếp cạnh nhau, khi phiên mã sẽ tạo ra một phân tử mARN chung gọi là mARN đa cistron (polycistronic mRNA).

Đối với operon Lac, đó là ba gen: lacZ, lacY và lacA; trong đó lacZ mã hoá β-galactosidase (thuỷ phân lactose thành galactose và glucose), lacY xác định permease (vận chuyển lactose qua màng) và lacA mã hoá transacetylase.

- Một yếu tố vận hành (operator = O): trình tự ADN nằm kế trước nhóm gen cấu trúc, là vị trí tương tác với chất ức chế. Đối với operon-lac, đó là đoạn trình tự ADN dài 34 cặp bazơ cách gen Z chừng 10 cặp bazơ về phía trước. Nó chứa trình tự 24 cặp bazơ đối xứng xuôi ngược, giúp chất ức chế có thể nhận biết và bám vào bằng cách khuếch tán dọc theo ADN từ cả hai phía (Hình 6.2).

Page 95: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

95

Hình 6.2. Mô hình operon lactose ở E. coli (hình trên) và sự phân giải phân tử đường lactose thành

glucose và galactose bởi enzyme β-galactosidase. - Một vùng khởi động (promoter region = P): trình tự ADN nằm trước yếu tố vận hành và có

thể trùm lên một phần hoặc toàn bộ vùng này, là vị trí bám vào của ARN polymerase. Đối với operon Lac, đó là đoạn ADN đặc thù vài chục cặp bazơ nằm trước yếu tố vận hành O và gối lên nó 7 cặp bazơ. Điểm khởi đầu phiên mã là vị trí gần cuối của vùng khởi động P nằm trong đoạn vận hành O.

- Một gen điều hoà hay còn gọi là gen ức chế (regulatory/ inhibitory gene = R/I): Gen này sinh ra loại protein điều hoà gọi là chất ức chế (repressor) điều hòa hoạt động của nhóm gen cấu trúc thông qua sự tương tác với yếu tố vận hành. Đối với operon Lac, gen lacI nằm trước vùng khởi động P, nó mã hoá một chất ức chế gồm bốn polypeptide giống nhau đều chứa 360 axit amin và tự nó có ái lực với vùng O. Mặc dù mỗi gen điều hòa có một vùng khởi động và không có yếu tố vận hành riêng, đôi khi người ta vẫn coi chúng là operon điều hòa (có tính chất cơ định).

Tóm lại, operon là đơn vị điều hoà hoạt động gen của các prokaryote, đặc trưng bởi phức hợp liên kết giữa vùng khởi động cùng với yếu tố vận hành và nhóm gen cấu trúc do nó kiểm soát.

Một số điểm cần lưu ý:

- Để nghiên cứu vai trò của mỗi yếu tố, người ta dùng phương pháp gây đột biến gen đối với các locus khác nhau của operon.

- Các locus kiểu dại ký hiệu bằng dấu cộng (+) và các locus đột biến bằng dấu trừ (–) ở phía trên locus. Đột biến có thể là trội hoặc lặn, tùy trường hợp.

- Ở vi khuẩn, mỗi một đột biến gen nếu như làm thay đổi một đặc tính sinh lý - sinh hóa (kiểu hình) của tế bào được coi là tạo ra một nòi mới.

- Kiểu gen của vi khuẩn là đơn bội. Tuy nhiên, bộ gen các tế bào vi khuẩn cũng có thể ở trạng thái lưỡng bội một phần; ấy là do ở vi khuẩn có các phương thức trao đổi di truyền thông qua các quá trình sau: tiếp hợp (conjugation), biến nạp (transformation) và tải nạp (transduction). Hình thức sinh sản này được gọi là sinh sản cận hữu tính (parasexual reproduction) chứ không phải hữu tính.

2.2. Điều hoà hoạt động của Operon lactose (lac operon)

2.2.1. Điều hoà âm tính Operon lactose

Khi trong môi trường nuôi cấy E. coli không có lactose (chất cảm ứng) thì operon không hoạt

Page 96: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

96

động, nghĩa là các enzyme tham gia phân giải lactose không được sinh ra. Nguyên nhân là do chất

ức chế bám chặt vào yếu tố vận hành gây ức chế sự phiên mã của các gen cấu trúc.

Hình 6.3. Cơ chế điều hòa âm tính của operon Lac. (a) Khi môi trường vắng mắt lactose, operon rơi vào trạng thái bị ức chế. (b) Khi môi trường có mắt lactose, operon được khử ức chế.

Hình 6.4. Chất cảm ứng allolactose (liên kết β-1,6 glycoside) do lactose (liên kết β-1,4) biến đổi thành dưới tác dụng của enzyme β-galactosidase.

Ngược lại, nếu bổ sung lactose vào môi trường thì một thời gian sau vi khuẩn sẽ bắt đầu hấp

thụ và phân giải nó, nghĩa là các enzyme liên quan đã được sinh ra. Sự kiện này được lý giải như

sau: Chất cảm ứng (inducer) ở đây là allolactose (liên kết β-1,6 glycoside) – một dạng đồng phân

của lactose (liên kết β-1,4) – tương tác với chất ức chế (repressor) và làm biến đổi hình dáng của

chất này. Vì vậy chất ức chế mất ái lực và không thể bám vào yếu tố vận hành. Lúc này các gen cấu

trúc được phiên mã và tổng hợp các enzyme tương ứng giúp vi khuẩn hấp thụ và phân giải đường

lactose như một nguồn năng lượng và carbon. Lactose vì vậy là tác nhân gây cảm ứng (hoạt hóa)

operon.

2.2.2. Điều hoà dương tính Operon lactose

Hoạt động của operon-lac còn chịu sự kiểm soát của một protein điều hoà dương tính liên

quan với sự có mặt của glucose.

Page 97: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

97

Hình 6.5. Điều hòa dương tính của operon Lac.

Khi trong môi trường có mặt đồng thời cả lactose và glucose thì operon Lac tạm ngưng hoạt

động gọi là ức chế dị hoá tạm thời. Khi glucose có mặt ở nồng độ cao thì hàm lượng AMP vòng

(cyclic AMP = cAMP) trong tế bào rất thấp; và ngược lại, khi không có glucose hoặc có không

đáng kể thì hàm lượng cAMP tăng cao. Vì vậy, cAMP được xem là chất chỉ thị của sự vắng mặt

glucose. Ngoài ra còn phát hiện một loại protein điều hoà dương tính có tên là protein hoạt hoá dị

hoá (catabolite activator protein = CAP). Protein CAP gồm hai tiểu đơn vị giống nhau gọi là

homodimer; nó chỉ hoạt động khi môi trường nội bào có hàm lượng cAMP cao. Lúc này cAMP kết

hợp với CAP tạo ra phức hợp CAP-cAMP hoạt động; phức hợp này có khả năng nhận biết và bám

vào một đoạn 16 cặp bazơ về phía trước của vùng khởi động, với các đoạn lặp đảo ngược, gọi là vị

trí CAP. Qua đó ARN polymerase được kích thích bám vào vị trí P và bắt đầu phiên mã ở mức cao.

Tóm lại, phức hợp CAP-cAMP kích thích phiên mã của operon Lac (lac operon) bằng việc

bám vào vị trí kích hoạt (activator site) nằm sát trước promoter và thúc đẩy ARN polymerase bám

vào promoter.

Hình 6.6. (a) CAP gồm hai monomer giống nhau, mỗi monomer nhận biết một trình tự ADN nhờ vùng xoắn alpha; (b) Trình tự đối xứng của vị trí CAP được xem là các đoạn lặp đảo ngược; (c) Cấu trúc phân tử cAMP; (d) Kích thích tổng hợp enzyme β-galactosidase

Page 98: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

98

bằng cAMP với kiểu dại và CAP dạng đột biến.

Pastan và cs thí nghiệm trên các tế bào vi khuẩn sống tự do để tạo ra β-galactosidase khi có

mặt cAMP với kiểu dại, hoặc một dạng chiết xuất từ các tế bào đột biến có CAP với ái lực giảm

sút đối với cAMP. Thể đột biến này tạo ra hàm lượng β-galactosidase ít hơn nhiều, điều đó làm ta

kỳ vọng nếu như phức hợp CAP-cAMP là quan trọng trong phiên mã operon. Tuy nhiên, khi hàm

lượng cAMP tăng cao quá hiển nhiên là nó gây nhiễu sự tổng hợp β-galactosidase ở tế bào kiểu

dại. Điều này không khiến ta ngạc nhiên vì cAMP có nhiểu tác dụng, và một số có thể ức chế gián

tiếp một số bước trong sự biểu hiện in vitro của gen lacZ (Emmer et al, 1970).

Hình 6.7. Vị trí bám của CAP và của ARN polymerase ở vùng khởi động của operon Lac (hình

trên). Cấu trúc của phức hợp CAP-cAMP bám vào ADN (hình trái, dưới) và giả thuyết về

sự kích hoạt phiên mã operon Lac bởi phức hợp hay dimer CAP-cAMP (Theo S. Busby

và R.H. Ebright 1994).

2.3. Điều hoà hoạt động của Operon tryptophan (trp operon)

Đại diện cho tất cả các operon của các loại axit amin và các vitamin là operon tryptophan (trp

operon). Để cho tiện ta viết: operon Trp.

2.3.1. Cấu trúc của trp operon

Operon tryptophan của E. coli có chứa năm gen cấu trúc (trpE, trpD, trpC, trpB và trpA) mã

hoá cho các enzyme tham gia vào quá trình tổng hợp axit amin tryptophan. Ngoài ra, nó có một số

đặc điểm khác như: trình tự operator nằm lọt trong promoter, còn gen điều hoà nằm cách xa

operon về phía trước, bình thường chất ức chế (trp repressor hay aporepressor) của operon tự nó

không bám được vùng vận hành O. Operon Trp cũng chịu sự điều hoà âm tính như operon Lac;

nó chỉ hoạt động khi môi trường nội bào thiếu hụt tryptophan và không hoạt động khi dư thừa

tryptophan, sản phẩm cuối của con đường sinh tổng hợp. Vì vậy operon Trp được gọi là operon

ức chế (repressible) hay operon đồng hoá.

Page 99: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

99

Hình 6.8. (a) Cấu trúc của operon tryptophan. (b) Ký hiệu các vùng điều hòa của operon Trp. (c) Đại cương về trạng thái hoạt động và bất hoạt của operon.

2.3.2. Cơ chế điều hoà âm tính của trp operon

Khi trong tế bào E. coli dư thừa axit amin tryptophan (sản phẩm cuối cùng của con đường chuyển hoá) thì trp operon ngừng hoạt động và do đó các enzyme tổng hợp chúng không được tạo ra. Sự kiện này được giải thích như sau: Bình thường chất ức chế của operon này (trp repressor) tồn tại ở trạng thái bất hoạt, không có ái lực đối với yếu tố vận hành (trp operator). Nhưng khi các axit amin này dư thừa sẽ kết hợp vào chất ức chế và tạo ra phức hợp có có ái lực với yếu tố vận hành. Tryptophan vì vậy được gọi là chất đồng ức chế (co-repressor). Phức hợp này bám vào yếu tố vận hành làm kìm hãm sự phiên mã của trp operon.

Ngược lại, khi trong tế bào vắng mặt hay thiếu hụt axit amin này, vì chất ức chế vốn ở trạng thái bất hoạt không bám được vào yếu tố O, dẫn đến ARN polymerase bám promoter và tiến hành phiên mã các gen. Kết quả là các enzyme tham gia tổng hợp tryptophan được sinh ra. Một khi hàm lượng axit amin này được tổng hợp ở mức dư thừa sẽ tác động ngược trở lại, kìm hãm hoạt động của operon Trp.

Hình 6.9. Operon tryptophan ở trạng thái bị hoạt động (a) và kìm hãm (b).

Page 100: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

100

Tóm lại, nhờ có các cơ chế điều hòa hoạt động gen theo kiểu phản hồi như thế mà bộ gen vi khuẩn có thể hoạt động một cách nhịp nhàng hợp lý, từ đó vi khuẩn có thể thích nghi và phát triển trước các điều kiện môi trường không ngừng thay đổi.

2.3.3. Sự kết thúc phiên mã sớm ở trp operon

Phiên mã dở (attenuation) là một cơ chế điều hoà gây ra sự kết thúc phiên mã sớm dưới những điều kiện nhất định; bằng cách đó nó ngăn cản sự biểu hiện sản phẩm của mARN. Sự phiên mã dở tạo ra mARN uốn gập một cách điển hình thành các cấu trúc bậc hai xen kẻ, một trong số đó là yếu tố kết thúc độc lập ρ (Rho-independent terminator).

Đối với operon tryptophan, đó là việc sử dụng dịch mã để điều khiển sự phiên mã. Khi có mặt tryptophan trong môi trường nội bào, thậm chí ở nồng độ thấp, sẽ xảy ra sự dịch mã một phần ở đoạn dẫn dầu (leader) của mARN đang được tổng hợp. Kết quả là làm dừng sự phiên mã trước khi gen cấu trúc đầu tiên (trpE) của operon được phiên mã.

Sự kết thúc phiên mã sớm ở operon tryptophan là kết quả của sự tương tác bổ sung nội phân tử giữa các trình tự ADN bên trong vùng leader của bản sao ARN. Hệ quả của sự kết thúc phiên mã sớm này tạo ra một mARN chứa 140 bazơ. Tại vùng đầu mút 3' của nó xảy ra sự tự bổ sung ở đoạn giàu GC tạo thành một cấu trúc hình vòng trên thân ARN và gây ra sự kết thúc phiên mã sớm. Vùng này được gọi là đoạn phiên mã dở (trp attenuator) và ở phần đuôi của mARN này cũng có 8 bazơ uridine. Kiểu cấu trúc “kẹp tóc” này là tín hiệu kiểm soát kết thúc phiên mã ở prokaryote nói chung.

Hình 6.10. (a) Cấu trúc đoạn dẫn đầu - TrpL của trp operon. (b) Khi mức tryptophan cao, xảy ra sự kết thúc phiên mã sớm tại trp attenuator với một cái đuôi 3' gồm 8 uridine. (c) Khi mức tryptophan thấp, sự phiên mã tiếp diễn.

Với kiểu cấu trúc đặc thù ở đoạn dẫn đầu của operon Trp làm cho nó có ý nghĩa quan trọng trong điều hoà phiên mã dở, ở chỗ: (i) tổng hợp một peptide dẫn đầu chứa 14 axit amin; (ii) trên mARN của đoạn peptide này chứa hai codon của Trp ở các vị trí 10 và 11; (iii) ở bốn vùng được đánh số 1–4 xảy ra sự tự bổ sung giữa các vùng 1 và 2, và giữa 3 và 4; ở một số trường hợp có thể xảy ra sự kết cặp giữa các vùng 2 và 3.

Page 101: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

101

Do trong trình tự mã hóa của đoạn dẫn đầu trpL có hai codon Trp, nên sự dịch mã đoạn này tỏ ra nhạy cảm với số lượng tARNtrp đưa vào. Nếu môi trường cung cấp đầy đủ Trp, ribosome trượt qua các codon Trp để đi vào vùng 2. Và sự có mặt của ribosome ở vùng 2 ngăn cản vùng này kết cặp với vùng 3. Khi đó vùng 3 sẽ cặp với vùng 4 và tạo ra điểm kết thúc phiên mã sớm (xảy ra sau khi tổng hợp xong 8 uridine ở ngay sau vùng 4). Khi số lượng tARNTrp đưa vào không đầy đủ, sự dịch mã đoạn dẫn đầu dừng lại đột ngột ở các codon Trp của nó. Điều này ngăn cản ribosome tiến vào vùng 2, do đó vùng này sẽ cặp với vùng 3 gây cản trở việc tạo thành cấu trúc phiên mã dở (trp

attenuator). Kết quả là phân tử mARN đa cistron của operon Trp được tạo thành một cách đầy đủ.

2.4. Điều hoà ở mức dịch mã

Hình 6.11. Sự tương tác giữa đoạn trình tự Shine-Dalgarno của mARN và trình tự tương ứng ở đầu 3' của rARN 16S trong tiểu đơn vị ribosome bé của vi khuẩn, qua đó ribosome bám vào vùng 5'UTR của mARN (M.W.King 1996).

Hiệu quả của sự khởi đầu dịch mã thường phụ thuộc vào trình tự giàu purine ở vùng 5'-UTR. Đó là 6-8 bazơ (thường gặp là AGGAGGU) nằm ngay trước codon khởi đầu AUG của mARN. Đoạn này bám vào tiểu đơn vị ribosome bé trước khi bắt đầu dịch mã, đã được J. Shine và L. Dalgarno xác định lần đầu tiên năm 1974. Vì vậy nó được gọi là trình tự Shine-Dalgarno (Hình 6.11). Các tác giả này cho rằng hầu như có sự bổ sung chính xác giữa đoạn trình tự này (ở đầu 5' của mARN) và vùng tương ứng ở đầu 3' của rARN 16S. Điều đó phù hợp với hiện tượng cố định bước đầu phân tử mARN trên tiểu đơn vị 30S. Thông thường, ở các mARN được dịch mã có hiệu quả nhất thì vùng bám vào ribosome thường nằm cách codon khởi đầu khoảng 8 nucleotide về phía trước. Nếu như đột biến xảy ra ở vùng này thì có thể làm giảm đột ngột hiệu quả dịch mã trên mARN. Tuy nhiên, chỉ riêng sự có mặt của trình tự Shine-Dalgarno phân bố chuẩn vẫn chưa đủ đảm bảo cho sự khởi đầu dịch mã. Trên thực tế, có nhiều trình tự như thế bị che khuất bởi các cấu trúc “kẹp tóc”, vì vậy nó không thể tham gia tương tác với vùng tương ứng của rARN 16S.

Các số liệu thu được cho thấy hiệu quả của việc sử dụng trình tự Shine-Dalgarno nhất định có thể “chế tác” các protein mà đến lượt chúng lại bám vào trình tự đó và ngăn cản nó. Được nghiên cứu chi tiết nhất là các protein của ribosome ở E. coli. Khi tốc độ tổng hợp các protein này vượt quá mức sản sinh các rARN thì sẽ xảy ra sự tích luỹ các protein ribosome tự do. Số protein dư thừa này được gọi là các protein “khoá”; chúng bám vào trình tự Shine-Dalgarno trong các mARN tương

Page 102: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

102

ứng. Nhờ vậy, tốc độ tổng hợp các protein ribosome được duy trì ở mức không vượt quá khả năng sử dụng chúng để cấu thành các ribosome. Có thể nói, sự điều hoà ở mức dịch mã là sự “cạnh tranh” giữa rARN và mARN của các protein ribosome, gây ra sự kết hợp với các protein “khoá” này. Khi sự dịch mã mARN của các protein ribosome không thể tiếp diễn được nữa (do sự bám dính bởi các protein “khoá”) thì các mARN này sẽ bị thoái hoá nhanh hơn bình thường.

3. Điều hoà biểu hiện gen ở eukaryote

3.1. Điều hoà biểu hiện gen ở eukaryote

Rõ ràng, với trình độ tiến hoá cao hơn và sự phân hoá vô cùng phong phú đa dạng của nhóm eukaryote, sự điều hòa biểu hiện gen ở các eukaryote phức tạp hơn rất nhiều so với các prokaryote; thậm chí ngay trong nhóm eukaryote các phương thức và chiến lược điều hoà cũng rất phong phú và đa dạng.

Cần lưu ý rằng, những ước tính gần đây cho thấy một tế bào người chứa khoảng 25.000 gen mã hoá protein, trong đó: (i) Một số gen được biểu hiện trong tất cả các tế bào vào mọi lúc. Các gen này được gọi là gen nội trợ (housekeeping genes), chúng chịu trách nhiệm cho các chức năng chuyển hoá thông thường phổ biến cho mọi tế bào (ví dụ, hô hấp); (ii) Một số được biểu hiện khi tế bào đi vào một con đường biệt hoá cụ thể; (iii) M ột số được biểu hiện mọi lúc chỉ trong các tế bào đã được biệt hoá theo một cách thức cụ thể; (iv) Một số chỉ được biểu hiện khi các điều kiện bên ngoài và trong tế bào thay đổi, ví dụ khi có một hormon đi đến có thể kích hoạt hoặc kìm hãm các gen nào đó trong tế bào.

Vậy các gen ở eukaryote được điều hoà bằng cách nào? Có nhiều cách điều hoà được sử dụng bởi các tế bào eukaryote, như: thay đổi tỷ lệ phiên mã của các gen. Đây là chiến lược quan trọng nhất và được sử dụng rộng rãi. Tuy nhiên, các eukaryote còn có nhiều cách thức điều hoà phiên mã khác, ví dụ: (i) Biến đổi tỷ lệ mà trong đó các bản sao ARN được xử lý ở trong nhân (xem sửa đổi

ARN); (ii) Thay đổi độ ổn định của các phân tử mARN, nghĩa là tỷ lệ mà chúng bị suy thoái (ví dụ, nhiễu ARN); (iii) Bi ến đổi hiệu suất dịch mã của các ribosome.

Đối với các gen phân đoạn của tế bào eukaryote, các đoạn không mã hoá protein sẽ được loại bỏ khỏi mARN trước khi nó đi ra tế bào chất để làm khuôn cho dịch mã; cũng như các quá trình bổ

sung chóp (cap) và đuôi poly(A) ở các đầu 5' và 3' của hầu hết các bản sao mARN sơ cấp.

Những vấn đề quan trọng khác: vị trí khởi đầu phiên mã, promoter, yếu tố tăng cường (enhancer) và yếu tố gây bất hoạt (silencer) phiên mã. Các gen nằm kề nhau (adjacent genes), kể cả các gen mã hoá các ARN và gen mã hoá protein, thường phân cách nhau bằng yếu tố cách ly (insulator). Nhờ vậy chúng tránh được việc lấn sân và nhầm lẫn các promoter và enhancer hoặc silencer của nhau.

3.2. Vùng khởi động (Promoter)

Trong nhân các tế bào eukaryote có ba kiểu vùng khởi động khác nhau được nhận biết bởi ba loại ARN polymerase khác nhau. Sự thật là các polymerase I và II cùng nhận biết một loại promoter, còn polymerase III sử dụng hai lớp promoter hoàn toàn khác nhau.

Hầu hết các promoter của eukaryote được nhận biết bởi ARN polymerase II đều có ít nhất một đặc điểm chung, đó là: một trình tự điều hoà nằm trước vị trí bắt đầu phiên mã ~30 cặp bazơ và chứa motif TATA. Hầu hết các promoter của polymerase II cũng chứa các trình tự quan trọng nằm trước hộp TATA, ví dụ hộp CAAT và hộp GC (Hình 6.12a).

Page 103: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

103

Hơn nữa, tự thân các ARN polymerase này không thể bám vào các promoter tương ứng của chúng mà đòi hỏi phải có các nhân tố phiên mã (transcription factors) là những protein điều hoà tổng hợp mARN eukaryote. Có hai lớp nhân tố như vậy: các nhân tố phiên mã chung (general transcription factors) và các nhân tố phiên mã đặc thù-gen (gene-specific transcription factors).

(a)

LCR

TE

P

PTE

vïng ®iÒu hoµ locus (locus control region)

gene A

gene B

yÕu tè phiªn m· (transcription element)

promoter

exon exon

exon exonpromoter

(b)

Hình 6.12. (a) Các yếu tố phiên mã (TE) và promoter đối với ARN polymerase II có thể định khu theo nhiều kiểu khác nhau. Ở đây chỉ cho thấy kiểu TE nằm xa gen về phía trước; các gen được biểu hiện phối hợp cùng nhau thì có thể chịu sự điều hoà của một yếu tố kiểm soát chung, gọi là “vùng điều hoà locus” (LCR) cũng như các yếu tố đặc thù-gen. (b) Các protein bám enhancer - ngoài vị trí bám ADN của chúng, còn có các vị trí bám vào các nhân tố phiên mã tụ họp ở promoter của gen nhờ đó có thể kích thích tăng tỷ lệ phiên mã.

3.3. Các nhân tố phiên mã

3.3.1. Enhancer và Silencer

Các nhân tố phiên mã đặc thù-gen còn gọi là các yếu tố phiên mã (transcription elements = TE) là các trình tự ADN điều hoà gen. Các TE xác định hiệu suất phiên mã. Chúng có thể phân bố trước gen, sau gen hoặc bên trong gen (tại các intron chẳng hạn) và bao gồm các enhancer, silencer, các yếu tố đáp ứng (response element) và các yếu tố cách ly. Nói chung các gen có thể có vố số yếu tố phiên mã (Hình 6.12 và 6.13).

Các enhancer là các yếu tố trình tự ADN đặc thù có thể kích thích gia tăng tỷ lệ phiên mã. Khác với các promoter ở chỗ, chúng có thể hoạt động ở một khoảng cách xa cả ngàn cặp bazơ so với các gen mà chúng kiểm soát. Nguyên do là ở chỗ: các protein bám enhancer - ngoài vị trí bám ADN của chúng, còn có các vị trí bám vào các nhân tố phiên mã (TF) tụ họp ở promoter của gen (Hình 6.13).

Các silencer cũng là các yếu tố ADN đặc thù có thể định khu và hoạt động ở tầm như các enhancer. Tuy nhiên, khi các nhân tố phiên mã bám vào chúng thì sự biểu hiện của gen do chúng kiểm soát bị kìm hãm.

Các yếu tố đáp ứng là các trình tự đích cho các phân tử tín hiệu.

Page 104: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

104

Các yếu tố cách ly là những đoạn ADN (~42 cặp bazơ) định khu giữa các enhancer và promoter hoặc giữa các silencer và promoter của các gen nằm sát nhau hoặc các cụm gen kề nhau. Chức năng của chúng là ngăn cản một gen khỏi bị ảnh hưởng bởi sự hoạt hoá (hoặc ức chế) của các gen lân cận. Ví dụ: enhancer cho promoter của gen xác định chuỗi delta của thể nhận gamma/delta tế bào-T cho kháng nguyên (TCR) định khu gần promoter đối với chuỗi alpha của alpha/beta TCR (trên nhiễm sắc thể số 14 ở người). Một tế bào T phải chọn lựa giữa cái này hoặc cái kia. Có một yếu tố cách ly giữa promoter của gen alpha và promoter của gen delta nhằm đảm bảo sự hoạt hoá của một gen không lan rộng sang gen khác.

3.3.2. Các nhân tố phiên mã của ARN polymerase II

Promoter cơ bản có chứa trình tự gồm 7 bazơ (TATAAAA) g ọi là hộp TATA. Nó được bám bởi một phức hợp lớn có chừng 50 protein khác nhau, bao gồm: (i) Nhân tố phiên mã IID (transcription factor IID = TFIID) là một phức hợp của protein bám TATA (TATA-binding protein = TBP) với chức năng nhận biết và bám vào hộp TATA cùng với 14 nhân tố protein khác bám vào TBP và bám vào nhau chứ không bám vào ADN. (ii) Nhân tố phiên mã TFIIB bám cả ADN và polymerase II.

Nhìn chung, kiểu promoter cơ bản này thấy có trong tất cả các gen mã hoá protein; nhiều gen khác nhau và nhiều kiểu tế bào khác nhau cùng chia xẻ chung các nhân tố phiên mã; Pol II (một phức hợp của 12 protein khác nhau) bám vào promoter thông qua các nhân tố thuộc TFII. ARN polymerase II được hỗ trợ bởi ít nhất 6 nhân tố phiên mã chung (TFIIA, B, D, E, F và H), cũng như bởi các nhân tố phiên mã đặc thù-gen mà hầu hết chúng bám vào các enhancer gắn với các gen nào đó. TFIID có chứa protein bám hộp TATA (TBP); protein này bám hộp TATA của promoter và làm trung tâm tổ chức cho việc hình thành phức hợp tiền khởi đầu.

+1

TBP

TFIIDB

E F

H

J

RNA pol II

Hình 6.13. Bám vào promoter của các nhân tố phiên mã, ARN polymerase II, các TF chuyên hoá, và hình thành phức hợp tiền khởi đầu.

3.4. Sửa đổi ARN

Như đã đề cập, tất cả các ARN eukaryote đều phải trải qua quá trình sửa đổi sau phiên mã ở trong nhân (RNA processing) để tạo ra các ARN trưởng thành. Sau đó các phân tử mARN đi ra tế bào chất để tham gia vào quá trình dịch mã. Hai sự kiện sửa đổi chính yếu, đó là:

– Gắn thêm chóp m7Gppp và đuôi poly(A); và

– Loại bỏ các intron và nối các exon hay còn gọi là splicing.

3.4.1. Gắn thêm chóp m7Gppp và đuôi poly(A)

Trước tiên là lắp thêm “chóp” 7-methylguanosine-triphosphate (m7Gppp) ở đầu 5' và sau đó là

Page 105: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

105

“đuôi” poly(A) ở đầu 3' của nó. Đối với các gen mã hóa protein không thuộc kiểu phân đoạn như các gen histone chẳng hạn, quá trình hoàn thiện mARN dừng tại đây. Nói chung, tất cả các mARN trưởng thành của eukaryote đều có chóp 5' (5'cap) và hầu hết các mARN đều chứa đuôi poly(A), ngoại trừ các mARN histone. Chóp 5' và đuôi poly(A) có tác dụng bảo vệ mARN khỏi bị phân cắt bởi các enzyme ribonuclease (RNase) trong tế bào chất.

� Sự hình thành chóp 5': Quá trình này đòi hỏi nhiều bước, bước thứ nhất xảy ra ngay sau khi khởi đầu phiên mã. Nucleotide khởi đầu có một đầu 5'-triphosphate được thuỷ giải thành một đầu monophosphate và pyrophosphate vô cơ (PPi). Sau đó enzyme guanylyltransferase chuyển một gốc G cho đầu monophosphate bằng cách sử dụng GTP như là một cơ chất, làm giải phóng Pi. Liên kết được hình thành là một liên kết 5'-5' triphosphate. Tiếp đó enzyme methyltransferase gắn nhóm methyl (-CH3) vào vị trí 7 của guanosine ở đầu mút 5', tạo thành methyl-7-guanosine triphosphate (m7Gppp). Sau đó, xảy ra sự methyl hoá ở hai nucleotide tại các vị trí 2' ribose. Chóp 5' có chức năng bảo vệ đầu 5' của mARN (gia tăng tính ổn định mARN) và cần thiết cho khởi đầu tổng hợp protein.

� Sự hình thành đuôi poly(A): Ở đầu 3' của hầu hết các gen mã hóa protein eukaryote có chứa trình tự AATAAA là tín hiệu cho việc gắn “đuôi” poly(A) vào đầu 3' của mARN. Sự phiên mã thường vẫn còn tiếp diễn sau khi đi qua vị trí polyadenyl hoá này. Trình tự AAUAAA ở đầu 3' của mARN báo hiệu cho endonuclease nhận biết và cắt chuỗi ARN tại một điểm nằm sau nó ~10-30 bazơ. Sau đó, enzyme poly(A)-polymerase sẽ lắp thêm vào đầu 3' của mARN một dãy adenine dài khoảng 150-200 bazơ gọi là đuôi poly(A). Đuôi này có chức năng bảo vệ mARN khỏi bị suy thoái và trong nhiều trường hợp nó còn kích thích sự dịch mã.

Hình 6.14. Các bước tổng quát của quá trình phiên mã và sửa đổi sau phiên mã đối với bản sao pre-mARN của các gen phân đoạn: (1) Lắp chóp 5’-m7Gppp cùng lúc phiên mã; (2) Gắn đuôi poly(A); và (3) Splicing.

3.4.2. Sự cắt-nối pre-mARN của các gen phân đọan

Việc lý giải cơ chế cắt-nối (splicing) trong quá trình xử lý bản sao pre-mARN dựa chủ yếu trên hai sự kiện:

Page 106: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

106

Hình 6.15. Mô hình splicing pre-mARN bằng thể cắt nối spliceosome (Phỏng theo T. Villa et al., 2002, Cell 109:149).

(1) Kết quả phân tích trình tự bazơ tại các chỗ tiếp giáp exon/intron (vị trí cho) và intron/exon (vị trí nhận) cho thấy ở hai đầu mút của mỗi intron có hai nucleotide rất ổn định, gọi là 'trình tự chuẩn': 5'-GU......AG-3'. Vậy bằng cách nào bộ máy cắt-nối có thể xác định một cách chính xác và hiệu quả các vị trí cắt nối nếu như xảy ra sự biến đổi trong các vị trí này? Điều đó cũng đặt ra khả năng là sự biến đổi hay đột biến của các vị trí cắt nối này tại các gốc then chốt có thể làm rối loạn chức năng của chúng.

(2) Ở một số snARN chứa trong thành phần của enzyme splicing cũng có các trình tự dinucleotide bổ sung với các trình tự chuẩn trong intron. Các snARN (U1-U6) trong phức hợp enzyme này, snRNP (small nuclear ribonucleoprotein), tương tác với các đầu mút của mỗi intron, kéo chúng xích lại gần nhau tạo ra cấu trúc hình vòng, nhờ đó enzyme tiến hành cắt bỏ intron và nối các exon lại với nhau. Ví dụ, gen ovalbumin gồm 7 intron xen kẽ giữa 8 exon có độ dài 7.700 cặp bazơ sau khi enzyme splicing cắt bỏ các intron và nối tất cả các exon thì mARN trưởng thành có trình tự mã hóa protein dài 1.872 bazơ.

3.4.3. Cắt nối chọn lọc tạo ra các mARN khác nhau từ một gen

Một trong những trường hợp thú vị là việc cắt nối sau phiên mã theo các cách khác nhau (có tính chất biệt hoá và chọn lọc) dẫn tới tạo ra các mARN khác nhau (Hình 6.16 và 6.17). Ví dụ điển hình là gen phân đoạn mã hóa calcitonin và sản phẩm pre-mARN của nó (xem Hình 6.16).

Page 107: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

107

Hình 6.16. Cùng một bản sao pre-mARN được tạo ra từ sự phiên mã gen calcitonin, qua quá trình sửa đổi theo kiểu cắt nối chọn lọc đặc thù tạo ra hai mARN trưởng thành khác nhau: mARN của calcitonin được sinh ra chủ yếu bởi tuyến giáp và mARN cho sản phẩm họ hàng với calcitonin sinh ra chủ yếu ở tuyến dưới đồi thị.

Quá trình xử lý ARN này xảy ra theo những con đường đặc thù, tuỳ theo tuyến giáp hay tuyến dưới đồi thị. Kết quả là tạo ra hai mARN trưởng thành giống nhau ở đầu 5' và khác nhau ở đầu 3'. Cụ thể, con đường cắt-nối ở tuyến giáp dẫn tới hình thành mARN mà ở đầu 3' là trình tự mã hoá calcitonin, còn con đường đặc trưng cho tuyến dưới đồi thị dẫn đến hình thành mARN mà ở phía đầu 3' là trình tự mã hoá sản phẩm có liên quan họ hàng với calcitonin nhưng lượng calcitonin được tạo ra ở đây rất ít, và thay vào đó là protein có quan hệ họ hàng với calcitonin mà chức năng của nó còn chưa rõ.

3.4.4. Vai trò của các intron

Vấn đề đặt ra là sự có mặt cuả các intron trong các gen phân đoạn như thế có ý nghĩa gì? Bởi vì trong quá trình cắt nối pre-mARN có thể xảy ra dù là một sai sót nhỏ cũng đủ để tạo ra mARN có khung đọc mã bị thay đổi. Được biết khoảng 90% bản sao mARN bị suy thoái và chỉ để lại ~10% mARN trưởng thành đi ra tế bào chất. Theo hiểu biết hiện nay, các intron có thể có các vai trò sau:

(i) các intron là các đoạn đệm tạo thuận lợi cho sự tái tổ hợp (giữa các exon) bên trong một gen;

(ii) các intron là các vùng đệm phân cách các vùng chức năng của gen (tức các exon) và của một số protein;

(iii) các intron là nơi phân bố một số yếu tố phiên mã (TE);

(iv) các intron là các vùng phân cách các exon cho phép quá trình cắt-nối chọn lọc (alternative splicing) để tạo ra các mARN trưởng thành khác nhau và dịch mã thành các polypeptide khác nhau từ một gen. Con đường sử dụng exon có chọn lọc này mang tính đặc thù cho từng loại gen của các tế bào thuộc các mô nhất định ở các eukaryote bậc cao.

Page 108: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

108

Hình 6.17. Các kiểu sử dụng exon trong cắt nối chọn lọc có thể sinh ra nhiều protein khác nhau từ một gen.

TÓM T ẮT

(1) Các gen của mỗi bộ gen không tồn tại riêng rẽ và hoạt động như những thực thể độc lập mà trái lại, giữa chúng có sự kiểm soát lẫn nhau cũng như phụ thuộc vào các yếu tố của môi trường. Mỗi bộ gen của tế bào là một hệ thống mở có khả năng tự điều chỉnh, đảm bảo sự hoạt động của các gen diễn ra hợp lý trước điều kiện cụ thể của môi trường trong từng giai đoạn của quá trình phát triển cá thể.

(2) Sự điều hoà hoạt động của các gen biểu hiện ở nhiều mức độ khác nhau như phiên mã, sau phiên mã, dịch mã và sau dịch mã và theo các phương thức và cơ chế đặc thù cho từng nhóm loài. Đặc điểm chung nhất cho hoạt động của các gen trong các bộ gen khác nhau thể hiện chủ yếu ở sự điều hòa phiên mã, trong đó xảy ra sự tương tác giữa vùng khởi động (promoter) với ARN polymerase và với nhiều yếu tố khác.

(3) Ở sinh vật nhân sơ, sự điều hoà hoạt động của các gen có liên quan đến các quá trình chuyển hóa của tế bào. Các gen cấu trúc liên quan về chức năng được tổ chức và kiểm soát hoạt động chặt chẽ theo cụm gọi là operon. Các yếu tố điều hòa một operon gồm có vùng vận hành, vùng khởi động và gen ức chế. Mỗi tế bào vi khuẩn có các operon cảm ứng và operon ức chế với phương thức điều hòa chung là điều hòa âm tính, ngoài ra còn có các kiểu điều hòa dương tính, phiên mã dở... tùy loại operon.

(4) Ở sinh vật nhân chuẩn sự điều hòa biểu hiện của các gen phức tạp hơn nhiều. Điều này thể

Page 109: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

109

hiện ở sự biến đổi cấu hình chất nhiễm sắc trước khi các gen có thể phiên mã. Có nhiều yếu tố ADN và protein tham gia điều hòa ở mức phiên mã. Sự điều hòa sau phiên mã diễn ra trong nhân theo nhiều cơ chế khác nhau, như: gắn thêm chóp m7Gppp, lắp thêm đuôi poly(A), cắt nối có chọn lọc các exon để tạo ra nhiều kiểu ARN trưởng thành khác nhau từ một gen ở các mô khác nhau của sinh vật bậc cao.

CÂU HỎI VÀ BÀI T ẬP

101. Thông thường, thứ tự sắp xếp từ trái sang phải của các yếu tố trong một operon là: ___(a)___, ___(b)___, ___(c)___ và ___(d)___.

102. Theo định nghĩa chặt chẽ, một operon bao gồm một nhóm các ___(a)___ có liên quan với nhau về mặt ___(b)___ được liên kết chặt chẽ với một yếu tố ___(b)___ nằm kề sát trước chúng.

103. Đoạn trình tự đặc thù 5’-AAUAAA-3’ nằm đằng sau của hầu hết các pre-mARN sinh vật nhân chuẩn đóng vai trò là tín hiệu điều hòa

A. kết thúc phiên mã. B. cắt và gắn đuôi polyA.

C. kéo dài phiên mã. D. tốc độ phiên mã.

104. Quá trình xử lý các bản sao ARN sơ cấp ở tế bào nhân chuẩn được xem là sự điều hoà biểu hiện gen ở mức

A. phiên mã. B. sau phiên mã.

C. dịch mã. D. sau dịch mã.

105. Loại ARN nào sau đây có mặt trong thành phần của enzyme cắt-nối (splicing) đối với sản phẩm phiên mã sơ cấp của các gen phân đoạn?

A. rARN. B. mARN. C. snARN. D. tARN.

106. Khi môi trưòng nuôi cấy E.coli không có đường lactose thì operon Lac không hoạt động, chủ yếu bởi vì:

A. chất ức chế bám chặt vùng vận hành.

B. ARN polymerase bị các phân tử hiệu ứng ngăn cản từ xa.

C. Operator hoặc promoter bị mất chức năng tín hiệu.

D. phức hợp “chất ức chế - chất cảm ứng” gắn vào vùng vận hành.

107. Thế nào là Operon? Sơ lược các thành phần tham gia vào sự điều hòa hoạt động của một operon. Vẽ một sơ đồ operon.

108. Phân tích và chỉ ra những điểm giống nhau và khác nhau trong cấu trúc, chức năng và cơ chế điều hòa âm tính của operon Lactose và operon Tryptophan. Từ đó nêu ý nghĩa sinh học của chúng.

109. Nếu trong môi trường nuôi cấy E. coli được bổ sung cả hai loại đường lacto và gluco thì vi khuẩn sẽ sử dụng chất nào trước? Tại sao? Khi glucose đã được sử dụng hết thì việc ức chế dị hóa còn tiếp tục diễn ra nữa hay không, tại sao?

110. Xét 3 nòi vi khuẩn có kiểu gen của operon Lac như sau (dấu + biểu thị cho locus bình

Page 110: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

110

thường tức kiểu dại, và dấu “–” chỉ locus bị đột biến). Hãy giải thích và cho biết kiểu hình của mỗi nòi vi khuẩn sau: (1) R+ P+ O+ Z– Y+ A+; (2) R+ P+ O+ Z+ Y– A+; (3) R+ P+ O+ Z+ Y+ A+.

111. Một nòi vi khuẩn có kiểu gen operon Lac như sau: R+ P+ O– Z+ Y+ A+. Hãy giải thích và xác định kiểu hình của vi khuẩn.

112. Một nòi E. coli có kiểu gen operon Lac là R+ P– O+ Z+ Y+ A+. Hãy giải thích và xác định kiểu hình của vi khuẩn.

113. Một vi khuẩn có kiểu gen operon Lac là: R– P+ O+ Z+ Y+ A+. Hãy giải thích và xác định kiểu hình của vi khuẩn.

114. Phân biệt các cặp khái niệm sau: (a) chất cảm ứng với chất ức chế; (b) điều hoà âm tính với điều hoà dương tính; (c) điều hoà theo kiểu cảm ứng - âm tính với ức chế - âm tính. Hãy vẽ sơ đồ một operon và giải thích mối quan hệ giữa các yếu tố điều hoà hoạt động của một operon.

115. Hãy giải thích các tình trạng đóng-mở của lac operon dưới các điều kiện sau đây và cho các hình vẽ minh hoạ: (a) chỉ có glucose; (b) chỉ có lactose; (d) có cả glucose và lactose; và (c) không có đường nào cả.

116. Sự điều hòa dịch mã ở vi khuẩn xảy ra như thế nào? Nêu ý nghĩa của kiểu điều hòa ấy.

117. Phân tích cơ chế sửa đổi sau phiên mã đối với sản phẩm của các gen phân đoạn và vẽ một sơ đồ minh họa.

118. Phân tích một ví dụ về sửa đổi sau phiên mã theo kiểu cắt nối chọn lọc đối với sản phẩm của gen phân đoạn. Vẽ một sơ đồ minh họa.

119. Trình bày vai trò và ý nghĩa của các intron trong các gen phân đoạn.

120. Trình bày sơ lược các yếu tố điều hòa biểu hiện gen ở mức phiên mã đối với các gen eukaryote.

Page 111: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

111

Chương 7

CÁC BIẾN ĐỔI CỦA BỘ GEN

Một trong những đặc tính căn bản của vật chất di truyền là khả năng bị biến đổi, tạo ra những vật liệu mới. Ở mức độ phân tử đó là sự phát sinh các đột biến gen tự phát diễn ra trong quá trình tái bản của bộ gen cũng như do tác động của các yếu tố môi trường như hóa chất, các tia phóng xạ…; sự phát sinh các biến dị tổ hợp và các yếu tố di truyền vận động. Bằng cách đó các nguồn biến dị di truyền sơ cấp và thứ cấp được tạo ra và cung cấp cho quá trình chọn lọc và tiến hóa của sinh giới. Bên cạnh đó bộ gen các tế bào cũng có các hệ thống sửa chữa nhằm hạn chế phát sinh đột biến cũng như các tổn thương trong ADN.

Trong chương này, chúng ta sẽ tìm hiểu và giải đáp các vấn đề sau: (i) Đột biến gen là gì, có các loại cơ bản nào? Vai trò và ý nghĩa của chúng trong tiến hóa và chọn giống? (ii) Đột biến gen xảy ra do những tác nhân, nguyên nhân và cơ chế nào? (iii) Các tế bào có thể hạn chế sự phát sinh các đột biến gen tự phát như thế nào? Các tổn thương trong ADN được sửa chữa ra sao? (iv) Sự tái tổ hợp của ADN diễn ra như thế nào? (v) Bản chất của các yếu tố di truyền vận động là gì? Các đoạn xen và gen nhảy khác nhau ở những điểm nào?

1. Đột biến gen

1.1. Đại cương về đột biến gen

���� Định nghĩa: Đột biến gen (gene mutation) là những biến đổi xảy ra bên trong cấu trúc của một gen hoặc một vùng nhỏ của bộ gen, liên quan chủ yếu tới sự thay đổi trình tự nucleotide vốn có của nó (kiểu dại), làm phát sinh các alen (allele) mới.

� Nguyên nhân: Các đột biến gen xảy ra có thể do sai sót trong quá trình tái bản, hoặc do trong bộ gen có các vùng dễ phát sinh đột biến gọi là các ''điểm nóng'' (hot spots), hoặc các tổn thương tự phát dưới ảnh hưởng của các tác nhân lý-hoá từ môi trường ngoài.

� Phân loại: Các đột biến gen có thể được phân loại theo các cách khác nhau. Chẳng hạn, dựa vào các hiệu quả của chúng lên kiểu hình (các đột biến hình thái, đột biến gây chết, các đột biến soma và dòng mầm) hoặc lên chính bản thân vật chất di truyền ADN. Căn cứ vào nguồn gốc, chúng được chia thành các đột biến tự phát và đột biến cảm ứng.

� Hậu quả: Các đột biến gen nói chung làm suy yếu hoặc biến đổi chức năng của gen hơn là tăng cường chức năng của nó. Từ đó ảnh hưởng lên các đặc tính sinh lý-hoá sinh của tế bào cũng như sức sống và sinh sản của cơ thể sinh vật nói chung.

� Vai trò và ý nghĩa: Đột biến gen vì vậy được xem là cơ sở của hiện tượng đa hình di truyền trong các quần thể và là nguồn biến dị di truyền sơ cấp vô cùng phong phú và đa dạng cho các quá trình chọn lọc và tiến hoá. Người ta lợi dụng đặc tính biến đổi nầy của các sinh vật để xây dựng các phương pháp gây đột biến khác nhau và có thể kết hợp với lai hữu tính hoặc sử dụng kỹ thuật di truyền để cải biến bộ gen của các vật nuôi, cây trồng về các tính trạng cần quan tâm.

� Tỷ lệ đột biến gen (ở người): Nếu như đột biến bộ gen (genome mutation) và đột biến nhiễm

sắc thể xảy ra với tần số trung bình tương ứng là 10-2 và 6×10-4 mỗi lần phân bào, thì với đột biến

gen tỷ lệ là 10-10 cho mỗi cặp bazơ trong mỗi lần phân bào hoặc có thể biến thiên từ 10-4 đến 10-7 (tính bằng số đột biến / locus / thế hệ) tuỳ thuộc vào kích thước gen và bản chất của nó. Tỷ lệ này ở

Page 112: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

112

hầu hết locus là 10-5-10-6.

� Hiện tượng đa hình (polymorphism) trong bộ gen: Ở người, con số các đa hình tồn tại là ~1 trên mỗi 500 cặp bazơ. Như vậy có khoảng 5,8 triệu sai khác trong mỗi bộ gen đơn bội là do các đột biến gây ra.

1.2. Các kiểu đột biến điểm (point mutations)

1.2.1. Các đột biến thay thế bazơ (base substitution)

• Đồng hoán và dị hoán

Đồng hoán (transition) là dạng đột biến trong đó một purine này được thay bởi một purine khác (A → G hoặc G → A) hoặc một pyrimidine này được thay bởi một pyrimidine khác (T → C hoặc C → T).

Dị hoán (transversion) là dạng đột biến trong đó một purine được thay thế bằng một pyrimidine, hoặc ngược lại: A � T; A � C; G �

C; G � T. (xem sơ đồ)

• Các đột biến nhầm nghĩa và vô nghĩa

+ Đột biến nhầm nghĩa (missense mutation) - biến đổi nghĩa của một codon kéo theo sự thay thế một axit amin. Hiệu quả của nó phụ thuộc vào vị trí và tính chất của axit amin bị biến đổi (Bảng 7.1; Hình 7.1 và 7.5).

Hình 7.1. Ba kiểu đột biến điểm. (a) Trình tự ADN ban đầu ở mạch đối khuôn của gen mã hóa cho

1 trình tự axit amin; (b) Đột biến thay thế 1 bazơ dạng nhầm nghĩa; (c) Đột biến thêm 1 bazơ; (d) Đột biến mất 1 bazơ.

Page 113: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

113

Hình 7.2. Đột biến vô nghĩa. Đột biến thay thế 1 bazơ làm biến đổi 1 bộ ba có nghĩa của trình tự

mã hóa thành bộ ba vô nghĩa (đột biến vô nghĩa), hậu quả là protein được tổng hợp ngắn một cách bất thường.

+ Đột biến vô nghĩa (nonsense mutation) - biến đổi một bazơ ở codon có nghĩa (sense codon) bên trong trình tự mã hoá của gen tạo thành codon kết thúc chuỗi (Hình 7.2). Đột biến này gây ra

chuỗi polypeptide ngắn bất thường và không có hoạt tính. Ví dụ, các dạng thiếu máu vùng biển β-

thalasemie mà không tổng hợp được β- globin là do đột biến điểm ở các codon 17 hoặc 39 của gen

β-globin. Ngược lại, nếu đột biến làm biến đổi codon kết thúc thành codon có nghĩa sẽ dẫn tới hậu quả là chuỗi polypeptide được tổng hợp dài hơn bình thường. Đây là trường hợp đặc biệt của đột biến nhầm nghĩa (Hình 7.1). Điển hình là dạng hemoglobin Constant Spring (HbCS). Phân tử mARN của chuỗi alpha bình thường có codon kết thúc là UAA với polypeptide dài 141 axit amin, còn ở mARN dạng bệnh này nó là CAA mã hoá cho glutamine, với chuỗi alpha có tới 172 axit amin.

Hình 7.3. Đột biến lặp bộ ba. Một bộ ba nào đó trong trình tự mã hóa protein của gen có thể bị lặp lại nhiều lần, do dó kéo theo sự bổ sung nhiều lần 1 loại axit amin nào đó. Một số bệnh tật ở người là do kiểu đột biến này gây ra.

Page 114: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

114

Hình 7.4. Đột biến thay thế 1 bazơ ở 1 codon có thể tạo ra 9 codon mới, trong đó có loại nhầm nghĩa, có loại vô nghĩa.

Bảng 7.1. Các đột biến nhầm nghĩa điển hình ở chuỗi β-globin người

Chuỗi β Vị trí axit amin

Thay thế axit amin

Thay đổi ở

β-mARN

Kiểu thay thế ở

gen β-globin

HbS 6 Glu → Val GAA → GUA Dị hoán A → T

HbC 6 Glu → Lys GAA → AAA Đồng hoán G → A

HbE 26 Glu → Lys GAA → AAA Đồng hoán G → A

(a) (b)

(c) Hình 7.5. Bệnh hồng cầu hình lưỡi li ềm. (a) Sơ dồ điện di hemoglobin của ba kiểu gen cho thấy: kiểu HbA/HbA chỉ có một vạch của chuỗi β-hemoglobin A, kiểu HbS/HbS có một vạch của chuỗi β-hemoglobin S, còn kiểu HbA/HbS cho 2 vạch ứng với 2 chuỗi β-globin A và S. (b) Các tế bào hồng cầu bình thường (hình trên) và các tế bào dạng lưỡi li ềm với kích thước phóng đại gần gấp đôi. (c) Một đoạn trình tự axit amin của các chuỗi β-globin bình thường (HbA) và bệnh (HbS) khác

Page 115: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

115

nhau chỉ một axit amin ở vị trí số 6, Glu (có tính axit) → Val (trung tính); hình dưới giải thích cơ sở của đột biến HbA → HbS.

Các đột biến im lặng và trung tính

Các đột biến làm biến đổi thành phần bazơ của một codon nhưng vẫn mã hoá cùng một axit amin, gọi là các đột biến im lặng (silent mutation) hay đột biến đồng nghĩa (synonymous). Phần lớn các đột biến này xảy ra ở vị trí thứ ba của các codon, và chúng xảy ra với tốc độ cao hơn rất nhiều so với các vị trí khác. Đây được coi là một trong những bằng chứng quan trọng của Thuyết trung

tính về sự tiến hoá phân tử (xem Kimura 1983).

1.2.2. Đột biến dịch khung (frameshift mutation)

Dạng đột biến mất hoặc xen thêm một bazơ trong gen dẫn đến khung đọc mã bị dịch chuyển một bazơ, kể từ vị trí bị biến đổi cho đến cuối gen, được gọi là đột biến dịch khung (Hình 7.1c,d). Hậu quả là vùng protein được tổng hợp tương ứng có trình tự axit amin bị biến đổi đáng kể. Điển hình là dạng hemoglobin Wayne (HbWl); do mất một bazơ thứ ba của codon ở vị trí 138 trên chuỗi α (141 aa) gây hậu quả là ba axit amin ở các vị trí 139 - 141 sát đầu C của polypeptide bị biến đổi, đồng thời do codon kết thúc ở vị trí 142 cũng bị biến đổi đã kéo dài thêm 5 axit amin.

1.3. Các đột biến tự phát (spontaneous mutations)

Về nguyên tắc, tất cả các đột biến đều phải có một nguyên nhân, nhưng đôi khi các đột biến xảy ra mà không có các tác nhân gây đột biến (mutagens). Các đột biến tự phát như vậy có nhiều nguyên nhân khác nhau gây ra mà không phải từ bên ngoài.

1.3.1. Các đột biến gây ra bởi bộ máy tái bản ADN

Dù cho sự tái bản được coi là chính xác, nhưng không phải là hoàn hảo. Như thế một số đột biến nào đó xảy ra đơn thuần là do tổng hợp sai. Tần số kết cặp bazơ sai có thể là 10-5 và bản thân các ADN polymerase có khả năng đọc sửa trong khi tổng hợp ADN, nhờ vậy hạn chế đáng kể tần

số phát sinh đột biến do tái bản (10-5 ×10-5 = 10-10).

1.3.2. Sai sót trong tái bản do sự hỗ biến của các bazơ

Các bazơ trong ADN thường tồn tại ở một trong hai trạng thái biến đổi qua lại giữa chúng gọi là các dạng hỗ biến (tautomer). Hiện tượng hỗ biến (tautomerism) xảy ra có thể đơn thuần là do sự sắp xếp lại của các liên kết và do sự thay đổi vị trí của các nguyên tử hydro trong các bazơ.

Các bazơ purine và pyrimidine có thể tồn tại dưới các dạng hỗ biến: amino ↔ imino (đối với adenine và cytosine), hoặc keto ↔ enol (đối với guanine và thymine). Đó là sự biến đổi qua lại giữa hai trạng thái tồn tại bền (phổ biến) và kém bền (hiếm gặp) của các bazơ trong ADN do sự dịch chuyển vị trí của các nguyên tử hydro (Hình 7.6). Chính hiện tượng hỗ biến này dẫn tới sự thay đổi khả năng kết cặp bình thường của các bazơ và làm phát sinh các đột biến gen dạng thay thế một cặp bazơ. Nói chung, các bazơ này đều ít tan trong nước và có khả năng hấp thu ánh sáng cực đại ở bước sóng 260-270 nanomet. Vì vậy chúng có thể được tách ra bằng các phương pháp sắc ký và điện di.

Page 116: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

116

Hình 7.6. Các dạng hỗ biến qua lại giữa keto và enol của các bazơ G và T.

Các dạng phổ biến (bền vững) của adenine và cytosine là các dạng amino; chúng có thể sắp xếp lại thành các dạng hiếm imino kém bền hơn. Chính sự thay đổi vị trí của các hydro làm thay đổi đặc tính kết cặp của các bazơ. Hậu quả của nó là dẫn tới sự kết cặp nhầm giữa các bazơ trong tái bản, do đó trong những lần tái bản tiếp theo sẽ tạo ra các thể đột biến đồng hoán tương ứng. Ví dụ, ADN cha mẹ chứa cặp CG, trong lúc tái bản C chuyển sang dạng imino (hiếm) và cặp nhầm với A (thay vì với G) tạo thành cặp C-A trong một ADN con. Trong lần tái bản tiếp theo, A sẽ cặp bình thường với T tạo ra cặp T-A thay chỗ cặp CG trước đây. Đây là cơ chế của đột biến đồng hoán CG → TA.

1.3.3. Các đột biến dịch khung tự phát trong khi tái bản

Các tác nhân xen vào giữa là nhóm tác nhân quan trọng khác gây biến đổi ADN, bao gồm các thuốc nhuộm acridine. Chúng là các phân tử mô phỏng các bazơ và có thể xen vào giữa các bazơ nitơ của chuỗi xoắn kép ADN. Bằng cách đó chúng gây ra sự xen thêm hoặc mất một cặp nucleotide trên gen (acridine lớn gấp đôi một nucleotide), dẫn đến khung đọc mã thay đổi và các protein được tổng hợp thường không có hoạt tính.

1.3.4. Các đột biến tự phát gây ra bởi deamine hoá

Các đột biến tự phát có thể xảy ra bằng các cơ chế kết cặp sai khác trong tái bản ADN. Chẳng hạn, các bazơ đặc biệt là cytosine, có xu hướng mất đi nhóm amin của chúng trong một quá trình gọi là deamine hoá (deamination). Phổ biến nhất là đảo cytosine thành uracil, thường thì không dẫn tới đột biến, bởi vì các tế bào có một cơ chế tách bỏ uracil (nhờ uracil-ADN glycosylase). Enzyme này cắt liên kết giữa uracil và deoxyribose của nó, để rồi một enzyme khác tới bổ sung một cytosine vào gốc đường này để nó cặp với guanine ở sợi đối diện.

1.4. Tác nhân gây đột biến

1.4.1. Các tác nhân hoá học

• Đột biến gây ra bởi các chất tương tự nucleoside

Một số hợp chất hoá học có thể làm tăng tần số hỗ biến và qua đó gây ra các đột biến. Ví dụ kinh điển là 5-bromodeoxyuridine (BrdU), thường gọi là 5-bromouracil (5-BU; Hình 7.7 và 7.8), một chất giống như thymidine ngoại trừ thay một nguyên tử bromine (Br) cho một nhóm methyl ở vị trí 5. Tuy nhiên, một khi 5-BU được kết hợp vào chỗ của thymidine, nó có thể gây rắc rối. Rắc rối bắt nguồn từ chỗ 5-BU có xu hướng tăng cường bật sang dạng hỗ biến enol để có thể kết cặp bazơ giống như C thay vì T, tạo ra cặp 5-BU-G (Hình 7.7). Và ở lần tái bản sau tạo thành cặp GC

Page 117: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

117

thay chỗ AT. Kết quả là tạo ra đồng hoán AT→ GC. Do hỗ biến mà 5-BU có thể gây đồng hoán hai chiều, AT � GC.

Hình 7.7. Các kiểu kết cặp bazơ của 5-BU với A (phổ biến) và với G (hiếm).

Một hóa chất gây đột biến khác là 2-aminopurine (2-AP), chất tương tự của A, có thể cặp với T. Khi bị proton hóa, 2-AP có thể kết cặp nhầm với C để gây đột biến đồng hoán AT → GC ở lần tái bản sau.

• Đột biến gây ra bởi sự alkyl hoá của các bazơ

Một số chất trong môi trường là các chất có ái lực với điện tử (electrophyle); chúng tìm các trung tâm điện tích âm trong các phân tử khác và bám vào. Nhiều chất khác thuộc môi trường được chuyển hoá trong cơ thể thành ra các hợp chất có ái lực điện tử. Một trong những trung tâm điện tích âm rõ nhất trong sinh học là phân tử ADN. Mỗi nucleotide chứa một điện tích âm toàn phần trên phosphate và các điện tích âm từng phần trên các bazơ. Khi các chất ái lực điện tử bắt gặp các trung tâm điện tích âm này, chúng sẽ tấn công, thông thường là gắn thêm các nhóm chứa carbon - nhóm alkyl, gọi là alkyl hoá (alkylation).

Nhiều tác nhân gây ung thư (carcinogen) là các chất ái lực điện tử dường như hoạt động bằng cách tấn công ADN và alkyl hoá nó. Nhiều tác nhân đột biến được sử dụng trong phòng thí nghiệm để gây tạo các đột biến cũng là các tác nhân alkyl hoá, ví dụ ethylmethane sulfonate (EMS). Khi xử lý bằng EMS (Hình 7.9), hoá chất này nhường nhóm ethyl (CH3-CH2) cho ADN mà cụ thể là cho oxy O6 của guanine tạo ra O6-alkylguanine. Bazơ được alkyl hoá này cặp với thymine thay vì cytosine. Kết quả là sinh ra đồng hoán GC → AT ở lần tái bản sau.

Page 118: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

118

Hình 7.8. Các chất tương tự nucleoside. Dạng keto phổ biến của 5-BU là chất tương tự thymidine, có thể cặp với A (a); còn dạng ion hoá (enol) của 5-BU có thể cặp với G (b). 2-aminopurine (2-AP) là chất tương tự adenosine, có thể cặp với T (c); khi ở dạng proton hoá, nó có thể cặp với C (d).

Hình 7.9. Alkyl hóa của bởi EMS. Bên trái là cặp bazơ guanine–cytosine bình thường. Lưu ý oxy O6 tự do (màu đỏ) trên guanine. Ethylmethane sulfonate (EMS) cho một nhóm ethyl (đậm có gạch) vào oxy O6, tạo ra O6-ethylguanine (hình bên phải), ở đó xảy ra kết cặp bazơ với thymine thay vì cystosine. Sau nhiều hơn một lần tái bản, một cặp bazơ A–T sẽ thay thế một cặp G–C. Đây là đột biến đồng hoán GC → AT.

1.4.2. Các tác nhân vật lý

Trong số tác nhân phóng xạ gây đột biến, các tia tử ngoại, tia gamma và tia X là phổ biến trong tự nhiên và trong các thí nghiệm gây đột biến. Các loại bức xạ khác nhau gây ra các kiểu tổn thương khác nhau.

Các tia cực tím (ultraviolet radiation = UV) có năng lượng tương đối thấp, và chúng gây ra kiểu tổn thương vừa phải, đó là các dimer pyrimidine mà phổ biến là dimer thymine (–T=T–; Hình 7.11). Tổn thương này biểu hiện ở sự biến dạng của chuỗi xoắn kép, làm cản trở sự kết cặp của các bazơ purine (Adenine) trong tái bản. Hậu quả là có thể làm chết tế bào hoặc tạo ra đột biến do việc lắp sai nucleotide vào vị trí đối diện với dimer trong khi tái bản. Loại bức xạ cực tím làm tổn thương ADN nặng nhất ở bước sóng khoảng 260 nm, là vùng sóng mà ADN hấp thụ mạnh nhất. Bức xạ này có rất nhiều trong ánh sáng mặt trời và có nguy cơ gây ung thư da (Hình 7.10).

Hình 7.10. Các biểu hiện ở kiểu hình lâm sàng của những người bị bệnh ung thư da (Xeroderma pigmentosum), chủ yếu do tác động của các tia cực tím.

Các tổn thương do bức xạ cực tím đối với ADN (dimer thymine) có thể được sửa chữa trực tiếp bằng photolyase; enzyme này sử dụng năng lượng ánh sáng từ bước sóng gần với tia UV đến ánh sang xanh để cắt đứt các liên kết giữ hai pyrimidine với nhau.

Các tia gamma và tia X có năng lượng lớn hơn nhiều; chúng ion hóa các phân tử xung quanh ADN và tạo thành các gốc tự do có khả năng phản ứng cao: tấn công ADN, biến đổi các bazơ hoặc làm đứt gãy các sợi.

Page 119: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

119

Hình 7.11. Sự hình thành dimer thymine bởi tia cực tím (UV). (a) Ví dụ dimer T; (b) Tổng quát cho dimer pyrimidine, chú ý vòng cyclobutan.

� Hồi biến (reversion) hay đột biến ngược (back-mutation) là đột biến quay lại kiểu hình ban đầu. Các đột biến gây ra bởi các bazơ tương đồng hoặc HNO2 có thể hồi biến bằng cách tiếp tục xử lý chính tác nhân đó. Tuy nhiên một số chất như hydroxylamine vì chỉ phản ứng đặc thù với cytosine và làm phát sinh đồng hoán một chiều GC → AT, nên không thể hồi biến bằng chính nó.

2. Tổn thương và sửa chữa ADN

Sửa chữa ADN là đặc tính thiết yếu của các tế bào nhằm phục hồi cấu trúc ADN bị tổn thương do các tác nhân lý-hoá hoặc tự phát trong quá trình tái bản ADN. Có nhiều hệ thống sửa sai trong các tế bào. Tựu trung có các cơ chế cơ bản sau: đọc sửa trong lúc tái bản nhờ một số ADN polymerase (như đã đề cập), quang phục hoạt, cắt bỏ bazơ hoặc nucleotide và sửa chữa sau tái bản. Tỷ lệ đột biến tự nhiên nói chung thấp là nhờ tính hiệu quả của các hệ thống sửa sai này.

2.1. Sửa chữa bằng quang phục hoạt

Quang phục hoạt (photoreactivation) là kiểu sửa chữa xảy ra dưới tác dụng của ánh sáng, nên còn gọi là sửa chữa ngoài sáng (light repair). Nó được xúc tác bởi enzyme ADN photolyase. Cơ chế sửa chữa dimer thymine bởi enzyme này được hình dung như sau: (i) phát hiện và bám vào vị trí ADN bị tổn thương; (ii) enzyme hấp thụ ánh sáng có bước sóng 320-370 nm, và được kích hoạt để có thể cắt đứt các liên kết vốn tạo ra dimer, làm phục hồi trạng thái bổ sung giữa các bazơ của hai sợi; và (iii) hư hại được chữa xong, và enzyme rời khỏi ADN.

Page 120: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

120

Hình 7.12. Mô hình về quang phục hoạt (xem giải thích trong bài).

2.2. Sửa chữa bằng cắt bỏ

Sự sửa chữa bằng cắt bỏ (excision repair) được thực hiện bởi các enzyme đặc thù và không cần ánh sáng, nên gọi là sửa chữa trong tối (dark repair). Sự tách bỏ vùng ADN hư hại và thay bằng ADN mới xảy ra bằng cách hoặc cắt bỏ bazơ hoặc cắt bỏ nucleotide. (Hình 7.12 và 7.13)

Đối với sự sửa chữa bằng cách cắt bỏ nucleotide (nucleotide excision repair), chẳng hạn, tổn thương bazơ hàng loạt, kể cả dimer thymine, cũng có thể tách bỏ trực tiếp mà không cần sự giúp đỡ của ADN glycosylase. Ở E. coli, enzyme chủ chốt của quá trình này là urvABC endonuclease (vì nó chứa ba polypeptide của các gen urvA, urvB và urvC). Enzyme này cắt một đoạn dài 12-13 nucleotide trên một sợi, tuỳ thuộc vào sai hỏng ảnh hưởng lên một nucleotide (alkyl hoá) hoặc hai nucleotide (dimer). Khoảng trống này sẽ được lấp đầy nhờ ADN polymerase I. Và cuối cùng, ADN

ligase sẽ hàn gắn các khe hở (Hình 7.14).

Hình 7.13. Sửa chữa bằng cách cắt bỏ bazơ ở E. coli. (a) ADN glycosylase nhận biết bazơ bị tổn thương. (b) ADN glycosylase loại bỏ bazơ, để lại vị trí apurine hay apyrimidinine gọi là AP trên sợi ADN phía dưới. (c) Một AP endonuclease cắt ADN ở đầu 5' của vị trí AP. (d) ADN phosphodiesterase loại bỏ AP-deoxyribose phos-phate mà đã bị cắt rời bởi ADN glycosylase, (e) ADN polyme-rase I lấp khoảng trống và tiếp tục sửa chữa một số nucle-otide mới theo chiều 5'→3'. (f) ADN ligase hàn liền khe hở.

Hình 7.14. Sửa chữa bằng cách cắt bỏ nucleotide ở E. coli. (a) UrvABC excinuclease cắt bỏ một trong hai bên của bazơ tổn thương có dạng búp. (b)

Page 121: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

121

Điều này giúp loại bỏ một oligonucleotide ~12 nucleotide. Nếu tổn thương là một dimer pyrimidine lúc đó oligonu-cleotide dài 13 đơn phân thay vì 12. (c) ADN polymerase I lấp đầy khoảng trống, bằng cách sử dụng đầu 3' của sợi trên để làm khuôn, sau đó ADN ligase hàn liền khe hở.

3. Tái tổ hợp (Recombination)

Tái tổ hợp là sự trao đổi vật liệu di truyền tạo ra các tổ hợp gen mới trong các phân tử ADN thế hệ con, là nhân tố quan trọng trong tiến hoá. Nói đến tái tổ hợp là nói đến sự trao đổi sợi hay trao đổi chéo có thể xảy ra nội trong phân tử (do sự vặn xoắn và đứt-nối của một sợi) hoặc có liên quan giữa hai phân tử với cơ chế thuận nghịch hoặc không thuận nghịch. Có ba kiểu tái tổ hợp khác nhau về căn bản:

(1) Tái tổ hợp đặc hiệu vị trí (site-specific recombination) phụ thuộc vào trình tự tương đồng

được giới hạn giữa các ADN tái tổ hợp. Ví dụ điển hình là sự xen của ADN phage λ vào ADN vật

chủ.

(2) Tái tổ hợp tương đồng (homologous) hay đôi khi được gọi là tái tổ hợp chung (generalized) là loại tái tổ hợp xảy ra trong giảm phân. Đây là dạng phổ biến nhất của tái tổ hợp, phụ thuộc vào độ tương đồng về trình tự rộng rãi giữa các phân tử ADN tham gia.

(3) Tái tổ hợp không chính thức (illegimate) cũng cần có một sự tương đồng nhỏ nào đó giữa các ADN tái tổ hợp, nhưng không đặc thù. Các yếu tố di truyền vận động thường sử dụng con đường tái tổ hợp ngoại lệ này.

Hình 7.15. Ảnh hiển vi điện tử về sự tái tổ hợp của ADN plasmid.

Các mô hình hiện nay về cơ chế tái tổ hợp tương đồng thống nhất gồm các bước thiết yếu nhưng không nhất thiết theo thứ tự, như sau: (1) kết cặp của hai ADN tương đồng; (2) đứt gãy của hai trong số các sợi ADN tương đồng; (3) tái tạo các liên kết phosphodiester để nối li ền hai sợi tương đồng (hoặc các vùng của cùng một sợi trong tái tổ hợp nội phân tử); (4) đứt gãy hai sợi khác và nối chúng lại. Cơ chế cơ sở do Robin Holliday đưa ra vào năm 1964 nên gọi là mô hình

Holliday. Tổng quát, mô hình này dựa trên việc tạo ra một cầu chéo có thể di chuyển dọc theo hai

Page 122: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

122

chuỗi xoắn kép khác nhau và sau đó cắt đứt cấu trúc trung gian theo một trong hai cách để tạo ra các kiểu phân tử ADN tái tổ hợp khác nhau. Hình 7.16 về tái tổ hợp tương đồng là mô hình Holliday đã được cải biên.

Hình 7.16. Con đường tái tổ hợp tương đồng với sự tham gia của các protein tái tổ hợp RecBCD. Đầu tiên, RecBCD tạo các vết đứt; sau đó các protein RecA và SSB xúc tiến sự xâm nhập sợi, tạo ra bắt chéo hay là chỗ nối Holliday; RuvA và B thúc đẩy sự di chuyển theo nhánh bên; RuvC tạo các vết nứt làm dung giải cấu trúc này thành ra các ADN tái tổ hợp.

DNA của một chromatid không chị em (''1') bị cắt đứt xuyên qua cả hai sợi (một sự “đứt gãy sợi kép”)

Một enzyme gặm dần phía đầu 5' của mỗi sợi, để lại hai cái “đuôi” 3' của DNA sợi đơn. Khoảng này có thể dài 600-800 bazơ và có lẽ được ổn định bằng các protein chuyên hoá cho chức năng đó.

1. Một trong các đuôi sợi đơn tự nó xen giữa chuỗi xoắn kép của chromatid không chị em “2” (màu đỏ) làm tách các sợi đơn của nó. 2. Nếu sợi “xâm nhập” tìm thấy một trình tự các nucleotide bổ sung với nó thì sẽ xảy ra sự kết cặp. 3. Sợi thế chỗ (màu đỏ phía trên) cặp với đuôi 3' thứ hai của chromatid 1. 4. Tổng hợp DNA lấp cả hai khoảng trống (các sọc xanh) nhờ sử dụng cả hai sợi của chromatid 2 (đỏ) làm khuôn.

Tất cả các sợi được cắt và các đầu mút bị cắt của một chromatid được trao đổi và nối lại bằng liên kết đồng hoá trị với các đầu mút bị cắt của chromatid khác. Nếu điều này xảy ra, các chromatid không chị em sẽ có các vai trao đổi và trao đổi chéo là hoàn toàn (phía dưới).

Page 123: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

123

4. Các yếu tố di truy ền vận động

4.1. Đại cương về các yếu tố di truyền vận động

Yếu tố di truyền vận động (transposable genetic element = TGE) là những đoạn ADN có khả năng di chuyển sang các vị trí mới trong bộ gen tế bào, nghĩa là không có vị trí cố định trên nhiễm sắc thể. Trong quá trình này, chúng có thể gây ra các đột biến và gia tăng hoặc giảm hàm lượng ADN trong bộ gen. Hiện tượng này được phát hiện lần đầu tiên bởi B. McClintock năm 1952 ở ngô (Zea mays). Chính công trình này đã mang lại cho bà giải thưởng Nobel năm 1984. Ngày nay, các yếu tố di truyền vận động được phát hiện ở nhiều virus, vi khuẩn và eukaryote.

4.2. Các yếu tố di truyền vận động ở prokaryote

4.2.1. Đoạn xen

Đoạn xen (insertion sequence = IS) là loại yếu tố di truyền vận động đơn giản nhất, có cấu trúc khá giống nhau ở các sinh vật và cần thiết cho quá trình tách và xen của các yếu tố này. Ở E. coli có các nhóm đoạn xen: IS1, IS2, IS3, IS4, IS5 ; chúng có thể phân bố rải rác trên NST và các plasmid. Ví dụ, IS1 (Hình 7.17) có khoảng 5-8 bản sao trên NST với chiều dài 768 bp; gồm một gen transposase mã hoá enzyme chuyển vị 720 bp, nằm giữa hai đoạn lặp đảo ngược hay ngược chiều (inverted repeat = IR) dài 24 bp.

Hình 7.17 Cấu trúc của một đoạn xen, ở đây là IS1. [Từ Russell, 2009]

4.2.2. Gen nhảy

Các yếu tố IS riêng lẻ không chỉ có khả năng tự di chuyển mà khi hai yếu tố này nằm đủ gần nhau thì chúng có thể vận động như một đơn vị hoàn chỉnh và mang theo các gen nằm giữa chúng. Cấu trúc phức tạp như thế gọi là gen nhảy (jumping gene) mà thuật ngữ là transposon (Tn). Ví dụ gen nhảy Tn 1681 ở E. coli gồm hai đoạn xen IS1 nằm ở hai đầu của một gen xác định độc tố chịu nhiệt gây ỉa chảy có kích thước 552 bp.

Có hai kiểu tổ chức transposon ở vi khuẩn:

(1) Transposon hỗn hợp, ví dụ Tn10 (Hình 7.18a) mang gen kháng tetracylin nằm giữa hai yếu tố IS10 ngược chiều (bên trái và bên phải, ký hiệu là IS10L và IS10R).

(2) Transposon đơn giản, ví dụ Tn3 (Hình 7.18b) mang cụm [gen transposase + gen phân tách resolvase + gen β-lactamase] và ở hai đầu là các đoạn lặp ngược chiều IR với 38 bp giống nhau.

Page 124: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

124

(a)

(b)

Hình 7.18. Cấu trúc của các gen nhảy Tn10 (a) và Tn3 (b). [Từ Russell, 2011]

4.2.3. Mô hình xen của gen nhảy

Hình 7.19 cho thấy một đoạn xen IS hay một gen nhảy đơn giản bằng quá trình “cắt và dán”, nó được chèn vào một vị trí bất kỳ trong ADN nhiễm sắc thể vật chủ. Quá trình này đòi hỏi một enzyme được mã hoá bên trong nó là transposase. Có thể hình dung cơ chế xen điển hình của một transposon như sau:

(1) Đầu tiên, enzyme này bám vào cả hai đầu mút của transposon (gồm cả các đoạn lặp đảo ngược, IR).

(2) Kế đó, enzyme transposase nhận biết một trình tự ADN đặc thù như là vị trí đích (target site) của chúng và cắt theo kiểu zigzag tạo ra các “đầu dính” (sticky end) tựa như một số enzyme giới hạn; nhưng một số transposase khác có thể xen transposon vào bất cứ chỗ nào trong bộ gen.

(3) Sau khi transposon được gắn vào ADN vật chủ, các khoảng trống được lấp đầy theo nguyên tắc bổ sung nhờ tác dụng của ADN polymerase và ligase. Vì vậy tạo ra các đoạn lặp cùng chiều (direct repeat) giống nhau ở mỗi đầu mút của transposon.

Hình 7.19. Một mô hình xen của một gen nhảy. [Từ Russell, 2011]

Page 125: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

125

4.3. Các yếu tố di truyền vận động ở eukaryote

Các yếu tố di truyền vận động ở eukaryote được chia làm ba kiểu: (1) Các retrotransposon hay TGE lớp I; trước tiên chúng phiên mã ADN thành ARN và sau đó sử dụng enzyme phiên mã ngược để tạo ra một bản sao ADN của ARN để xen vào một vị trí mới; (2) Các ADN transposon lớp II bao gồm chỉ các đoạn ADN trực tiếp di chuyển từ vị trí này sang vị trí khác; (3) Các ADN transposon lớp III, hay yếu tố vận động lặp lại-đảo ngược bé (miniature inverted-repeat transposable element = MITE).

• Các retrotransposon hay TGE lớp I

Các retrotransposon di chuyển bằng cơ chế “cắt và dán” nhưng khác với các transposon đã được mô tả ở trên, bản sao được làm bằng ARN, chứ không phải ADN. Các bản sao ARN này sau đó được phiên mã thành ADN nhờ enzyme phiên mã ngược, và chúng bắt đầu xen vào các vị trí mới trong bộ gen. Nhiều retrotransposon có các đoạn lặp tận cùng dài (long terminal repeat = LTR), tại các đầu mút của chúng có thể chứa trên 1.000 cặp bazơ ở mỗi đầu. Giống như các ADN transposon, chúng tạo ra các đoạn lặp cùng chiều tại các vị trí mới được xen vào. Có khoảng 40% toàn bộ bộ gen người gồm các retrotransposon. HIV-1 - nguyên nhân gây bệnh AIDS - và nhiều retrovirus khác ở người (HTLV-1 là loại virus gây bệnh bạch cầu tế bào-T) có tập tính giống như các retrotransposon.

Lưu ý: (1) Các retrovirus điển hình như HIV-1 có bộ gen ARN - có chứa một gen cho enzyme phiên mã ngược và một gen cho integrase - có cùng chức năng như các transposase của các ADN transposon. Nhờ vậy các bản sao ADN có thể được chèn vào bất cứ đâu trong bộ gen. (2) Trong bộ gen người chứa khoảng 850.000 yếu tố phân tán dài gọi là các LINE (long interspersed element); chiếm khoảng 21% bộ gen. Các LINE này khá đa dạng về kích thước và chức năng. (3) Các yếu tố phân tán ngắn gọi là các SINE (short interspersed element). Đó là các đoạn ADN ngắn (100-400bp). Các SINE phong phú nhất là các yếu tố Alu (Alu element). Trong bộ gen người có trên một triệu bản sao của các yếu tố Alu này (chiếm 11% toàn bộ ADN). Các yếu tố Alu gồm một trình tự 300 bp có chứa một vị trí nhận biết của enzyme cắt giới hạn AluI. Dường như chúng là các bản sao ngược của ARN 7S. Hầu hết các SINE không mã hoá bất kỳ phân tử chức năng nào và nó phụ thuộc vào bộ máy của các yếu tố L1 có hoạt tính (nhóm LINE) để được sao chép và gắn vào các vị trí mới (Hình 7.20).

Hình 7.20. Có tới hàng ngàn yếu tố Alu trong bộ gen chúng ta chèn vào trong các intron của các gen cấu trúc như thế này. Một số có thể được phiên mã thành bản sao sơ cấp và một số sau quá trình splicing vẫn được nối vào mARN trưởng thành để tạo ra một exon mới (EXON), và sau đó sẽ được dịch mã thành một sản phẩm protein mới.

• Các ADN transposon lớp II

Đó là các đoạn ADN trực tiếp di chuyển từ vị trí này sang vị trí khác bằng cơ chế giống như ở vi khuẩn đã được trình bày ở trên. Điển hình là các transposon được khám phá đầu tiên ở ngô vào thập niên 1940 bởi Barbara McClintock. Tuy nhiên, các yếu tố P (P element; Hình 7.21) là những

Page 126: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

126

transposon lớp II được phát hiện đầu tiên ở ruồi giấm Drossophila. Chúng gây hại một ít do sự biểu hiện của gen transposase thường bị ức chế. Tuy nhiên khi lai các con đực có các yếu tố P với các con cái thiếu yếu tố này, transposase lại có hoạt tính trong dòng mầm sinh ra nhiều đột biến làm cho đời con của chúng bị bất dục. Các yếu tố P cung cấp những công cụ giá trị cho các nhà di truyền học ruồi giấm. Các transposon khác được nghiên cứu về khả năng của chúng để tạo ra các côn trùng chuyển gen có tầm quan trọng trong nông nghiệp và y tế cộng đồng.

Yếu tố copia (Hình 7.21) của ruồi giấm có cấu trúc tương tự yếu tố Ty của nấm men, dài ~5.000 cặp bazơ với hai đoạn lặp cùng chiều ~300 cặp bazơ ở hai đầu. Chúng có mặt 10-100 lần trong bộ gen ruồi giấm.

Hình 7.21. Cấu trúc của các yếu tố copia và yếu tố P ở ruồi giấm Drosophila.

Hình 7.22. Cấu trúc của các yếu tố Ac và Ds ở ngô (Zea mays).

Ở ngô, các yếu tố Ac và Ds (Hình 7.22) là thành viên của họ transposon đơn giản, có thể di chuyển trên nhiễm sắc thể, tác động lên các gen kiểm tra màu sắc của các hạt aleuron. Các yếu tố này được phân lập cho thấy có liên quan với ADN transposon của vi khuẩn và của các eukaryote khác. Giống như yếu tố P của ruồi giấm, yếu tố Ac có đoạn cuối lặp lại đảo ngược mã hóa cho transposase, nhưng yếu tố Ds không mã hóa cho transposase. Khi Ac có mặt trong bộ gen, transposase của nó có thể bám vào đầu mút của cả hai yếu tố Ac và Ds và khởi động sự chuyển vị

Page 127: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

127

của chúng.

Ở nấm men, mỗi tế bào có ~35 bản sao của gen nhảy phổ biến nhất là Ty (Hình 7.23). Yếu tố

này dài khoảng 5.900 cặp bazơ, trong đó các đoạn lặp cùng chiều, tức đoạn delta (δ), dài 340 cặp

bazơ. Nhiều đột biến ngẫu nhiên được phân lập ở ruồi giấm cho thấy cũng chứa retrotransposon.

Hình 7.23. Cấu trúc của yếu tố Ty ở nấm men bia (Sacchromyces cerevisiae).

• Các ADN transposon lớp III

Đây là các yếu tố vận động lặp lại-đảo ngược bé (miniature inverted-repeat transposable element = MITE). Việc xác định đầy đủ trình tự các bộ gen gần đây của lúa và C. elegans đã phát hiện ra rằng bộ gen của chúng có chứa hàng ngàn bản sao của một motif lặp lại, bao gồm hầu như các trình tự giống nhau dài ~400 cặp bazơ, kèm ở hai bên là các đoạn lặp đảo ngược đặc trưng dài khoảng 15 cặp bazơ, chẳng hạn:

5'GGCCAGTCACAATGG..~400bp..CCATTGTGACTGGCC3' 3' CCGGTCAGTGTTACC..~400 bp..GGTAACACTGACCGG 5'

Các MITE là quá bé để mã hoá cho bất cứ protein nào. Trong bộ gen của cây lúa có hơn 100.000 MITE (chiếm ~6% bộ gen). Một số đột biến phát hiện được trong các giống lúa nhất định được gây ra bởi sự xen vào của một MITE trong gen. Các MITE cũng phát hiện được trong bộ gen của người, cóc Xenopus và cây táo tây.

4.4. Các gen nhảy và đột biến

Các transposons là các tác nhân gây đột biến. Chúng có thể gây đột biến theo nhiều cách, dưới đây là một số trường hợp: (i) Nếu một transposon tự nó xen vào trong một gen chức năng, nó có thể làm hư hại gen đó. Việc xen vào các exon, intron và thậm chí vào trong ADN kề hai đầu các gen (mà có chứa các promoter và enhancer) có thể phá huỷ hoặc thay đổi hoạt tính của gen. (ii) Việc sửa chữa tạo các khoảng trống để lại ở các vị trí cũ có thể dẫn đến đột biến tại đó. (iii) Các SINE (hầu hết là các trình tự Alu) và các LINE chỉ gây ra một tỷ lệ thấp các đột biến ở người. Tuy nhiên, chúng được coi là nguyên nhân của các đột biến chịu trách nhiệm cho một số bệnh di truyền ở người, bao gồm: Hemophilia A (gen của nhân tố VIII) và hemophilia B (gen của nhân tố IX); suy giảm miễn dịch phối hợp liên kết-X (SCID); rối loạn dưỡng cơ Duchenne v.v.

TÓM T ẮT

(1) Bộ gen các sinh vật có khả năng bị biến đổi bởi các quá trình và mức độ khác nhau. Ở mức phân tử, bao gồm: các đột biến gen tự phát xảy ra trong tái bản ADN, do tác động của các tác nhân vật lý và hóa hoc từ môi trường; các biến dị tổ hợp; và các yếu tố di truyền vận động.

(2) Các nguồn biến đổi di truyền sơ cấp và thứ cấp trong ADN rất cần thiết cho quá trình chọn lọc và tiến hóa của sinh giới. Các nhà khoa học đã lợi dụng hiểu biết ấy để gây tạo các giống vật

Page 128: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

128

nuôi và cây trồng mới cũng như khắc phục và điều trị các bệnh tật ở người.

(3) Trong bộ máy di truyền của tế bào có các hệ thống hạn chế sự phát sinh các đột biến gen tự phát cũng như sửa chữa các tổn thương trong ADN do các tác nhân vật lý và hóa học gây ra.

CÂU HỎI VÀ BÀI T ẬP

121. Chứng minh rằng đột biến gây bệnh hồng cầu hình lưỡi li ềm (HbS) gây ra không phải bởi sự thay thế AT bằng GC mà là TA → AT. Đột biến này thuộc kiểu nào và có tác hại ra sao?

122. Một protein nào đó có axit amin Gly ở một vị trí xác định. Giả sử đã phân lập được 4 thể đột biến thay vì có Gly, chúng lại có các axit amin tương ứng là Ala, Arg, Trp, và Leu. Các codon có thể có cho các axit amin đó là gì, và codon nào là có khả năng được dùng cho Gly?

123. Phân biệt các dạng đột biến gen HbS, HbC và HbE. Tại sao các chuỗi anpha trong các dạng HbCS và HbW1 có số gốc axit amin nhiều hơn trong chuỗi anpha của dạng bình thường (HbA)?

124. Giải thích cơ chế phát sinh đột biến đồng hoán hai chiều của tác nhân gây đột biến 5-bromouracil.

125. Dựa vào tính chất hỗ biến của các bazơ, hãy giải thích: Tại sao trong thực tế bắt gặp chủ yếu các đột biến đồng hoán hơn là các dị hoán?

126. Thế nào là đột biến gen? Trình bày sơ lược các dạng đột biến điểm và cho một số ví dụ thích hợp phát hiện được ở người.

127. Phân biệt các cặp khái đột biến dưới đây và cho ví dụ: a) Đồng hoán và dị hoán; b) Đột biến nhầm nghĩa và vô nghĩa; c) Đột biến thay thế và dịch khung; d) Đột biến im lặng và trung tính..

128. Giả sử bạn nghiên cứu một gen của E. coli mã hóa cho một protein cụ thể, và một đoạn bình thường của của protein đó như sau: -Ala - Pro - Trp - Ser - Glu - Lys - Cys - His. Biết rằng bốn thể đột biến thuộc gen này đều cho enzyme bất hoạt, với trình tự axit amin như sau:

Thể đột biến 1: - Ala - Pro - Trp - Arg - Glu - Lys - Cys -His

Thể đột biến 2: - Ala - Pro

Thể đột biến 3: - Ala - Pro - Gly - Val - Lys - Asn - Cys - His

Thể đột biến 4: - Ala - Pro - Trp - Phe - Phe - Thr - Cys - His

Cơ sở phân tử của mỗi thể đột biến trên là gì? Trình tự ADN xác định cho đoạn polypeptide thuộc kiểu dại là gì?

129. Dimer thymine là gì, gây ra bởi tác nhân gây đột biến nào và có tác hại ra sao? Cơ chế sữa chữa dạng đột biến này diễn ra như thế nào?

130. Trình bày hiểu biết của bạn về tác động của bức xạ cực tím lên ung thư da ở người và nêu các biện pháp phòng tránh.

131. Các tế bào có khả năng hạn chế sự phát sinh các đột biến gen tự phát trong quá trình tái bản ADN như thế nào? Và có các kiểu sửa chữa nào đối với các tổn thương trong ADN?

Page 129: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

129

132. Có những kiểu tái tổ hợp nào? Hãy trình bày ngắn gọn mô hình Holliday về cơ chế tái tổ hợp tương đồng.

133. Yếu tố di truyền vận động là gì? Hãy nêu những điểm giống và khác nhau giữa các đoạn xen và gen nhảy. Vẽ hai sơ đồ minh họa.

134. Phân tích và minh họa một mô hình xen của gen nhảy. Hậu quả của hiện tượng ấy là gì?

135. Sử dụng các ví dụ thích hợp để xác nhận sự tồn tại phổ biến của các yếu tố di truyền vận động trong bộ gen các sinh vật khác nhau.

Page 130: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

130

Chương 8

CÁC PHƯƠNG PHÁP SINH HỌC PHÂN TỬ

VÀ CÔNG NGHỆ ADN TÁI T Ổ HỢP

Kể từ ngày sinh học phân tử ra đời (1953) và phát triển cho đến nay có hàng loạt kỹ thuật và phương pháp nghiên cứu khác nhau được phát minh ra nhằm đáp ứng các nghiên cứu trong các lĩnh vực khác nhau. Đỉnh cao của sự phát triển ấy là sự ra đời và phát triển vượt bậc của kỹ thuật di

truyền (genetic engineering) và công nghệ ADN tái tổ hợp (recombinant DNA technology) từ những năm 1970, mà nền tảng của chúng là các hiểu biết về các plasmid và việc phát hiện enzyme cắt giới hạn đầu tiên (1970) ở vi khuẩn. Sự phát triển nhanh chóng của lĩnh vực này không những đã đưa lại khối lượng tri thức khổng lồ về cấu trúc và cơ chế hoạt động của các gen, các bộ gen sinh vật mà còn trở thành lực lượng sản xuất trực tiếp của xã hội như: sản xuất hàng loạt các chế phẩm y-sinh học hữu ích từ các tế bào vi khuẩn, nấm men; tạo các giống sinh vật mới... góp phần giải quyết những vấn đề thực tiễn đặt ra trong y học và trong nông lâm ngư nghiệp.... Và thành tựu vĩ đại gần đây là việc xác định đầy đủ trình tự bộ gen người cùng với bộ gen của nhiều sinh vật khác, đã mở ra một kỷ nguyên mới - kỷ nguyên bộ gen, với các lĩnh vực nghiên cứu mới đồng loạt ra đời như: Genomics, Proteomics, Transcriptomics v.v.

Trong chương này chúng ta sẽ tìm hiểu những nét đại cương về: (i) Các phương pháp thông dụng của Sinh học phân tử; (ii) Các công cụ và phương pháp tạo dòng ADN tái tổ hợp; và (iii) Ứng dụng của công nghệ ADN tái tổ hợp và kỹ thuật di truyền trong các lĩnh vực khác nhau của khoa học, sản xuât và đời sống xã hội.

1. Các phương pháp thông dụng của Sinh học phân tử

Như chúng ta đã biết, kể từ khi sinh học phân tử ra đời và phát triển cho đến nay có hàng loạt kỹ thuật và phương pháp nghiên cứu khác nhau được phát minh ra nhằm đáp ứng các nghiên cứu trong các lĩnh vực khác nhau của khoa học, công nghệ, sản xuât và đời sống xã hội. Có đến hàng trăm cuốn sách dày mô tả các kỹ thuật, các phương pháp và quy trình công nghệ liên quan đến sinh học phân tử, kỹ thuật di truyền và công nghệ gen, công nghệ protein, công nghệ enzyme...

Có thể kể ra đây một số phương pháp như vậy để chúng ta thấy rằng, chúng là vô số, mà một số trong chúng đã được đề cập sơ lược và rải rác trong giáo trình. Đó là các phương pháp hiển vi điện tử (dùng trong nghiên cứu cấu trúc các phân tử); đánh dấu đồng vị phóng xạ (S35, P32, N15, triti v.v.); các phương pháp sắc ký (trong phân tích thành phần hóa học của protein, ADN và ARN), sắc ký lỏng, sắc ký ái lực, sắc ký lọc gel hay sắc ký trao đổi ion; phương pháp nhiễu xạ Rơngen (do L. Pauling phát minh năm 1949, dùng trong nghiên cứu cấu trúc phân tử protein và sau này là ADN); ly tâm siêu tốc; điện di gel (protein và ADN); phóng xạ tự ghi; phương pháp giải mã di truyền in

vitro do M. Nirenberg và H. Khorana đề xuất (1961); các phương pháp xác định trình tự nucleotide (bằng con đườn hóa học của Maxam Gilbert, bằng enzyme của F. Sanger, xác định trình tự ADN tự động); sử dụng các mẩu dò đánh dấu; các phương pháp lai phân tử axit nucleic; phương pháp Southern blots (dù trong trong lập bản đồ giới hạn chẳng hạn), Northern blots…; các phương pháp kiến tạo các ADN tái tổ hợp trong ống nghiệm; các phương pháp tạo dòng cADN; các phương pháp biến nạp ADN tái tổ hợp; các phương pháp biểu hiện các gen được tạo dòng; vi tiêm; gây đột biến định hướng vị trí (site-directed mutagenesis dùng trong kỹ thuật protein…) bởi M. Smith; phương

Page 131: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

131

pháp PCR do K. Mullis đề xuất (1985) cùng hàng loạt các phương pháp cải biên của nó về sau này; các phương pháp RFLP, AFLP…; chip ADN và phân tích vi mảng ADN; phương pháp FISH; phân tích chuỗi của sự biểu hiện gen (SAGE); … Hàng loạt các phương pháp toán học xác suất và thống kê hiện đại ra đời đã được đưa vào ứng dụng từ rất sớm. Đặc biệt, cùng với sự phát triển của máy tính và công nghệ thông tin đã hình thành nên một lĩnh vực ứng dụng vô cùng mới mẻ và rộng lớn, với hiệu quả và giá trị vô song trong Sinh học phân tử và kỹ thuật di truyền ngày nay, đó là Tin-Sinh

học (Bioinformatics).

Dưới đây chỉ lược trình vài phương pháp đại diện, có tính thông dụng.

1.1. Lai phân tử axit nucleic và sử dụng các mẩu dò

Người ta lợi dụng khả năng nói trên của ADN để tạo ra các phân tử ADN lai bằng cách làm lạnh từ từ hỗn hợp các ADN biến tính từ hai loài khác nhau. Kỹ thuật lai phân tử (Hình 8.1) này đã được ứng dụng rộng rãi để xác định mức độ tương đồng ADN của các nhóm phân loại khác nhau. Trên nguyên tắc, nếu mức độ tương đồng càng lớn thì số lượng các đoạn lai càng lớn và ngược lại. Ví dụ, các thực nghiệm cho thấy có khoảng 25% tổng số ADN người và chuột có thể lai với nhau. Thông thường, mức độ lai được xác định bằng các phương pháp sắc ký hoặc ly tâm, trong đó một loại ADN được đánh dấu bằng đồng vị phóng xạ. Hiện giờ các kỹ thuật này được áp dụng khá rộng rãi trong các nghiên cứu sinh học phân tử cũng như trong các lĩnh vực điều tra hình sự hoặc phát hiện sớm một số bệnh phân tử để điều trị kịp thời.

Hình 8.1. Biến tính và hồi tính của ADN (trái) và lai axit nucleic.

Tóm lại, theo nghĩa rộng, lai phân tử được hiểu là sự tương tác bổ sung giữa các mạch đơn axit nucleic. Nó có thể xảy ra giữa hai mạch ADN, giữa các mạch ADN và ARN, hoặc giữa hai mạch ARN, và đó chính là cơ sở của nhiều kỹ thuật, như: lai một mẩu dò có đánh dấu đồng vị phóng xạ (radioactive probe) để lọc ra ADN hay ARN bám vào màng lai - là một trong những thí nghiệm quan trọng

Hình 8.2 Sử dụng mẫu dò ADN để tìm đoạn đích.

Page 132: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

132

trong sinh học phân tử. Hai kiểu cơ bản của lai phân tử là phương pháp lai Southern (Southern blots) và lai

Northern (Northern blots).

Trong đó, kiểu đầu lai bằng một mẩu dò để phát hiện, định lượng một phân tử ADN xác định;

còn kiểu sau dùng để phát hiện, định lượng một phân tử ARN. Mẩu dò (probe) là công cụ sơ cấp

được dùng để xác định các trình tự bổ sung mà ta quan tâm, còn gọi là trình tự đích. Theo đó thì

một axit nucleic mạch đơn có đánh dấu phóng xạ được dùng để xác định một trình tự axit nucleic

bổ sung bám trên màng lọc nitrocellulose hay màng lai bằng nylon (Hình 8.2).

1.2. Phương pháp PCR

Những tiến bộ của công nghệ sinh học ngày nay có thể cho một ADN của vi sinh vật “sinh

trưởng” thậm chí ngay cả khi sinh vật đó khó nuôi cấy. Nhờ đó có đủ các mẩu ADN cho việc xác

định hầu như bất kỳ vi sinh vật nào có thể thu được từ một mẩu tiêu bản thậm chí không phải qua

nuôi cấy sinh vật đó. Đó chính là nhờ sự phát triển của phương pháp PCR (Polymerase Chain

Reaction).

PCR là một kỹ thuật cho phép khuyếch đại nhanh một mẩu ADN cụ thể trong ống nghiệm

(hơn là trong các tế bào sống như là E. coli). Với quy trình này người ta có thể tạo ra vô số bản sao

của một phân tử ADN đơn. Quy trình “tạo dòng in vitro” này được tóm tắt như sau (Hình 8.3):

• Để thực hiện một PCR, cần phải biết ít nhất một đoạn trình tự của phân tử ADN cần quan

tâm (ví dụ một mẩu máu).

• Sau đó phải tổng hợp các đoạn mồi (primer), tức các oligonucleotide ngắn (chứa khoảng 20

nucleotide) mà nó bổ sung chính xác với trình tự ở đầu 3' của mỗi một sợi của ADN cần khuyếch

đại.

• Mẩu ADN được đun nóng để tách các sợi đơn (biến tính) và trộn lẫn với các đoạn mồi.

• Nếu như các đoạn mồi tìm thấy các trình tự bổ sung trong ADN, chúng sẽ kết hợp vào các

sợi đó.

• Sự tổng hợp bắt đầu (bao giờ cũng theo chiều 5' → 3') bằng cách sử dụng sợi gốc làm

khuôn.

• Hỗn hợp phản ứng phải chứa tất cả bốn loại deoxynucleotide triphosphate (dATP, dCTP,

dGTP và dTTP) và một ADN polymerase chịu nhiệt (ví dụ, Taq polymerase được chiết xuất từ vi

khuẩn Thermus aquaticus - sống ở suối nước nóng - vẫn giữ được hoạt tính trong khi gây biến tính

ở nhiệt độ cao).

• Sự trùng hợp tiếp diễn chừng nào mỗi sợi đơn được tổng hợp mới còn chứa đủ vị trí được

nhận biết bởi đoạn mồi khác.

• Lúc này ta có hai phân tử ADN giống hệt phân tử ban đầu.

• Bây giờ ta lấy hai phân tử này cho biến tính và lặp lại quá trình đó.

• Sau mỗi chu kỳ số phân tử ADN lại tăng gấp đôi.

Page 133: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

133

Hình 8.3. Sơ đồ minh họa quy trình kỹ thuật PCR do Kary Mullis đề xuất.

Rõ ràng, phản ứng PCR tái bản ADN theo một cách thức tương tự với sự tái bản xảy ra trong

tế bào, ở chỗ:

(1) ADN sợi kép được tách thành các sợi đơn. Tuy nhiên, trong PCR, thì nhiệt chứ không phải

enzyme được dùng để làm biến tính ADN.

(2) Các mẩu nucleotide ngắn được dùng làm mồi để khởi đầu tái bản. Các đoạn mồi của PCR

được tổng hợp từ các deoxynucleotide. Chúng bổ sung với các trình tự ở hai đầu của gen quan tâm.

Một đoạn mồi kết dính vào đầu 3' của mỗi một sợi ADN bổ sung.

(3) ADN polymerase tiếp tục kéo dài sợi ADN mới từ đầu 3'-OH của các đoạn mồi. Sản phẩm

của sự tái bản bán bảo toàn này là hai sợi con.

Ưu thế của PCR là ở chỗ, cứ sau mỗi vòng hay chu kỳ tái bản thì thế hệ ADN sợi kép con lại

bị biến tính, nếu tiếp tục bổ sung các đoạn mồi thì quá trình này lại tiếp diễn. Nhờ sử dụng các thiết

bị tự động, mỗi chu kỳ tái bản có thể hoàn thành chưa đầy 5 phút. Bằng cách đó, từ một mẩu ADN

đơn có thể khuyếch đại lên 1.000 lần sau 10 chu kỳ (210 = 1.024 ≈ 103). Và sau 30 chu kỳ, từ một

phân tử ADN ban đầu được khuyếch đại lên hơn một tỷ bản sao (230 = 1,02 x 109).

Ứng dụng của PCR: Trên thực tế, PCR được dùng để tạo các mẩu dò (probe) nucleic acid cho

việc xác định các vi sinh vật. Chẳng hạn, nó có thể phát hiện số lượng nhỏ các tác nhân gây bệnh

trong các mẩu lâm sàng và qua đó chẩn đoán các bệnh gây ra bởi các tác nhân khó nuôi cấy, như

virus HIV/AIDS, Mycobacterium tuberculosis sinh trưởng chậm v.v. PCR cũng đã được dùng để

Vùng DNA quan tâm 1. DNA bị biến tính. Các đoạn mồi đính vào mỗi sợi. Một sợi DNA mới được tổng hợp trên mỗi sợi khuôn nhờ DNA polymerase.

2. Vòng khác: DNA bị biến tính, các đoạn mồi đính vào, và số sợi DNA được tăng gấp đôi.

các mồi (primer) được tổng hợp bằng hoá học

3. Vòng khác: DNA bị biến tính, các đoạn mồi đính vào, và số sợi DNA được tăng gấp đôi.

4. Vòng khác: DNA bị biến tính, các đoạn mồi đính vào, và số sợi DNA được tăng gấp đôi.

5. Các vòng/chu kỳ khuyếch đại cứ tiếp diễn mau lẹ sinh ra số lượng lớn các đoạn giống nhau. Mỗi đoạn có chứa vùng DNA cần quan tâm.

Page 134: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

134

khuyếch đại các gen người phục vụ cho việc phân tích trình tự trong dự án bộ gen người (HGP),

chẩn đoán các bệnh di truyền, và xác định các nghi can thuộc các trường hợp tội phạm (hoặc để

chứng minh cho sự vô tội của họ). Thậm chí ngay cả những vết máu nhỏ nhất hoặc một sợi tóc còn

sót lại ở hiện trường phạm tội vẫn có thể dùng làm khuôn cho PCR - khuyếch đại đủ số ADN cần

thiết cho việc kiểm tra ADN. ADN này được phân cắt bằng các enzyme giới hạn (restriction

enzyme), và các phân đoạn tạo ra được tách riêng theo kích thước và thành phần bằng cách chạy

điện di gel (gel electrophoresis). [Theo nguyên tắc, sự di chuyển của các phân tử qua bản gel lỗ xốp

đáp ứng với dòng điện - các đoạn càng bé di chuyển càng nhanh hơn so với các đoạn lớn hơn]. Sau

đó mẩu ADN này được đem so với mẩu của nghi can đang tạm giam. Nếu như nó trùng khớp, có

thể dùng làm chứng cứ xác nhận nghi can đã gây án hoặc phạm tội ở hiện trường đó, giống như các

dấu vân tay là bằng chứng hợp pháp vậy.

Nói chung, PCR là một kỹ thuật có ưu thế rất lớn và được sử dụng rất phổ biến trong các

nghiên cứu liên quan đến công nghệ sinh học. Với đóng góp to lớn của sự phát minh ra phương

pháp PCR này, Kary Mullis đã được trao giải thưởng Nobel năm 1993 (cùng với Michael Smith,

người đề xuất phương pháp gây đột biến định hướng vị trí, site-directed mutagenesis và sự phát

triển của nó trong các nghiên cứu protein).

2. Các công cụ và phương pháp tạo dòng ADN tái tổ hợp

2.1. Các enzyme giới hạn (restriction endonuclease)

Công trình nghiên cứu đầu tiên của Daniel Nathan và Hamilton Smith năm 1969 ở

Haemophilus influenzae xác nhận các tế bào vi khuẩn là những hệ thống chứa các enzyme sửa đổi

và enzyme giới hạn Các enzyme đều có đối tượng nhận biết là các đoạn trình tự ADN vật chủ và

ADN ngoại lai, nhưng có vai trò khác nhau. Các enzyme sửa đổi (methylase) đóng vai trò bảo vệ

ADN vật chủ bằng cách gắn thêm nhóm methyl ở một số bazơ nhất định trong đoạn nhận biết hay

đoạn đích (target sequence), trong khi các enzyme giới hạn (restriction endonuclease) đóng vai trò

vô hiệu hoá hoạt tính của các ADN lạ bằng cách phân cắt ở các vị trí đặc thù.

Hình 8.4. Enzyme giới hạn của vi khuẩn chủ cắt vụn ADN của phage lạ.

Page 135: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

135

Danh pháp và tính chất của các enzyme giới hạn:

- Các enzyme giới hạn chỉ phát hiện được ở các vi khuẩn vì vậy, tên gọi của các enzyme giới

hạn được biểu thị bằng ba hoặc bốn chữ cái viết tắt của vi khuẩn mà từ đó enzyme được chiết xuất.

Chữ cái đầu tiên được viết hoa để chỉ chi (genus) và hai chữ cái tiếp theo viết thường để chỉ loài

(species), và nếu cần thêm chữ cái thứ tư để chỉ nòi hoặc chủng (strain, type). Ngoài ra, để phân biệt

các enzyme của cùng một nòi dùng thêm số La Mã kèm theo sau (xem Bảng 8.1).

- Tính chất quan trọng nhất của các enzyme giới hạn là tính đặc hiệu vị trí, nghĩa là chúng có

thể nhận biết và cắt tại trình tự ADN đặc thù.

- Đoạn đích là có kích thước ngắn 4-8 cặp bazơ và có tính đối xứng xuôi ngược (palindrome;

Hình 8.5).

- Các enzyme giới hạn khác nhau có hai kiểu cắt: cắt lệch và cắt thẳng (Hình 8.6). Với kiểu

cắt lệch, tạo ra các đoạn ADN có các đầu sợi đơn bổ sung gọi là các đầu dính (cohesive/sticky

ends); ví dụ EcoRI. Với kiểu cắt thẳng, tức cắt cùng vị trí trên cả hai sợi của ADN sợi kép, tạo ra

các đoạn ADN có các đầu bằng (blunt ends); ví dụ AluI (Bảng 8.1).

Bảng 8.1. Các trình tự nhận biết và vị trí cắt của các enzyme giới hạn chọn lọc (mũi tên chỉ vị

trí cắt; các trình tự được chỉ ra trên sợi 5'→3')

Nguồn vi sinh vật Tên enzyme Trình tự nhận biết

Arthrobacter luteus AluI AG↓CT

Bacillus amyloliquefaciens H BamHI G↓GATCC

Escherichia coli RY13 EcoRI G↓AATTC

Haemophilus influenzae Rd HindII GTPy↓PuAC

Haemophilus influenzae Rd HindIII A↓AGCTT

Nocardia otitidis-caviarum NotI GC↓GGCCGC

Providencia stuartii PstI CTGCA↓G

Serratia marcescens SmaI CCC↓GGG

Xanthomonas malvaccarum XmaI C↓CCGGG

Các enzyme giới hạn khác nhau có đoạn đích giống nhau, mặc dù vị trí và kiểu cắt có thể

giống hoặc khác nhau, gọi là các enzyme giới hạn tương ứng (isoschizomers); ví dụ, SmaI và XmaI

(Bảng 8.1; Hình 8.6).

Bên cạnh các enzyme giới hạn, còn có các enzyme khác thuộc ba nhóm sau đây được sử dụng

trong lĩnh vực công nghệ này: (i) Các polymerase: ADN polymerase và ARN polymerase, kể cả

reverse transcriptase; (ii) Các ligase: ADN ligase và ARN ligase; và (iii) Các nuclease: ADNse và

ARNse.

Page 136: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

136

Hình 8.5. Tính đối xứng quay bậc hai (palindrome) của 1 đoạn ADN mạch kép.

Hình 8.6. Sơ đồ minh họa hai kiểu cắt khác nhau của các enzyme giới hạn và các enzyme giới hạn

tương ứng. Ví dụ ở đây là SmaI và XmaI.

2.2. Các vector thông dụng trong kỹ thuật di truyền

ADN tái tổ hợp (recombinant ADN) là phân tử ADN được tạo ra trong ống nghiệm bằng cách

kết hợp các ADN từ các nguồn khác nhau, theo một quy trình kỹ thuật nhất định (gọi là kỹ thuật tái

tổ hợp ADN).

Thông thường một phân tử ADN tái tổ hợp bao gồm một phân tử ADN có bản chất là plasmid

hoặc phage nguyên vẹn gọi là vector (Hình 8.7) và một đoạn ADN từ nguồn khác mang một gen

hoặc yếu tố điều hòa mong muốn được cho xen vào gọi là ADN ngoại lai (foreign ADN).

Hình 8.7A. Cấu trúc của các plasmid pBR322 và pUC19. Lưu ý các vùng chứa khởi điểm tái bản (Ori), các gen kháng thuốc (ampicillin, tetracyclin) và các marker chọn lọc; đặc biệt đối với vector pUC19 cho thấy vị trí đa tạo dòng (chứa nhiều vị trí cắt của các enzyme giới hạn – xem thêm ở Hình 8.7B). Với vector pUC19, lacZ′ = gen β-galactosidase; lacI = gen ức chế của operon Lac.

Page 137: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

137

Hình 8.7B. Bản đồ của một đoạn trình tự chứa nhiều vị trí tạo dòng của các enzyme giới hạn khác nhau của vector pUC19.

Trong số các vector, các plasmid của vi khuẩn được sử dụng rộng rãi hơn cả, nhờ có các đặc điểm sau: (i) Mỗi plasmid là một phân tử ADN sợi kép thường ở dạng vòng và chỉ có một khởi điểm tái bản riêng; (ii) Có khả năng xâm nhập vào tế bào vật chủ và hoạt động bình thường; (iii) Có kích thước bé, thường chỉ vài ngàn cặp bazơ nên dễ dàng tinh chiết; (iv) Số bản sao trong mỗi tế bào vi khuẩn thường khá cao; (v) Một số plasmid có chứa các gen kháng thuốc tiện lợi cho việc theo dõi và phát hiện sự có mặt của plasmid tái tổ hợp trong vi khuẩn chủ.

Hình 8.8. Các đầu dính của ADN lambda (a) và vector lambda có xen một vùng ADN miễn dịch gt10 thông qua vết cắt của EcoRI.

Hình 8.9 Cấu trúc và sử dụng của nhiễm sắc thể nhân tạo của nấm men (YAC). Chú thích: trp1, ura3 = các marker chọn lọc; cen/ars = centromere và trình tự tái bản tự trị (autonomously replicating sequence = ARS), cho phép tái bản ở S. cerevisiae; tel = telomere; để đơn giản, khởi điểm tái bản của E. coli và các marker chọn lọc đối với E. coli không nêu ra ở đây.

Page 138: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

138

Trong số các phage dùng làm vector thì phage lambda (λ; Hình 8.8) có nhiều ưu thế nhất, bởi

lẽ ở phần giữa của bộ gen có chứa một số gen không quan trọng và không liên quan với sự tái bản của nó, nên thuận lợi cho việc xen đoạn ADN mong muốn vào đây. Các phage không chứa các gen kháng thuốc cho nên việc theo dõi phage tái tổ hợp được xác định dựa vào các vết tan dương tính (positive plaques) trên nền vi khuẩn.

Sau này, do kỹ thuật công nghệ ADN tái tổ hợp phát triển nhằm phục vụ cho giải trình tự bộ gen các sinh vật và đặc biệt là bộ gen người, các plasmid kích thước lớn ở nấm men được phát hiện và sử dụng rộng rãi. Người ta đã tạo ra các nhiễm sắc thể nhân tạo của nấm men (yeast artificial chromosome = YAC; Hình 8.9) và các nhiễm sắc thể nhân tạo của vi khuẩn (bacterial artificial chromosome = BAC) gọi là các siêu vector (supervectors).

2.3. Cơ sở của việc xây dựng phân tử ADN tái tổ hợp in vitro

2.3.1. Phương pháp sử dụng các đầu dính

Bất kỳ đoạn ADN nào nếu được cắt bởi cùng một loại enzyme giới hạn (ví dụ, EcoRI) cho các đầu dính thì có thể dính líp lại với nhau và được nối bởi ADN ligase. Phương pháp thành lập phân tử ADN tái tổ hợp kiểu này lần đầu tiên được đưa ra bởi J. Mert và R. Davis năm 1972 bằng thực nghiệm trên các virus. Và sau đó, lần đầu tiên năm 1973, H.Boyer và nhóm nghiên cứu của S.Cohen đã tạo ra được phân tử ADN tái tổ hợp gồm vector là plasmid nhỏ pSC101 của E. coli và ADN ''ngoại lai'' là một plasmid khác. Chính sự kiện này đã đặt nền móng và mở ra triển vọng to lớn cho kỹ thuật ADN tái tổ hợp sau này. (Hình 8.10)

Hình 8.10. Thành lập phân tử ADN tái tổ hợp bằng phương pháp sử dụng các đoạn có đầu dính

được tạo ra bởi enzyme giới hạn cắt lệch (ở đây là BamHI).

2.3.2. Phương pháp nối trực tiếp hoặc tổng hợp các đầu bổ sung

Đối với các đoạn ADN được tạo ra bằng cách xử lý enzyme giới hạn cắt thẳng như HindII chẳng hạn, thì việc nối các đoạn ADN có đầu bằng được tạo ra có thể thực hiện theo hai cách sau:

Page 139: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

139

Hình 8.11A. Khâu nối tạo đầu dính sợi đơn vào đoạn ADN đầu bằng (blunt) với enzyme transferase đầu mút (terminal transferase).

Nối trực tiếp bằng ADN ligase của phage T4 hoặc tổng hợp thêm các đầu dính vào các đầu 3' một số nucleotide bổ sung bằng cách sử dụng các enzyme end transferase, rồi sau đó các đoạn ADN như thế sẽ được nối với nhau bởi ADN ligase của vi khuẩn. Cơ sở của phương pháp kết hợp

ADN này được thực hiện lần đầu tiên giữa ADN của virus SV40 với ADN của phage λ bởi L.

Lobban và D. Kaiser (1972), và D. Jackson và P. Berg (1972) (Hình 8.11).

Hình 8.11B. Tạo dòng bằng cách sử dụng việc khâu nối homopolymer đối với các đoạn đầu bằng được tạo ra bởi enzyme giới hạn SmaI.

2.4. Tạo dòng tái tổ hợp

2.4.1. Nguyên tắc chung

Về nguyên tắc, kỹ thuật ADN tái tổ hợp hay tạo dòng (cloning) gồm các bước chung nhất như sau (Hình 8.12): (1) Tách chiết và tinh sạch ADN thuộc các nguồn khác nhau (gồm vector và ADN mang gen mong muốn); (2) Tạo ra phân tử ADN tái tổ hợp in vitro; (3) Đưa phân tử ADN tái tổ hợp vào trong tế bào nhận, thường là E. coli hoặc nấm men; và (4) Phát hiện và phân lập các dòng ADN tái tổ hợp đặc hiệu.

Trong tế bào chủ, phân tử ADN tái tổ hợp có thể biểu hiện gen mong muốn (cho sản phẩm protein) hoặc tái bản độc lập nhiều lần để tạo ra hàng loạt bản sao của nó, và khi tế bào chủ phân chia sẽ kéo theo sự tạo dòng phân tử (molecular cloning). Mặt khác, do tốc độ phân chia rất nhanh của các vi khuẩn nên có thể tạo hàng triệu bản sao mong muốn trong một thời gian ngắn. Vì thế nhà khoa học có thể tách dòng bất kỳ một gen nào để dùng cho nghiên cứu hoặc cho sản xuất trên quy mô công nghiệp một số lượng lớn các protein là các chế phẩm y-sinh học nào đó.

2.4.2. Quy trình tạo dòng gen tái tổ hợp (Hình 8.13)

Page 140: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

140

Hình 8.12. Đại cương về quy trình tạo dòng gen (sản xuất protein) ở vi khuẩn.

Bây giờ ta xét quy trình kỹ thuật tạo dòng mà việc phát hiện ADN tái tổ hợp dựa trên khả năng kháng thuốc do vector plasmid mang lại.

• Bước 1: Tinh chiết ADN

Giả sử đã tinh chiết được plasmid có chứa hai gen kháng ampicillin và tetracyclin, ký hiệu là AmpR và TetR; và cũng giả thiết rằng gen TetR có chứa điểm cắt của EcoRI, và phân tử ADN người có mang gen insulin.

Hình 8.13. Sơ đồ thí nghiệm tạo dòng vi khuẩn mang ADN tái tổ hợp, ở đây là gen insulin người.

Page 141: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

141

• Bước 2: Kiến tạo phân tử ADN tái tổ hợp in vitro

Trước tiên, dùng enzyme giới hạn đầu dính EcoRI (xem Bảng 8.1) để cắt vòng plasmid tại giữa gen TetR và cho cắt ADN người, trong số các đoạn bị cắt có một đoạn mang gen insulin. Sau đó đem trộn lẫn hai loại ADN trên trong ống nghiệm với ADN ligase. Kết quả là có thể xảy ra ba trường hợp: (1) Plasmid tự nối lại thành mạch vòng như lúc đầu; (2) Đoạn ADN tự nối lại thành mạch vòng; và (3) Plasmid tái tổ hợp có mang gen insulin, và có thể mang một đoạn ADN không phải gen đó.

• Bước 3: Biến nạp và phát hiện dòng ADN tái tổ hợp chung

Đưa các ADN được xử lý vào các tế bào E. coli. Nếu phân tử có kích thước lớn người ta phải xử lý vi khuẩn 'thể nhận' bằng chlorid calcium (CaCl2) để làm cho màng trở nên thấm được dễ dàng. Sau đó đem cấy riêng rẽ các vi khuẩn trên môi trường có ampicillin và theo dõi.

+ Nếu có xuất hiện khuẩn lạc, chứng tỏ vi khuẩn có mang gen AmpR, tức là chúng có mang plasmid ban đầu (trường hợp 1) hoặc plasmid tái tổ hợp (trường hợp 3). Ngược lại, nếu chỗ cấy không xuất hiện khuẩn lạc, chứng tỏ vi khuẩn mang ADN tự nối (trường hợp 2).

+ Kế đó, đem cấy riêng rẽ các vi khuẩn thu được sang môi trường có tetracyclin. Nếu có xuất hiện khuẩn lạc, chứng tỏ vi khuẩn có mang gen TetR nguyên vẹn (trường hợp 1). Nếu không có khuẩn lạc, chứng tỏ vi khuẩn đem cấy có mang ADN tái tổ hợp (trường hợp 3); vì gen TetR bị bất hoạt do đoạn ADN xen vào. Bằng cách theo dõi như vậy cho phép xác định được dòng vi khuẩn mang ADN tái tổ hợp, nhưng vẫn chưa biết được đâu là các dòng đặc hiệu, nghĩa là có mang gen insulin.

• Bước 4: Chọn dòng ADN tái tổ hợp đặc hiệu

Về nguyên tắc, trong cả triệu phép thử mới có một tế bào mang gen mong muốn. Với trường hợp trên, người ta có thể sử dụng phương pháp miễn dịch học bằng cách dùng kháng thể chống lại protein được sinh ra bởi dòng vi khuẩn tương ứng (tức huyết thanh tìm gen kháng insulin).

Hình 8.14 minh họa một công đoạn của quy trình thí nghiệm ADN tái tổ hợp ở vi khuẩn E.

coli khi sử dụng môi trường nuôi cấy có bổ sung ampicillin đối với ba kiểu tế bào: tế bào có mang plasmid tái tổ hợp, tế bào chỉ mang plasmid pUC19 không tái tổ hợp, và tế bào không biến nạp được (Hình 8.14a). Qua đêm sinh trưởng, các tế bào nào có mang plasmid tái tổ hợp và plasmid không tái tổ hợp sẽ mọc thành các khuẩn lạc (màu sắc tương ứng ở đây là trắng và xanh; Hình 8.14b). Sau khi chọn ra các dòng có xen plasmid tái tổ hợp, đưa lên màng lọc và cho tiến hành lai hóa giữa ARN và ADN (gen) của nó bằng các vật dò phóng xạ như đã nói ở trên. Sau đó đưa sản phẩm lai phân tử này lên tấm phim X quang để định vị gen quan tâm từ dòng tái tổ hợp (Hình 8.14c).

Nói chung, để tìm dòng lai đặc hiệu người ta sử dụng các mẫu dò là mARN hoặc rARN đặc hiệu. Chẳng hạn, trong trường hợp nếu cần chọn dòng lai mang đoạn mARN cụ thể, người ta đem cấy đều các dòng vi khuẩn có chứa ADN tái tổ hợp lên trên mặt thạch của hộp petri chứa môi trường nuôi cấy. Sau đó đóng dấu lên màng lọc nitrocellulose, và thu được bản sao. Việc xử lý bản sao bằng NaOH sẽ làm cho các tế bào vi khuẩn tan vỡ tại chỗ (in situ), và các ADN thoát ra từ chúng sẽ bị biến tính (các sợi đơn tách rời nhau) và dính vào màng lọc. Sau đó đem nhúng màng lọc này vào mẫu mARN tương ứng đã được tinh khiết và đánh dấu phóng xạ (P32); mẫu ARN này được gọi là vật dò phóng xạ (radioactive probe). Nếu dòng nào có chứa ADN mã hoá cho mARN thì sẽ

Page 142: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

142

xảy ra hiện tượng lai giữa mARN và vùng sợi đơn tương ứng trên ADN đó. Sau khi loại bỏ các mARN không lai được, người ta đặt một miếng phim ảnh lên trên màng lọc; những vết ảnh xuất hiện trên ảnh phóng xạ tự ghi cho thấy vị trí của dòng mang ADN bổ trợ với mẫu ARN. Từ đây có thể tách riêng các dòng lai đặc hiệu để sử dụng cho các nghiên cứu tiếp theo.

Hình 8.14. Xác định các dòng vi khuẩn mang plasmid có xen một đoạn ADN (gen) đặc hiệu bằng vật dò phóng xạ là mARN - sản phẩm của nó.

2.5. Tổng hợp và tạo dòng cADN

Đối với trường hợp cần cho biểu hiện một gen lạ (sản xuất một protein) mong muốn trong vi khuẩn, người ta có thể tổng hợp gen của nó dựa trên khuôn mẫu mARN và enzyme phiên mã ngược tinh chế từ retrovirus. Sau đó cho xen gen này vào plasmid, rồi đem cấy vào vi khuẩn và xác định các dòng cADN đặc hiệu. Ở đây ta chỉ xét hai bước đầu:

Bước 1: Tổng hợp cADN (Hình 8.15A)

Hình 8.15A. Tổng hợp cADN từ một ARN nhờ enzyme phiên mã ngược.

Như đã biết, các mARN eukaryote đều có cái đuôi poly(A) ở đầu 3'. Chính trình tự này tạo điều kiện thuận lợi cho việc tổng hợp sợi ADN bổ sung, cADN. Khi đem trộn lẫn các đoạn ngắn

Tế bào + pUC19

Tế bào + pUC19 + đoạn xen

Môi trường +

ampicillin +

X-gal

Tế bào không được biến nạp

Các khuẩn lạc trắng: pUC19 + đoạn xen

Các dòng kháng ampicillin

Sinh trưởng qua đêm

Các dòng chọn lọc

Màng

Màng

Phim tia X

Các khuẩn lạc xanh: chỉ có pUC19

Mẩu dò phóng xạ

Page 143: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

143

gồm các nucleotide thymine (oligodT) với mARN này sẽ xảy ra sự lai hoá giữa nó với vùng đuôi mARN. Đoạn oligo(dT) làm mồi cho enzyme phiên mã ngược (reverse transcriptase) tổng hợp sợi cADN mà sản phẩm là sợi kép lai ARN- cADN. Ở đầu 3' của sợi cADN được tổng hợp có cái ‘chóp’ (tương tự đầu 5' của mARN). Tiếp theo, bằng cách xử lý với NaOH, sợi mARN bị loại ra; kế đó cái ‘chóp’ ở đầu 3' của cADN lại làm mồi cho ADN polymerase I tổng hợp sợi thứ hai dọc theo sợi khuôn vốn có của nó. Sản phẩm cADN bây giờ còn mang cái ‘vòng’ sợi đơn. Sau đó, cái vòng này được cắt bỏ bằng cách xử lý với nuclease S1 để tạo ra cADN sợi kép.

Bước 2: Xen đoạn cADN vào plasmid (Hình 8.15B)

Để xen đoạn cADN vào plasmid người ta có thể dùng enzyme end transferase để gắn thêm “đuôi” homopolymer (ví dụ, CCCC....) vào các đầu 3' của cADN. Và plasmid sau khi được mở vòng, cũng phải lắp thêm ở đầu 3' những trình tự tương ứng là GGGG... cũng với enzyme trên. Tuy nhiên, cách phổ biến hơn cả là gắn thêm vào cả hai ‘đầu bằng’ của sợi kép cADN này bằng các oligonucleotide gồm 8-10 cặp bazơ, nhờ xúc tác của ADN ligase T4. Sau đó, dùng enzyme giới hạn thích hợp để cắt “đoạn nối” này tạo ra các đầu dính. Đồng thời cắt plasmid bởi cùng một enzyme đó tại gen TetR. Hai ADN nói trên được nối với nhau bằng ADN ligase để tạo ra plasmid lai.

Hình 8.15B. Tạo dòng cADN

3. Ứng dụng của công nghệ ADN tái tổ hợp và kỹ thuật di truy ền

3.1. Ứng dụng trong nghiên cứu các bộ gen

Việc tách dòng tái tổ hợp cho phép nhận được một số lượng lớn bất kỳ gen hoặc vùng điều hoà nào để tiến hành phân tích trình tự nucleotide, xác định các vùng chức năng và chỉ ra các cơ chế hoạt động của chúng. Nhờ đó đã đưa lại những hiểu biết mới về tổ chức và hoạt động của các bộ gen prokaryote (như các khởi điểm tái bản, các vùng điều hoà phiên mã, các gen nhảy v.v.) và ở các bộ gen eukaryote (như các centromere, telomere, các gen phân đoạn, các gen giả, ADN lặp lại v.v.) như đã được thảo luận ở các chương trước.

Page 144: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

144

Bằng các thí nghiệm tạo dòng plasmid tái tổ hợp kinh điển ở vi khuẩn E. coli, và bằng cách cải tiến sử dụng nhiễm sắc thể nấm men nhân tạo này (YAC), người ta đã thành lập các thư viện

gen (gene library) hay thư viện bộ gen (genomic library) để trên cơ sở đó tiến hành lập bản đồ vật lý và xác định trình tự ADN bộ gen của nhiều sinh vật khác nhau, kể cả bộ gen người. Nếu như vào năm 1977, F.Sanger xác định đầy đủ các trình tự phage φX174 (5386 nucleotide, 9 gen) và phage G4 (5577 nucleotide, 10 gen), thì đến nay người ta xác định và lập bản đồ cho các ADN có kích thước lớn hơn nhiều; ví dụ: bộ gen phage lambda gồm 48.502 cặp bazơ với khoảng 61 gen (1983) v.v... Đáng kể là, Dự án Bộ gen Người (HGP) đã chính thức đi vào hoạt động từ 1990 do J.Watson chủ trì cùng với sự cộng tác của nhiều nhà khoa học trên thế giới. Việc phân tích trình tự bộ gen người hoàn thành vào 4/2003, cho thấy bộ gen của chúng ta có trình tự đầy đủ gồm 3.164.700.000 cặp bazơ, chứa đựng khoảng 25.000 gen mã hóa protein chịu trách nhiệm xây dựng nên một bộ protein (proteome) gồm khoảng 35.000 protein khác nhau trong các tế bào.

3.2. Ứng dụng trong y-dược học

3.2.1. Sản xuất các chế phẩm y-sinh học

Nếu như vào năm 1972, Giáo sư Roger Guillemin (Pháp) đã phải dùng tới 500.000 não cừu mới tinh chiết được vài miligram somatostatin, một hormone sinh trưởng của vùng dưới đồi thị (với công trình này ông đã được trao giải Nobel năm 1980), thì vào 10/1977 Hebert Boyer (Mỹ) đã chế tạo thành công hormone này từ E. coli bằng phương pháp ADN tái tổ hợp. Đến 8/1978 chính Boyer lại là người đầu tiên cho sản xuất thành công insulin người từ E. coli. Các thành tựu đầu tiên này đã mở ra một kỷ nguyên mới phát triển rực rỡ nhất trong lịch sử công nghệ sinh học, công nghệ ADN tái tổ hợp.

Sau đó là hàng loạt các chế phẩm khác như các hormone tăng trưởng của người (HGH), bò (BGH), lợn (PGH), các vaccine và các interferon phòng chống các căn bệnh nan ở người y như ung thư, viêm gan v.v. và một số bệnh quan trọng ở gia súc như hiện tượng 'lở mồm-long móng' do virus gây ra... tất cả đều được sản xuất từ E. coli. Đặc biệt là, sự ra đời của các hãng, các công ty lớn đã đầu tư mạnh mẽ cho sự phát triển của kỹ nghệ này. Nhờ vậy góp phần giải quyết có hiệu quả nhiều vấn đề thực tiễn đặt ra trong y học, trong chăn nuôi-thú y, và nông nghiệp nói chung ...

Một số sản phẩm được tạo dòng ở vi khuẩn liên quan đến các ứng dụng khác nhau trong điều trị bệnh ở người được giới thiệu ở Bảng 8.2.

Page 145: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

145

Bảng 8.2. Các sản phẩm của người được tạo dòng từ vi khuẩn

Sản phẩm Áp dụng

Các interferon Dùng để điều trị các bệnh lây nhiễm virus và ung thư.

Interleukin 2 Kích thích hệ thống miễn dịch và có thể dùng trong điều trị ung thư và các rối loạn hệ thống miễn dịch.

Insulin Được dùng để điều trị bệnh tiểu đường.

Somatotropin Được dùng để điều trị dị tật lùn thuộc về tuyến yên.

Chất kích hoạt plasminogen

Làm tan các cục đông máu cho điều trị và ngăn chặn các tình trạng tắc nghẽn tim mạch.

Nhân tố hoại tử Tấn công và giết các khối u ung thư.

Nhân tố XI, VIII Được dùng để điều trị bệnh máu khó đông.

Erythropoietin Kích thích tạo các tế bào hồng cầu cho điều trị bệnh thiếu máu (anemia).

Beta endorphin Các chất giảm đau tự nhiên do cơ thể tạo ra; có thể được dùng làm thuốc giảm đau.

Các enzyme Được dùng rộng rãi từ việc điều khiển các phản ứng hoá học trong các quá trình kỹ nghệ cho đến việc bổ sung các enzyme trong khẩu phần ăn của người.

Các vaccine tiểu đơn vị

Kích thích khả năng miễn dịch của cơ thể đối với một hoặc hai kháng nguyên then chốt của một tác nhân gây bệnh; giảm nguy cơ rủi ro của các vaccine thông thường.

Bên cạnh việc sản xuất các hormone, vaccine... nói trên, người ta còn sản xuất được các

kháng thể đơn dòng (monocloning antibodies) dùng để: (i) xác định vi khuẩn gây bệnh (như thương

hàn chẳng hạn); (ii) xác định mức hormone từ đó đánh giá chức năng tuyến nội tiết hoặc sự thay đổi

trong quá trình tổng hợp hormone do khối u gây ra; (iii) phát hiện một số protein có ý nghĩa trong

chẩn đoán khối u hoặc một số tình trạng trước khi sinh; (iv) phát hiện các thuốc bị cấm có trong

máu, hoặc kiểm tra nồng độ thuốc trong máu và tổ chức nhằm đảm bảo liều thuốc sử dụng sao cho

không vượt quá ngưỡng gây độc v.v. Nhờ có tính đặc hiệu và chính xác cao và sử dụng dễ dàng,

việc sản xuất các kháng thể đơn dòng đã tạo nên một nhánh phát triển mau lẹ nhất của công nghệ

sinh học, và cùng với việc sản xuất các vaccine chúng đã trở thành những phương tiện quan trọng

nhất trong chính sách y tế cộng đồng của các nước đang phát triển và xét về lâu dài, việc ứng dụng

các kháng thể đơn dòng có triển vọng chữa được nhiều bệnh trong đó có các khối u ác tính.

3.2.2. Ứng dụng trong chẩn đoán và điều trị gen

Trong chẩn đoán bệnh ở mức phân tử, thành tựu nổi bật nhất là vào năm 1981, lần đầu tiên

bệnh thiếu máu hồng cầu hình liềm được chẩn đoán trước sinh ở mức độ gen nhờ phân tích ADN

bằng enzyme giới hạn. Từ đây đã mở ra hai hướng chính trong chẩn đoán gen là: chẩn đoán các bất

Page 146: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

146

thường bẩm sinh và chẩn đoán các bất thường ADN soma. Một số thành tựu khác đạt được theo

hướng đầu gồm có: bệnh hemophilia A, rối loạn dưỡng cơ Duchenne, hội chứng X-fragile, bệnh

retinoblastoma - một dạng ung thư võng mạc...Theo hướng sau, người ta đã áp dụng đối với một số

dạng ung thư máu như các lympho Burkitt, lympho nang, bệnh bạch cầu...Đáng kể là gần đây,

người ta đã xác định được nhiều gen gây bệnh quan trọng ở người, như: gen gây bệnh hóa xơ nang

(cystic fibrosis) năm 1990, gen gây bệnh Huntington năm 1993...

Liệu pháp gen (gene therapy) cũng là một phương thức sản xuất và điều trị mới bằng các

phân tử trị liệu. Đây là hướng có nhiều triển vọng nhất nhưng khó thực hiện nhất vì nó có liên quan

đến cả vấn đề phương pháp luận lẫn khía cạnh đạo lý. Sự kiện nổi bật nhất là vào năm 1990-91,

W.F.Anderson, R.M.Blaese và Ken Cuver thực hiện thành công ca liệu pháp gen đầu tiên trên một

bé gái bốn tuổi mắc bệnh suy giảm miễn dịch phối hợp (SCID) với sự thiếu hụt adenosine

deaminase (ADA), một enzyme cần thiết cho sản xuất các kháng thể trong các tế bào hệ miễm dịch,

gọi là hội chứng “bubble-boy” (bệnh do gen ở gần đầu mút vai ngắn nhiễm sắc thể số 20 gây ra).

Mặt khác, liệu pháp gen cũng đã mở ra những triển vọng to lớn trong chữa trị các căn bệnh phổ biến

nhất, tác động tới hàng triệu triệu người trên hành tinh như: ung thư, SIDA/AIDS, viêm gan do

virus, các bệnh tim mạch, các bệnh thoái hóa thần kinh (bệnh Parkinson, bệnh Huntington, bệnh

Alzheimer...) hay cả những bệnh mạn tính như đa thấp khớp.

3.3. Ứng dụng trong nông nghiệp

Kỹ thuật di truyền với các sinh vật biến đổi gen (GMO)

• Đối với ngành chăn nuôi, công nghệ sinh học nói chung và công nghệ sinh học nói riêng đã đạt nhiều thành tựu đáng kể, chẳng hạn các kỹ thuật chuyển ghép gen áp dụng cho hợp tử và phôi ở các gia súc nhằm tăng cường khả năng chống bệnh và cải thiện giống nói chung; cũng như các kỹ thuật mới trong xác định giới tính của phôi...

Hình 8.16. Mô hình tổng quát về thí nghiệm truyền gen ở động vật.

Hình 8.16 cho thấy khả năng ứng dụng kỹ thuật cấy ghép gen trên trứng chuột đã được thụ tinh. Sau đó đem phôi đã ghép gen cấy vào trong tử cung của con chuột làm mẹ khác. Kết quả là tạo ra được chuột con có bộ lông dạng khảm như mong muốn. Điển hình cho các thí nghiệm truyền

Page 147: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

147

gene ở động vật là vào năm 1982,R.D.Palmiter, R.L.Brinster và các đồng sự ở Đại học Seatle (Philadelphia, USA) bằng cách truyền gen xác định hormone sinh trưởng của chuột cống vào trứng đã thụ tịnh của chuột bình thường, rồi cấy trở lại các tế bào đã được biến đổi gen vào vòi trứng của các chuột cái có thể mang thai cho đến cùng. Và kết quả là, các tác giả này đã thu được dạng chuột nhắt có kích thước lớn gấp 2-3 lần chuột bình thường, gọi là chuột khổng lồ.

• Đối với trồng trọt, việc sử dụng các phương pháp chuyển ghép gen đã đạt được nhiều thành tựu to lớn. Chẳng hạn, hãng Biogen (USA) năm 1984 đã chuyển thành công plasmid Ti vào tế bào thực vật; hãng Calgen và Phytogen (USA, 1984) đã ghép thành công gen kháng glyphosate để bảo vệ cây bông; năm 1985 hãng Molecular Genetics (USA) đã tạo được giống ngô mới cho nhiều tryptophan. Năm 1993, bằng kỹ thuật súng bắn gen vào tế bào thực vật người ta đã đưa được gen sản xuất protein diệt sâu vào cây ngô, và kết quả là đã tạo ra được giống ngô chống chịu cao đối với sâu đục thân. Điều thú vị là việc tách các gen cố định đạm, gen Nif (Nif = nitrogen fixation) từ các vi khuẩn nốt sần cây họ đậu và đưa vào bộ gen của các cây trồng khác để tạo ra các giống cây trồng mới có khả năng cố định nitơ và cho năng suất cao (Hình 8.17).

Hình 8.17. Mô hình chuyển gen ở cây trồng

• Trong chọn giống vi sinh vật, người ta đã thực hiện thành công việc chuyển gen cellulase vào vi khuẩn (J.P.Aubert, 1/1983), cải biến E. coli để sản xuất L-aspartat (hãng Tanabe, Nhật 1985), ghép gen vào xạ khuẩn S. violacconiger để cải tiến việc sản sinh enzyme glucoisomerase (hãng Roquette và Cayla, 1985), ngoài ra còn tạo được các giống vi sinh vật biến đổi gen có khả năng ăn cặn dầu dùng trong xử lý các phế thải có độc tố nhằm bảo vệ môi sinh. Bên cạnh việc tạo ra giống nấm men mới có thể giết chết các vi khuẩn xuất hiện trong bia (hãng Suntory, 1985), còn tạo được chủng nấm men sản xuất insulin và interferon (Kimura, 1986) v.v.

3.4. Ứng dụng trong khoa học hình sự và các vấn đề xã hội khác

Kỹ thuật di truyền còn được ứng dụng rất hiệu quả trong các ngành hình pháp học, chẳng hạn bằng cách sử dụng kỹ thuật 'dấu vân ADN' (ADN fingerprinting) thay cho 'dấu vân tay' trước đây cho phép các ngành cảnh sát hình sự xác định chính xác các tội phạm hoặc nhận dạng xác nạn nhân trong chiến tranh hoặc do tai nạn gây ra (Hình 8.18).

Page 148: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

148

Hình 8.18. Dấu vân DNA (DNA finger-printing) có thể giúp các nhà nghiên cứu xác định khả nghi trong trường hợp tội phạm.

TÓM T ẮT

(1) Việc tinh chế và sử dụng enzyme cắt giới hạn cùng với các plasmid để tạo ra các phân tử ADN tái tổ hợp đầu tiên trong ống nghiệm là nền tảng cho sự ra đời và phát triển mạnh mẽ của kỹ thuật di truyền và công nghệ ADN tái tổ hợp từ giữa thập niên 1970 đến nay.

(2) Sự phát triển nhanh chóng của lĩnh vực công nghệ này không những đã nhanh chóng mang lại khối lượng tri thức khổng lồ về cấu trúc và cơ chế hoạt động của các gen, các bộ gen mà còn trở thành lực lượng sản xuất trực tiếp của xã hội, tạo ra hàng loạt các chế phẩm y-sinh học hữu ích từ các tế bào vi khuẩn; tạo ra các sinh vật biến đổi gen (GMOs) - mang những đặc tính quý hiếm... Qua đó góp phần giải quyết những vấn đề thực tiễn đặt ra trong y học và trong công tác chọn tạo giống.

(3) Đáng kể nhất là cùng với sự phát triển vượt bậc của công nghệ ADN tái tổ hợp và kỹ thuật di truyền, các nhà khoa học đã thành công trong việc xác định trình tự đầy đủ của bộ gen người vào 4-2003.

(4) Kể từ sau sự kiện thành công sớm hơn mong đợi của Dự án bộ gen người đã mở ra hàng loạt các hướng nghiên cứu mới; đáng kể nhất là Genomics và Proteomics.

Page 149: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

149

CÂU HỎI VÀ BÀI T ẬP

1. Có 2 phân tử ADN được đem gây biến tính. Kết quả thu được cho thấy phân tử ADN I nóng chảy ở 720C và phân tử ADN II nóng chảy ở 820C. Số liệu đó chủ yếu nói lên điều gì?

2. Giả sử bạn dùng 2 enzyme HaeI và BamHI để phân cắt một plasmid ký hiệu là pZ28. Từ BamHI thu được chỉ 1 đoạn và từ HaeI bạn nhận được 9 đoạn. Có bao nhiêu vị trí cắt cho mỗi enzyme ấy? Giải thích.

3. Giả sử một enzyme cắt hạn chế có một mẩu trình tự đích đối xứng bậc hai là 5'-GCA, có thể suy ra trình tự đầy đủ của đoạn đích ấy là gì?

4. Giả sử lần đầu tiên một enzyme cắt giới hạn được phát hiện từ vi khuẩn có tên tạm gọi là Bacterium malvacarum, bạn sẽ đặt tên của enzyme đó như thế nào?

5. Trong tự nhiên, các tế bào vi khuẩn có hai hệ thống enzyme nào giúp nó vừa chống lại sự xâm nhập của các phage lạ vừa bảo vệ được bộ gen của chúng?

6. Thế nào là enzyme giới hạn? Chúng có những tính chất nào mà được coi là công cụ thiết yếu đối với công nghệ ADN tái tổ hợp? Bằng hai ví dụ về enzyme giới hạn, hãy chứng tỏ rằng ít nhất có hai phương pháp thành lập các phân tử ADN tái tổ hợp in vitro.

7. Từ các enzyme giới hạn BamHI, EcoRI và HindIII ở Bảng 8.1 và BglII có đoạn đích được biết

là A↓GATCT, hãy cho biết cặp enzyme nào sẽ tạo ra các đầu dính hay đầu bổ sung (sticky

ends) tương thích? Trình tự của đầu dính tương thích này là gì?

8. Giả sử bạn cắt hai ADN khác nhau, một với BamHI và một với BglII, sau đó nối chúng lại với nhau thông qua các đầu dính tương thích. Một khi đã khâu nối rồi, bạn có thể tách hai ADN này lần nữa bằng 1 trong 2 enzyme giới hạn đó hay không? Tại sao, hoặc tại sao không?

9. Giả sử bạn biến nạp một ADN tái tổ hợp cho vi khuẩn và do nhầm lẫn, bạn đặt các tế bào được biến nạp đó trên môi trường không có chất kháng sinh nào cả. Kết quả mà bạn quan sát được là gì? Tại sao?

10. Giả sử rằng bạn chiết xuất được một enzyme cắt giới hạn từ loài vi khuẩn có tên khoa học là Xenobacterium giganticus. Theo danh pháp đã học, bạn sẽ viết tên enzyme đó như thế nào?

11. Cho biết trình tự của một đoạn ADN có chứa một vị trí nhận biết đối xứng xuôi ngược (palindromic recognition site) cho một enzyme giới hạn là GACGATATCAACT. Hãy tìm trình tự của vị trí nhận biết đó.

12. Thế nào là phân tử ADN tái tổ hợp, vector tách dòng? Hãy nêu các bước của quy trình tạo dòng gen tái tổ hợp và cho sơ đồ minh hoạ.

13. Giả sử tinh chế được plasmid pBR322 và ADN người có chứa một gen cần nghiên cứu. Hãy phân tích kỹ thuật tạo dòng gen ấy ở E. coli.

14. Enzyme phiên mã ngược là gì? Nó được tinh chế từ loại sinh vật nào và được ứng dụng vào khâu nào trong công nghệ ADN tái tổ hợp? Giải thích và cho sơ đồ minh hoạ.

15. Có thể sử dụng các chất kháng sinh để xác định xem liệu plasmid pBR322 đã nhận được một đoạn xen ở trong vị trí EcoRI của nó hay không? Tại sao, hoặc tại sao không?

Page 150: Giáo trình Sinh học phân tử - Hoàng Trọng Phấn

150

ChÞu tr¸ch nhiÖm néi dung:

Pgs.Ts. NguyÔn v¨n hßa Biªn tËp:

Tæ c«ng nghÖ th«ng tin

Phßng kh¶o thÝ - ®¶m b¶o chÊt l−îng gi¸o dôc