Bài giảng Tin sinh học đại cương - Chương 1: Giới thiệu về tin sinh học - Trần Văn Lăng

Tóm tắt Bài giảng Tin sinh học đại cương - Chương 1: Giới thiệu về tin sinh học - Trần Văn Lăng: ... tự gene đầy đủ đầu tiên của một sinh vật (Bacteriophage FX174) được công bố; nó bao gồm 5.386 cặp base trong đó có 9 mã protein. Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 69 • 1981: Thuật toán Smith-Waterman về việc bắt cặp trình tự (sequence alignment) đư... 12/9/2013 • Một nhóm các nhà khoa học Nhật Bản thuộc Viện nghiên cứu Riken, Viện nghiên cứu Y Sinh và Bệnh viện Sáng tạo ở Kobe đã cấy ghép thành công tế bào võng mạc được phát triển từ các tế bào gốc đa năng cho một phụ nữ khoảng 70 tuổi • Đây là lần đầu tiên các tế bào gốc đa năng đ... phân tử sinh học: hay đa phân tử sinh học (biopolymer) là một đa phân tử (polymer) có trong các cơ thể sống. • Có 4 đại phân tử không thể thiếu để hình thành nên cơ thể sống; đó là: Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 148 38 • Protein • Nucleic acid...

pdf54 trang | Chia sẻ: havih72 | Lượt xem: 108 | Lượt tải: 0download
Nội dung tài liệu Bài giảng Tin sinh học đại cương - Chương 1: Giới thiệu về tin sinh học - Trần Văn Lăng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
cứu tiếp, thấy rằng: 
– Vấn đề này liên quan đến một protein tên là Tau. 
– Và sự xuất hiện protein beta Amyloid - không 
hòa tan nên tích tụ thành những mảng keo. 
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 131
– Những chất này nằm xung quanh các tế bào 
thần kinh chết, 
– Một loại protein có tên Amyloid precursor (APP) 
cũng tồn tại ở đây giúp cho hoạt động hủy hoại 
tế bào thần kinh của Beta Amyloid
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 132
34
• Sự có mặt quá nhiều của Beta Amyloid sẽ 
làm giảm chất trung gian dẫn truyền thần 
kinh acetylcholine cần thiết cho trí nhớ. 
• Beta Amyloid cũng ngăn chặn sự vận 
chuyển ion kali, natri, calcium qua màng tế 
bào (giúp cho quá trình truyền tín hiệu thần 
kinh)
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 133
• Beta Amyloid là một 
peptide có từ 36 – 43 
amino acid
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 134
• Vấn đề đặt ra là với những biểu hiện như 
vậy, liệu con người có thể có những hiểu biết 
để kiểm soát quá trình phát triển này.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 135
• Người ta thấy rằng trên nhiễm sắc thể 19 có 
một gene có ý nghĩa y tế rất lớn, nó được gọi 
là gene APOE; trình tự DNA của gene này 
gồm 897 chữ.
• Nucleotid thứ 334 thường là A, nhưng trong 
một số người lại là G. Những người này có 
khả năng lớn sẽ bị bệnh Alzheimer.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 136
35
• Vấn đề lớn đối với tin sinh học hiện nay là 
làm sao để các thông tin về các trình tự sinh 
học phục vụ thiết thực hơn nữa cho sự sống, 
không dừng ở mức độ lưu trữ thông tin.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 137
• Từ đó hướng đến việc 
– chuyển đổi thông tin trình tự sinh học sang các tri 
thức hóa sinh và lý sinh; 
– giải mã các đầu mối tiến hóa; 
– chẩn đoán cấu trúc và chức năng của các cơ thể 
sống.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 138
• Chẳng hạn, với bệnh tế bào thiếu máu hình 
lưỡi liềm (sickle cell amenia), 
• Đây là một bệnh di truyền ảnh hưởng đến 
Hemoglobin hay Haemoglobin (huyết sắc tố) 
– phân tử vận chuyển dưỡng khí (oxygen) 
trong máu.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 139
• Bệnh này được đặt tên từ hình dạng của các 
tế bào máu
• Trong một điều kiện nào đó hồng huyết cầu 
(red blood cell) bị biến dạng thành hình lưỡi 
liềm
• và tế bào này kéo dài ra làm cho một số 
mạch máu nhỏ của cơ thể không nhận đủ 
lượng oxy cần thiết.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 140
36
• Bệnh này được gây ra bởi một sự thay đổi 
mã chữ cái trong trình tự DNA, nó làm cho 
một amino acid của protein hemoglobin là 
Glutamic acid bị thay bởi Valine.
• Valine làm cho các phân tử hemoglobin dính 
lại cùng nhau, hình thành các sợi dài bóp 
méo hình dạng của các hồng huyết cầu, dẫn 
đến tình trạng người khỏe mạnh bình thường 
trở nên thiếu máu trầm trọng.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 141 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 142
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 143
• Như vậy, Với DNA trên mạch GAG (CTC) khi 
phiên mã sang mRNA sẽ là GAG (đây là 
amino acid có tên Glutamic acid).
• Tuy nhiên, do sự biến đổi, GAG thay bởi 
GTG (CAC), và được phiên mã sang mRNA 
thành GUG. Mà đó là một amino acid có tên 
là Valine.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 144
37
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 145
• Với người nghiên cứu về tin học: 
– Protein như một bài văn, 
– Mà các câu văn là các trình tự Peptide
– Những từ của câu văn đó là các Amino acid
– Các chữ cái là A, C, G, T dùng để tạo nên từ
• Vấn đề làm sao biết quy tắc văn phạm để 
tạo nên câu, tạo nên bài văn.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 146
MỘT SỐ KHÁI NIỆM CƠ BẢN
Một chút về lịch sử
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 147
1.4. Một số khái niệm cơ bản
• Đại phân tử sinh học: hay đa phân tử sinh 
học (biopolymer) là một đa phân tử (polymer) 
có trong các cơ thể sống.
• Có 4 đại phân tử không thể thiếu để hình 
thành nên cơ thể sống; đó là:
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 148
38
• Protein
• Nucleic acid
• Polysaccharide
• Lipid
• Về mặt tổ chức, đây là 
những hợp chất cấu tạo 
nên từ nhiều phân tử 
cùng hoại, gọi là đơn 
phân tử (monomer)
• Chúng liên kết với nhau 
bằng liên kết cộng hóa 
trị.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 149
• Quan trọng hơn cả là:
– Nucleic acid: lưu trữ thông tin di truyền
– Protein: biểu hiện của vật chất sống
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 150
• Còn:
– Polysaccharide: tham gia cấu tạo tế bào, là 
nguồn dự trữ năng lượng chính
– Lipid: thành phần của màng tế bào, được cấu tạo 
từ các acid béo; là nhân tố chính để hình thành 
các màng sinh học.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 151
• Một đặc điểm quan trọng là cấu trúc và tính 
chất hoá lý của các Nucleic acid, Lipid, 
Polysaccharide tương đối đồng nhất, 
• Nhưng Protein lại đa dạng về cấu trúc và 
chức năng.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 152
39
• Ngoài ra, như đã nói ở trên, tất cả các đại 
phân tử sinh học đều được cấu thành từ một 
số đơn vị cấu tạo đơn giản và kết nối với 
nhau rất chặt chẽ đó là các đơn phân tử 
(monomer).
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 153
• Chẳng hạn,
– Nucleic acid được hình thành từ nucleotide, các 
nucleotide này bao gồm phosphate, đường 
pentose và base hữu cơ
– Protein được hình thành từ các amino acid
– Polysaccharide được hình thành từ các 
monosaccharide
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 154
NUCLEIC ACID
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 155
Nucleic acid
• Thực chất Nucleic acid là vật chất 
mang thông tin di truyền của các 
cơ thể sống, được hình thành từ 
các phân tử nucleotide. 
• Mỗi nucleotide gồm 3 thành phần:
– Phosphate
– Đường Pentose 
– Và một Base hữu cơ
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 156
40
• Do các Nucleotide chỉ khác nhau ở thành 
phần Base hữu cơ, 
• Nên thỉnh thoảng người ta thường dùng thuật 
ngữ Base thay cho Nucleotide.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 157
• Đại phân tử Nucleic acid gồm 2 loại đa phân 
tử giống nhau:
– DNA: Deoxyribonucleic Acid
– RNA: Rebonucleic Acid
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 158
DEOXYRIBONUCLEIC ACID
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 159
Deoxyribonucleic Acid
• Đại phân tử DNA là chuỗi xoắn 
kép gồm 2 mạch đơn, mỗi mạch 
đơn là một chuỗi nucleotide. 
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 160
41
Deoxyribonucleic Acid
• Chuỗi nucleotide của DNA bao gồm 
– Phosphate, 
– Đường Desoxyribose
– Và một trong 4 base hữu cơ là Adenine (A), 
Cytosine (C), Guanine (G) và Thymine (T). 
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 161
• Các nucleotide trong một mạch đơn liên kết 
với nhau bằng liên kết cộng hóa trị
– là liên kết được hình thành giữa đường của 
nucleotide này với phosphate của nucleotide kế 
tiếp. 
• Hai mạch đơn liên kết với nhau bằng liên kết 
hydro hình thành giữa các base
– là tương tác tĩnh điện yếu giữa phần tử Hydro 
mang điện tích dương với phần tử mang điện tích 
âm
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 162
• Trong hai mạch đơn liên kết với nhau thì:
– G của mạch này liên kết với C của mạch kia 
– A của mạch này liên kết với T của mạch kia
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 163
• Lưu ý rằng, do DNA là một chuỗi xoắn kép 
và liên kết giữa 2 chuỗi được thông qua liên 
kết giữa A-T và C-G.
• Nên trong trình tự DNA người ta thường gọi 
AT và CG là các cặp base (base pair).
• Từ đó, chiều dài của trình tự DNA thường 
được đo bằng base pase (bp)
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 164
42
Cấu trúc DNA
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 165
• Do các Nucleotide chỉ khác nhau thành phần 
base hữu cơ, 
• Nên đại phân tử DNA như là một trình tự sinh 
học (Biology sequence) gồm các base là:
– A (Adenine),
– C (Cytosine), 
– G (Guanine),
– T (Thymine). 
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 166
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 167
C5H6N2O2 C5H5N5
C4H5N3O C5H5N5O
• Điều này rất thuận lợi khi biểu diễn các đại 
phân tử DNA trên máy tính bằng chuỗi ký tự 
chứa bốn ký tự chữ A, C, G, T
• Như vậy, với một chuỗi nucleotid được người 
nghiên cứu về tin học coi đó như là một chuỗi 
gồm 4 ký tự chữ như trên
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 168
43
• Khi đó, số lượng chuỗi 
nuleotide sẽ rất lớn
– Ví dụ, một chuỗi có 10 
nucleotide, thì số loại DNA khác 
nhau là 410 = 220 = 1.048.576
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 169
REBONUCLEIC ACID
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 170
Ribonucleic Acid
• Đại phân tử RNA tương tự DNA nhưng có 3 
điểm khác nhau:
– Là chuỗi xoắn đơn
– Đường Pentose là Ribose
– Thymine được thay bởi Uracil (U)
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 171
C4H4N2O2
• Trong tế bào có 3 loại RNA chính, 
tham gia vào quá trình dịch mã 
sang protein:
– mRNA (messenger RNA)
– tRNA (transfer RNA)
– rRNA (ribosomal RNA
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 172
44
• mRNA: là các RNA thông 
tin. 
– Đây chính là các bản sao của 
các trình tự trên DNA, nhằm 
chuyển thông tin mã hóa trên 
DNA đến bộ máy giải mã 
protein tương ứng.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 173
• tRNA: là các RNA vận chuyển, đóng vai trò 
vận chuyển các amino acid đến bộ máy dịch 
mã để tổng hợp ra protein từ mRNA tương 
ứng.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 174
• rRNA: là các RNA của risbosome, rRNA này 
chiếm phần lớn tổng số RNA của tế bào. 
• Ribosome là một thành phần trong bộ máy 
dịch mã của tế bào, được tạo thành bằng 
cách kết hợp rRNA với protein
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 175
PROTEIN
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 176
45
Amino acid
• Amino acid được cấu thành từ các base trên 
trình tự DNA, 
• Có tất cả 20 Amino acid chính
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 177
• Cấu trúc bao gồm 
– một nguyên tử carbon ở trung tâm, nguyên tử 
carbon này được gắn với nguyên tử Hydro và 
được gọi là nguyên tử C-α (α-carbon)
– Nguyên tử C-α liên kết với 3 thành phần khác là 
nhóm amino (NH2), nhóm carboxylic (COOH) và 
gốc amino acid ký hiệu là R
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 178
• Các gốc amino acid khác nhau sẽ tạo ra các 
amino acid với tính chất hóa học khác nhau.
• Chẳng hạn, với amino acid: Alanine, Serine
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 179
SerineAlanine
• Trình tự các base trên DNA quyết định trình 
tự amino acid trên protein tương ứng.
• Mỗi amino acid có 3 base, nên với 4 base A, 
C, G, T sẽ có số lượng amino acid lý thuyết 
là 43 = 64 (gọi là 64 codon)
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 180
46
• Tuy nhiên, hiện nay 
chỉ phát hiện được 
20 amino acid với 
mã di truyền như 
hình.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 181
• Margaret Oakley Dayhoff 
(American Physical Chemist, 
pioneer in Bioinformatics) đề 
xuất dùng one-letter code để 
mã hóa 20 amino acid này.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 182
Bảng mã ký tự của 20 amino acid
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 183
• Nên có hơn 1 codon mã 
hóa một amino acid.
• Bảng mã di truyền chuẩn 
được Marshall Warren 
Nirenberg (Giải Nobel Y 
học 1968) và Matthaei 
đưa ra năm 1961 như 
hình
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 184
47
Mã di truyền
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 185
Bảng 20 amino acid
• Theo bảng mã này:
– chỉ có 61 codon chứa thông tin (mã hóa amino 
acid cụ thể)
– 3 codon: UAA, UAG, UGA là dấu hiệu kết thúc
– Codon AUG vừa là amino acid có tên Methionine 
(Met) vừa là dấu hiệu bắt đầu
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 186
Công thức hóa học của 20 amino acid
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 187
• Trong 20 amino acid này có 9 
amino acid gọi là thiết yếu 
• Bởi nó không thể được tạo ra 
trực tiếp từ cơ thể con người, 
• Mà được cung cấp thông qua 
nguồn thực phẩm dinh dưỡng từ 
bên ngoài.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 188
48
• 9 amino acid thiết yếu đó 
là: histidine, isoliucine, 
leucine, lysine, 
methionine, 
phenylalanine, threonine, 
tryptophan, valine.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 189
CHUỖI PEPTIDE
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 190
Liên kết peptide (Peptide bond)
• Là liên kết giữa đầu Carboxylic (COOH) của 
amino acid này với đầu amin (NH2) của 
amino acid khác và loại bỏ đi một phân tử 
nước (H2O)
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 191
Chuỗi peptide
• Là chuỗi không nhiều hơn 50 amino acid 
trong đó các amino acid này liên kết với nhau 
theo liên kết peptide.
• Một đầu của chuỗi là nhóm amino (H3N+) và 
một đầu là nhóm carboxylic (COO-)
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 192
49
• Khi có nhiều hơn 50 amino acid người ta hay 
gọi đó là chuỗi polypeptide.
• Nên thực chất: chuỗi polypeptide là một 
chuỗi gồm nhiều chuỗi peptid; nó dài và 
không phân nhánh.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 193 Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 194
• Liên kết peptide trong cấu trúc bậc một của 
protein là một liên kết đặc biệt, 
– mạnh hơn liên kết đơn nhưng lại yếu hơn liên kết 
đôi. 
• Chính điều này đã tạo cho các liên kết trong 
chuỗi peptide vừa có tính ổn định của một 
liên kết đôi, vừa có tính linh động của một 
liên kết đơn. 
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 195
• Nhờ tính linh động này, phân tử protein có 
thể tự xoay quanh trục của nó một góc nhỏ.
• Điều này có ý nghĩa đặc biệt quan trọng 
trong việc hình thành cấu trúc bậc cao của 
protein. 
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 196
50
CẤU TRÚC PROTEIN
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 197
Cấu trúc bậc I
• Do amino acid là các đơn phân 
tử cấu thành nên protein, nên 
chuỗi peptid hay polypeptide là 
protein.
• Trong trường hợp chỉ quan tâm 
đến các liên kết peptide trong 
chuỗi này, ta có cấu trúc bậc 1 
của protein (protein primary 
structure)
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 198
Cấu trúc bậc II
• Khi các amino acid gần nhau liên kết 
với nhau thông qua liên kết hydro giữa 
nhóm amin (NH) của amino acid này 
với nguyên tử Oxy của amino acid 
khác sẽ tạo nên vòng xoắn của chuỗi 
polypeptide.
• Khi đó có cấu trúc bậc II của protein 
(secondary structure)
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 199
Cấu trúc bậc III
• Ngoài các liên kết hydro để tạo ra cấu trúc 
bậc II, các nhóm amino acid trên chuỗi 
polypeptide còn liên kết lại cùng nhau. 
• Chẳng hạn, các Cystein sẽ liên kết với nhau, 
hoặc các Proline liên kết với nhau để hình 
thành nên các nhóm riêng.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 200
51
• Khi đó tạo nên cấu trúc 
không gian (3 chiều) của 
tất cả các nguyên tử 
trong phân tử protein. 
Gọi là cấu trúc bậc III 
(Protein tertiary 
structure)
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 201
Cấu trúc bậc IV
• Khi có nhiều hơn một chuỗi polypeptite với 
các cấu trúc bậc III được liên kết với nhau, sẽ 
tạo nên cấu trúc protein bậc IV (Quaternary 
structure)
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 202
Tổng kết
• Protein chiếm phần lớn cấu trúc của tế bào 
và hành động như những enzyme xúc tác 
vào các phản ứng tế bào
• Có 20 amino acid, và 9 trong số đó là rất cần 
thiết cho chế độ ăn uống của con người.
• Tổng hợp: amino acid, peptid bond, protein 
structure
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 203
GIẢI TRÌNH TỰ (SEQUENCING)
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 204
52
CODON
• Như đã có
– Bộ ba mã hóa (codon) đóng vai trò dịch mã tế 
bào
– Mỗi codon mã hóa cho một amino acid để cấu 
tạo nên đại phân tử protein
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 205
– Có tất cả 64 codon, trong đó có 
1 codon mở đầu là AUG (gọi là start codon), gọi là 
Methionine đóng vai trò mở đầu của quá trình dịch mã
3 codon (UAA, UAG, UGA) gọi là codon kết thúc (stop 
codon)
còn lại 61 codon mã hóa cho 20 amino acid.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 206
• Trong quá trình dịch mã, phân tử mRNA 
mang thông tin di truyền từ nhân ra ngoài tế 
bào chất với trình tự là các codon tương ứng 
với trình tự amino acid sắp được tổng hợp.
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 207
ORF
• Open Reading Frame – ORF
– Là một đoạn trình tự DNA có khả năng dịch mã 
thành một chuỗi polypeptide.
– Một ORF được bắt đầu bởi start codon và kết 
thúc bởi stop codon
• Gene: là một ORF mã hóa cho một protein
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 208
53
Minh họa
• Có thể truy cập trang web Sequence 
Manipulation Siute (Ver 2.0) tại 
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 209
để thực hiện các thao 
tác liên quan đến trình 
tự sinh học.
Chẳng hạn
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 210
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 211
Sau khi đã có trình tự, tìm ORF
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 212
54
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 213
Sequencing
• Mục đích là tìm ra nucleotide trong gene
• Frederick Sanger đưa ra phương pháp giải 
trình tự vào năm 1977, gọi là Sanger 
Sequencing.
• Kĩ thuật phổ biến gọi là “chain termination“, 
sử dụng Defective DNA nucleotide (tức là 
nucleotide bị chỉnh sửa làm mất khả năng 
kết hợp thêm một nucleotide khác tại đầu 
3′của nó)
Assoc. Prof. Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 214

File đính kèm:

  • pdfbai_giang_tin_sinh_hoc_dai_cuong_chuong_1_gioi_thieu_ve_tin.pdf