Bottom-up proteomics and top-down proteomics

Nhận dạng protein bằng phương pháp khối phổ song song

11/02/2025

Kỹ thuật Proteomics

15/02/2025

Published by admin on 11/02/2025

Bottom-up proteomics and top-down proteomics

Uyen Nguyen (Research Officer, Hoan Vu Biomolecules., JSC)

Bottom-Up:

Hay được còn được gọi là “shotgun”, một phương pháp dùng enzyme để cắt các đoạn protein lớn thành các peptide có hoặc không có sự tách biệt. Các protein đầu tiên có thể được tách ra bằng GE hoặc sắc ký, trong trường hợp đó mẫu chứa một hoặc một vài protein. Trong trường hợp hỗn hợp protein phức tạp ban đầu có thể được tiêu hóa thành peptide, sau đó được tách ra bằng sắc ký trực tuyến kết hợp với khối phổ điện phun (ESI–MS). Trong trường hợp này dịch tiêu hóa chứa hàng nghìn đến hàng trăm nghìn peptide và cần được tách theo hai hoặc nhiều chiều sắc ký trước khi phân tích MS.

A diagram of a graph Description automatically generated with medium confidence

Hình 1 – Phương pháp Bottom-up Protepmics và Top-down Proteomics

Nhận dạng của protein ban đầu được xác định bằng cách so sánh phổ khối peptide với khối lượng peptide lý thuyết được tính toán từ cơ sở dữ liệu proteomic hoặc genomic. Khối lượng peptide thu được từ quét MS được so sánh với khối lượng peptide tính toán được tạo ra bằng cách cắt “in silico” các chuỗi protein hoặc gen trong cơ sở dữ liệu bằng cách sử dụng cùng độ đặc hiệu như enzyme.

Có hai phương pháp để nhận dạng protein bằng phương pháp từ dưới lên, dấu vân tay khối lượng peptide và MS song song (MS-MS):

Lấy dấu vân tay khối lượng peptide:
- Sau khi hỗn hợp peptide được sắc ký và ion hóa, dấu vân tay của các mảnh peptide được tạo ra bằng phép đo MS/MS để nhận dạng peptide. Phương pháp này có thể thu được một số lượng lớn kết quả nhận dạng trong thời gian ngắn. khối lượng peptide thu được từ quét MS được so sánh với khối lượng peptide tính toán được tạo ra bằng cách cắt “in silico” các chuỗi protein hoặc gen trong cơ sở dữ liệu bằng cách sử dụng cùng độ đặc hiệu như enzyme được sử dụng trong thí nghiệm.
- Một nhược điểm của lấy dấu vân tay khối lượng peptide là yêu cầu đối với protein tinh khiết hoặc hỗn hợp protein đơn giản. Do đó, các bước tinh chế hạn chế thông lượng của phương pháp lấy dấu vân tay khối lượng peptide. Một nhược điểm khác là yêu cầu đối với một số peptide để xác định duy nhất một protein.
- Lấy dấu vân tay khối lượng peptide có thể được thực hiện bằng cùng một thiết bị được sử dụng cho MS-MS, nhưng cũng có thể được thực hiện bằng máy quang phổ khối thời gian bay (TOF) với ion hóa giải hấp phụ laser hỗ trợ ma trận (MALDI)
MS-MS:
- Một ion peptide được cô lập trong máy phân tích khối lượng và trải qua quá trình phân ly để tạo ra các mảnh ion sản phẩm. Trình tự axit amin của ion tiền chất ban đầu có thể được suy ra từ khối lượng của các ion mảnh; điều này tạo thành cơ sở cho giải trình tự de novo bằng MS-MS¹
- Đây là một quá trình tốn nhiều công sức và thời gian, không phù hợp với phân tích thông lượng cao. Ngoài ra, dữ liệu phân mảnh có thể được sử dụng để xác định một đoạn ngắn của trình tự axit amin (một “thẻ trình tự”), có thể được sử dụng để tìm kiếm trong cơ sở dữ liệu²
- Một cách tiếp cận thuận tiện hơn là phương pháp proteomics chưa được giải thích hoặc “shotgun” do Yates tiên phong³, trong đó phổ ion sản phẩm được so sánh với cơ sở dữ liệu bằng phân tích tương quan chéo để xác định protein còn nguyên vẹn.

Trong bước tính toán, phương pháp bản đồ phân tích hiện có bao gồm tìm kiếm thư viện trình tự, tìm kiếm thư viện bản đồ, giải trình tự de novo và phương pháp giải trình tự de novo kết hợp với tìm kiếm khả năng chịu lỗi. Một số phần mềm tìm kiếm thư viện cổ điển đã được sử dụng rộng rãi, bao gồm MASCOT, SEQUEST, X! Tandem, v.v.. Quy trình cơ bản của phương pháp tìm kiếm thư viện trình tự như sau:

- Về mặt lý thuyết, cắt chuỗi protein trong cơ sở dữ liệu thành các peptide và mô phỏng bản đồ phân mảnh của các peptide đã cắt.
- Các bản đồ thử nghiệm được ghép nối và ghi điểm dựa trên sự giống nhau của chúng. Kết quả nhận dạng peptide có độ tin cậy cao thu được bằng các phương pháp kiểm soát chất lượng peptide cụ thể.
- Protein được tạo ra dựa trên sự tương ứng giữa các peptit và trình tự axit amin của protein.

Ưu điểm của các chiến lược từ dưới lên:

Đây phương pháp được sử dụng rộng rãi nhất để xác định và mô tả protein. HPLC pha đảo ngược cung cấp khả năng phân tách độ phân giải cao các sản phẩm tiêu hóa peptide với các dung môi tương thích với ESI.

LC–ESI–MS–MS pha đảo ngược trực tuyến ở quy mô nano có thể được tự động hóa hoàn toàn và hầu như được sử dụng phổ biến cho phân tích protein từ dưới lên. Chiến lược từ dưới lên sử dụng HPLC–MS-MS đa chiều trực tuyến đã thành công nhất trong việc xác định protein trong các sản phẩm tiêu hóa có nguồn gốc từ các hỗn hợp rất phức tạp như dịch phân giải tế bào⁴. Hơn nữa, các kỹ thuật định lượng đã được phát triển bằng cách sử dụng các thẻ ái lực và nhãn đồng vị ổn định để xác định các protein được điều chỉnh tăng và giảm trong phân tích protein biểu hiện⁵.

Hạn chế của các chiến lược từ dưới lên:

Quan trọng nhất là chỉ một phần nhỏ của tổng số quần thể peptide của một protein nhất định được xác định. Do đó, thông tin về chỉ một phần của trình tự protein được thu thập. Rõ ràng từ các nghiên cứu về bộ gen rằng mỗi khung đọc mở có thể tạo ra nhiều dạng protein, có thể bắt nguồn từ các sản phẩm ghép nối thay thế và các loại và vị trí khác nhau của các sửa đổi sau dịch mã (PTM). Các PTM như phosphoryl hóa và glycosyl hóa được biết là quan trọng trong việc điều chỉnh chức năng protein và chuyển hóa tế bào. Một hậu quả của phạm vi trình tự hạn chế trong nghiên cứu proteomics từ dưới lên là mất nhiều thông tin về PTM. Hơn nữa, PTM thường không ổn định trong quá trình CID và yêu cầu các kỹ thuật như quét mất trung tính để phát hiện chúng.

Các hạn chế thực tế gặp phải khi sử dụng các phương pháp từ dưới lên để nhận dạng protein từ các hỗn hợp peptide rất phức tạp. Phân tích LC–MS-MS đa chiều trực tuyến sử dụng trao đổi ion kết hợp với các cột pha đảo ngược đòi hỏi thời gian chạy kéo dài tới 15 giờ hoặc hơn. Mặc dù điều này có thể được tự động hóa, nhưng thông lượng của LC–MS-MS đa chiều khá hạn chế. Các vấn đề khác bao gồm mất thông tin về các peptide có hàm lượng thấp trong phổ khối do các loài có hàm lượng cao chi phối. Cuối cùng, độ rộng đỉnh sắc ký hẹp có thể ảnh hưởng đến việc thu thập thông tin MS–MS đầy đủ trong quá trình rửa giải.

Hình 2 – Sơ đồ phương pháp tiếp cận từ trên xuống so với từ dưới lên trong nghiên cứu về protein.

Top-Down:

Các ion phân tử protein nguyên vẹn được tạo ra bởi ESI được đưa vào máy phân tích khối lượng và trải qua quá trình phân mảnh pha khí. Một trở ngại đối với phương pháp này là việc xác định khối lượng ion sản phẩm từ các ion sản phẩm tích điện nhiều lần⁶. Các ion này có thể thay đổi trạng thái điện tích lên đến ion tiền chất protein tích điện nhiều lần. Hai phương pháp đã được sử dụng để khắc phục hạn chế này. Phương pháp đầu tiên là thao tác trạng thái điện tích thông qua tương tác ion–ion pha khí và phương pháp thứ hai là sử dụng các thiết bị có độ chính xác đo khối lượng cao (MMA).

Có thể giải trình tự trực tiếp các protein nguyên vẹn bao gồm các protein đã biến đổi sau dịch mã và các protein đoạn lớn khác, thay vì chỉ các peptide. Các protein nguyên vẹn đầu tiên được tách ra khỏi các mẫu sinh học phức tạp bằng sắc ký lỏng pha đảo ngược, sau đó được ion hóa trực tiếp bằng công nghệ ion hóa phun điện tử (ESI) hoặc công nghệ ion hóa/giải hấp laser hỗ trợ ma trận (MALDI).

Các ion được tạo ra bị phân mảnh bằng phương pháp phân ly do va chạm (CID), phân ly do va chạm năng lượng cao (HCD), phân ly bắt electron (ECD) hoặc phân ly chuyển electron (ETD) và được phân tích trong khối phổ song song (MS/MS). Phương pháp này hứa hẹn cho việc nhận dạng protein, phân tích, phân tích trình tự và mô tả đặc điểm biến đổi sau dịch mã.

Ưu điểm của chiến lược từ trên xuống:

Hai ưu điểm chính của chiến lược từ trên xuống là khả năng tiếp cận chuỗi protein hoàn chỉnh và khả năng định vị và mô tả đặc điểm của PTM. Ngoài ra, quá trình tiêu hóa protein tốn thời gian cần thiết cho các phương pháp từ dưới lên được loại bỏ.

Hạn chế của chiến lược từ trên xuống:

Proteomics từ trên xuống là một lĩnh vực tương đối mới so với proteomics từ dưới lên và hiện đang gặp phải một số hạn chế. Đầu tiên, quang phổ rất phức tạp do các protein tích điện nhiều lần tạo ra hạn chế cách tiếp cận đối với các protein bị cô lập hoặc hỗn hợp protein đơn giản nhất. Thứ hai, các thiết bị được ưa chuộng (FT-ICR, bẫy ion lai FT-ICR hoặc bẫy ion lai–orbitrap) rất tốn kém để mua và vận hành. Thứ ba, cách tiếp cận từ trên xuống không hiệu quả với các protein nguyên vẹn có kích thước lớn hơn khoảng 50 kDa. Thứ tư, các kỹ thuật phân ly được ưa chuộng (ECT, ETD) là các quy trình hiệu suất thấp đòi hỏi thời gian tích lũy ion, hoạt hóa và phát hiện dài. Điều này hạn chế khả năng kết hợp các kỹ thuật MS từ trên xuống với các phân tách trực tuyến. Thứ năm, các cơ chế về hành vi phân ly protein ít được hiểu rõ hơn so với các cơ chế phân ly peptide.

Nếu các phương pháp tiếp cận từ trên xuống được áp dụng rộng rãi, cần phải hiểu rõ hơn về sự phân mảnh của các ion tích điện nhiều lần⁶, bao gồm ảnh hưởng của trạng thái tích điện ion tiền chất, vai trò của cấu trúc bậc một, bậc hai và bậc ba của protein, và sự đóng góp của PTM. Cuối cùng, các công cụ tin sinh học cho nghiên cứu proteomics từ trên xuống còn thô sơ so với các công cụ cho nghiên cứu proteomics từ dưới lên.

Một chiến lược nghiên cứu protein “từ giữa xuống“

trong đó các protein lớn chịu sự phân giải protein hạn chế bởi các enzyme như LysC, tạo ra các sản phẩm trong phạm vi 5–20 kDa. Các peptide này sau đó được giải trình tự bằng cách sử dụng phương pháp từ trên xuống, có ưu điểm là độ phủ trình tự cao và lưu giữ thông tin PTM.

Tài liệu tham khảo:

1. D. F. Hunt, J. R. Yates, 3rd, J. Shabanowitz, S. Winston, and C. R. Hauer. Protein sequencing by tandem mass spectrometry, Proc Natl Acad Sci U S A 1986, 83(17), 6233-7.

2. M. Mann and M. Wilm. Error-tolerant identification of peptides in sequence databases by peptide sequence tags, Anal Chem 1994, 66(24), 4390-9.

3. J. K. Eng, A. L. McCormack, and J. R. Yates. An approach to correlate tandem mass spectral data of peptides with amino acid sequences in a protein database, J Am Soc Mass Spectrom 1994, 5(11), 976-89.

4. A. J. Link, J. Eng, D. M. Schieltz, E. Carmack, G. J. Mize, D. R. Morris, B. M. Garvik, and J. R. Yates, 3rd. Direct analysis of protein complexes using mass spectrometry, Nat Biotechnol 1999, 17(7), 676-82.

5. S. P. Gygi, B. Rist, S. A. Gerber, F. Turecek, M. H. Gelb, and R. Aebersold. Quantitative analysis of complex protein mixtures using isotope-coded affinity tags, Nat Biotechnol 1999, 17(10), 994-9.

6. G. E. Reid and S. A. McLuckey. ‘Top down’ protein characterization via tandem mass spectrometry, J Mass Spectrom 2002, 37(7), 663-75.