Research & Development (R&D)
07/02/2025
Bottom-up proteomics and top-down proteomics
11/02/20251. Giới thiệu về Nhận dạng Protein và Phổ khối Tandem
Phổ khối song song (MS/MS) là quá trình xác định và phân tích protein bằng cách cung cấp khả năng chính xác và thông lượng cao để phân tích các hỗn hợp protein phức tạp với độ nhạy đáng chú ý. Việc xác định và mô tả đặc điểm của protein là trọng tâm của khoa học sự sống, cho phép chúng ta làm sáng tỏ các cơ chế phân tử của chức năng tế bào, trạng thái bệnh tật và phản ứng với thuốc.
Phổ khối (MS), và cụ thể hơn là phổ khối song song (MS/MS), đã nổi lên như một kỹ thuật hàng đầu để xác định protein, do độ chính xác và khả năng phân tích nhanh chóng các tập dữ liệu lớn. Bằng cách kết hợp sắc ký lỏng (LC) với MS song song, các nhà nghiên cứu có thể đạt được khả năng phân tách và phân tích protein trong các mẫu sinh học phức tạp thậm chí còn tốt hơn—một quy trình được gọi là xác định protein LC-MS/MS.
2. Tại sao sử dụng khối phổ để xác định protein?
Khác với các phương pháp truyền thống để nhận dạng protein, LC-MS/MS cho phép tách peptide hiệu quả trước khi chúng đi vào máy quang phổ khối, nó có thể phân tích nhanh các hỗn hợp, giúp nhận dạng protein và phân tích protein trên quy mô lớn bằng cách nhận dạng và mô tả protein dựa trên tỷ lệ khối lượng trên điện tích (m/z) của chúng.
3. Nguyên lý của phép đo phổ khối song song để xác định protein
Phổ khối song song (MS/MS) còn được gọi là MS-MS, hoạt động thông qua 5 giai đoạn được thiết kế để phân tích chính xác các protein hoặc peptide phức tạp. Ưu điểm: có lợi cho việc nhận dạng protein vì nó cho phép phân tích chi tiết các protein thành các peptide nhỏ hơn, có thể nhận dạng được, sau đó có thể khớp với các trình tự đã biết trong cơ sở dữ liệu protein.
Giai đoạn 1 – Ion hóa: Chuyển đổi protein thành các hạt tích điện
Bước thiết yếu đầu tiên trong phép đo phổ khối song song là ion hóa, một quá trình chuyển đổi protein hoặc peptide thành các ion pha khí để chúng có thể được thao tác và đo bằng máy quang phổ khối. Hai trong số các phương pháp ion hóa phổ biến nhất được sử dụng trong phép đo phổ khối protein là:
- Electrospray Ionization (ESI): Trong ESI, mẫu protein được đưa vào dưới dạng lỏng và đi qua một kim nhỏ dưới điện áp cao. Quá trình này tạo ra một lớp sương mù mịn của các giọt tích điện, từ đó dung môi bốc hơi, để lại các ion protein hoặc peptide tích điện.
- Hấp phụ/Ion hóa bằng laser hỗ trợ ma trận (MALDI): Ở đây, mẫu protein được nhúng trong một ma trận tinh thể và chịu tác động của tia laser, làm bay hơi ma trận và ion hóa protein. MALDI đặc biệt phù hợp với các protein có khối lượng lớn và thường được sử dụng trong các ứng dụng phân tích protein đòi hỏi phạm vi khối lượng rộng.

Hình 1. Quá trình phổ khối MALDI-TOF (Tâm Trần, Research Officer, Hoan Vu Biomolecules., JSC)
Các kỹ thuật ion hóa này cho phép sử dụng phép đo phổ khối để phân tích protein bằng cách tạo ra các ion có thể đo được dựa trên tỷ lệ khối lượng trên điện tích (m/z) của chúng.
Giai đoạn 2 – Lựa chọn khối lượng: Cô lập các ion cụ thể
Sau khi ion hóa, các ion thu được được đưa vào máy phân tích khối đầu tiên. Trong MS-MS, máy phân tích này hoạt động như một bộ lọc, chỉ cho phép các ion có tỷ lệ m/z cụ thể đi qua giai đoạn tiếp theo. Bước lựa chọn này rất cần thiết để xác định protein bằng phép đo phổ khối vì nó cô lập một ion cụ thể để phân tích chi tiết mà không bị ảnh hưởng bởi các ion khác có trong mẫu.
Có một số loại máy phân tích khối lượng được sử dụng trong phép đo phổ khối song song, mỗi loại có những đặc điểm riêng:
- Máy phân tích khối tứ cực: Sử dụng trường điện để lọc các ion theo tỷ lệ m/z của chúng. Thường được sử dụng trong quy trình MS song song, tứ cực có hiệu quả cao trong việc cô lập các ion cụ thể và thường được sử dụng trong phép đo phổ khối song song LC-MS/MS.
- Máy phân tích Time-of-Flight (TOF): Đo thời gian cần thiết để các ion đến được máy dò, với các ion nhẹ hơn đến nhanh hơn các ion nặng hơn. Máy phân tích TOF cung cấp độ phân giải cao, khiến chúng phù hợp với các hỗn hợp protein phức tạp.
- Orbitrap và cộng hưởng Cyclotron ion biến đổi Fourier (FTICR): Các máy phân tích có độ phân giải cao này lý tưởng cho việc phân tích protein chính xác bằng phép đo phổ khối và có thể phát hiện ra những khác biệt rất nhỏ về khối lượng, điều này rất quan trọng trong việc xác định và phân biệt protein.
Giai đoạn 3 – Phân mảnh: Phân hủy Peptide để giải trình tự
Sau khi được cô lập, các ion được chọn trải qua quá trình phân mảnh trong một ô va chạm, tại đó chúng bị bắn phá bằng các phân tử khí trơ (thường là nitơ hoặc heli). Bước này, được gọi là phân ly do va chạm (collision-induced dissociation-CID) hoặc phân ly va chạm năng lượng cao hơn (higher-energy collisional dissociation-HCD), phá vỡ các ion peptide thành các mảnh nhỏ hơn, thường là tại các liên kết peptide. Quá trình phân mảnh tạo ra một loạt các ion phản ánh cấu trúc và trình tự của peptide ban đầu, một đặc điểm quan trọng để xác định peptide bằng phép đo phổ khối.
Các ion mảnh thường được phân loại thành ion b và ion y, đại diện cho các mảnh mà điện tích vẫn nằm ở đầu N hoặc đầu C của peptide. Mẫu của các ion này trên phổ MS/MS tạo thành dấu vân tay duy nhất có thể được ánh xạ vào các chuỗi peptide trong cơ sở dữ liệu, một bước cốt lõi trong việc xác định protein bằng khối phổ.
Giai đoạn 4 – Phân tích và phát hiện khối lượng thứ hai
Các ion phân mảnh được tạo ra trong ô va chạm sau đó đi vào máy phân tích khối lượng thứ hai, tại đó tỷ lệ m/z của chúng được đo và ghi lại, tạo ra phổ MS/MS cuối cùng. Phổ MS/MS này cung cấp cái nhìn toàn diện về kiểu phân mảnh của peptide, điều này rất cần thiết để xác định trình tự axit amin của peptide. Mức độ chi tiết trong dữ liệu phổ này rất quan trọng để xác định protein bằng phép đo phổ khối và hỗ trợ đặc tính protein chính xác, bao gồm xác định các sửa đổi sau dịch mã ( post-translational modifications – PTM).
Giai đoạn 5 – Diễn giải dữ liệu và khớp với cơ sở dữ liệu protein
Phổ MS/MS sau đó được phân tích bằng các công cụ tin sinh học, so sánh các mẫu phân đoạn với cơ sở dữ liệu protein. Các thuật toán như Mascot, SEQUEST và MaxQuant tạo điều kiện thuận lợi cho việc nhận dạng protein bằng cách ghi điểm các điểm trùng khớp giữa phổ quan sát được và phổ peptide lý thuyết được tạo ra từ các trình tự protein đã biết. Quá trình khớp này cho phép các nhà nghiên cứu xác định chính xác danh tính của protein với độ tin cậy cao và trong nhiều trường hợp, mô tả các sửa đổi hoặc đặc điểm cấu trúc cụ thể.
4. Các bước tiến hành xác định protein bằng LC-MS/MS

Hình 2. Các bước tiến hành xác định protein bằng LC-MS (Tâm Trần, Research Officer, Hoan Vu Biomolecules., JSC)
Bước 1 – Chuẩn bị mẫu protein
Chuẩn bị mẫu bắt đầu bằng việc chiết xuất và tinh chế protein từ vật liệu (hoặc mô) trong tế bào động vật hoặc thực vật… Các mẫu thường được phân cắt bằng enzyme (thường là trypsin) thành các peptide nhỏ hơn để cải thiện hiệu quả phát hiện và nhận dạng.
Bước 2 – Tách bằng sắc ký lỏng (LC)
Trong LC-MS/MS để nhận dạng protein, các peptide đầu tiên được tách bằng sắc ký lỏng. Giai đoạn LC làm giảm độ phức tạp của mẫu, cho phép mỗi peptide đi vào hệ thống MS song song với sự chồng chéo tối thiểu, giúp tăng cường độ tin cậy của việc nhận dạng protein bằng phép đo phổ khối.
Bước 3 – Phân tích khối phổ song song
Trong giai đoạn MS, các peptide được ion hóa và lọc qua máy phân tích khối đầu tiên, máy này sẽ chọn các ion để phân mảnh trong ô va chạm. Các ion phân mảnh kết quả được phát hiện trong máy phân tích khối thứ hai, tạo ra quang phổ cho thấy trình tự của peptide. Dữ liệu trình tự này rất quan trọng trong việc xác định protein bằng phép đo phổ khối vì nó cho phép các nhà nghiên cứu tái tạo cấu trúc chính của peptide.
Bước 4 – Thu thập dữ liệu LC-MS/MS
Trong giai đoạn thu thập dữ liệu, máy quang phổ khối song song thu thập dữ liệu quang phổ thô, bao gồm tỷ lệ khối lượng trên điện tích (m/z) của các ion peptide và các ion mảnh của chúng, cùng với các giá trị cường độ của chúng. Quá trình thu thập dữ liệu này được đồng bộ hóa theo thời gian với quá trình tách LC, do đó hệ thống có thể liên hệ các peptide cụ thể với thời gian lưu, thêm một lớp đặc hiệu nữa vào phép đo quang phổ khối protein. Dữ liệu MS/MS thu được được lưu trữ ở định dạng thô để phân tích tính toán thêm, trong đó quang phổ sẽ được so sánh với cơ sở dữ liệu protein để tạo điều kiện thuận lợi cho việc nhận dạng protein.
Bước 5 – Phân tích dữ liệu để xác định protein
Quá trình nhận dạng đạt đến đỉnh cao trong tin sinh học. Phần mềm chuyên dụng, chẳng hạn như Mascot, SEQUEST và MaxQuant, so sánh phổ MS/MS với các cơ sở dữ liệu protein đã biết, cho phép nhận dạng protein với độ chính xác cao. Nhận dạng peptide bằng khối phổ là then chốt ở đây, vì nó cho phép khớp từng peptide với protein mục tiêu.
5. Ưu điểm của Tandem MS trong việc nhận dạng protein
– Độ đặc hiệu cao thông qua Phân tích phân mảnh
Một trong những tính năng có giá trị nhất của tandem MS là khả năng tiến hành phân tích phân mảnh. Bằng cách phân chia peptide thành các mảnh nhỏ hơn, tandem MS tạo ra một quang phổ độc đáo phản ánh trình tự các axit amin trong một peptide. Sự phân mảnh này tạo ra các ion b và ion y, tương ứng đại diện cho các mảnh đầu N và đầu C, và cùng nhau cung cấp dấu vân tay cụ thể cho từng peptide.
Các mẫu phân mảnh cho phép MS tandem phân biệt giữa các protein với độ chính xác cao, ngay cả giữa các biến thể có liên quan chặt chẽ hoặc các trình tự tương đồng. Mức độ đặc hiệu này rất quan trọng khi phân tích các mẫu phức tạp chứa hàng nghìn protein, vì MS tandem có thể xác định chính xác các peptide ngay cả khi có peptide isobaric hoặc peptide tương tự.
– Độ nhạy cao đối với protein có hàm lượng thấp
Phổ khối protein qua MS song song có độ nhạy cao, cho phép phát hiện protein có nồng độ rất thấp. Độ nhạy này đặc biệt có lợi trong nghiên cứu protein, nơi nhiều protein có ý nghĩa sinh học (ví dụ, phân tử tín hiệu, yếu tố phiên mã hoặc dấu ấn sinh học) có thể tồn tại ở mức độ thấp và sẽ khó phát hiện bằng các phương pháp kém nhạy hơn.
Sử dụng các kỹ thuật ion hóa tiên tiến như ion hóa phun điện (electrospray ionization-ESI) hoặc ion hóa/giải hấp laser hỗ trợ ma trận (matrix-assisted laser desorption/ionization-MALDI), MS song song có thể xác định và định lượng protein với lượng mẫu bị mất tối thiểu. Độ nhạy này cho phép các nhà nghiên cứu đạt được khả năng nhận dạng protein mạnh mẽ ngay cả trong các mẫu có phạm vi nồng độ khó, chẳng hạn như huyết tương máu hoặc dịch phân giải tế bào.
– Năng suất cao cho Proteomics quy mô lớn
Trong proteomics LC-MS/MS, thiết lập MS song song kết hợp với sắc ký lỏng cho phép phân tích thông lượng cao các hỗn hợp protein phức tạp. Thành phần LC cho phép tách các peptide trước khi chúng đến máy quang phổ khối, đảm bảo mỗi peptide được phân tích độc lập với sự can thiệp tín hiệu giảm từ các ion chồng chéo. Cấu hình này đẩy nhanh quá trình nhận dạng, khiến MS song song trở nên lý tưởng cho các nghiên cứu proteomics quy mô lớn, trong đó hàng trăm hoặc hàng nghìn protein có thể cần được nhận dạng trong một thí nghiệm duy nhất.
Thông lượng cao là một lợi thế đáng kể trong các lĩnh vực nghiên cứu đòi hỏi phải thu thập dữ liệu nhanh chóng, chẳng hạn như phát hiện dấu ấn sinh học, phát triển thuốc và chẩn đoán lâm sàng. Với MS song song, các nhà nghiên cứu có thể phân tích nhiều mẫu và điều kiện trong thời gian ngắn hơn, có được cái nhìn toàn diện hơn về proteome và tạo ra dữ liệu quan trọng cho những hiểu biết sinh học.
– Khả năng phát hiện và mô tả các sửa đổi sau dịch mã (PTM)
Các sửa đổi sau dịch mã (PTM) như phosphoryl hóa, glycosyl hóa và ubiquitin hóa rất quan trọng đối với chức năng và sự điều hòa của protein, nhưng lại khó xác định do tính đa dạng về cấu trúc và độ phong phú thấp của chúng. Tandem MS vượt trội trong việc mô tả đặc điểm của PTM bằng cách nắm bắt mô hình phân mảnh chính xác của các peptide đã sửa đổi, điều này rất cần thiết để xác định cả loại sửa đổi và vị trí trên protein.
Thông qua phân mảnh có mục tiêu, tandem MS có thể phân biệt PTM với các dạng peptide chưa biến đổi, tạo ra các mẫu ion độc đáo báo hiệu sự hiện diện và vị trí cụ thể của các biến đổi. Khả năng này vô cùng có giá trị đối với các nghiên cứu đòi hỏi phải mô tả chi tiết về protein và được sử dụng rộng rãi trong phép đo phổ khối để phân tích protein trong nghiên cứu chức năng proteomics.
– Khả năng tương thích dữ liệu với các công cụ tin sinh học tiên tiến
Một lợi thế khác của MS song song là khả năng tương thích của dữ liệu đầu ra với nhiều nền tảng tin sinh học khác nhau, giúp tăng cường đáng kể khả năng xử lý và diễn giải phổ MS/MS phức tạp. Nhận dạng protein bằng phép đo phổ khối dựa trên việc so sánh phổ thu được với cơ sở dữ liệu protein đã biết, một nhiệm vụ được quản lý bởi phần mềm như Mascot, SEQUEST và MaxQuant.
Các công cụ này sử dụng thuật toán để so sánh các mẫu phân mảnh từ MS tandem với quang phổ lý thuyết, tạo điều kiện cho việc xác định protein hiệu quả và chính xác trên nhiều loài và loại mẫu. Bằng cách tích hợp với phần mềm như vậy, MS tandem cho phép các nhà nghiên cứu tận dụng khả năng khớp cơ sở dữ liệu mạnh mẽ, điều này rất quan trọng để xác định các protein mới hoặc không mong muốn trong các tập dữ liệu lớn.
– Tính linh hoạt trên các mẫu sinh học khác nhau và thiết kế thử nghiệm
Tandem MS có khả năng thích ứng cao với nhiều loại mẫu và thiết lập thử nghiệm. Cho dù phân tích hỗn hợp đơn giản, chất lỏng sinh học phức tạp hay mẫu mô, tandem MS có thể được tối ưu hóa để phân tích protein cụ thể theo nhu cầu khối phổ. Tính linh hoạt của tandem MS cũng mở rộng sang các chế độ định lượng khác nhau, bao gồm cả định lượng không có nhãn và có nhãn (ví dụ: SILAC, TMT), khiến nó phù hợp với các nghiên cứu về proteomics so sánh đòi hỏi phải đo chính xác lượng protein trong nhiều điều kiện.
Tính linh hoạt này cho phép MS song song được áp dụng rộng rãi, từ nghiên cứu sinh học cơ bản đến các ứng dụng lâm sàng và dược lý, nơi nó cung cấp những hiểu biết cần thiết về cấu trúc protein, chức năng và mạng lưới tương tác.
– Độ chính xác và khả năng tái tạo cao trong việc xác định protein
Khả năng tái tạo của tandem MS là một lợi ích quan trọng, bằng cách sử dụng các quy trình ion hóa và phân mảnh được kiểm soát, tandem MS tạo ra quang phổ nhất quán, chất lượng cao có thể được phân tích nhiều lần để xác nhận nhận dạng protein. Độ chính xác này đặc biệt có giá trị đối với các nghiên cứu đòi hỏi dữ liệu có độ tin cậy cao, chẳng hạn như các nghiên cứu trong các lĩnh vực được quản lý như nghiên cứu protein lâm sàng hoặc phân tích protein điều trị.
Tài liệu tham khảo
- Raquel Pérez-Míguez, María Luisa Marina, María Castro-Puyana. High resolution liquid chromatography tandem mass spectrometry for the separation and identification of peptides in coffee silverskin protein hydrolysates. Microchemical Journal, 2019,149.
- Swearingen Kristian E, Eng Jimmy K, Shteynberg David, et al. A Tandem Mass Spectrometry Sequence Database Search Method for Identification of O-Fucosylated Proteins by Mass Spectrometry. Journal of proteome research, 2019,18(2).





