重庆理工大学学报(自然科学) ›› 2023, Vol. 37 ›› Issue (6): 242-248.

• 信息·计算机 • 上一篇    下一篇

多信息融合和自注意力识别新冠磷酸化位点

闫 路,来佳丽,王明辉   

  1. 青岛科技大学 数理学院,山东 青岛 266042
  • 出版日期:2023-07-12 发布日期:2023-07-12
  • 作者简介:闫路,女,硕士研究生,主要从事生物信息学研究,Email:yanlu_qust@163.com;通信作者 王明辉,博士,教授,主 要从事科学计算和生物计算研究,Email:mhwang@qust.edu.cn。

Multi-information fusion and self-attention identification of phosphorylation sites of SARS-CoV-2

  • Online:2023-07-12 Published:2023-07-12

摘要: 由严重急性呼吸系统综合症冠状病毒 2(SARSCoV2)引起的疾病正在威胁着人 们的健康。识别磷酸化位点是理解感染新型冠状病毒的分子机制的重要步骤。由于实验方法 的局限性,建立有效的预测模型是非常有必要的,由此提出一种新的新冠磷酸化位点预测模型 SelfDeepIPs。利用二肽组成 (DC),增强氨基酸组成 (EAAC),组成、转化和分布(CTD),BLO SUM62四种特征提取方法将蛋白质序列信息转化为数字信息,并首尾相连融合这些特征,采用 互信息方法去除冗余信息。利用 BILSTM和自注意力机制结合构建深度学习模型预测新冠磷 酸化位点。利用五折交叉验证对模型进行检验。训练集的 ACC和 AUC值分别达到 83.62%和 91.70%,独立测试集的 ACC和 AUC值分别达到 82.56%和 91.23%。实验结果表明:SelfDeep IPs方法能够有效识别新冠磷酸化位点。

关键词: 新冠磷酸化, 多信息融合, 自注意力机制, 深度学习

Abstract: The disease caused by severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) is threatening people’s health and lives.Identifying phosphorylation sites is an important step in understanding the molecular mechanism of SARS-CoV-2.Due to the limitations of experimental methods,it is very necessary to establish effective prediction models.Therefore,a new SARS-CoV-2 phosphorylation site prediction model,Self-DeepIPs,is proposed.The protein sequence information is converted into digital information using dipeptide composition (DC),enhanced amino acid composition (EAAC),composition,transformation and distribution (CTD) and BLOSUM62.These features are also fused end-to-end,and the mutual information (MI) method is used to remove redundant information.The combination of BILSTM and the self-attention mechanism is used to build a deep learning model to predict the phosphorylation sites of the SARS-CoV-2.Then,five-fold cross-validation is used to test the model.The ACC and AUC values on the training set reach 83.62% and 91.70% respectively,and the ACC and AUC values on the independent test set reach 82.56% and 91.23% respectively.The experimental results show that the Self-DeepIPs method proposed in this paper can effectively identify SARS-CoV-2 phosphorylation sites.

中图分类号: 

  • TP181