本周分享文献:Disease-specificvariantpathogenicitypredictionsignificantlyimprovesvariantinterpretationininheritedcardiacconditions,于年10月13日发表在GeneticsinMedicine(IF=8.)上。
罕见变异的致病性仍是目前临床基因组学解释的主要问题。目前主流的、基于机器学习的变异分类工具其结果并不准确,同时也忽略了基因-疾病的关系。本研究提出了整合疾病特异性信息可以提高变异分类准确性的假设,开发了一个疾病特异性变异的分类器CardioBoost,用来估计罕见错义突变在遗传性心脏病和心律失常中的致病概率,区分已知的致病性和良性突变,对疾病相关变异和患者的结局进行划分。
本研究在可靠的遗传性心脏病中的基因-疾病关系数据(个心肌病相关基因的变异和个心律失常相关基因的变异)的基础上,通过整合76种其他计算工具的变异注释和致病性评分,使用AdaBoost算法构建了遗传性心脏病特异性变异分类器CardioBoost,能够预测与遗传性心脏病和遗传性心律失常综合征密切相关的基因中罕见错义突变的致病性概率。详细研究路线如下图:
详见原文Figure1a:模型的训练和评价
CardioBoost和其他工具的性能比较
◆全局分类评价指标下分类器的性能使用PR-AUC和ROC-AUC曲线下的面积来评判。在和其他几种主流工具的比较中,CardioBoost在PR-AUC和ROC-AUC的评价指标都达到了最优值,说明CardioBoost的分类性能都优于目前主流的全基因组水平的预测工具(图2)。
详见原文Figure2:CardioBoost和其他几种主流工具的分类性能比较
◆除了估计传统的分类性能外,还在临床决策的确定性水平阈值上比较了CardioBoost和其他几种主流工具的表现,如下表所示,可以看出CardioBoost的性能也优于已知的几种工具。
详见原文Table1:临床相关变异分类阈值下CardioBoost和其他工具的性能比较
CardioBoost能够提高致病突变和良性突变的预测效果
◆本研究使用了其他4个来源的致病性已知的变异数据来进一步测试CardioBoost,详细数据如下表。可以看出,和其他两个软件相比,CardioBoost在致病性变异和良性突变的分类性能上都达到了最好。
详见原文Table2:CardioBoost在其他4个来源的数据中的分类结果
CardioBoost能有效区分与疾病高度相关的变异
◆在心肌病相关的8个基因中,CardioBoost预测发现其中7个基因(MYH7、TNNI3、TPM1、ACTC1、TNNT2、MYBPC3和MYL3)上变异的OR值(即预测的致病性概率Pr≥0.9)大于所有变异(包括所有观察到的变异,而不区分致病和良性变异)的基线值,说明CardioBoost能够区分和疾病强相关的变异。而M-CAP和REVEL的预测结果在OR值上则没有显示出这种差异。
CardioBoost的变异分类和不良临床结局有关
◆通过比较例携带肌节蛋白基因罕见突变的肥厚型心肌病患者和1,例不携带此类突变的肥厚型心肌病患者的无事件生存率(如第一次出现复合不良临床结果时的年龄,包括心力衰竭事件、心律失常事件、中风和死亡),并按照CardioBoost预测的致病性分层,结果显示相比于不携带CardioBoost预测为致病性突变的患者,携带这些突变的患者倾向于更早的发病时间和更高比例的不良结局。在60岁之前,患者由心血管疾病引起的总体综合结局的发生概率为54%(95%Ci:46-59%),而基因型阴性患者为33%(95%Ci:30-35)。
本研究表明使用疾病特异性预测工具可有效改善遗传性心脏病致病性变异的预测。在90%的置信度水平上,CardioBoost对心肌病和心律失常的变异分类准确率分别为90.2%和91.9%,极大优于目前主流的工具。被预测为致病性的变异均与疾病状态、临床严重程度和严重不良结局风险增加等表型相关,在提高致病性预测上具有广阔的前景。
原文链接: