科研人员发展基于深度学习的蛋白质单分子分析新方法( 二 ) 蛋白质是生命活动的物质基础和主要承担

2018, 9:11;Cell Res., 2015, 25,738-752）。

最近，他们针对单分子光漂白计数分析中检测信号弱、易被噪音掩盖和光闪烁干扰、数据量大等挑战性问题，巧妙地利用人工智能深度学习技术，提出了一个机器学习的深度神经网络架构——CLDNN ，对单分子光漂白事件进行准确、高效计数。他们所设计的CLDNN可凭借其自身强大的学习能力以及特征提取能力，通过卷积层提取光漂白台阶信号，通过长短时记忆（LSTM）循环层排除荧光闪烁等干扰，实现90%以上准确率的化学计量比分析。相比于已报道的单分子信号分析方法， CLDNN具有诸多优势：（1）更高的分析准确率，尤其对于低信噪比的数据，优势更为明显；（2）更高的计算效率，可以快速处理大批量数据；（3）简单易用，无需对单分子数据做滤噪等预处理，也无需设置算法参数；（4）具有较好的推广性和扩展性，可对除训练水平外的不同信噪比数据以及包含更多光漂白事件的数据进行有效分析。此外，使用者也可以加入自己的实验数据集重新训练CLDNN ，使其更加满足个性化分析需要。

CLDNN为研究人员提供了一种全新的数据分析策略，使人们可更为高效、准确、客观地分析蛋白质等生物大分子化学计量比，该架构还可应用于分析化学领域其它具有时间序列特征的数据分析，将促进人工智能技术在化学中的应用。相关研究成果近期发表于