收录:
摘要:
为了进一步研究大肠杆菌启动子的识别算法,结合大肠杆菌基因分子生物学的有关理论,利用支持向量机(support vector machine,SVM)方法对启动子进行了识别.根据启动子的序列保守性,从每个启动子样本中选取了长65bases的序列作为正样本,从大肠杆菌编码区选取相应长度的序列作为负样本,建立了基于支持向量机的分类器;并讨论了应用SVM方法时,核函数参数的选择问题.实验结果表明,基于支持向量机的识别方法能更好地提取启动子保守序列的统计特征,正样本和负样本的相关系数可以达到81.62%.
关键词:
通讯作者信息:
电子邮件地址: