多序列的汉明距离矩阵

2022-04-15 00:00:00 python bioinformatics hamming-distance

问题描述

我有一个包含ID和相应DNA序列的FASTA文件,我已将其解析并存储到词典中。 我现在需要编写一个Python程序来计算所有序列的成对汉明距离矩阵。

到目前为止,我已经尝试对词典的所有值运行for循环并检查每个字符,但这不能正确实现汉明距离或返回矩阵。


解决方案

尝试使用Skledge包,它有一个函数来计算指定距离度量的成对距离。您可以在此处找到该函数:https://scikit-learn.org/stable/modules/generated/sklearn.metrics.pairwise_distances.html。

相关文章