1.类型(S, H, C)
a cluster centroid (S) :某一聚类的代表性序列
a hit (H) assigned to a cluster :某一聚类的非代表性序列(即通过阈值,后期去除的)
cluster records (C) :某个聚类的整体信息
2.聚类号
3.
ccentroid length (S) 如果第1列类型是S,此列是Centroid的序列长度。
query length (H)如果第1列类型是H,此列是query的序列长度。
cluster size (C)如果第1列类型是C,此列是某一聚类的大小(即此聚类包含序列数量)
4.(只有类型为H,S和C都是*)
某一聚类的非代表性序列与代表性序列的相似度,
5.(只有类型为H,S和C都是*),匹配定位 +/-
6.Not used,(H为0,S和C都是*)
7.Not used,(H为0,S和C都是*)
8.(只有类型为H,S和C都是*)
CIGAR format(Compact Idiosyncratic Gapped Align-ment Report)
M (match/mismatch), D (deletion) and I (insertion)
9.
如果第1列类型是H,此列是query的序列ID
如果第1列类型是S or C,此列是Centroid的序列ID
10.
如果第1列类型是H,此列是Centroid的序列ID
如果第1列类型是S or C,此列都是*
结论:
先看第2列聚类号,再看第1列类型(如果是S则为此聚类的代表性序列,如果是H则为此聚类的非代表性序列)