一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例(定义为GC-Ratio)是序列中G和C两个字母的总的出现次数除以总的字母数目(也就是序列长度)。在基因工程中,这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。 给定一个很长的DNA序列,以及要求的最小子序列长度,研究人员经常会需要在其中找出GC-Ratio最高的子序列。
输入描述: 输入一个string型基因序列,和int型子串的长度
输出描述: 找出GC比例最高的子串,如果有多个输出第一个的子串
输入例子: AACTGTGCACGACCTGA 5
输出例子: GCACG
解析:#include <iostream>#include <string>using namespace std;int main(){ string str; int i,j,n; //string max_str; while(cin>>str) { cin>>n; int max_sum = 0; int maxi; for(i=0;i<str.length();++i) { int count_gc = 0; for(j=0;j<n;++j) { if(str[i+j]=='G'||str[i+j]=='C') { count_gc++; } } if(count_gc>max_sum) { max_sum = count_gc; maxi = i; } } for(i=0;i<n;++i) { cout<<str[maxi+i]; } cout<<endl; } return 0;}新闻热点
疑难解答