首页 > 学院 > 开发设计 > 正文

bzoj 4212: 神牛的养成计划 (trie+可持久化trie)

2019-11-06 07:11:04
字体:
来源:转载
供稿:网友

4212: 神牛的养成计划

Time Limit: 10 Sec  Memory Limit: 512 MBSubmit: 112  Solved: 25[Submit][Status][Discuss]

Description

Hzwer成功培育出神牛细胞,可最终培育出的生物体却让他大失所望......后来,他从某同校女神 牛处知道,原来他培育的细胞发生了基因突变,原先决定神牛特征的基因序列都被破坏了,神牛hzwer很生气,但他知道基因突变的低频性,说不定还有以下优秀基因没有突变,那么他就可以用限制性核酸内切酶把它们切出来,然后再构建基因表达载体什么的,后面你懂的......黄学长现在知道了N个细胞的DNA序列,它们是若干个由小写字母组成的字符串。一个优秀的基因是两个字符串s1和s2,当且仅当s1是某序列的前缀的同时,s2是这个序列的后缀时,hzwer认为这个序列拥有这个优秀基因。现在黄学长知道了M个优秀基因s1和s2,它们想知道对于给定的优秀基因,有多少个细胞的DNA序列拥有它。

Input

第一行:N,表示序列数接下来N行,每行一个字符串,代表N个DNA序列,它们的总长为L1接下来一个M,表示询问数接下来M行,每行两个字符串s1和s2,由一个空格隔开,hzwer希望你能在线回答询问,所以s1等于“s1”的所有字符按字母表的顺序向后移动ans位(字母表是一个环),ans为上一个询问的答案,s2同理。例如ans=2  “s1”=qz则s1=sb。对于第一个询问,ans=0s1和s2的总长度为L2

Output

输出M行,每行一个数,第i行的数表示有多少个序列拥有第i个优秀基因。

Sample Input

10emikuqihgokuhsywlmqemihhpgijkxdukjfmlqlwrpzgwrwozkmlixyxniutssasrriafuemikuqihgokuookbqaaoyiorpfdetaeduogebnolonaoehthfaypbeiutssasrriafuemikuqihgokuorocifwwymkcyqevdtglszfzgycbgnpomvlzppwrigowekufjwiiaxniutssasrriafuemikuqihgokuorociysgfkzpgnotajcfjctjqgjeeiheqrepbpakmlixyxniutssasrriafuemikuqihgokuorociysgfrhulymdxsqirjrfbngwszuyibuixyxniutssasrriafuemikuqihgokuorguowwiozcgjetmyokqdrqxzigohiutssasrriafuemikuqihgokuorociysgsczejjmlbwhandxqwknutzgdmxtiutssasrriafuemikuqihgokuorociysgvzfcdxdiwdztolopdnboxfvqzfzxtpecxcbrklvtyxniutssasrriafuemikuqihgokuorocsbtlyuosppxuzkjafbhsayenxsdmkmlixyxniutssasrriafuemikuqihgokuorociysgfjvaikktsixmhaasbvnsvmkntgmoygfxypktjxjdkliixyxniutssasrriafu10emikuqihgokuorociysg yxniutssasrriafuaiegqmedckgqknky eqpoowonnewbqxfbdnjbazhdnhkhvb qrqgbnmlltlkkbtynbjfhrnfedlhrlolzfv qppxpoofxcrzhdfpldcbjf stsidponnvnmmdvapzhdfpldcbjfpjmjxdt gdstsidponnvnmmdvapdlhjtphgfnjtnqnbhxr wxwmhtsrrzrQQhzetbjfhrnfedlhrlolzfv frqppxpoofxcrzhdfpldcbjf dponnvnmmdvapucyakgyxweakehes nondykjiiqihhyqvk

Sample Output

47355135104

HINT

N<=2000L1<=2000000M<=100000L2<=2000000

Source

[Submit][Status][Discuss]

题解:trie+可持久化trie

今天的互测题,感觉是道不错的字符串题,不过非官方数据较水,可以用hash过掉。

首先对于读入的字符串排序,然后按照顺序加入trie,对于trie中的每个节点都维护一下排序后的那一段区间可以到达这个点(就是那一段的前缀可以匹配到这里)。

然后按照排好的顺序将每个串反过来,建立可持久化trie。

对于每个询问,我们用前缀在trie上匹配,得到一段合法的区间[l,r],然后在可持久化trie上查询[l,r]区间中可以匹配上的后缀的数量即可。

#include<iostream>#include<cstring>#include<cstdio>#include<algorithm>#include<cmath>#define N 2000003using namespace std;int n,cnt,m,sz,tot,x[N],b[N],c[N]; int a[N],ch[N][27],ch1[N][27],size[N],root[N],ls[N],rs[N],l[N],r[N];char s[N],s1[N],s2[N];int cmp(int x,int y){	int len=min(r[x]-l[x]+1,r[y]-l[y]+1);	for (int i=0;i<len;i++)	 if (a[l[x]+i]!=a[l[y]+i]) return a[l[x]+i]<a[l[y]+i];	return r[x]-l[x]<r[y]-l[y];}void insert(int l,int r,int j){	int now=0;	for (int i=l;i<=r;i++) {		int x=a[i];		if (!ch[now][x]) ch[now][x]=++sz;		now=ch[now][x];		ls[now]=min(ls[now],j); rs[now]=max(rs[now],j);	}}void buildtree(int i,int l,int r){	int PRe=root[i-1];	root[i]=++tot; int now=root[i];	for (int i=r;i>=l;i--) {		int x=a[i];		size[now]=size[pre]+1;		ch1[now][x]=++tot;		for (int j=1;j<=26;j++)		 if (j!=x) ch1[now][j]=ch1[pre][j];		now=ch1[now][x]; pre=ch1[pre][x];	}	size[now]=size[pre]+1;}int get_pos(){	int len=strlen(s1+1);	int now=0;	for (int i=1;i<=len;i++) {		int x=b[i];		now=ch[now][x];		if (!now) return -1;	}	return now;}int find(int i,int j){	int len=strlen(s2+1); 	bool pd=false;	for (int k=len;k>=1;k--) {		int x=c[k];		if (!pd&&size[ch1[i][x]]==size[ch1[j][x]]||!size[ch1[j][x]]) return 0;		//cout<<size[ch1[i][x]]<<" "<<size[ch1[j][x]]<<endl;		if (!pd) i=ch1[i][x]; 		j=ch1[j][x];		if(!j) return 0;		if (!i) pd=true;		//if (pd) cout<<"!"<<endl;	}	if (pd) return size[j];	return size[j]-size[i];}int main(){	freopen("xiba.in","r",stdin);	freopen("xiba.out","w",stdout);	scanf("%d",&n);	for (int i=1;i<=n;i++) {	  scanf("%s",s+1);	  int len=strlen(s+1);	  for (int j=1;j<=len;j++) a[++cnt]=s[j]-'a'+1;	  l[i]=r[i-1]+1; r[i]=cnt;	}	for (int i=1;i<=n;i++) x[i]=i;	sort(x+1,x+n+1,cmp);	memset(ls,127/3,sizeof(ls));	for (int i=1;i<=n;i++) {		int t=x[i];		insert(l[t],r[t],i);	}	for (int i=1;i<=n;i++) 	  buildtree(i,l[x[i]],r[x[i]]);	scanf("%d",&m); int lastans=0;	for (int i=1;i<=m;i++) {		scanf("%s%s",s1+1,s2+1);		int len=strlen(s1+1); int len1=strlen(s2+1);		for (int j=1;j<=len;j++) b[j]=(s1[j]-'a'+1+lastans-1)%26+1;		for (int j=1;j<=len1;j++) c[j]=(s2[j]-'a'+1+lastans-1)%26+1;		int t=get_pos(); 		if (t==-1) {			lastans=0;			printf("0/n");			continue;		}		printf("%d/n",(lastans=find(root[ls[t]-1],root[rs[t]])));	}}


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表