【bzoj2754】[SCOI2012]喵星球上的点名

2015.04.15 08:13 Wed | 3次阅读 | 旧日oi | 固定链接 | 源码

Description

a180285幸运地被选做了地球到喵星球的留学生。他发现喵星人在上课前的点名现象非常有趣。   假设课堂上有N个喵星人,每个喵星人的名字由姓和名构成。喵星球上的老师会选择M个串来点名,每次读出一个串的时候,如果这个串是一个喵星人的姓或名的子串,那么这个喵星人就必须答到。 然而,由于喵星人的字码过于古怪,以至于不能用ASCII码来表示。为了方便描述,a180285决定用数串来表示喵星人的名字。
现在你能帮助a180285统计每次点名的时候有多少喵星人答到,以及M次点名结束后每个喵星人答到多少次吗?

Input

现在定义喵星球上的字符串给定方法:
先给出一个正整数L,表示字符串的长度,接下来L个整数表示字符串的每个字符。
输入的第一行是两个整数N和M。
接下来有N行,每行包含第i 个喵星人的姓和名两个串。姓和名都是标准的喵星球上的
字符串。
接下来有M行,每行包含一个喵星球上的字符串,表示老师点名的串。

Output

对于每个老师点名的串输出有多少个喵星人应该答到。
然后在最后一行输出每个喵星人被点到多少次。

Sample Input

2 3
6 8 25 0 24 14 8 6 18 0 10 20 24 0
7 14 17 8 7 0 17 0 5 8 25 0 24 0
4 8 25 0 24
4 7 0 17 0
4 17 0 8 25

Sample Output

2
1
0
1 2
【提示】
事实上样例给出的数据如果翻译成地球上的语言可以这样来看
2 3
izayoi sakuya
orihara izaya
izay
hara
raiz

HINT

【数据范围】
对于30%的数据,保证:
1<=N,M<=1000,喵星人的名字总长不超过4000,点名串的总长不超过2000。
对于100%的数据,保证:
1<=N<=20000,1<=M<=50000,喵星人的名字总长和点名串的总长分别不超过100000,保证喵星人的字符串中作为字符存在的数不超过10000。

题解

后缀数组果然diao……
把所有的串合到一起,中间用分隔符隔开,然后求后缀数组和h数组。
我们记录一下每个点名串的起始位置和长度,枚举每个串,找到这个串的排名。由h数组的性质,从这个位置开始向左右扩展,知道h[k]<=这个串的长度,则从l到r这段区间所代表的后缀的前缀都包含此串,并且由于分隔符的存在,不会出现跨了两个串的匹配。
但是这些后缀的前缀可能属于同一个串,所以我们还需要判一下重,详细见代码吧
不知道为什么以前写的后缀数组要比hzwer版的快3000多ms

我的程序

#include<iostream>
#include<cstring>
#include<cstdio>
#include<algorithm>
#define maxn 500005
using namespace std;
int read()
{
    int x=0,f=1;char ch=getchar();
    while(ch<'0'||ch>'9'){if(ch=='-')f=-1;ch=getchar();}
    while(ch>='0'&&ch<='9'){x=x*10+ch-'0';ch=getchar();}
    return x*f;
}
int n,m,len,p,q=1;
int s[maxn],vis[maxn];
int st[50105],last[50105];
int sa[2][maxn],v[maxn],rk[2][maxn],h[maxn];
void mul(int k,int *sa,int *rk,int *SA,int *RK)
{
    for(int i=1;i<=len;i++) v[rk[sa[i]]]=i;
    for(int i=len;i;i--)
        if(sa[i]>k)
            SA[v[rk[sa[i]-k]]--]=sa[i]-k;
    for(int i=len-k+1;i<=len;i++) SA[v[rk[i]]--]=i;
    for(int i=1;i<=len;i++)
        RK[SA[i]]=RK[SA[i-1]]+(rk[SA[i-1]]!=rk[SA[i]]||rk[SA[i-1]+k]!=rk[SA[i]+k]);
}
void get_sa(int lim)
{
    for(int i=1;i<=len;i++) v[s[i]]++;
    for(int i=1;i<=lim;i++) v[i]+=v[i-1];
    for(int i=1;i<=len;i++) sa[p][v[s[i]]--]=i;
    for(int i=1;i<=len;i++) 
        rk[p][sa[p][i]]=rk[p][sa[p][i-1]]+(s[sa[p][i-1]]!=s[sa[p][i]]);
    for(int k=1;k<len;k<<=1,swap(p,q)) mul(k,sa[p],rk[p],sa[q],rk[q]);
    for(int k=0,i=1;i<=len;i++)
    {
        int j=sa[p][rk[p][i]-1];
        while(s[j+k]==s[i+k]) k++;
        h[rk[p][i]]=k;if(k) k--;
    }
}
int tmp[50105],ans[50105];
void solve()
{
    int l,r,ret;
    for(int i=1;i<=m;i++)
    {
        l=r=rk[p][st[i]];
        while(h[l]>=last[i]) l--;
        while(h[r]>=last[i]) r++;
        r--;ret=0;
        for(int j=l;j<=r;j++)
        if(vis[sa[p][j]]&&tmp[vis[sa[p][j]]]!=i)
        {
            tmp[vis[sa[p][j]]]=i;
            ret++;
            ans[vis[sa[p][j]]]++;
        }
        printf("%d\n",ret);
    }
    for(int i=1;i<n;i++) printf("%d ",ans[i]);
    printf("%d\n",ans[n]);
}
int main()
{
    n=read();m=read();int sep=10100;
    for(int t,i=1;i<=n;i++)
    {
        t=read();
        for(int j=1;j<=t;j++)
        {
            s[++len]=read();
            vis[len]=i;
        }
        s[++len]=++sep;
        t=read();
        for(int j=1;j<=t;j++)
        {
            s[++len]=read();
            vis[len]=i;
        }
        s[++len]=++sep;
    }
    for(int t,i=1;i<=m;i++)
    {
        t=read();st[i]=len+1;last[i]=t;
        for(int j=1;j<=t;j++)
        s[++len]=read();
        s[++len]=++sep;
    }
    get_sa(200000);
    solve();
}```