bzoj5073

题目大意 :
        给你两个串s,t和一个数k,询问是否存在s个k个不重叠子串按原顺序排列后能匹配 t,
        |s|<1e5,|t|<1e5,k<100,时间30s
        设状态dp1[i][j]代表串s从s[1]匹配到s[i]的时候选择了k个不重叠子串后,能够匹配到t串到最远位置。设状态dp2[i][j]代表代表串s从s[1]匹配到s[i]的时候选择了k个不重叠子串且最后一个子串以s[i]结尾后,能够匹配到t串到最远位置,
        分析此状态,显然根据定义dp1[i][j]=max(dp2[t][j]) (t<=i ),于是简单的写出了转移式子:dp1[i][j]=max(dp1[i-1][j],dp2[i][j]);复杂的是dp2[i][j]不好得到,根据定义,dp2[i][j]一定会选择s[i]作为结尾的,
        现在分两类来讨论:
        1.s[i]单独为一个子串,那么可以由dp1[i-1][j-1]转移过来,
        2.s[i]可能不单独为一个子串,是跟前面的某串拼在一起的,那么可以由dp2[i-1][j]转移过来。
        知道了转移来源,但是状态转移过来了,值要怎么更新呢?处理不好的话,更新是个麻烦事,这里我们预处理出t串里面从t[1]到t[i]中字符ch最后一次出现的位置,成为max_index_before[i][ch]
        于是我们就有了转移式:
        dp2[i][j]=max(
        max_index_before[dp1[i-1][j-1]+1][s[i]],
        max_index_before[dp2[i-1][j]+1][s[i]]
        );
        最后处理一下边界情况,把输入进来的s变成”@&”+s,把t变成”@”+t,k增大1,边界就简单了。最终答案在dp1[n][k]中。
        时间复杂度O(nk)
        做完了之后翻了下题解,没有人用我这方法做这个题目。。。。。。
        正解如下:
        考虑dp[i][j]就是我上文所谈到的dp1[i][j],他没有dp2[i][j],所以不能像我那样转移了。用到了“我为人人”的转移思路,dp[i][j]如果转移走的时候花费一次取子串,就能够转移到dp[i+len][j+1],其中len代表lcp(s.suffix(i+1),t.suffix(dp[i][j]+1)),这个地方的lcp可以用后缀数组+rmq预处理优化为O(1),如果不花费就转移到了dp[i+1][j]。总体上时间复杂度为O(nlogn+nk),时间复杂度较前一个做法偏高,代码也很长。
        事实也是如此
#include<bits/stdc++.h>
using namespace std;

const int MAXN=1e5+555;
char s[MAXN],t[MAXN];
int dp1[MAXN][105];//前i的匹配最远
int dp2[MAXN][105];//i必须匹配的最远的
int max_index_before[MAXN][256];

int main(){
    int T,n,m,k;
    scanf("%d",&T);
    while(T--){
        //@&---
        //@---
        scanf("%d%d%d%s%s",&n,&m,&k,s+3,t+2);
        n+=2;
        m++;
        k++;
        s[1]=t[1]='@';
        s[2]='&';

        int max_index[256];
        for(int i=0;i<256;i++){
            max_index[i]=0;
        }
        for(int i=1;i<=m;i++){
            max_index[t[i]]=i;
            for(int j='a';j<='z';j++){
                max_index_before[i][j]=max_index[j];
            }
            max_index_before[i]['@']=max_index['@'];
            max_index_before[i]['&']=max_index['&'];
        }

        for(int i=1;i<=n;i++){
            dp1[i][1]=1;
            dp2[i][1]=0;
        }
        dp2[1][1]=1;

        for(int j=1;j<=k;j++){
            dp1[1][j]=dp2[1][j]=1;
        }

        for(int i=2;i<=n;i++){
            for(int j=2;j<=k;j++){
                dp2[i][j]=max(max_index_before[dp1[i-1][j-1]+1][s[i]],max_index_before[dp2[i-1][j]+1][s[i]]);
                dp1[i][j]=max(dp1[i-1][j],dp2[i][j]);
            }
        }

        if(dp1[n][k]==m)puts("YES");
        else puts("NO");
    }
}
#include<bits/stdc++.h>
using namespace std;

//定义以s[i]开头的后缀是suf(i)
//后缀数组性质:suf(sa[i])<suf(sa[i+1])
//模版从下标为1的地方开始,引入的字符串下标也要从下标为1开始

struct SA{
    static const int MAXN=2e5+555;
    static int lg[MAXN];
    int h[MAXN][20],rank[MAXN],sa[MAXN],n;

    void init(char*s,int len){//第一个参数要是从下标为1开始的字符串,第二个参数是要从下标为
        static int x[MAXN],y[MAXN],c[MAXN];//全部是辅助数组
        n=len;//初始化后缀数组内部的n->s后缀数组长度
        int m=1000;//桶的大小
        for(int i=1;i<=n;i++)sa[i]=y[i]=0;//初始化sa,y
        for(int i=1;i<=n;i++)x[i]=s[i];//把s复制到x
        for(int i=1;i<=m;i++)c[i]=0;//初始化c
        for(int i=1;i<=n;i++)c[x[i]]++;//对x计数
        for(int i=1;i<=m;i++)c[i]+=c[i-1];//计数前缀和
        for(int i=n;i>=1;i--)sa[c[x[i]]--]=i;//按照计数排序后的结果
        for(int k=1;k<=n;k<<=1){
            int num=0;
            for(int i=n-k+1;i<=n;i++)y[++num]=i;
            for(int i=1;i<=n;i++)if(sa[i]>k)y[++num]=sa[i]-k;
            for(int i=1;i<=m;i++)c[i]=0;//初始化c
            for(int i=1;i<=n;i++)c[x[i]]++;//对x计数
            for(int i=1;i<=m;i++)c[i]+=c[i-1];//计数前缀和
            for(int i=n;i>=1;i--)sa[c[x[y[i]]]--]=y[i];
            for(int i=1;i<=n;i++)y[i]=x[i];
            for(int i=1;i<=n;i++)x[i]=0;
            num=1;
            x[sa[1]]=1;
            for(int i=2;i<=n;i++){
                if((y[sa[i]]!=y[sa[i-1]])||(y[sa[i]+k]!=y[sa[i-1]+k])){
                    x[sa[i]]=++num;
                }
                else x[sa[i]]=num;
            }
            if(num>=n)break;
            m=num;
        }
        for(int i=1;i<=n;i++)rank[i]=x[i];
        //获取高度数组
        int k=0;
        for(int i=1;i<=n;i++){
            if(k)k--;
            int j=sa[rank[i]-1];
            while((i+k<=n)&&(j+k<=n)&&(s[i+k]==s[j+k]))k++;
            h[rank[i]][0]=k;
        }
        //对高度数组做rmq
        for(int j=1;j<20;j++){
            int d=1<<j;
            for(int i=1;i+2*d-1<=n;i++)h[i][j]=min(h[i][j-1],h[i+d][j-1]);
        }
        if(lg[1]!=0)for(int i=1;i<MAXN;i++)lg[i]=trunc(log(i+0.5)/log(2));
    }

    int lcp(int x,int y){//注意没有下标检查,如果访问越界的话,会错。
        int L=min(rank[x],rank[y])+1;
        int R=max(rank[x],rank[y]);
        int k=lg[R-L+1];
        return min(h[L][k],h[R-(1<<k)+1][k]);
    }
}sa;
int SA::lg[SA::MAXN];

const int MAXN=1e5+555;
char s[MAXN<<1];
int dp[MAXN][105];

int main(){
    int T,n,m,k;
    scanf("%d",&T);
    while(T--){
        //@&---
        //@---
        scanf("%d%d%d",&n,&m,&k);
        n+=2;
        m++;
        k++;
        char*t=s+n;

        scanf("%s%s",s+3,t+2);
        s[1]=t[1]='@';
        s[2]='&';

        sa.init(s,n+m);

        for(int i=1;i<=n;i++){
            for(int j=1;j<=k;j++){
                dp[i][j]=0;
            }
        }

        for(int i=1;i<=n;i++)dp[i][1]=1;
        for(int j=1;j<=k;j++)dp[1][j]=1;

        for(int i=1;i<=n;i++){
            for(int j=1;j<=k;j++){
                dp[i+1][j]=max(dp[i+1][j],dp[i][j]);//not choose

                if(dp[i][j]>=m)continue;//此处为下标检查
                int len=sa.lcp(i+1,n+dp[i][j]+1);
                dp[i+len][j+1]=max(dp[i][j]+len,dp[i+len][j+1]);//choose

            }
        }

        if(dp[n][k]==m)puts("YES");
        else puts("NO");
    }
}