算法一特殊样例: 1、长度小于 $5$ 的字符串不折叠, 因为压缩的话至少长度为 $4$; 例如:AAAA->4(A) 折叠前后相等 A->1(A) 不折叠更优 2、长度大于等于 $5$ 时,只包含一个字母; 例如:AAAAAAAAA->9(A)
算法二区间DP 设 $dp[i][j]$ 表示把区间 $[l, r]$ 内的字符压缩之后的最短长度,考虑两种操作: 1、合并两个小区间后变为一个大区间; 这显然就是区间 $dp$ 的套路方法,即: for (int k = l;k < r;++k) dp[l][r] = min (dp[l][r],dp[l][k] + dp[k + 1][r]); 2、将某个区间进行折叠; 对于 $[l,r]$ 字符串,若要被折叠成循环节长度为 $k$ 的字符串,需要满足 $1≤k≤r−l+1$ 且 $k ∣(r−l+1)$ 且 $∀i∈[l,r−k]$ $s[i]==s[i+k]$,若符合要求,则 $dp[l][r] = min (dp[l][r] , 2 + nums ((r - l + 1) / k) + dp[l][l + k - 1])$。其中的 $2$ 是两个括号的长度,$nums (x)$ 表示重复次数 $x$ 的位数,$dp[l][l + k - 1]$ 即循环节。
在得到最小长度后,由于需要输出合法的方案,所以我们在此基础上还要记录一些断点的信息,从而进行搜索。 用两个数组分别记录第一和第二种的操作的断点,第一种操作记录断点位置,第二种操作记录循环节的长度。 由于一个区间的处理只进行一种操作,所以在标记时要把另外一种操作的断点设为 0。
在递归时,对于一个区间若两种断点均不存在,则直接输出这段区间; 若是第一种操作的断点 k,则分别递归处理区间 [l,k] 和 [k+1,r]; 若是第二种,则先输出左括号和重复的次数,递归循环节的区间,再输出右括号即可。
//参考程序1:dp[][]记录最优长度,额外记录断点,递归输出方案 #include<bits/stdc++.h> #define init(x,y) memset(x,y,sizeof(x)) #define INF 0x3f3f3f3f using namespace std; const int N = 105; char str[N]; int n,dp[N][N],cut[N][N],fold[N][N]; int nums (int num) { int cnt = 0; while (num) num /= 10,++cnt; return cnt; } void check (int l,int r,int k) {//[l,r]字符串是否可以折叠为长度为k的字符串 if ((r - l + 1) % k) return ; for (int i = l;i <= r - k;++i) if (str[i] != str[i + k]) return ;//不合法 int s = 2 + nums((r - l + 1) / k) + dp[l][l + k - 1]; if (s < dp[l][r]) { dp[l][r] = s; cut[l][r] = 0; fold[l][r] = k;//区间可直接折叠 } } void dfs (int l,int r) {//递归输出折叠方案 if (!cut[l][r] && !fold[l][r])//不能折叠,原样输出 for (int i = l;i <= r;++i) printf ("%c",str[i]); else if (cut[l][r])//有断点,分别递归两个区间 dfs (l,cut[l][r]),dfs (cut[l][r] + 1,r); else//区间可直接折叠 { printf ("%d(",(r - l + 1) / fold[l][r]); dfs (l,l + fold[l][r] - 1);//继续递归循环节 printf (")"); } } int main () { freopen ("folding.in","r",stdin); freopen ("folding.out","w",stdout); while (scanf ("%s",str + 1) != EOF) { n = strlen (str + 1);//从下标1开始存储 init (dp,INF);init (cut,0);init (fold,0); for (int i = 1;i <= n;++i) dp[1][i] = i,dp[i][i] = 1;//初始化 for (int len = 1;len <= n;++len) {//枚举区间长度 for (int l = 1;l <= n - len + 1;++l) {//枚举区间左边界 int r = l + len-1;//右边界 //情况2:区间可直接折叠 for (int k = 1;k <= (r - l + 1) / 2;++k) check(l,r,k); //情况1:枚举断点,分别折叠左右区间后再合并 for (int k = l;k < r;++k) {//枚举断点 if (dp[l][k] + dp[k + 1][r] < dp[l][r])//区间合并 { dp[l][r] = dp[l][k] + dp[k + 1][r]; cut[l][r] = k;//记录断点 fold[l][r] = 0; } } } } //printf ("%d\n",dp[1][n]);// 最小操作次数 dfs (1,n);//递归输出最优方案 puts ("\n"); } return 0; }----------------------------------------------------------------------------------------------------------------------------- //参考程序2:dp[l][r]直接存最优方案; #include <bits/stdc++.h> using namespace std; string dp[110][110], s; string _to_string(int num) { string ans; while(num) { ans += num % 10 + '0'; num /= 10; } reverse(ans.begin(), ans.end()); return ans; } int main() { freopen("folding.in","r",stdin); freopen("folding.out","w",stdout); int n; while(cin >> s) { n = s.length(); for (int i = 0; i < n; i++) { dp[i][i] = s[i];//初始化 } for (int len = 2; len <= n; len++) {//枚举区间长度 for (int lt = 0; lt < n - len + 1; lt++) {//枚举区间左边界 int rt = lt + len - 1;//枚举区间右边界 dp[lt][rt] = s.substr(lt, rt - lt + 1);//初始化 for (int loop = 1; loop <= len / 2; loop++) {//枚举循环节长度,检测区间是否可以直接折叠 if(len % loop) continue; int l = lt, r = lt + loop; while(s[l] == s[r] && r <= rt) l++, r++; if(r > rt) { int num = len / loop;//循环次数 dp[lt][rt] = _to_string(num); dp[lt][rt] += "("; dp[lt][rt] += dp[lt][lt + loop - 1]; dp[lt][rt] += ")"; //cout<< dp[lt][rt] <<endl; break; } } for (int k = lt; k < rt; k++)//区间DP {//枚举断点,分别折叠左右子区间后再合并 if(dp[lt][rt].length() > dp[lt][k].length() + dp[k + 1][rt].length() || dp[lt][rt].length() == 0) { dp[lt][rt] = dp[lt][k] + dp[k + 1][rt]; } } } } cout << dp[0][n - 1] <<endl; } return 0; }
题目2996 [POJ 2176]折叠字符串(Folding)
9
评论
2022-10-27 10:58:33
|