Gravatar
yuan
积分:1076
提交:413 / 669

Pro2996  [POJ 2176]折叠字符串(Folding)

算法一

特殊样例:

1、长度小于 $5$ 的字符串不折叠, 因为压缩的话至少长度为 $4$;

例如:AAAA->4(A) 折叠前后相等  A->1(A) 不折叠更优

2、长度大于等于 $5$ 时,只包含一个字母;

例如:AAAAAAAAA->9(A)


算法二

区间DP

设 $dp[i][j]$ 表示把区间 $[l, r]$ 内的字符压缩之后的最短长度,考虑两种操作:

1、合并两个小区间后变为一个大区间;

这显然就是区间 $dp$ 的套路方法,即:

for (int k = l;k < r;++k)
    dp[l][r] = min (dp[l][r],dp[l][k] + dp[k + 1][r]);

2、将某个区间进行折叠;

对于 $[l,r]$ 字符串,若要被折叠成循环节长度为 $k$ 的字符串,需要满足 $1≤k≤r−l+1$ 且 $k ∣(r−l+1)$ 且 $∀i∈[l,r−k]$   $s[i]==s[i+k]$,若符合要求,则 $dp[l][r] = min (dp[l][r] , 2 + nums ((r - l + 1) / k) + dp[l][l + k - 1])$。其中的 $2$ 是两个括号的长度,$nums (x)$ 表示重复次数 $x$ 的位数,$dp[l][l + k - 1]$ 即循环节。


在得到最小长度后,由于需要输出合法的方案,所以我们在此基础上还要记录一些断点的信息,从而进行搜索。

用两个数组分别记录第一和第二种的操作的断点,第一种操作记录断点位置,第二种操作记录循环节的长度。

由于一个区间的处理只进行一种操作,所以在标记时要把另外一种操作的断点设为 0。


在递归时,对于一个区间若两种断点均不存在,则直接输出这段区间;

若是第一种操作的断点 k,则分别递归处理区间 [l,k] 和 [k+1,r];

若是第二种,则先输出左括号和重复的次数,递归循环节的区间,再输出右括号即可。


//参考程序1:dp[][]记录最优长度,额外记录断点,递归输出方案
#include<bits/stdc++.h>
#define init(x,y) memset(x,y,sizeof(x))
#define INF 0x3f3f3f3f
using namespace std;
const int N = 105;
char str[N];
int n,dp[N][N],cut[N][N],fold[N][N];
int nums (int num)
{
	int cnt = 0;
	while (num) num /= 10,++cnt;
	return cnt;
}
void check (int l,int r,int k)
{//[l,r]字符串是否可以折叠为长度为k的字符串
	if ((r - l + 1) % k) return ;
	for (int i = l;i <= r - k;++i)
		if (str[i] != str[i + k]) return ;//不合法
	int s = 2 + nums((r - l + 1) / k) + dp[l][l + k - 1];
	if (s < dp[l][r])
	{
		dp[l][r] = s;
		cut[l][r] = 0;
		fold[l][r] = k;//区间可直接折叠
	}
}

void dfs (int l,int r)
{//递归输出折叠方案
	if (!cut[l][r] && !fold[l][r])//不能折叠,原样输出
		for (int i = l;i <= r;++i) printf ("%c",str[i]);
	else
		if (cut[l][r])//有断点,分别递归两个区间
			dfs (l,cut[l][r]),dfs (cut[l][r] + 1,r);
		else//区间可直接折叠
		{
			printf ("%d(",(r - l + 1) / fold[l][r]);
			dfs (l,l + fold[l][r] - 1);//继续递归循环节
			printf (")");
		}
}
int main ()
{
	freopen ("folding.in","r",stdin);
	freopen ("folding.out","w",stdout);
	while (scanf ("%s",str + 1) != EOF)
	{
		n = strlen (str + 1);//从下标1开始存储
		init (dp,INF);init (cut,0);init (fold,0);
		for (int i = 1;i <= n;++i) dp[1][i] = i,dp[i][i] = 1;//初始化
		for (int len = 1;len <= n;++len)
		{//枚举区间长度
			for (int l = 1;l <= n - len + 1;++l)
			{//枚举区间左边界
				int r = l + len-1;//右边界
				//情况2:区间可直接折叠
				for (int k = 1;k <= (r - l + 1) / 2;++k)
					check(l,r,k);
				//情况1:枚举断点,分别折叠左右区间后再合并
				for (int k = l;k < r;++k)
				{//枚举断点
					if (dp[l][k] + dp[k + 1][r] < dp[l][r])//区间合并
					{
						dp[l][r] = dp[l][k] + dp[k + 1][r];
						cut[l][r] = k;//记录断点
						fold[l][r] = 0;
					}
				}
			}
		}
		//printf ("%d\n",dp[1][n]);// 最小操作次数
		dfs (1,n);//递归输出最优方案
		puts ("\n");
	}
	return 0;
}
-----------------------------------------------------------------------------------------------------------------------------
//参考程序2:dp[l][r]直接存最优方案;
#include <bits/stdc++.h>
using namespace std;
string dp[110][110], s;
 
string _to_string(int num) {
	string ans;
	while(num) {
		ans += num % 10 + '0';
		num /= 10;
	}
	reverse(ans.begin(), ans.end());
	return ans;
}
int main() {
	freopen("folding.in","r",stdin);
	freopen("folding.out","w",stdout);
	int n;
	while(cin >> s) {
		n = s.length();
		for (int i = 0; i < n; i++) {
			dp[i][i] = s[i];//初始化
		}
		for (int len = 2; len <= n; len++)
		{//枚举区间长度
			for (int lt = 0; lt < n - len + 1; lt++)
			{//枚举区间左边界
				int rt = lt + len - 1;//枚举区间右边界
				dp[lt][rt] = s.substr(lt, rt - lt + 1);//初始化
				for (int loop = 1; loop <= len / 2; loop++)
				{//枚举循环节长度,检测区间是否可以直接折叠
					if(len % loop) continue;
					int l = lt, r = lt + loop;
					while(s[l] == s[r] && r <= rt) l++, r++;
					if(r > rt)
					{
						int num = len / loop;//循环次数
						dp[lt][rt] = _to_string(num);
						dp[lt][rt] += "(";
						dp[lt][rt] += dp[lt][lt + loop - 1];
						dp[lt][rt] += ")";
						//cout<< dp[lt][rt] <<endl;
						break;
					}
				}
				for (int k = lt; k < rt; k++)//区间DP
				{//枚举断点,分别折叠左右子区间后再合并
					if(dp[lt][rt].length() > dp[lt][k].length() + dp[k + 1][rt].length() || dp[lt][rt].length() == 0)
					{
						dp[lt][rt] = dp[lt][k] + dp[k + 1][rt];
					}
				}
			}
		}
		cout << dp[0][n - 1] <<endl;
	}
	return 0;
}


2022-10-27 10:58:33    
我有话要说
暂无人分享评论!