2262. 字符串的总引力
题目描述
字符串的 引力 定义为:字符串中 不同 字符的数量。
- 例如,
"abbca"
的引力为3
,因为其中有3
个不同字符'a'
、'b'
和'c'
。
给你一个字符串 s
,返回 其所有子字符串的总引力 。
子字符串 定义为:字符串中的一个连续字符序列。
示例 1:
输入:s = "abbca" 输出:28 解释:"abbca" 的子字符串有: - 长度为 1 的子字符串:"a"、"b"、"b"、"c"、"a" 的引力分别为 1、1、1、1、1,总和为 5 。 - 长度为 2 的子字符串:"ab"、"bb"、"bc"、"ca" 的引力分别为 2、1、2、2 ,总和为 7 。 - 长度为 3 的子字符串:"abb"、"bbc"、"bca" 的引力分别为 2、2、3 ,总和为 7 。 - 长度为 4 的子字符串:"abbc"、"bbca" 的引力分别为 3、3 ,总和为 6 。 - 长度为 5 的子字符串:"abbca" 的引力为 3 ,总和为 3 。 引力总和为 5 + 7 + 7 + 6 + 3 = 28 。
示例 2:
输入:s = "code" 输出:20 解释:"code" 的子字符串有: - 长度为 1 的子字符串:"c"、"o"、"d"、"e" 的引力分别为 1、1、1、1 ,总和为 4 。 - 长度为 2 的子字符串:"co"、"od"、"de" 的引力分别为 2、2、2 ,总和为 6 。 - 长度为 3 的子字符串:"cod"、"ode" 的引力分别为 3、3 ,总和为 6 。 - 长度为 4 的子字符串:"code" 的引力为 4 ,总和为 4 。 引力总和为 4 + 6 + 6 + 4 = 20 。
提示:
1 <= s.length <= 105
s
由小写英文字母组成
解法
方法一:枚举
我们可以枚举以每个字符 $s[i]$ 结尾的字符串,计算其引力值之和 $t$,最后将所有 $t$ 相加即可。
考虑遍历到 $s[i]$ 时,即把 $s[i]$ 添加到以 $s[i-1]$ 结尾的子字符串的后面,其引力值之和 $t$ 的变化情况:
- 如果 $s[i]$ 在之前没出现过,那么所有以 $s[i-1]$ 结尾的子字符串的引力值都会增加 $1$,共有 $i$ 个,所以 $t$ 增加 $i$,再加上 $s[i]$ 自身的引力值 $1$,所以 $t$ 一共增加 $i+1$;
- 如果 $s[i]$ 在之前出现过,不妨记上次出现的的位置为 $j$,那么我们向子字符串 $s[0..i-1]$, $[1..i-1]$, $s[2..i-1]$, $\cdots$, $s[j..i-1]$ 后面添加 $s[i]$,这些子字符串的引力值不会发生变化,因为 $s[i]$ 已经在这些子字符串中出现过了;而子字符串 $s[j+1..i-1]$, $s[j+2..i-1]$, $\cdots$, $s[i-1]$ 的引力值都会增加 $1$,共有 $i-j-1$ 个,所以 $t$ 增加 $i-j-1$,再加上 $s[i]$ 自身的引力值 $1$,所以 $t$ 一共增加 $i-j$。
综上,我们可以用一个数组 $pos$ 记录每个字符上次出现的位置,初始时所有位置都为 $-1$,
接下来,我们遍历字符串,每一次我们更新以当前字符结尾的子字符串的引力值之和 $t = t + i - pos[c]$,其中 $c$ 是当前字符,累加 $t$ 到答案中。然后我们更新 $pos[c]$ 为当前位置 $i$。继续遍历直到字符串结束。
时间复杂度 $O(n)$,空间复杂度 $O(|\Sigma|)$,其中 $n$ 是字符串 $s$ 的长度;而 $|\Sigma|$ 是字符集的大小,本题中 $|\Sigma| = 26$。
1 2 3 4 5 6 7 8 9 10 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
|
1 2 3 4 5 6 7 8 9 10 11 12 13 |
|