题目描述
给定字符串 s
和字符串数组 words
, 返回 words[i]
中是s
的子序列的单词个数 。
字符串的 子序列 是从原始字符串中生成的新字符串,可以从中删去一些字符(可以是none),而不改变其余字符的相对顺序。
- 例如,
“ace”
是 “abcde”
的子序列。
示例 1:
输入: s = "abcde", words = ["a","bb","acd","ace"]
输出: 3
解释: 有三个是 s 的子序列的单词: "a", "acd", "ace"。
Example 2:
输入: s = "dsahjpjauf", words = ["ahjpjau","ja","ahbwzgqnuk","tnmlanowax"]
输出: 2
提示:
1 <= s.length <= 5 * 104
1 <= words.length <= 5000
1 <= words[i].length <= 50
words[i]
和 s 都只由小写字母组成。
解法
方法一:分桶
题目中字符串 $s$ 的数据规模最高达到 $5 \times 10^4$,如果暴力枚举 $words$ 中的每个字符串 $w$,判断其是否为 $s$ 的子序列,很有可能会超时。
我们不妨将 $words$ 中的所有单词根据首字母来分桶,即:把所有单词按照首字母分到 $26$ 个桶中,每个桶中存储的是所有以该字母开头的所有单词。
比如对于 words = ["a", "bb", "acd", "ace"]
,我们得到以下的分桶结果:
a: ["a", "acd", "ace"]
b: ["bb"]
然后我们从 $s$ 的第一个字符开始遍历,假设当前字符为 'a'
,我们从 'a'
开头的桶中取出所有单词。对于取出的每个单词,如果此时单词长度为 $1$,说明该单词已经匹配完毕,我们将答案加 $1$;否则我们将单词的首字母去掉,然后放入下一个字母开头的桶中,比如对于单词 "acd"
,去掉首字母 'a'
后,我们将其放入 'c'
开头的桶中。这一轮结束后,分桶结果变为:
c: ["cd", "ce"]
b: ["bb"]
遍历完 $s$ 后,我们就得到了答案。
实际上,每个桶可以只存储单词的下标 $i$ 以及该单词当前匹配到的位置 $j$,这样可以节省空间。
时间复杂度 $O(n + \sum_{i=0}^{m-1} |w_i|)$,空间复杂度 $O(m)$。其中 $n$ 和 $m$ 分别为 $s$ 和 $words$ 的长度,而 $|w_i|$ 为 $words[i]$ 的长度。
1
2
3
4
5
6
7
8
9
10
11
12
13
14 | class Solution:
def numMatchingSubseq(self, s: str, words: List[str]) -> int:
d = defaultdict(deque)
for w in words:
d[w[0]].append(w)
ans = 0
for c in s:
for _ in range(len(d[c])):
t = d[c].popleft()
if len(t) == 1:
ans += 1
else:
d[t[1]].append(t[1:])
return ans
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22 | class Solution {
public int numMatchingSubseq(String s, String[] words) {
Deque<String>[] d = new Deque[26];
Arrays.setAll(d, k -> new ArrayDeque<>());
for (String w : words) {
d[w.charAt(0) - 'a'].add(w);
}
int ans = 0;
for (char c : s.toCharArray()) {
var q = d[c - 'a'];
for (int k = q.size(); k > 0; --k) {
String t = q.pollFirst();
if (t.length() == 1) {
++ans;
} else {
d[t.charAt(1) - 'a'].offer(t.substring(1));
}
}
}
return ans;
}
}
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20 | class Solution {
public:
int numMatchingSubseq(string s, vector<string>& words) {
vector<queue<string>> d(26);
for (auto& w : words) d[w[0] - 'a'].emplace(w);
int ans = 0;
for (char& c : s) {
auto& q = d[c - 'a'];
for (int k = q.size(); k; --k) {
auto t = q.front();
q.pop();
if (t.size() == 1)
++ans;
else
d[t[1] - 'a'].emplace(t.substr(1));
}
}
return ans;
}
};
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18 | func numMatchingSubseq(s string, words []string) (ans int) {
d := [26][]string{}
for _, w := range words {
d[w[0]-'a'] = append(d[w[0]-'a'], w)
}
for _, c := range s {
q := d[c-'a']
d[c-'a'] = nil
for _, t := range q {
if len(t) == 1 {
ans++
} else {
d[t[1]-'a'] = append(d[t[1]-'a'], t[1:])
}
}
}
return
}
|
方法二:二分查找
我们还可以先用数组或哈希表 $d$ 存放字符串 $s$ 每个字符的下标,即 $d[c]$ 为 $s$ 中所有字符 $c$ 的下标组成的数组。
然后我们遍历 $words$ 中的每个单词 $w$,我们通过二分查找的方法,判断 $w$ 是否为 $s$ 的子序列,是则答案加 $1$。判断逻辑如下:
- 定义指针 $i$ 表示当前指向字符串 $s$ 的第 $i$ 个字符,初始化为 $-1$。
- 遍历字符串 $w$ 中的每个字符 $c$,在 $d[c]$ 中二分查找第一个大于 $i$ 的位置 $j$,如果不存在,则说明 $w$ 不是 $s$ 的子序列,直接跳出循环;否则,将 $i$ 更新为 $d[c][j]$,继续遍历下一个字符。
- 如果遍历完 $w$ 中的所有字符,说明 $w$ 是 $s$ 的子序列。
时间复杂度 $O(\sum_{i=0}^{m-1} |w_i| \times \log n)$,空间复杂度 $O(m)$。其中 $n$ 和 $m$ 分别为 $s$ 和 $words$ 的长度,而 $|w_i|$ 为 $words[i]$ 的长度。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 | class Solution:
def numMatchingSubseq(self, s: str, words: List[str]) -> int:
d = defaultdict(deque)
for i, w in enumerate(words):
d[w[0]].append((i, 0))
ans = 0
for c in s:
for _ in range(len(d[c])):
i, j = d[c].popleft()
j += 1
if j == len(words[i]):
ans += 1
else:
d[words[i][j]].append((i, j))
return ans
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23 | class Solution {
public int numMatchingSubseq(String s, String[] words) {
Deque<int[]>[] d = new Deque[26];
Arrays.setAll(d, k -> new ArrayDeque<>());
for (int i = 0; i < words.length; ++i) {
d[words[i].charAt(0) - 'a'].offer(new int[] {i, 0});
}
int ans = 0;
for (char c : s.toCharArray()) {
var q = d[c - 'a'];
for (int t = q.size(); t > 0; --t) {
var p = q.pollFirst();
int i = p[0], j = p[1] + 1;
if (j == words[i].length()) {
++ans;
} else {
d[words[i].charAt(j) - 'a'].offer(new int[] {i, j});
}
}
}
return ans;
}
}
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20 | class Solution {
public:
int numMatchingSubseq(string s, vector<string>& words) {
vector<queue<pair<int, int>>> d(26);
for (int i = 0; i < words.size(); ++i) d[words[i][0] - 'a'].emplace(i, 0);
int ans = 0;
for (char& c : s) {
auto& q = d[c - 'a'];
for (int t = q.size(); t; --t) {
auto [i, j] = q.front();
q.pop();
if (++j == words[i].size())
++ans;
else
d[words[i][j] - 'a'].emplace(i, j);
}
}
return ans;
}
};
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20 | func numMatchingSubseq(s string, words []string) (ans int) {
type pair struct{ i, j int }
d := [26][]pair{}
for i, w := range words {
d[w[0]-'a'] = append(d[w[0]-'a'], pair{i, 0})
}
for _, c := range s {
q := d[c-'a']
d[c-'a'] = nil
for _, p := range q {
i, j := p.i, p.j+1
if j == len(words[i]) {
ans++
} else {
d[words[i][j]-'a'] = append(d[words[i][j]-'a'], pair{i, j})
}
}
}
return
}
|
方法三
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 | class Solution:
def numMatchingSubseq(self, s: str, words: List[str]) -> int:
def check(w):
i = -1
for c in w:
j = bisect_right(d[c], i)
if j == len(d[c]):
return False
i = d[c][j]
return True
d = defaultdict(list)
for i, c in enumerate(s):
d[c].append(i)
return sum(check(w) for w in words)
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43 | class Solution {
private List<Integer>[] d = new List[26];
public int numMatchingSubseq(String s, String[] words) {
Arrays.setAll(d, k -> new ArrayList<>());
for (int i = 0; i < s.length(); ++i) {
d[s.charAt(i) - 'a'].add(i);
}
int ans = 0;
for (String w : words) {
if (check(w)) {
++ans;
}
}
return ans;
}
private boolean check(String w) {
int i = -1;
for (int k = 0; k < w.length(); ++k) {
int c = w.charAt(k) - 'a';
int j = search(d[c], i);
if (j == d[c].size()) {
return false;
}
i = d[c].get(j);
}
return true;
}
private int search(List<Integer> t, int x) {
int left = 0, right = t.size();
while (left < right) {
int mid = (left + right) >> 1;
if (t.get(mid) > x) {
right = mid;
} else {
left = mid + 1;
}
}
return left;
}
}
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20 | class Solution {
public:
int numMatchingSubseq(string s, vector<string>& words) {
vector<vector<int>> d(26);
for (int i = 0; i < s.size(); ++i) d[s[i] - 'a'].emplace_back(i);
int ans = 0;
auto check = [&](string& w) {
int i = -1;
for (char& c : w) {
auto& t = d[c - 'a'];
int j = upper_bound(t.begin(), t.end(), i) - t.begin();
if (j == t.size()) return false;
i = t[j];
}
return true;
};
for (auto& w : words) ans += check(w);
return ans;
}
};
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24 | func numMatchingSubseq(s string, words []string) (ans int) {
d := [26][]int{}
for i, c := range s {
d[c-'a'] = append(d[c-'a'], i)
}
check := func(w string) bool {
i := -1
for _, c := range w {
t := d[c-'a']
j := sort.SearchInts(t, i+1)
if j == len(t) {
return false
}
i = t[j]
}
return true
}
for _, w := range words {
if check(w) {
ans++
}
}
return
}
|