• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

python刷题模板-子序列自动机

python 搞java代码 3年前 (2022-06-29) 26次浏览 已收录 0个评论
文章目录[隐藏]

@TOC

一、 算法&数据结构

1. 形容

子序列自动机能够用来解决子序列判断问题:问模式串p是否是原串s的子序列。
当须要对同一个串进行屡次不同模式串匹配时,能够事后对s进行自动机的结构。
用一次结构开销,节俭询问开销。

这类问题奢侈的做法显然是双指针:

  • 让i在原串s上,j在模式串p上。
  • 字符相等,模式串能力后移,不同的话,i要始终后移,直到相等。
  • 这个做法复杂度是 O(n+m),n,m别离是两个串的长度。
咱们发现:i后移时,肯定会挪动到后边第一个(最近的),与p[j]雷同的字符上。那咱们能够预处理进去原串上每个字符后边的所有字符最近呈现的地位。
这就是子序列自动机的做法。
  • 用dp的形式预处理,逆序遍历s串,dpi贮存每个字符后边每个字母最近呈现的地位。
  • 这样能够间接转移,省去大量无用扫描。

2. 复杂度剖析

1) 奢侈做法, O(n+m)

2) 自动机:

  • 自动机结构复杂度 O(mc)*,c=26即为字典长度,m是原串长度。
  • 每次匹配复杂度为 O(n)。

3. 常见利用

1) 判断子序列问题,当屡次对同一个原串进行询问时,事后结构原串的自动机。

4. 罕用优化

1) 对python来说,从dp[i+1]转移到dp[i]时,能够间接切片复制,比一个一个赋值快十分多。

二、 模板代码

1. 奢侈询问判断子序列

例题: 392. 判断子序列

间接询问。

class SubSequenceAuto:
    def __init__(self,s,abc='abcdefghijklmnopqrstuvwxyz'):
        self.s,self.abc = s,abc
        self.n,abc_len = len(s),len(abc)
        self.abc_index = {v:k for k,v in enumerate(abc)}
        self.dp = [[self.n]*abc_len for _ in range(self.n+1)]
        dp = self.dp
        # dp.append([self.n]*abc_len)
        for i in range(self.n-1,-1,-1):
            dp[i] = dp[i+1][:]
            dp[i][self.abc_index[s[i]]] = i
            # for j in range(abc_len):
            #     dp[i][j] = i if s[i]==abc[j] else dp[i+1][j] 
    def query_is_sub_seq(self,t):
        dp = self.dp
        abc_index = self.abc_index
        n = self.n
        r = 0
        for c in t:
            r = dp[r][abc_index]
            if r == n:
                return False
            r += 1
        return True



class Solution:
    def isSubsequence(self, s: str, t: str) -> bool:
        ssa = SubSequenceAuto(t)
        return ssa.query_is_sub_seq(s)

2. 屡次询问,应用自动机

链接: 522. 最长非凡序列 II

这题正解应该是自动机,然而数据弱,每个单次长度<=10,所以可能不如奢侈。

class SubSequenceAuto:
    def __init__(self,s,abc='abcdefghijklmnopqrstuvwxyz'):
        self.s,self.abc = s,abc
        self.n,abc_len = len(s),len(abc)
        self.abc_index = {v:k for k,v in enumerate(abc)}
        self.dp = [[self.n]*abc_len for _ in range(self.n+1)]
        dp = self.dp
        # dp.append([self.n]*abc_len)
        for i in range(self.n-1,-1,-1):
            dp[i] = dp[i+1][:]
            dp[i][self.abc_index[s[i]]] = i
            # for j in range(abc_len):
            #     dp[i][j] = i if s[i]==abc[j] else dp[i+1][j] 
    def query_is_sub_seq(self,t):
        dp = self.dp
        abc_index = self.abc_index
        n = self.n
        r = 0
        for c in t:
            r = dp[r][abc_index]
            if r == n:
                return False
            r += 1
        return True
class Solution:
    def findLUSlength(self, strs: List[str]) -> int:
        """
        先说一个显然:如果s的子序列ss是一个非凡序列,那么s更是非凡序列。
        因而本题只须要判断每个字符串是否是其它字符串的子序列。
        判断子序列能够双指针,或者用子序列自动机。
        """
        n = len(strs)
        flags = [True] * n  # 每个字符串是否是非凡序列,初始化为0。如果他是他人的子序列,则置False
        # 以下判断j是不是i的子序列
        for i in range(n):
            sba = SubSequenceAuto(strs[i])
            for j in range(n):
                if i == j or flags[j] ==False:
                    continue
                if sba.query_is_sub_seq(strs[j]):
                    flags[j] = False 
        
        ans = -1
        for i in range(n):
            if flags[i]:
                ans = max(ans,len(strs[i]))
        return ans

三、其余

1) 待补充

四、更多例题

  • 待补充

五、参考链接

  • 我的题解: Python子序列自动机做法

    人生苦短,我用Python!


搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:python刷题模板-子序列自动机

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址