python 正则示例

2020/03/28 技术

python 正则示例

1. 提取内容

使用 re.findall() 或者 re_pattern.findall() 提取匹配内容

  • 提取url: re.compile(r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+').findall(content)
  • 提取日期: re.compile(r'[0-9]{4}-[0-9]{2}-[0-9]{2}').findall(content)

2. 替换内容

使用 re.sub() 对匹配内容进行替换。

  • 删除文本开头的链接: re.sub(r'^[\s]*http[s]?://www.abc.com/[0-9a-zA-Z]+', "", content)
  • 删除文本中的空白符号: re.sub('[\r\n\t]', '', content)

Search

    Table of Contents