匹配中文
过程 获取中文字词(源码 为 文本型) 变量 结果 为 文本型() 变量 个数 为 整数型 变量 计次 为 整数型 变量 内容 为 文本型 结果 = 正则匹配(源码,"[\\u4e00-\\u9fa5]") '匹配文本中的中文字符 个数 = 取数组下标(结果,1) 如果 个数 > 0 则 变量循环首 计次 = 1 至 个数 内容 = 内容 & " " & 结果(计次 - 1) 变量循环尾 演员 = 内容 否则 演员 = "没有找到数据" 结束 如果 结束 过程
匹配html代码
过程 匹配html标记(源码 为 文本型) 变量 结果 为 文本型() 变量 个数 为 整数型 变量 计次 为 整数型 变量 内容 为 文本型 结果 = 正则匹配(源码,"<(S*?)[^>]*>.*?|<.*? />") '匹配文本中的html字符 个数 = 取数组下标(结果,1) 如果 个数 > 0 则 变量循环首 计次 = 1 至 个数 内容 = 内容 & " " & 结果(计次 - 1) 内容=子文本替换(内容,内容,"") 变量循环尾 弹出提示(内容) 演员 = 内容 否则 演员 = "没有找到数据" 结束 如果 结束 过程
正则匹配替换html代码,返回替换后的内容
过程 演员获取(源码 为 文本型) 变量 内容 为 文本型 创建表达式("<(S*?)[^>]*>.*?|<.*? />",真,真) 开始匹配(源码) 内容=全部替换("") 演员 = 内容 结束 过程