引用引用第9楼adec3cd0于2024-04-27 23:23发表的 :如果干扰码只在行尾的的话。直接用正则从行尾贪婪匹配:(。.*$)替换为:(。)“。”更换为有干扰码行尾的标点符号.......
引用引用第6楼dc5c1b69于2024-04-27 20:37发表的 :正则表达式,搜索,替换https://tool.oschina.net/regex/以前做盗版小说爬虫就是用这个去某些网站的广告字符
引用引用第8楼4db15def于2024-04-27 21:38发表的 :用ChatGPT写个正则匹配吧,可以删掉这些有规矩的字符
引用引用第14楼c34faf59于2024-04-28 10:50发表的 :用正则表达式按照逗号和句号将其分割成一个个字符串,然后通过判断其中是否存在汉字,将不存在汉字的字符串给删掉就行