马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有帐号?免费注册
x
起因:因为下载了吧内《P站超全合集30000+本 加上大量细分tag分类》这个文件" l/ z1 x( |0 A" F(欢迎访问老王论坛:laowang.vip)
问题:每文的开头都是以下格式:
) A$ I" k5 ]. l- _2 V ^' o! r['9260472', '女帝的一二三四五六事', '纪银徵和她的,嗯,男朋友们的故事?纯爱战士,退退退!', ['R-18G', '疼痛', '孕妇', '出产', '羊水', '中文', '妊娠', '恋愛', '孕交'], '`Moss', 5]. G- s( M$ [- |; @+ B(欢迎访问老王论坛:laowang.vip)
/ @0 |8 X0 I" t. J7 l['1546193', '北国万象', '本系列现在仅作为都市背景的合集\n每一篇的具体设定并不一定完全相同', ['R-18G', 'オリジナル', '中国語', '剧情向', '処刑', '百合', '猎奇', '秀色', '血腥', '斩首'], '〆リクキ〆', 5]……
7 B% ^# g m& O3 E1 L& [* V
1 d0 i# z7 Q& I( `8 p2 X4 ?
" B N8 \" S/ c' t3 |不影响观看,但是又有点不舒服,所以想要校对一下,经过一些努力,总算校准了一点,但是还是有一些问题,所以发帖和大家讨论一下。
3 ?, O" G, D6 O5 C8 F3 ], D# ~6 P
4 s9 Y* W( C* A+ j& G7 j, X' X+ ]5 O校对软件:EmEditor. O7 V- K( W' t2 F4 N! M4 I(欢迎访问老王论坛:laowang.vip)
+ p5 A; E- p, ^3 m2 _* y(欢迎访问老王论坛:laowang.vip)
用正则表达式进行查找替换后可以把开头格式转换为图1图2所示:$ \- e, Z3 K0 R% i: L(欢迎访问老王论坛:laowang.vip)
+ Y2 {: k! p& G(欢迎访问老王论坛:laowang.vip)
表达式:查找\['\d{4,7}', '(.*?)', '(.*?)', \['(.*?)', '(.*?)'\], '(.*?)', (.*?)\] 替换\1\6\n\5\n\2\n\[\3,\4\]9 o0 F/ U- a6 _. z; d4 ?8 W(欢迎访问老王论坛:laowang.vip)
) l& ?( r! ~2 }* ~# ~* \(欢迎访问老王论坛:laowang.vip)
经过校对后书名章节数作者简介都很好,但是在文章标签这块,也就是我举例中的['R-18G', '疼痛', '孕妇', '出产', '羊水', '中文', '妊娠', '恋愛', '孕交']和['R-18G', 'オリジナル', '中国語', '剧情向', '処刑', '百合', '猎奇', '秀色', '血腥', '斩首']这块出现一点小问题,并没有出现我希望的[R-18G,疼痛,孕妇,出产,羊水,中文,妊娠,恋愛,孕交]和[R-18G,オリジナル,中国語,剧情向,処刑,百合,猎奇,秀色,血腥,斩首]的格式,也就是替换后这里面还是出现了', '这个(如图),并没有替换成中文逗号,虽然可以进行二次处理,但是有点麻烦,经过检查,这是由于查找表达式中这一块', '(.*?)是连在一起被表达的,所以在替换中这一块中间的', '是没有被换成中文逗号,但是由于标签数量不固定,也就是可能是9个可能是10个或其它数量,所以尝试了很多办法,还是没有能够很好的处理,所以请吧友们帮帮忙,有什么方法能够处理。表达式引擎是Boost.regex。
( ~- _% b! ] B+ h; m& I' o+ [8 y4 H& {2 O" e6 p(欢迎访问老王论坛:laowang.vip)
+ i0 r" |! \: _1 R2 _/ s(欢迎访问老王论坛:laowang.vip)
2 S2 U5 I+ |9 s/ v9 o(欢迎访问老王论坛:laowang.vip)
|