【FFH】OpenHarmony——ArkTs应用开发+正则表达式 原创

FFH物联黄同学
发布于 2023-5-25 16:20
浏览
0收藏

【FFH】OpenHarmony——ArkTs应用开发+正则表达式

@[toc]

1. 前言——系列介绍

本系列文章主要是记录笔者在鸿蒙领域的学习与工作中的知识点笔记记录,其中不止会针对鸿蒙中的学习问题进行思考与记录,也会对涉及到的一些嵌入式等其他领域进行记录。

目前该系列已发布的内容有:

  1. 【FFH】开源鸿蒙南向嵌入学习笔记——NAPI框架学习(一)-开源基础软件社区-51CTO.COM

2. 本文摘要及背景

2.1 摘要

  1. 本文最核心:sparkle: :在做(开源)鸿蒙应用开发时,ArkTs中使用正则表达式处理像string等字符串对象。
  2. 介绍一些ArkTs使用正则表达式示例,以及一些可能比较常用的小技巧:eight_pointed_black_star: 。
  3. 介绍正则表达式的一些应用技巧,涉及到匹配模式
  4. 正则表达式在开源鸿蒙应用开发中,可以起到怎样的一个应用。

2.2 背景

  1. 黄同学最近在做OpenHarmony 应用开发的时候,遇到了一些场景,我需要从像string 这样的字符串数据中,获取我需要的特定信息。
  2. 传统的解决方式:相信我的读者可能都有一些DS的基础,知道这种其实就是字符串匹配问题,针对这种问题,常见的解法是使用:暴力匹配KMPAC自动机等方式,但是在实际应用当中如果这样做,可能比较蠢。
  3. 黄同学此前有过在Python中使用过具有正则表达(式)匹配功能的 re 模块的经历。但是ArkTs 并没有类似的集成API。但是在ArkTs 的相关文档以及文章中,对这一块的描述都比较少。但是从官方的描述来看,我们可以知道 ArkTs 是 TypeScriptJavaScript超集,兼容了JS/TS的语言生态。所以黄同学在写这篇文章的时候,看了不少JS和TS关于正则表达式的使用的文档。

2.3 MindMap

<img src=“https://img-blog.csdnimg.cn/c2a4bff044674a92926d9bade2262094.png” alt=“在这里插入图片描述” style=“zoom:100%;” />

3. 正则表达式在ArkTs的使用

3.1 变量 RegExp

  1. ArkTs 中,正则表达式的变量类型是RegExp,这一点基本上兼容了JS。

  2. 有两种表达方式

    1. 可以用斜杠来包住正则表达式,里边就是正则表达式的内容。

      let rep: RegExp = /a\S+b/;
      
    2. 也可以用RegExp的构造函数来构造,需要传入string作为参数

      let rep = new RegExp("a\S+b");
      

3.2 使用

正则表达式的变量使用较多,主要有:

  1. match,这个是黄同学使用的最多的,在字符串中执行查找匹配的string方法,会返回一个数组。

    let rep: RegExp = /acfun1+/;
    let s: string = "bkacfun1112";
    console.log(s.match(rep)[0]);			// acfun111
    
  2. test,在一个字符串中测试,判断正则表达式是否能够和字符串匹配

let rep: RegExp = /acfun1+/;
let s: string = "bkacfun1112";
console.log('' + rep.test(string) ? 'yes' : 'no');			// yes
  1. match 查到的是一个第一个,但如果想匹配所有符合正则表达式的,可以使用 matchAll,这个返回的是一个迭代器 :atom_symbol:,这个就不给出用例了,感兴趣的朋友可以自行去js 的相关文档,或者看看我的参考资料23。下面也一样。

  2. search,在字符串中查找匹配的位置(第一个),成功时返回匹配的位置,失败返回-1

  3. replace,即用字符串替换匹配到的字符子串。

3.3 贪婪模式与懒惰模式

黄同学在ArkTs中使用正则表达式做匹配的时候,发现和使用Pythonre模块有所不同。在python中,使用 re.match 的时候,会先匹配到最短满足的字符串子串。而在ArkTs中,使用正则表达式和match的时候,会匹配到最长满足的字符串子串。

上面的文字描述可能会比较抽象,下面用示例来表示:注释中即为输出内容

  1. python:

    import re
    s = 'sttstts'
    pat = re.compile(r's.*s')
    print(pat.match(pat).group(0))		# stts
    
  2. ArkTs:

    let rep: RegExp = /s.*s/
    let s: string = 'sttstts'
    console.log(s.match(rep)[0])		// sttstts
    

以上这两种情况其实就是,在正则表达式的相关概念中,其实就是关于匹配模式中的 贪婪模式懒惰模式

关于这两种的详细概念,如果朋友们想要了解,不妨去看看正则表达式的文档。黄同学在这里将用比较简单、浅显的文字表述来解释这两种模式:

  1. 这两种模式,具体的运作其实就和名字一样。贪婪模式其实就是尽可能匹配比较长的字符串,如上面的例子2中的输出,匹配过程很贪婪,和贪心算法思想类似,尽可能使匹配的结果长;而懒惰模式类似,就是匹配尽可能少的字符串,匹配到满足的即可。
  2. 这两种模式,其实就是为了让开发者能更加灵活的使用正则表达式。这种两种模式的区别主要体现在匹配多个字符的特殊正则表达式字符,比如正则表达式中 +* 等。

:eye_speech_bubble:ArkTs 正则表达式 懒惰模式

那么,如果你是ArkTs开发者,你要用懒惰模式,但是在ArkTs中,正则表达式默认是贪婪的。如何切换到懒惰模式呢?

  1. 这里和Js 一样,可以用?来切换到懒惰模式,我们将上面的代码修改后

    let rep: RegExp = /s.*?s/
    let s: string = 'sttstts'
    console.log(s.match(rep)[0])		// stts
    
  2. 上述的用 ? 后,就匹配最少的字符。

4. 正则表达式应用

  1. 相信通过上文的了解,我们已经可以对正则表达式的已经有了简单的认知,尤其是通过这些使用的示例,很容易知道,从直接角度,正则表达式的应用是对字符串这种类型的数据处理。这种处理是查询匹配,替换。
  2. 通过上述的直接角度,我们可以对字符串数据,即文本数据,可以用于做字符串过滤,在很多有查找,替换功能的应用(比如大家常用的编辑器vscode,记事本),这些功能其实就有正则表达式影子。黄同学曾经用过python的正则表达式写过一些代码过滤器,感兴趣的可以看看这几篇文章:
    1. (160条消息) 利用re模块去除代码块注释——Python开发_python re 注释_物联黄同学的博客-CSDN博客
    2. (160条消息) 利用re实现修改测试用例格式——python实现_方法有重写如何修改测试用例_物联黄同学的博客-CSDN博客

4.1 ArkTs应用——网络数据过滤

  1. 这个是黄同学在编写OpenHarmony应用时,遇到的一个场景:使用 @ohos.net.http 库中相关api向服务器发送http请求,会收到http报文。这种报文并不只是数据,还会有其他的部分。而黄同学需要提取数据部分,且要分别提取出数据部分的某些字段。因此,需要使用正则表达式来进行对网络数据的过滤。
  2. CodeArKTs)<img src=“https://img-blog.csdnimg.cn/3697ae7b9181471ba24cab23c53d0dc4.png” alt=“在这里插入图片描述” style=“zoom:150%;” />

参考资料

黄同学在编写这篇blog的时候,参考了一些文献。

  1. ArkTS 语言 - HarmonyOS应用开发官网
  2. 正则表达式 - JavaScript | MDN (mozilla.org)
  3. 正则表达式语言 - 快速参考 | Microsoft Learn
  4. JS正则(贪婪模式)_iteye_20185的博客-CSDN博客

©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
1
收藏
回复
举报
回复
    相关推荐