【数据分析】走进数据分析 4 正则表达式
【数据分析】⚠️走进数据分析 4⚠️ 正则表达式.
·
概述
数据分析 (Data Analyze) 可以在工作中的各个方面帮助我们. 本专栏为量化交易专栏下的子专栏, 主要讲解一些数据分析的基础知识.
正则表达式
正则表达式 (Regular Expression) 是一种用来匹配字符串的强有力的工具. 可以帮助我们提取我们想要的信息.
字符
字符 | 描述 |
---|---|
$ | 匹配输入字符串的结尾位置 |
( ) | 标记一个子表达的开始和结束位置 |
* | 匹配前面的子表达 0 次或多次 |
+ | 匹配前面的子表达式 1 次或多次 |
. | 匹配除换行符\n 之外的任何单字符 |
? | 匹配前面的子表达式 0 次或 1 次 |
^ | 匹配输入字符串的开始位置 |
| | 指明两项之间的一个选择 |
限定符
字符 | 描述 |
---|---|
{n} | n 是一个非负整数, 匹配确定的 n 次 |
{n,} | n 是一个非负整数, 至少匹配 n 次 |
{n,m} | n 和 m 均是非负整数 |
实战
re
是 Python 中使用正则表达式的一个库.
导入:
import re
电话号码匹配
例子:
import re
# 内容(电话)
content = "02187888822 05114405222 02584533622 xxxxxa"
# 正则表达式
pattern = r"[0-9]{11,}"
# 匹配
match = re.findall(pattern, content)
print(match)
输出结果:
['02187888822', '05114405222', '02584533622']
匹配股票代码
匹配沪深:
import re
# 内容(股票代码)
content = "601101.XSHE 600661.XSHE 600071.XSHE 601666.XSHE"
# 正则表达式
pattern = r"[0-9]{6}.XSHE"
# 匹配
match = re.findall(pattern, content)
print(match)
输出结果:
['601101.XSHE', '600661.XSHE', '600071.XSHE', '601666.XSHE']
匹配上证:
import re
# 内容(股票代码)
content = "601888.XSHG 601628.XSHG 600276.XSHG 600519.XSHG"
# 正则表达式
pattern = r"[0-9]{6}.XSHG"
# 匹配
match = re.findall(pattern, content)
print(match)
输出结果:
['601888.XSHG', '601628.XSHG', '600276.XSHG', '600519.XSHG']

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)