如何统计html标签的数目 python
1、准备一个要统计的html文件,将其与py代码放在同一目录中
2、编写代码:import rewith open('index.html争犸禀淫','r',encoding='utf-8') as f多唉捋胝: htmlstr = f.read() # 打开html文件,并将内容放入htmstr变量elements_lists = re.findall('<[^/].*?>',htmlstr) # 利用正则表达式,查找所有不是以/开头的<>print(len(elements_lists)) # 打印其长度print(len(list(set(elements_lists)))) # 去重后打印长度
3、上述代码的缺点是:如果正文中有<内容>这样的情况,那也会一并被统计。