谢钦焱的作业二

代码


import requests
from bs4 import BeautifulSoup
import re
x = requests.get('http://www.jxufe.edu.cn/')
print(x.text)
a = x.text
soup = BeautifulSoup(a,'html.parser',from_encoding='utf-8') #将html解析为对象进行处理
string1 = soup.get_text()  #获取标签内文字
string = re.sub('\n+',' ',string1)  # \n+表示匹配一个或多个换行符,并将其替换为空格

结果

结果截图

解释

用BeautifulSoup可快速对html解析,并提取相应标签里的内容。解释见代码注释。