余梓依的作业一

余梓依的作业一

代码


# replace with your code here
import requests#导入request模块
x = requests.get('http://www.jxufe.edu.cn/')
y = x.text
print(y)#请求访问江西财经大学主页，并打印出文本内容
from bs4 import BeautifulSoup
soup = BeautifulSoup(y,'html.parser')
#导入BeautifulSoup模块使用BeautifulSoup解析这段代码
#将html解析为对象进行处理，全部页面转化为字典或数组
a = soup.get_text() #获取文字内容，并赋给变量a
import re #引入正则表达式
b = re.sub('\n+','\n',a) #将'\n+'替换为'\n'，消除空行

结果

结果截图

解释

解释在代码的注释里。