期末实验报告

姓名:卢慧娟

学号:4201476

配置环境,导入数据

处理链接

整理链接,更新至最新版

筛选公司

下载十家公司年报pdf

提取文件名

提取年报文件

封装提取文件数据函数

提取并储存每家公司年营业收入,绘图

发现华天科技2018年数据有较大波动,经检查发现数据提取少一位数,经修正后图形如下:

提取十家公司营业收入数据

一种提取方式为: year1=[]#输入年份 for i in range(len(year1)): year2= year1[i] pdf = [f for f in filenames if year2 in f and f.endswith('.pdf')] fname = [p[:4] for p in pdf] df_data=pd.DataFrame(columns=['营收'],index= fname) df_data=df_data.fillna('') for y in range(len(fname)): lines=parse_data_line(pdf[y]) df_fnc1=pd.DataFrame([l for l in lines],columns=['0','1','1','2','3']) s=df_fnc1.iloc[0,1] s=s.replace(',','') df_data['营收'][[y]]=eval(s) 但该种方式提取出错不易发现,故作出改进。

绘制十家公司每年的营业收入图

从以上图表可观察出十家公司中:

1、欧比特、台基股份、惠伦晶体、南大光电的营收额在十亿元以下,欧比特、台基股份、南大光电从2015年至2020年营收增幅分别约为124%、134%和396%,惠伦晶体2020年的营收却比2015年的减少了;
2、上海贝岭在2020年的营收额首次突破十亿元,与2016年的营收相比增幅为161%;
3、苏州固锝的营收额在2015-2019年缓慢增长,2020年跌幅约为2019年的9%;
4、士兰微、通富微电、华天科技为十家公司中近五年年平均营业额最高且较为稳定的公司,其中士兰微、通富微电的营收额增长迅速,华天科技营收额增长也较为迅速,但在2018年有一次较大的跌幅,营收额仅为2017年的11.5%,2020年的9.7%;
5、2020年排名前三的公司营收与后面公司出现脱节;
6、通富微电从2015年开始,营收不断接近华天科技并在2019年超越,且2020年远远超越华天科技。
现就南大光电、通富微电、华天科技三家公司进行一些分析。

将三家上市公司的股票代码存为list

对三只股票的价格相关性进行分析

从上面可看出通富微电与HS300指数的相关性最强,也就是说通富微电股价会受到大盘走势的明显影响,南大光电次之,华天科技相对受影响最小;华天科技和南大光电的相关性也要比华天科技和南大光电分别和通富微电的相关性小。

绘制三只股票的时间序列图

由上图可观察出三只股票近七年走势基本呈“U”字形,且在2018年年中股价一致出现下跌,现对其进行正态分布检验。

南大光电、通富微电、华天科技的股价均值为:28.33、15.17、10.93,南大光电、通富微电、华天科技在2021-12-13的股价分别为:51.24、20.45、13.31(单位:元/股),可认为三只股票当前价格偏高,如果有强力支撑股价上升则可以考虑买入,反之则要警惕股价有回落风险,且三只股票的标准差较大,即波动较大,风险承受能力低者谨慎买入。

通过 qq 图检查数据与正态分布的贴近程度

红线表示y=x,即要求理想正态分布的分位数与实际对比,如图所示,三只股票的qq图左下角处偏离红线,因而认为其不服从正态分布。

用几何布朗运动模拟三只股票未来6个月走势