import pandas as pd
import pdfplumber
def change_code(x):
'''
Function
----------
补全证券代码
Parameters
----------
x : 证券代码
Returns
-------
六位数证券代码
'''
length = len(str(x))
if length == 6:
return str(x)
else:
return '0'*(6-length)+str(x)
def get_page(file_path,page):
'''
Function
----------
提取pdf中的表格
Parameters
----------
file_path : 读取的pdf文件
page : 读取的页码
Returns
-------
将某页pdf以dataframe格式返回
'''
page0 = pdfplumber.open(file_path).pages[page] #获取第78页
table0 = page0.extract_table()
df = pd.DataFrame(table0)
df.columns = df.iloc[0,:]
df = df.iloc[1:]
return df