get_code模块¶

In [ ]:
import pandas as pd
import pdfplumber
In [ ]:
def change_code(x):
    '''
    Function
    ----------
    补全证券代码    

    Parameters
    ----------
    x : 证券代码

    Returns
    -------
    六位数证券代码

    '''
    length = len(str(x))
    if length == 6:
        return str(x)
    else:
        return '0'*(6-length)+str(x)
In [ ]:
def get_page(file_path,page):
    '''
    Function
    ----------
    提取pdf中的表格 
    
    Parameters
    ----------
    file_path : 读取的pdf文件
    
    page : 读取的页码

    Returns
    -------
    将某页pdf以dataframe格式返回

    '''
    page0 = pdfplumber.open(file_path).pages[page]  #获取第78页 
    table0 = page0.extract_table()
    df = pd.DataFrame(table0)
    df.columns = df.iloc[0,:]
    df = df.iloc[1:]
    return df