一、文件
一个测试有两个sheet页的Excel测试文件 test.xlsx
二、代码
import pandas as pd file1 = pd.ExcelFile('D:\\data\\py\\test.xlsx') file2 = pd.read_excel('D:\\data\\py\\test.xlsx') print(file)
<pandas.io.excel._base.ExcelFile object at 0x0000021DE525DF88> -----------------分割线--------------------- 姓名 年龄 性别 住址 0 张三 7 男 NaN 1 李四 6 男 NaN 2 王芳 6 女 NaN
三、分析
pd.read_excel读出来是一个dataframe可以直接打印出内容,但是只能读取一个sheet页,默认第一个sheet页
@Appender(_read_excel_doc) @deprecate_kwarg("skip_footer", "skipfooter") def read_excel( io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipr<p>本文来源gao!%daima.com搞$代*!码9网(</p>ows=None, nrows=None, na_values=None, keep_default_na=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, comment=None, skip_footer=0, skipfooter=0, convert_float=True, mangle_dupe_cols=True, **kwds ): for arg in ("sheet", "sheetname", "parse_cols"): if arg in kwds: raise TypeError( "read_excel() got an unexpected keyword argument " "`{}`".format(arg) ) if not isinstance(io, ExcelFile): io = ExcelFile(io, engine=engine) elif engine and engine != io.engine: raise ValueError( "Engine should not be specified when passing " "an ExcelFile - ExcelFile already has the engine set" ) return io.parse( sheet_name=sheet_name, header=header, names=names, index_col=index_col, usecols=usecols, squeeze=squeeze, dtype=dtype, converters=converters, true_values=true_values, false_values=false_values, skiprows=skiprows, nrows=nrows, na_values=na_values, keep_default_na=keep_default_na, verbose=verbose, parse_dates=parse_dates, date_parser=date_parser, thousands=thousands, comment=comment, skipfooter=skipfooter, convert_float=convert_float, mangle_dupe_cols=mangle_dupe_cols, **kwds )
pd.ExcelFile 返回值是一个Excel对象,不能直接用,但是可以读取整个Excel内容
四、pd.ExcelFile
file = pd.ExcelFile('D:\\data\\py\\test.xlsx')
sheet页名称
print(file.sheet_names)
['一年级', '二年级']
遍历读取每个sheet页的内容
for name in file.sheet_names: _df = pd.read_excel(file,name) print(_df)
姓名 年龄 性别 住址 0 张三 7 男 NaN 1 李四 6 男 NaN 2 王芳 6 女 NaN 姓名 年龄 性别 0 李明 8 男 1 刘敏 8 女 2 张强 7 男
将两个sheet页的内容合并,并添加一列内容为sheet页名称
df_list=[] for name in file.sheet_names: _df = pd.read_excel(file,name) _df['班级']=name df_list.append(_df) df = pd.concat([_df for _df in df_list],sort=False) print(df)
姓名 年龄 性别 住址 班级 0 张三 7 男 NaN 一年级 1 李四 6 男 NaN 一年级 2 王芳 6 女 NaN 一年级 0 李明 8 男 NaN 二年级 1 刘敏 8 女 NaN 二年级 2 张强 7 男 NaN 二年级