第一题答案为:
import pandas as pd
from pandas import DataFrame
data = {'身高':[158, 165, 167, 164, 163, 163], '胸围': [80, 85, 88, 86, 83, 83], '腰围': [65, 70, None, 72, 68, 68],
'臀围': [83, 90, 92, 88, 88, 88], '胸围指数': ['','', '', '', '', ''],
'腰围指数': ['', '', '', '', '', ''],
'臀围指数': ['', '', '', '', '', '']}
df = DataFrame(data, index=['小乔', '貂蝉', '虞姬', '甄姬', '大乔', '大乔'])
df = df.drop_duplicates()
print(df)
# 以其他人的腰围平均值填充空缺值
df['腰围'].fillna(df['腰围'].mean(), inplace=True)
print(df)
# 定义计算三围指数的函数
def sanweizhishu(df):
df['胸围指数'] = df['胸围']/df['身高'] * 100
df['腰围指数'] = df['腰围']/df['身高'] * 100
df['臀围指数'] = df['臀围']/df['身高'] * 100
return df
# 填入三围指数
df = df.apply(sanweizhishu, axis=1)
print(df)
第二题答案:
因为代码写的比较长,分了多个文件,所以这里提供github地址
https://github.com/zhouwei713/data_analysis/tree/master/document_sort
展开