为什么要用 Dataprep?#
干过数据分析的都知道,数据报告有多费劲:
- pandas 分析数据要写一大堆代码
- matplotlib 画图配置项太多记不住
- 数据质量分析要写好几个函数
- 分析报告格式不够专业
Dataprep就是来解决这些痛点的!它能让你:
- 一行代码生成专业数据报告
- 自动进行数据质量分析
- 智能生成数据可视化
- 提供详细的统计信息
- 快速上手
安装#
先安装这个宝贝:
pip install dataprep
最简单的例子#
from dataprep.eda import create_report
import pandas as pd
# 创建示例数据
data = {
'姓名': ['张三', '李四', '王五', '赵六', '钱七'],
'年龄': [25, 30, 22, 35, 28],
'工资': [8000, 12000, 9000, 15000, 10000],
'部门': ['技术', '销售', '技术', '销售', '技术']
}
df = pd.DataFrame(data)
# 生成报告并保存到文件
report = create_report(df, title='员工数据分析报告')
report.save('employee_report.html')
print("报告已生成,请在浏览器中打开 employee_report.html 文件查看")
就这么简单!运行这段代码,就能得到一份包含以下内容的专业报告:
- 数据概览和基本统计
- 变量分布分析
- 缺失值分析
- 异常值检测
- 相关性分析