為什麼要用 Dataprep?#
幹過數據分析的都知道,數據報告有多費勁:
- pandas 分析數據要寫一大堆代碼
- matplotlib 畫圖配置項太多記不住
- 數據質量分析要寫好幾個函數
- 分析報告格式不夠專業
Dataprep就是來解決這些痛點的!它能讓你:
- 一行代碼生成專業數據報告
- 自動進行數據質量分析
- 智能生成數據可視化
- 提供詳細的統計信息
- 快速上手
安裝#
先安裝這個寶貝:
pip install dataprep
最簡單的例子#
from dataprep.eda import create_report
import pandas as pd
# 創建示例數據
data = {
'姓名': ['張三', '李四', '王五', '趙六', '錢七'],
'年齡': [25, 30, 22, 35, 28],
'工資': [8000, 12000, 9000, 15000, 10000],
'部門': ['技術', '銷售', '技術', '銷售', '技術']
}
df = pd.DataFrame(data)
# 生成報告並保存到文件
report = create_report(df, title='員工數據分析報告')
report.save('employee_report.html')
print("報告已生成,請在瀏覽器中打開 employee_report.html 文件查看")
就這麼簡單!運行這段代碼,就能得到一份包含以下內容的專業報告:
- 數據概覽和基本統計
- 變量分布分析
- 缺失值分析
- 異常值檢測
- 相關性分析