Autogluon，一個神奇的 python 庫

2023年9月4日#技术 #python脚本71

AI 翻譯

這篇文章透過AI由簡體中文翻譯成繁體中文。查看原文

AI 生成的摘要

今天我們要分享一個強大的Python庫，autogluon。AutoGluon是一個用於深度學習的AutoML工具包，可以自動執行端到端的機器學習任務，只需幾行代碼就能實現強大的預測性能。我們可以使用pip直接安裝AutoGluon。可以使用TabularDataset來加載數據集。使用該模型需要初始化評估指標、因變量和存儲結果的目錄。在這個例子中，我們使用f1作為評估指標，因變量是"class"，模型被放入"output_models"文件夾中。可以創建預測器，並查看模型的排行榜和特徵重要性。所有已構建的模型都存儲在輸出文件夾"output_models"中。

今天給大家分享一個超強的 Python 庫，autogluon

https://github.com/autogluon/autogluon
AutoGluon 是一個用於深度學習的 AutoML 工具包，它可以自動執行端到端機器學習任務，使我們能夠通過幾行代碼實現強大的預測性能。
AutoGluon「可自動執行機器學習任務」，使你能夠在應用程序中輕鬆實現強大的預測性能。
初體驗
安裝 AutoGluon
我們可以直接使用 pip 來進行安裝。

pip install autogluon

加載數據集
可以通過 TabularDataset 來加載數據集。

from autogluon.tabular import TabularDataset, TabularPredictor
train_data = TabularDataset('https://autogluon.s3.amazonaws.com/datasets/Inc/train.csv')
test_data = TabularDataset('https://autogluon.s3.amazonaws.com/datasets/Inc/test.csv')

模型構建
使用該模型需要初始化「評估指標、因變量和存儲結果的目錄。」

在如下示例中，我們使用 f1 作為評估指標。因變量是 "class"，模型被放入 "output_models" 文件夾中

evaluation_metric= "f1"
data_label= "class"
save_path= "output_models"

predictor = TabularPredictor(label='class').fit(train_data, time_limit=120)  # Fit models for 120s
leaderboard = predictor.leaderboard(test_data)

#創建預測器
predictor = TabularPredictor(label=data_label,path=save_path,eval_metric=evaluation_metric) 
predictor=predictor.fit(train_data)
predictor.leaderboard(silent=True)

下圖所示的排行榜可以讓你了解「所有模型的嘗試情況以及你在這些模型上獲得的分數。」

下面一起來看一下特徵重要性。

X = train_data 
Predictor.feature_importance(X)

所有已構建的模型都存儲在輸出文件夾 "output_models" 中。